Meet the team – Simon, Leiter Produktmanagement und verantwortlich für die Produktentwicklung

Mai 2022 |
zuletzt aktualisiert am 19. Juni 2024

Wie ist die Idee zu GoSpeech entstanden?

Ich beschäftige mich schon seit 20 Jahren mit dem Thema Spracherkennung, in der Vergangenheit hauptsächlich für das professionelle Diktat. Spracherkennung im Bereich Dokumentation funktioniert etwas anders, weil hier bereits schriftreif gesprochen wird. Satzzeichen und Absätze werden mit diktiert, die Sprachsoftware für eine optimale Erkennung entsprechend trainiert.
Mit der Weiterentwicklung von künstlicher Intelligenz haben sich in den letzten Jahren neue Möglichkeiten aufgetan, nämlich zur Nutzung von KI-basierter Spracherkennung auch in anderen Bereichen. Für Journalisten, die viel mit Interviews oder Podcasts arbeiten, für die öffentliche Verwaltung oder Unternehmen, wo viele Meetings und Sitzungen protokolliert werden. So entstand die Idee, eine Plattform zu entwickeln, die Audioaufnahmen und -mitschnitte von normal gesprochener Sprache automatisch in Text transkribieren kann.

Was ist dein Part im GoSpeech-Projekt?

Als Leiter des Produktmanagements bin ich sowohl für das Projekt als auch für das Team rund um das Projekt verantwortlich. GoSpeech war ein sehr umfangreiches Projekt, das wir in Kooperation mit einem internationalen Team zum Teil online entwickelt haben. Mein Aufgabenbereich ist sehr umfangreich, allein die Produktentwicklung ist sehr aufwendig. Man braucht Lieferanten für spezielle Technologien. Welche Partner sind dafür geeignet? Wie können wir das Produkt auf den Markt bringen? Kontakte knüpfen, Businesspläne erstellen und zahlreiche Abstimmungen gehören dazu.

Was denkst du: Wie wird künstliche Intelligenz in 10, 50 oder 100 Jahren unseren Alltag beeinflussen?

Schauen wir uns erstmal an, was künstliche Intelligenz heute kann, zum Beispiel auch die Spracherkennung von GoSpeech. Hier geht es um die sogenannte Mustererkennung, d.h. ein Audiosignal soll so erkannt werden, dass es entweder in Text umgesetzt oder als Befehl interpretiert wird. Je nachdem erhalte ich den Satz „wie wird das Wetter morgen“ (Spracherkennung) oder es wird mir die Wettervorhersage angezeigt (Sprachbefehl). Künstliche Intelligenz wird sich in den nächsten Jahren im Bereich Sprache weiterentwickeln. Es gibt bereits Projekte, bei denen mit Hilfe künstlicher Intelligenz automatisch neue Texte generiert werden können, und man ist dabei, künstliche Intelligenz so zu trainieren, dass sie die wichtigsten Punkte eines Textes erkennen und daraus eine Zusammenfassung erstellen kann. D.h. KI lernt zu interpretieren. Und dahin wird der Weg gehen.
In 10, 20 Jahren kann KI wahrscheinlich nicht nur Sprache, sondern auch Bewegungen und Emotionen interpretieren, und dann bewegen wir uns in Richtung gläserner Mensch.
Natürlich sind KI-basierte Anwendungen wie Alexa, Siri oder das Navigationssystem im Auto sehr praktisch im Alltag, auf der anderen Seite benötigen solche KI-Modelle aber auch unglaubliche Mengen an Daten, die gesammelt und natürlich auch kommerziell genutzt werden. Was wird mit diesen Daten passieren?

Da wird noch eine große Diskussion auf uns zukommen: Nutzen und Bequemlichkeit von KI versus Datenschutz.

Wie geht GoSpeech mit diesen Daten um?

Bei Grundig Business Systems, also auch bei GoSpeech, gilt absolute Datensicherheit. Die Daten bleiben auf unseren Servern, sie werden weder für andere Zwecke genutzt, noch weitergegeben oder ausgewertet. Dasselbe gilt für unsere Technologie-Lieferanten, mit denen wir für die Entwicklung von GoSpeech zusammengearbeitet haben.

Welcher Einsatz von KI ist bei GoSpeech noch möglich?

Zum einen die automatisierte Korrektur, das automatische Lektorat von Transkripten. Ein weiterer Bereich ist die Entwicklung von Schnittstellen, um auch andere Systeme mit der Sprachtechnologie von GoSpeech verwenden zu können. Spannend ist auch die automatische Indizierung von Medienarchiven via Spracherkennung für eine spätere Recherche oder Nutzung als Quelle, was bisher nur auf Basis zum Teil sehr lückenhafter manuell erstellter Protokolle möglich war.
Die Weiterentwicklung von GoSpeech basiert stark auf den Anforderungen der Anwender.

Und was machst du, wenn du dich gerade mal nicht mit künstlicher Intelligenz und Spracherkennung beschäftigst?

Ich versuche tatsächlich, meine Rechner auch mal auszuschalten, und mich in das reale Leben zu stürzen – Gartenarbeit, Klettern, Tauchen, meine Familie. Ich habe drei Kinder, die mich auf Trab halten, im wahrsten Sinne des Wortes. Erst kürzlich habe ich mit meiner Tochter einen neuen Stall für ihre Pferde gebaut.

Sie haben Interesse an unserer Transkriptionssoftware? Erfahren Sie mehr über die Vorteile oder nutzen Sie gleich die Möglichkeit, GoSpeech kostenlos zu testen!

Mehr erfahren