Nach einem langen Arbeitstag abends noch schnell das letzte Interview abtippen. Solange ich das Gespräch noch im Kopf habe, sollte es schnell gehen, zumal sich auf dem Schreibtisch bzw. im E-Mail Eingang die nächsten Aufträge stapeln. Nach zwei Stunden gebe ich auf, ich habe noch nicht einmal ein Drittel der Audio-Aufnahme transkribiert.
Ich weiß, dass es irgendwo da draußen Hilfe gibt, und zwar in Form von Tools, die gesprochene Sprache in Text umwandeln können. Innerhalb von wenigen Minuten oder zumindest in deutlich weniger Zeit, als ich für die manuelle Transkription brauche. Google weiß sicher Rat. Ich suche nach kostenlosen Tools und werde tatsächlich auch fündig. Ich probiere mich also durch, stoße allerdings auf einige Hindernisse.
Wie bei vielen Tools, die auch eine kostenlose Nutzung anbieten, ist selbige stark limitiert. Bis zu 5.000 Zeichen kann ich bei den meisten ohne Abschluss eines Abos oder Berechnung von Gebühren transkribieren lassen. Damit komme ich nicht weit – ein einstündiges Interview ist erheblich länger.
Beim nächsten Anbieter muss ich zunächst eine Software herunterladen und bin mir nicht ganz sicher, ob allein dieser Vorgang nicht schon verdeckte Kosten verursacht. Versuche es dennoch, aber auch hier ist die Zeichenzahl für eine unentgeltliche Transkription so begrenzt, dass ich einen Text in dieser Länge in derselben Zeit abgetippt hätte, wie die Installation des Tools gedauert hat.
Die Qualität der kostenlosen Transkriptionstools ist unterschiedlich. Oft scheitert es schon an der Erkennungsrate. Ich erhalte eine Bleiwüste ohne Punkt und Komma, geschweige denn mit Absatz, die einen zweiten Durchgang mit Audio und aufwendiger manueller Korrektur erforderlich macht. Die Zeitersparnis geht gegen Null.
Ein weiterer Nachteil ist, dass die meisten Tools gesprochene Sprache einfach zu Text machen, ohne auf Feinheiten beispielsweise in der Verwendung von Zahlen oder Datumsangaben zu achten. Da steht dann „acht und dreißig komma zwei prozent“ statt „38,2 %“, was auf Dauer in der Nachbearbeitung sehr mühsam werden kann.
Neben Arbeitserleichterung und Qualität der Transkription gibt es noch weitere Kriterien, die bei kostenlosen Tools eher zu kurz kommen. Beispielsweise das Thema Datenschutz. Gerade bei Interviews handelt es sich oftmals um vertrauliche Inhalte, zumindest, bis der fertige Artikel vom Interviewpartner freigegeben wurde. Inwieweit sensible Daten durch Zugriffe von Dritten geschützt sind, hängt vom Standort der Server ab, auf denen die Software läuft, und vom geltenden Datenschutz, der Zugriffsrechte auf Nutzerdaten regelt. Das deutsche Datenschutzrecht gehört zu den strengsten, greift aber nur, wenn der Anbieter seine Server in Deutschland stehen hat.
Nach dem Test diverser kostenloser Tools steht für mich fest: Wenn Transkriptionssoftware für eine echte Arbeitserleichterung sorgen soll, sprich für effizienteres Arbeiten mit qualitativ hochwertigen Ergebnissen, lohnt es sich, in kostenpflichtige Tools zu investieren und auf den Anbieter zu achten.
GoSpeech hat für mich einen fairen Preis überzeugt und kann auch ohne Abo gebucht werden. Die Spracherkennungsergebnisse sind gut. Ein Post-Processing beinhaltet, dass bestimmte Begriffe wie u.a. Zeitangaben, Längenmaße, medizinische Termini automatisch korrigiert und in die richtige Form gebracht werden. Das spart mir Zeit. Und da die Lösung nur in Deutschland gehostet wird, ist sie DSGVO-konform. Sprich: GoSpeech erfüllt alle Kriterien für den professionellen Einsatz von Spracherkennung für Interviews.
Sie sind Journalist und haben oft mit Audioaufnahmen zu tun? Dann nutzen Sie jetzt die Gelegenheit, GoSpeech kostenlos zu testen und Ihre Audio- und Videoaufnahmen von unserer Transkriptionssoftware in Text um wandeln zu lassen.
GoSpeech jetzt kostenlos testen
Sparen Sie Zeit und lassen Sie Ihre Aufnahmen automatisch transkribieren.
Jetzt kostenlos testen!