Das Release 1.8.2 von GoSpeech bietet eine erweiterte Funktionalität, einschließlich der Unterstützung von Mehrkanalaufnahmen sowie verbesserten Erkennungsergebnissen. Zudem ermöglicht es unseren Enterprise-Kunden die Verarbeitung sehr langer Aufnahmen.
Mehrkanalaufnahmen sind Aufnahmen, die gleichzeitig mehrere Audiosignale von verschiedenen Quellen oder Kanälen aufzeichnen. Typischerweise sind das verschiedene Mikrofone.
Solche Aufnahmen entstehen oft in umfangreichen Sitzungsräumen, bei Musik- oder Filmproduktionen. Um Mehrkanalaufnahmen zu erstellen, benötigen Sie spezielle Hardwarekomponenten. Ein einfaches Beispiel: Mikrofone oder andere Audioquellen senden Toninformationen über Kabel an ein Audio-Interface, das mehrere Kanäle verarbeiten kann. Von dort werden die Daten an die Aufnahmesoftware auf dem Computer übertragen.
Die KI-basierte Sprechertrennung von GoSpeech funktioniert bereits sehr gut. Durch die bereits separierten Tonspuren einzelner Sprecher und die verbesserte Tonqualität können jedoch noch präzisere Sprecherzuordnungen und noch bessere Erkennungsergebnisse erzielt werden.
Achten Sie darauf, dass die einzelnen Tonspuren nicht die Gespräche anderer Teilnehmer aufzeichnen, da dies die Erkennungsergebnisse beeinträchtigen kann.
Die folgende Grafik veranschaulicht das Erkennungsergebnis, wenn die Mikrofone andere Teilnehmer im Raum aufnehmen:
Stellen Sie sicher, dass alle Mikrofone synchronisiert sind, um sicherzustellen, dass die aufgezeichneten Audiodaten zeitlich abgestimmt sind. Dies ist entscheidend, damit die Daten aus den verschiedenen Kanälen korrekt kombiniert werden können.
Durch eine Überarbeitung des Postprocessing-Verfahrens liefert GoSpeech in der neuen Version noch präzisere Erkennungsergebnisse. Sollte die Darstellung der Begriffe dennoch nicht Ihren Erwartungen entsprechen, nutzen Sie bitte die Funktion 'Andere Schreibweise vorschlagen', um uns Ihre Verbesserungsvorschläge mitzuteilen.
Mit dem neuesten Release können unsere Enterprise-Lösungen nun auch Dateien mit einer Länge von mehr als 5 Stunden transkribieren. Bitte beachten Sie, dass diese Funktion ausschließlich unseren Geschäftskunden zur Verfügung steht. Falls Sie Interesse an der Nutzung von sehr langen Dateien haben, vereinbaren Sie bitte einen unverbindlichen Beratungstermin mit uns.
Derzeit arbeiten wir intensiv an unserer GoSpeech API, um unseren Geschäftskunden die Integration von GoSpeech in ihre Bestandssysteme über eine Schnittstelle zu ermöglichen.
Möchten Sie mehr über die Einsatzmöglichkeiten und Funktionalitäten unserer API erfahren? Dann vereinbaren Sie doch einen unverbindlichen Ersttermin mit unserem Business Development Team.
Sparen Sie Zeit und lassen Sie Ihre Aufnahmen automatisch transkribieren.
Jetzt kostenlos testen!