Release 1.8.2: Mehrkanalaufnahmen

Februar 2024 |
zuletzt aktualisiert am 19. Juni 2024

Das Release 1.8.2 von GoSpeech bietet eine erweiterte Funktionalität, einschließlich der Unterstützung von Mehrkanalaufnahmen sowie verbesserten Erkennungsergebnissen. Zudem ermöglicht es unseren Enterprise-Kunden die Verarbeitung sehr langer Aufnahmen.

Mehrkanalaufnahmen

Mehrkanalaufnahmen sind Aufnahmen, die gleichzeitig mehrere Audiosignale von verschiedenen Quellen oder Kanälen aufzeichnen. Typischerweise sind das verschiedene Mikrofone.


Solche Aufnahmen entstehen oft in umfangreichen Sitzungsräumen, bei Musik- oder Filmproduktionen. Um Mehrkanalaufnahmen zu erstellen, benötigen Sie spezielle Hardwarekomponenten. Ein einfaches Beispiel: Mikrofone oder andere Audioquellen senden Toninformationen über Kabel an ein Audio-Interface, das mehrere Kanäle verarbeiten kann. Von dort werden die Daten an die Aufnahmesoftware auf dem Computer übertragen.
 

Warum unterstützt GoSpeech Mehrkanalaufnahmen?

Die KI-basierte Sprechertrennung von GoSpeech funktioniert bereits sehr gut. Durch die bereits separierten Tonspuren einzelner Sprecher und die verbesserte Tonqualität können jedoch noch präzisere Sprecherzuordnungen und noch bessere Erkennungsergebnisse erzielt werden.

Worauf sollte man bei der Verwendung der Funktion 'Mehrkanalaufnahme' achten?

Achten Sie darauf, dass die einzelnen Tonspuren nicht die Gespräche anderer Teilnehmer aufzeichnen, da dies die Erkennungsergebnisse beeinträchtigen kann.

Die folgende Grafik veranschaulicht das Erkennungsergebnis, wenn die Mikrofone andere Teilnehmer im Raum aufnehmen:

 

Stellen Sie sicher, dass alle Mikrofone synchronisiert sind, um sicherzustellen, dass die aufgezeichneten Audiodaten zeitlich abgestimmt sind. Dies ist entscheidend, damit die Daten aus den verschiedenen Kanälen korrekt kombiniert werden können.

Verbesserte Erkennung:

Durch eine Überarbeitung des Postprocessing-Verfahrens liefert GoSpeech in der neuen Version noch präzisere Erkennungsergebnisse. Sollte die Darstellung der Begriffe dennoch nicht Ihren Erwartungen entsprechen, nutzen Sie bitte die Funktion 'Andere Schreibweise vorschlagen', um uns Ihre Verbesserungsvorschläge mitzuteilen.

Erweiterung für Enterprise Lösungen:

Mit dem neuesten Release können unsere Enterprise-Lösungen nun auch Dateien mit einer Länge von mehr als 5 Stunden transkribieren. Bitte beachten Sie, dass diese Funktion ausschließlich unseren Geschäftskunden zur Verfügung steht. Falls Sie Interesse an der Nutzung von sehr langen Dateien haben, vereinbaren Sie bitte einen unverbindlichen Beratungstermin mit uns.

Unverbindlichen Beratungstermin vereinbaren

API-Integration

Derzeit arbeiten wir intensiv an unserer GoSpeech API, um unseren Geschäftskunden die Integration von GoSpeech in ihre Bestandssysteme über eine Schnittstelle zu ermöglichen.

Möchten Sie mehr über die Einsatzmöglichkeiten und Funktionalitäten unserer API erfahren? Dann vereinbaren Sie doch einen unverbindlichen Ersttermin mit unserem Business Development Team.

Beratungstermin vereinbaren