Cela fait 20 ans que je me consacre à la reconnaissance vocale, dans le passé principalement pour la dictée professionnelle. La reconnaissance vocale dans le domaine de la documentation fonctionne un peu différemment, car on y parle déjà à l'écrit. Les signes de ponctuation et les paragraphes sont également dictés et le logiciel vocal est entraîné en conséquence pour une reconnaissance optimale.
Avec le développement de l'intelligence artificielle, de nouvelles opportunités se sont présentées ces dernières années, à savoir l'utilisation de la reconnaissance vocale basée sur l'IA dans d'autres domaines également. Pour les journalistes travaillant beaucoup avec des interviews ou des podcastspour l'administration publique ou les entreprises où de nombreuses réunions et séances sont consignées. C'est ainsi qu'est née l'idée de développer une plateforme capable de transcrire automatiquement en texte les enregistrements et les prises de son de parole ordinaire.
En tant que responsable de la gestion des produits, je suis à la fois responsable du projet et de l'équipe qui gravite autour du projet. GoSpeech était un projet très vaste, que nous avons développé partiellement en ligne, en coopération avec une équipe internationale. Mon domaine d'activité est très étendu, rien que le développement du produit est très coûteux. Il faut des fournisseurs pour des technologies spécifiques. Quels sont les partenaires appropriés ? Comment pouvons-nous lancer le produit sur le marché ? Nouer des contacts, élaborer des business plans et procéder à de nombreuses coordinations font partie intégrante du travail.
Regardons d'abord ce que l'intelligence artificielle est capable de réaliser aujourd'hui, par exemple la reconnaissance vocale de GoSpeech. Il s'agit ici de ce que l'on appelle la reconnaissance de formes, c'est-à-dire qu'un signal audio doit être reconnu de telle sorte qu'il soit converti en texte ou interprété comme une commande. Selon le cas, j'obtiens la phrase "quel temps fera-t-il demain ?" (reconnaissance vocale) ou les prévisions météorologiques me sont indiquées (commande vocale). L'intelligence artificielle va continuer à se développer dans le domaine de la parole au cours des prochaines années. Il existe déjà des projets permettant de générer automatiquement de nouveaux textes à l'aide de l'intelligence artificielle, et on est en train d'entraîner l'intelligence artificielle de manière à ce qu'elle puisse reconnaître les points les plus importants d'un texte et en faire un résumé. En d'autres termes, l'IA apprend à interpréter. Et c'est cette direction qu'elle va prendre.
Dans 10 ou 20 ans, l'IA sera probablement capable d'interpréter non seulement le langage, mais aussi les mouvements et les émotions, et nous nous dirigerons alors vers un homme de verre.
Bien sûr, les applications basées sur l'IA telles qu'Alexa, Siri ou le système de navigation dans la voiture sont très pratiques au quotidien, mais d'un autre côté, de tels modèles d'IA nécessitent également des quantités incroyables de données qui sont collectées et bien sûr exploitées commercialement. Qu'adviendra-t-il de ces données ?
Chez Grundig Business Systems, et donc aussi chez GoSpeech, la sécurité des données est garantie. Les données restent sur nos serveurs, elles ne sont ni utilisées à d'autres fins, ni transmises, ni analysées. Il en va de même pour nos fournisseurs de technologie avec lesquels nous avons collaboré pour le développement de GoSpeech.
D'une part, la correction automatisée, la relecture automatique des transcriptions. Un autre domaine concerne le développement d'interfaces permettant d'utiliser d'autres systèmes avec la technologie vocale de GoSpeech. L'indexation automatique d'archives médiatiques via la reconnaissance vocale en vue d'une recherche ultérieure ou d'une utilisation comme source est également passionnante, ce qui n'était jusqu'à présent possible que sur la base de protocoles établis manuellement et parfois très incomplets.
Le développement de GoSpeech se fonde fortement sur les exigences des utilisateurs.
J'essaie effectivement d'éteindre mes ordinateurs de temps en temps et de me plonger dans la vie concrète - le jardinage, l'escalade, la plongée, ma famille. J'ai trois enfants qui me tiennent en haleine, au sens propre du terme. Ce n'est que récemment que j'ai construit avec ma fille une nouvelle écurie pour ses chevaux.
Vous êtes intéressé par notre logiciel de transcription ? Apprenez-en plus sur les avantages ou profitez tout de suite de la possibilité d'essayer GoSpeech gratuitement !