Comment bien choisir un speech to text pour son Callbot

Un outil de reconnaissance vocale (SPEECH TO TEXT) ou TTS est une application qui utilise des algorithmes de reconnaissance vocale. Cela permet d’identifier le language et le retranscrire en texte dans la langue du locuteu. Voici une liste détaillée des meilleurs logiciels de reconnaissance vocale et vocale. Grâce à La reconnaissance vocale des logiciels basée sur l’intelligence artificielle et des réseaux de neurones cela permet de traduire des phrases vocales au format texte avec une précision qui s’approche des 95% voir plus. Grâce à certains TTS les utilisateurs ont la possibilité de transcrire des conversation vocales de manière efficace en temps réel. Par ailleurs,

Les utilisateurs n’ont qu’à dicter les notes et le texte apparaît sur l’écran avec une grande précision. On peut les envoyer directement vers un robot qui va analyser le texte pour le comprendre afin de pouvoir exécuter des actions en temps réel. Il faut savoir que la retranscription d’un flux audio va dépendre de la qualité sonore de l’enregistrement et du bruit ambiant. Une personne en voiture ou dans un environnement plus bruyant peut altérer la compréhension des mots. La compressions du flux audio est à 8Khz ce qui va dégrader la qualité de la voix. Cependant en important des listes de mots clés spécifique lié à un corpus métier car cela permet d’améliorer la compréhension globale. les Apis du traitement de la parole s’améliorent d’années en année

Comment cela fonctionne ?

Le fonctionne du processus de transcription vocal est théoriquement assez facile. En réalité c’est déjà beaucoup plus compliqué à mettre en oeuvre. Le logiciel commence par transformer le texte en une suite de phonèmes qui permettent de définir les sons qui sont associés aux phrases dicées. Ceci se fait via la connaissance orthographique des mots mais aussi du sens de la grammaire. Le logiciel doit pouvoir faire la différence entre les mots, des verbes, de sujets pour avoir une idée de leur prononciation. Le logiciel va ensuite établir intonation, rythme et l’intensité à donner à la lecture en ajoutant des virgules et des points.

Grâce à la voix il est possible de détecter d’autres informations que le texte. Cela permet d’analyser un discours audio afin d’en extraire des informations telles que le sexe, l’âge, les émotions du locuteur, etc. Et grâce au Speech Diarization: cela permet d’identifier et de différencier les différents locuteurs parlant dans le même audio. On différencie des accents, des spécificités, des fréquences vocales. Nous avons sélectionné certains fournisseurs que nous avons testés pour notre robot et les résultats sont variables en fonction des usescases.

Liste non exhaustive des moteurs STT

AWS Transcribe API
Bertin
Nuance
allomedia
Kaldi
Microsoft Azure Services
IBM Watson
Rev.ai
Assembly AI
Deepgramm
Otter
Le Voicelab
Authot
Linagora
Google Cloud Platform

Que faut il retenir pour choisir efficacement un bon STT


Les STT ne sont pas équivalents en fonction des uses cases et répondent plus ou moins bien et il est parfois utile d’utiliser deux api en fonction des phrases à tester. Le tarif est aussi à prendre en compte car les tarifs sont variables. Le temps pour entrainer les phrases peut avoir un impact aussi. Un point essentiel concerne la privacy : Certaines données peuvent être envoyées en dehors de Europe et certains projets sont parfois restreint sur une zone géographique et ne fonctionnent pas on premise.

Notre conseil : Commencer par une solution généraliste puis ensuite, choisir une solution plus spécifique. En fonction du projet et vérifier que celle-ci est compatible avec la problématique du client. Les solutions Open sources nous paraissent les moins cher pour des gros volumes mais demandent de l’entrainement

comment remplacer votre SVi avec un callbot

Gérez dynamiquement des réponses avec un assistant virtuel pour remplacer votre SVi

Proposer à vos clients de résoudre eux-mêmes leur panne sans wiki ! Grâce à l’arbre de réponses automatique et le chatbot

Seriez-vous prêt à vous laisser guider pour trouver une réponse

ETRE GUIDÉ VERS LA RÉPONSE EN RÉPONDANT À UN CIRCUIT DE QUESTIONS OUVERTES ET FERMÉES

tache attribuée au service concerné

Partagez des connaissances entre collaborateurs et clients grâce au callbot. Votre service hotline est souvent confronté à des questions redondantes des clients. Celles-ci génèrent des tâches en interne afin de résoudre les problématiques de chacun. L’arbre de questions va permettre de résoudre tout type de demande à une personne qui ne maitrise pas le domaine. Il lui suffira de suivre le protocole qui permet de résoudre le problème. Le chatbot / callbot est l’assistant idéal qui améliore vos Foires aux questions et améliore les interactions avec vos usagers qui utilisent vos services

Anticipez les appels, proposez des réponses pré-formatées accessibles sur mobile avant que vos services soient contactés

Vos clients déposent des demandes et des réclamations s’ils n’ont pas trouvé de réponse. Raccourcissez vos protocoles pour éviter des coûts de traitement de demandes répétitives et de maintenance de vos produits.

Construisez vos arbres de questions avec un assistant

Construisez un arbre de décisions qui permet d’identifier les pannes et les résolutions de problème grâce à des bots enrichi

  • Insertions de champs Textes
  • Insertions de champs images, vidéos, pdf

Eliminez les risques d’erreur en mettant des protocoles en place de vérification

Développez des parcours logiques pour trouver une réponse adaptée aux utilisateurs de vos services

  • Identifier et gérer mieux vos flux
  • Modifier votre workflow avec les autres équipes

quelles sont les méthodes pour améliorer la compréhension des bots

Vous avez peut-être réussi à créer un petit pilote de chatbot ou de callbot ? Mais en essayant de le l’améliorer au fur et à mesure, vous vous êtes rendu compte qu’il ne répondait plus bien sur certaines de vos questions. Vous avez peut-être testé un chatbot en production ? La satisfaction de vos clients n’est pas aussi grande que vous l’espériez ? Votre bot a du mal à comprendre vos utilisateurs et vous ne savez pas comment l’améliorer ?

Comment comprendre le language naturel grâce au NLP

L’outil de Kwalys permet de palier à cette grande difficulté que l’on rencontre sur beaucoup de plateforme. Lorsqu’un humain s’exprime en language naturel il faut donc pouvoir générer les utterances pour bien comprendre l’utilisateur. Alors comment améliorer sensiblement l’ensemble des réponses ? L’astuce est de se mettre à la place des utilisateurs finaux et de pouvoir tester les phrases de manière différentes afin de vérifier que l’ensemble fonctionne bien. La seconde méthode est d’aller piocher dans des FAQ. L’ensemble des corpus de questions réponses afin de délimiter le usecase le plus rapidement possible

Kwalys analyse et compare les datas de votre bot en visualisant et en comprenant où il fonctionne et où il ne fonctionne pas. Grâce à ces informations et ces jeux de données, vous pouvez ensuite prendre des décisions éclairées sur la manière dont vous améliorez les performances de votre bot. Kwalys s’appuie sur les techniques de validation des jeux de données et des intentions et entités qui doivent être améliorées. Avec vos données et vos questions, vous pouvez choisir entre deux types de tests ; les tests avec des jeux de questions sur des corpus métiers identifiés. Des tests plus élargis pour savoir ou placer le curseur

Améliorer les réponses avec des itérations en continue

Kwalys utilise des techniques classique de validation croisée. On intègre des méthodologies de type K-fold et leave-one-out. Notre expérience montre que le sur apprentissage nuit à la qualité des réponses d’où l’intérêt de pouvoir tester en permanence la façon dont les utilisateurs s’expriment. Notre panel de beta testeurs teste le robot en permanence. Ils dénichent les phrases qu’il faut améliorer à chaque itération via un apprentissage non linéaire. En observant la façon dont le robot s’exprime. cela en général de pouvoir récolter entre 30 et 100 intensions sur un thème. Au bout de quelques jours et de dépasser un taux de compréhension de la parole au delà de 90%. Cela aura un impact positif sur votre robot.

La puissance des outils de machine learning et de deep Learning (GPT3) montrent une progression importante dans la manière ou les robots s’améliorent et Il est fort à parier que dans le futur toutes ses phases d’apprentissages seront totalement écourtées.

TALKR IA Conversationnal IA agents