La seconde vague conversationnelle

Le texte est 100% écrit par un humain (KL talkr.ai)

L’image est 100% générée par une IA (dreamstudio.ai)

C’est sans équivoque : Parler est 6 fois plus rapide qu’écrire !

Les usages tendent vers une facilitation de l’interaction. Mais échanger en langage naturel ne suffit pas, il faut aussi que votre Assistant soit capable de parler. La conversation orale va l’emporter à la conversation écrite puisqu’elle est tout simplement plus rapide et plus facile pour l’humain.

Les nouvelles générations l’ont déjà prouvé et contournent les usages : elles utilisent des message vocaux dans les applis chat …Pourquoi s’embêter de taper quand on peut s’exprimer à la voix?!

La rapidité et la facilité d’échange font des Assistants vocaux les stars de demain (pour certains c’est même aujourd’hui). Les interactions avec les humains, lorsqu’elles sont fluides et maîtrisées, représentent un énorme atout dans le parcours utilisateur et offrent aux organisations un outil performant capable d’amener les métiers à un niveau supérieur dans la communication avec les clients.

Quels sont les canaux voix pour les assistants ? 

Il existe 3 types d’Assistants vocaux en fonction du canal sur lequel l’Assistant va opérer.

-Assistant vocal connecté au canal téléphonique => CallBot
Ce dernier est le plus complexe car la conversation va passer par le canal telecom.

-Assistant vocal sur les canaux Web => VoiceBot 

Ici les devicse utilisés sont l’ordinateur ou le téléphone, mais l’assistant est un applicatif Web: sur un site web, une application, un réseau social.

-Assistant vocal connecté à un objet connecté IoT (voiture, frigo, etc.), ici on classifie également les assistants intégrés dans les enseinte connectée (Alexa, Google Home) => VoiceBot

La conversation va également passer par le web.

Quelles sont les briques technologiques pour concevoir et faire parler un Assistant vocal? 

Nous distinguons 3 briques principales indispensable pour la bon déroulement d’une conversation avec un assistant vocal:

-Brique de Compréhension de la Parole (Speech to Text)

-Brique de Compréhension et du traitement du langage (NLP/NLU, LLM, SLM)

-Brique de vocalisation du texte (Text to Speech) Ce sont les voix que vous entendez lors des conversations avec un robot. 

En revanche, la combinaison de ces trois éléments fait que vous allez tomber sur des Assistants plus ou moins bons, plus ou moins performants!

Il est primordial que chacune de ces briques soit la meilleure possible et apporte sa contribution, mais il est d’autant plus crucial que les trois fonctionnent d’une manière synchronisée ensemble . 

Quelle est la place de l’IA générative pour les Assistants vocaux? 

L’IA générative apporte beaucoup de progrès sur les trois briques technologiques précédemment citées. Les Assistants vocaux de nouvelle génération sont plus naturels aussi bien dans la conversation que dans la voix. 

Filière de la Voix en France & Europe 

L’association @Le Voice Lab, co-fondée par TALKR et 30 autres acteurs privés et académiques, a pour objectif de construire la filière de la voix.

Le Voice Lab est une association française qui regroupe différents acteurs institutionnels (universités, laboratoires de recherche…) et des entreprises privées dont l’intérêt commun est de constituer un écosystème indépendant et des standards communs pour permettre à la France et l’Europe de rester compétitives sur le marché de la voix au niveau mondial. Il s’agit également de répondre aux enjeux stratégiques des grands groupes et des États qui ne sont pas compatibles avec l’utilisation de solutions américaines ou chinoises.

Pour conclure : Passez dès aujourd’hui aux Assistants vocaux afin d’anticiper les usages de vos clients et faciliter la vie de vos équipes ! 

RDV le 14/12/23 pour le #4 de la “Deuxième vague conversationnelle”.