La seconde vague conversationnelle

Le texte est 100% écrit par un humain (KL talkr.ai)

L’image est 100% générée par une IA (dreamstudio.ai)

C’est sans équivoque : Parler est 6 fois plus rapide qu’écrire !

Les usages tendent vers une facilitation de l’interaction. Mais échanger en langage naturel ne suffit pas, il faut aussi que votre Assistant soit capable de parler. La conversation orale va l’emporter à la conversation écrite puisqu’elle est tout simplement plus rapide et plus facile pour l’humain.

Les nouvelles générations l’ont déjà prouvé et contournent les usages : elles utilisent des message vocaux dans les applis chat …Pourquoi s’embêter de taper quand on peut s’exprimer à la voix?!

La rapidité et la facilité d’échange font des Assistants vocaux les stars de demain (pour certains c’est même aujourd’hui). Les interactions avec les humains, lorsqu’elles sont fluides et maîtrisées, représentent un énorme atout dans le parcours utilisateur et offrent aux organisations un outil performant capable d’amener les métiers à un niveau supérieur dans la communication avec les clients.

Quels sont les canaux voix pour les assistants ? 

Il existe 3 types d’Assistants vocaux en fonction du canal sur lequel l’Assistant va opérer.

-Assistant vocal connecté au canal téléphonique => CallBot
Ce dernier est le plus complexe car la conversation va passer par le canal telecom.

-Assistant vocal sur les canaux Web => VoiceBot 

Ici les devicse utilisés sont l’ordinateur ou le téléphone, mais l’assistant est un applicatif Web: sur un site web, une application, un réseau social.

-Assistant vocal connecté à un objet connecté IoT (voiture, frigo, etc.), ici on classifie également les assistants intégrés dans les enseinte connectée (Alexa, Google Home) => VoiceBot

La conversation va également passer par le web.

Quelles sont les briques technologiques pour concevoir et faire parler un Assistant vocal? 

Nous distinguons 3 briques principales indispensable pour la bon déroulement d’une conversation avec un assistant vocal:

-Brique de Compréhension de la Parole (Speech to Text)

-Brique de Compréhension et du traitement du langage (NLP/NLU, LLM, SLM)

-Brique de vocalisation du texte (Text to Speech) Ce sont les voix que vous entendez lors des conversations avec un robot. 

En revanche, la combinaison de ces trois éléments fait que vous allez tomber sur des Assistants plus ou moins bons, plus ou moins performants!

Il est primordial que chacune de ces briques soit la meilleure possible et apporte sa contribution, mais il est d’autant plus crucial que les trois fonctionnent d’une manière synchronisée ensemble . 

Quelle est la place de l’IA générative pour les Assistants vocaux? 

L’IA générative apporte beaucoup de progrès sur les trois briques technologiques précédemment citées. Les Assistants vocaux de nouvelle génération sont plus naturels aussi bien dans la conversation que dans la voix. 

Filière de la Voix en France & Europe 

L’association @Le Voice Lab, co-fondée par TALKR et 30 autres acteurs privés et académiques, a pour objectif de construire la filière de la voix.

Le Voice Lab est une association française qui regroupe différents acteurs institutionnels (universités, laboratoires de recherche…) et des entreprises privées dont l’intérêt commun est de constituer un écosystème indépendant et des standards communs pour permettre à la France et l’Europe de rester compétitives sur le marché de la voix au niveau mondial. Il s’agit également de répondre aux enjeux stratégiques des grands groupes et des États qui ne sont pas compatibles avec l’utilisation de solutions américaines ou chinoises.

Pour conclure : Passez dès aujourd’hui aux Assistants vocaux afin d’anticiper les usages de vos clients et faciliter la vie de vos équipes ! 

RDV le 14/12/23 pour le #4 de la “Deuxième vague conversationnelle”. 

Critères à prendre en compte pour mettre en place des LLMs

Conformité Légale et Règlementaire: La solution LLM  respecte-t-elle les exigences du RGPD et d’autres lois sur la protection des données, en tenant compte du contexte géopolitique tel que le Cloud Act, les embargos, et les risques d’espionnage industriel?

Réponse : Il est crucial que la solution garantisse la conformité légale, en particulier en matière de protection des données. Une évaluation approfondie du contexte géopolitique est nécessaire pour minimiser les risques liés aux lois extraterritoriales.

Sécurité des Données:  Quelles mesures de sécurité sont en place pour assurer la protection des données sensibles et données personnelles?

Réponse : La sécurité des données est primordiale. Des protocoles robustes, tels que le chiffrement, l’authentification forte, et la gestion des accès, doivent être mis en œuvre pour minimiser les risques de violation de données. il faut anonymiser les données avant de les envoyer.

Intégration avec l’Infrastructure Existantes: Comment la solution s’intègre-t-elle au sein du système d’information existant, notamment en termes d’API et de compatibilité avec le cloud?

Réponse : Une intégration transparente est essentielle pour maximiser l’efficacité opérationnelle. Des interfaces flexibles et une compatibilité avec les infrastructures existantes simplifient la mise en place de la solution.

Scalabilité: Dans quelle mesure la solution peut-elle évoluer pour répondre à des besoins croissants?

Réponse : La capacité de la solution à évoluer avec les besoins de l’entreprise est cruciale. Une scalabilité efficace garantit une utilisation optimale des ressources et une adaptation aux changements de charge. Le volet RSE est a prendre en compte dans une démarche éco-responsable

Coût Total de Possession:  Quels sont les coûts initiaux, de maintenance, de traitement, et d’évolution associés à la solution?

Réponse : Une évaluation exhaustive des coûts, y compris les coûts cachés, est nécessaire. Une transparence sur les dépenses permet de planifier efficacement le budget.

Performance et Vitesse de Traitement: Quelles sont les performances en termes de traitement de la solution?

Réponse: Des performances élevées sont essentielles pour garantir des réponses rapides. Une analyse approfondie de la vitesse de traitement contribue à évaluer l’efficacité opérationnelle.

Qualité et Fiabilité des Résultats:  Quelle est la précision et la fiabilité des résultats? Existe-t-il des mécanismes pour détecter les erreurs ou les réponses inexactes?

Réponse : Une précision élevée est cruciale. La mise en place de mécanismes de détection d’erreurs renforce la confiance dans les résultats générés par la solution.

Facilité d’Utilisation et Interface Utilisateur:  Quel est le niveau de complexité de l’interface utilisateur de la solution?

Réponse : Une interface conviviale favorise l’adoption de la solution. La simplicité d’utilisation réduit les obstacles à son déploiement. Le NO-Code est l’avenir de toutes les solutions technologiques.

Support:  Quelle est la disponibilité et la qualité du support technique?

Réponse : Un support technique réactif et de qualité est essentiel pour résoudre rapidement les problèmes. Il contribue à maintenir la continuité des opérations.

Formation: Quelles sont les modalités de formation disponibles pour la solution?

Réponse : Des programmes de formation complets favorisent une utilisation efficace de la solution. Ils sont essentiels pour maximiser les compétences des utilisateurs.

Accompagnement:  Quels services d’accompagnement sont proposés pour l’installation et le déploiement de la solution?

Réponse : Un accompagnement adapté facilite l’implémentation. Des services d’assistance personnalisés sont bénéfiques pour garantir une transition sans heurts.

Interopérabilité avec d’Autres Systèmes : Quelle est la facilité de connecter et d’échanger des données avec d’autres systèmes?

Réponse : Une interopérabilité efficace permet une collaboration transparente avec d’autres systèmes, améliorant ainsi l’efficacité globale du SI.

Mises à Jour et Évolution du Produit:  Quelle est la fréquence et la qualité des mises à jour de la solution?

Réponse : Des mises à jour régulières assurent la sécurité, la performance, et l’adaptabilité continue de la solution aux besoins changeants. Il faut prévoir des mécanismes de dédoublement quand le modèle doit être partiellement remis à jour

Capacité de Stockage et Gestion des Données:  Quelle quantité de données la solution est-elle capable de gérer, notamment en termes de nombre de tokens?

Réponse : Une capacité de stockage adéquate est essentielle pour gérer efficacement les données. La prise en compte du nombre de tokens est importante pour évaluer la pertinence du traitement.

Durabilité et Considérations Écologiques: : Quel est l’impact environnemental de la solution en termes énergétiques et de consommation d’eau?

Réponse : Une évaluation environnementale est cruciale. Une solution éco-responsable minimise son empreinte écologique, renforçant ainsi la durabilité de son utilisation. L’utilisation de Carbone.io peut être considéré comme un début d’une démarche RSE long terme.

Périmètre de validité: Reformulation: Quel est le périmètre d’application de la solution, et quels étaient les objectifs principaux à l’origine de son développement?

Réponse critique: Comprendre le périmètre d’application permet d’évaluer si la solution répond aux besoins spécifiques de l’entreprise. Les objectifs initiaux guident la pertinence de la solution par rapport aux attentes.

Multimodalité: Reformulation: Les solutions sont-elles capables de traiter des formats autres que le texte?

Réponse critique: La prise en charge de la multimodalité accroît la polyvalence de la solution. Elle permet de traiter efficacement divers formats de données, dépassant les limites du texte.

Plan de Continuité d’Activité et de Secours: Reformulation: Quels sont les plans en place en cas de panne ou de problème majeur, assurant la continuité des opérations?

Réponse critique: Des plans de continuité d’activité robustes minimisent l’impact des pannes. Ils garantissent une reprise rapide et efficace des opérations en cas d’incident majeur.