Comment améliorer la détection des voix de synthèse

En tant que société de création de bot, TALKR se doit de préserver les voix des appelants et d’imaginer la protection de la vie privée des personnes qui intéragissent avec le bot. Notre objectif : Mettre en lumière l’impact croissant que la technologie deepfake vocal dans certains domaines comme les élections, les faux appels de banques et proposer des solutions innovantes pour contrer cette menace émergente : Le spam Vocal indésirable et le démarchage abusif par téléphone. dailleurs la plateforme 33700 permet de lutter contre ce nouveau type d’appels intrusifs. (l’association AF2M est aussi impliquée dans cette démarche).

L’une des principales préoccupations soulevées de TALKR est de voir qu’il devient possible de frauder des voix afin de véhiculer des messages de type « Arnaque à la voix ».  l’utilisation malveillante de la technologie de clonage vocal permet de créer des enregistrements audio de haute qualité de personnes, souvent à leur insu, et de les utiliser à des fins de manipulation et de désinformation. Face au défi des pincalls, notre équipe chez TALKR a développé des solutions révolutionnaires pour lutter contre les deepfakes audio :

  1. Watermarker : Notre solution devra dans le futur utiliser un « filigrane invisible » qui s’attaque à l’utilisation malveillante des voix générées par l’IA en incorporant une fréquence inaudible dans les enregistrements audio et les Spams mobiles. Des recherches approfondies soutiennent l’efficacité de notre filigrane, permettant la traçabilité des données et renforçant ainsi la confiance dans l’authenticité des enregistrements. Les Speech to text (TTS) doivent se doter d’intelligence artificielle pour détecter des fausses voix mais surtout devront détecter les discours inadéquat des vendeurs virtuels peu scrupuleux.

  2. Vérification avec la biométrie vocale: Grâce au modèle avancé d’IA de détection des deepfakes proposé par Whispeack, nous offrons une précision de 98 % dans l’exposition des enregistrements audio deepfake surtout en cas de message douteux avec une voix fournie par les LLMs. Cette technologie de pointe permet de détecter rapidement les manipulations audio et de les signaler aux autorités compétentes. En effet, si une personne appelle sa banque, notre robot doit pouvoir vérifier qu’il s’agit bien d’un humain et non d’une machine qui tente de se faire passer pour un humain.

  3. Outils de détection gratuits : Pour renforcer la transparence et la lutte contre la désinformation, certaines entreprises mettent à disposition des outils gratuits comme les « Deepfake Detector », permettant de vérifier rapidement l’authenticité des contenus audio largement diffusés. Ces outils permettent aux utilisateurs de s’assurer de la véracité des informations avant de les utiliser, contribuant ainsi à limiter la propagation de fausses nouvelles.

  4. Détection en temps réel pour Google Meet et Teams : Anticipant les nouvelles formes de menaces, certaines sociétés développent des solutions de détection des deepfakes en temps réel pour les plateformes de visioconférence telles que Google Meet, kizwork, Zoom et Teams. Cette fonctionnalité permet aux utilisateurs d’avoir un aperçu immédiat de l’authenticité des enregistrements audio, protégeant ainsi les conversations contre les tentatives d’espionnage et de manipulation.

Nous sommes conscients que la technologie deepfake représente un défi sans précédent pour la démocratie et la sécurité nationale. Chez TALKR, nous sommes déterminés à faire progresser la lutte contre cette menace en collaborant étroitement avec les secteurs privé et public. Nous croyons fermement que l’innovation doit être utilisée de manière responsable et éthique, et nous sommes prêts à jouer un rôle actif dans la protection de l’intégrité des données et de la société dans son ensemble.

TALKR