in

Les gens sont vraiment mauvais pour repérer les voix Deepfake générées par l'AI-AI

Les gens sont vraiment mauvais pour repérer les voix Deepfake générées par l'AI-AI

Les tests montrent que lorsque les gens entendent des enregistrements de vraies voix et de création de l'AI, ils ne parviennent à repérer pas les contrefaçons – soulevant des inquiétudes concernant les escroqueries impliquant des voix contrefaites

Les gens sont vraiment mauvais pour repérer les voix Deepfake générées par l'AI-AI

Il est difficile de distinguer les vraies voix des régions générées par l'AI

Les gens ne peuvent plus distinguer de manière fiable l'IA et les voix humaines, sauf dans des exemples de discours de style conversationnel ou avec des voix familières, telles que celles des amis ou de la famille.

La reproduction de voix humaines utilisant l'intelligence artificielle est depuis longtemps un objectif de recherche, par exemple pour aider les personnes qui perdent la capacité de parler, mais jusqu'à récemment, les gens ont surtout pu reconnaître une voix générée par l'AI. En 2023, les chercheurs ont constaté que les orateurs anglais et mandarin pouvaient faire la différence entre les voix réelles et profondes d'environ 70% du temps.

Mais Hany Farid à l'Université de Californie à Berkeley et ses collègues ont montré que les meilleurs générateurs de voix d'IA sont maintenant beaucoup plus difficiles à repérer. Les résultats renforceront les craintes du risque d'escroqueries impliquant de fausses voix.

«Vous pensez que vous êtes bon (faire la différence), mais vous ne l'êtes pas», explique Farid. «Je ne peux pas vous dire combien de personnes à qui je parle qui me disent:« Je peux faire la différence entre l'IA ou non, c'est vraiment facile. Vous vous trompez.

Farid et son équipe ont utilisé le logiciel de clonage vocal de la société AI ElevenLabs pour reproduire un ensemble de données de vraies voix humaines de 220 anglophones des États-Unis. Ils comprenaient des personnes de races et de genres différentes, répondant chacune à 32 invites différentes, allant des réponses à une seule phrase d'environ une seconde à des réponses plus longues et non scénarisées de près d'une minute.

Ensuite, plus de 600 personnes ont écouté différentes paires de vraies voix et de voix d'IA similaires, sans qu'on leur dise que l'IA était impliquée, avant de se demander si elles pouvaient dire si deux voix provenaient de la même source. Les participants pensaient qu'une vraie voix et une voix clonée générée par l'AI étaient les mêmes environ 80% du temps.

Lorsque les chercheurs ont demandé aux gens de deviner si une voix était réelle ou générée par l'AI, les volontaires ont répondu correctement environ 60% du temps, ou juste au-dessus du hasard. Cependant, les gens étaient meilleurs pour repérer une voix d'IA lorsque l'échantillon de la parole était plus long ou moins scénarisé par rapport aux réponses de lecture plus courtes.

«Nous sommes maintenant à un moment où il y a des voix de profondeur à la pointe de la technologie qui sont suffisamment humaines dans leurs qualités pour être (indiscernables) des véritables enregistrements humains», explique Carolyn McGettigan à l'University College de Londres.

Dans une étude séparée, McGettigan et ses collègues ont également constaté que les gens avaient du mal à faire la différence entre l'IA et les voix humaines, faisant à peu près ainsi qu'une supposition aléatoire. Cependant, lors de l'écoute d'une voix qu'ils connaissaient bien, comme celle d'un membre de la famille, ils étaient bien meilleurs pour détecter Deepfakes.

Les fausses voix sont susceptibles d'être encore plus difficiles à détecter dans des situations réelles par rapport au cadre contrôlé d'une expérience, explique Farid. « C'est la meilleure situation possible. Ils sont assis à la maison, ils savent qu'ils gèrent une expérience, ils font attention, ils sont payés pour leur temps. Ce n'est pas un appel effréné à 2 heures du matin. »

Bien qu'il existe des outils statistiques et des détecteurs alimentés par l'IA qui peuvent aider à identifier une voix d'IA à partir d'un enregistrement, cela est beaucoup plus difficile à faire avec une voix vivante, donc la meilleure protection contre les escroqueries par voix d'IA est de s'entendre sur un mot de passe avec vos amis et votre famille, explique Farid. «Votre famille devrait avoir un mot de passe secret, et lorsque quelqu'un appelle, vous leur demandez quel est le mot de passe.»

Les simulations révèlent une formation microscopique sur les points chauds dans des explosifs élevés

Les simulations révèlent une formation microscopique sur les points chauds dans des explosifs élevés

Une méthode élégante pour la détection de tours simples en utilisant une photovoltalité

Une méthode élégante pour la détection de tours simples en utilisant une photovoltalité