in

Le grand truc de la voix : est-ce une intelligence artificielle ou est-ce réel ?

SciTechDaily

De nouvelles recherches révèlent que même si les gens ont du mal à faire la distinction entre les voix humaines et celles générées par l’IA, leurs réponses cérébrales diffèrent considérablement.

Les gens supposent que les voix joyeuses sont réelles et que les voix « neutres » sont l’IA.

La recherche montre que les gens ont du mal à identifier l’IA à partir des voix humaines, mais que leurs activités cérébrales diffèrent, ce qui suggère des réponses uniques à chaque type de voix, ce qui a des implications significatives pour la technologie et l’éthique.

Reconnaissance vocale IA

Les gens ne savent pas très bien faire la distinction entre les voix humaines et les voix générées par intelligence artificielle (IA), mais notre cerveau réagit différemment aux voix humaines et à celles de l’IA. C’est ce que révèle une étude qui sera présentée le 25 juin lors du forum 2024 de la Fédération européenne des sociétés de neurosciences (FENS).(1)

L'étude a été présentée par la doctorante Christine Skjegstad et réalisée par Mme Skjegstad et le professeur Sascha Frühholz, tous deux du Département de psychologie de l'Université Université d'Oslo (UiO), Norvège.

Spectrogrammes vocaux humains et IA

Spectrogrammes pour démontrer la similitude entre les voix humaines et celles de l'IA. Crédit : Forum FENS / Christine Skjegstad

Avancées et défis de la technologie vocale IA

Mme Skjegstad a déclaré : « Nous savons déjà que les voix générées par l’IA sont devenues si avancées qu’elles sont presque impossibles à distinguer des vraies voix humaines. Il est désormais possible de cloner la voix d'une personne à partir de quelques secondes d'enregistrement seulement, et des escrocs ont utilisé cette technologie pour imiter un proche en détresse et inciter les victimes à transférer de l'argent. Alors que apprentissage automatique Les experts ont développé des solutions technologiques pour détecter les voix de l'IA, mais on en sait beaucoup moins sur la réponse du cerveau humain à ces voix.

La recherche a impliqué 43 personnes à qui il a été demandé d'écouter des voix humaines et générées par l'IA exprimant cinq émotions différentes : neutre, colère, peur, joie, plaisir.(2) Il leur a été demandé d'identifier les voix comme étant synthétiques ou naturelles tandis que leur cerveau était étudié par imagerie par résonance magnétique fonctionnelle (IRMf). L’IRMf est utilisée pour détecter les modifications du flux sanguin dans le cerveau, indiquant quelles parties du cerveau sont actives. Il a également été demandé aux participants d'évaluer les caractéristiques des voix qu'ils ont entendues en termes de naturel, de fiabilité et d'authenticité.

Christine Skjegstad

Chercheuse Christine Skjegstad. Crédit : Forum FENS / Christine Skjegstad

Performance des participants dans l'identification vocale

Les participants ont identifié correctement les voix humaines seulement 56 % du temps et les voix artificielles 50,5 % du temps, ce qui signifie qu’ils étaient tout aussi mauvais pour identifier les deux types de voix.

Les gens étaient plus susceptibles d'identifier correctement une voix d'IA « neutre » comme étant de l'IA (75 % contre 23 % qui pouvaient correctement identifier une voix humaine neutre comme étant humaine), ce qui suggère que les gens supposent que les voix neutres ressemblent davantage à de l'IA. Les voix féminines neutres en IA ont été identifiées correctement plus souvent que les voix masculines neutres en IA. Pour les voix humaines heureuses, le taux d’identification correcte était de 78 %, contre seulement 32 % pour les voix heureuses de l’IA, ce qui suggère que les gens associent le bonheur à un sentiment plus humain.

Les voix neutres de l’IA et des humains étaient perçues comme les moins naturelles, les moins fiables et les plus authentiques, tandis que les voix humaines heureuses étaient perçues comme les plus naturelles, les plus fiables et les plus authentiques.

Différences de réponse cérébrale aux voix humaines et à celles de l'IA

Cependant, en examinant l’imagerie cérébrale, les chercheurs ont découvert que les voix humaines provoquaient des réponses plus fortes dans les zones du cerveau associées à la mémoire (hippocampe droit) et à l’empathie (gyrus frontal inférieur droit). Les voix de l’IA ont suscité des réponses plus fortes dans les domaines liés à la détection des erreurs (cortex cingulaire moyen antérieur droit) et à la régulation de l’attention (cortex préfrontal dorsolatéral droit).

Mme Skjegstad a déclaré : « Mes recherches indiquent que nous ne sommes pas très précis pour identifier si une voix est humaine ou générée par l'IA. Les participants ont également souvent exprimé combien il leur était difficile de faire la différence entre les voix. Cela suggère que la technologie vocale actuelle de l’IA peut imiter les voix humaines à un point tel qu’il est difficile pour les gens de les distinguer de manière fiable.

« Les résultats indiquent également un biais de perception selon lequel les voix neutres étaient plus susceptibles d’être identifiées comme générées par l’IA et les voix heureuses étaient plus susceptibles d’être identifiées comme plus humaines, qu’elles soient réellement ou non. C’était particulièrement le cas pour les voix féminines neutres de l’IA, peut-être parce que nous sommes familiers avec les assistants vocaux féminins tels que Siri et Alexa.

« Bien que nous ne soyons pas très doués pour identifier les voix humaines des voix de l'IA, il semble y avoir une différence dans la réponse du cerveau. Les voix de l’IA peuvent susciter une vigilance accrue, tandis que les voix humaines peuvent susciter un sentiment de relation.

Les chercheurs envisagent désormais d’étudier si les traits de personnalité, par exemple l’extraversion ou l’empathie, rendent les gens plus ou moins sensibles aux différences entre les voix humaines et celles de l’IA.

Opinion d’expert et implications plus larges

Le professeur Richard Roche est président du comité de communication du Forum FENS et chef adjoint du département de psychologie de l'Université Maynooth, Maynooth, comté de Kildare, Irlande, et n'a pas été impliqué dans la recherche. Il a déclaré : « L’étude des réponses du cerveau aux voix de l’IA est cruciale à mesure que cette technologie continue de progresser. Cette recherche nous aidera à comprendre les implications cognitives et sociales potentielles de la technologie vocale de l’IA, qui pourraient soutenir les politiques et les lignes directrices éthiques.

« Les risques liés à l’utilisation de cette technologie pour arnaquer et tromper les gens sont évidents. Cependant, il existe également des avantages potentiels, tels que le remplacement de la voix des personnes qui ont perdu leur voix naturelle. Les voix de l’IA pourraient également être utilisées en thérapie pour certains problèmes de santé mentale.

Remarques

  1. PS07-29AM-602, « Dynamique neuronale du traitement des vocalisations émotionnelles naturelles et numériques » par Christine Skjegstad, Session d'affiches 07 – Résumés de dernière minute, samedi 29 juin, 09h30-13h00, Zone d'affiches, https:// fens2024.abstractserver.com/program/#/details/presentations/4774
  2. Depuis la soumission de leur résumé, les chercheurs ont inclus des données supplémentaires dans leurs analyses.

Financement : Département de psychologie de l’Université d’Oslo (UiO)

SciTechDaily

Les bouteilles d’eau en plastique sont-elles sûres ? Une nouvelle étude suscite des inquiétudes concernant les COV

Trump déclare que l'avortement devrait être laissé aux États, dans une tentative cynique de convaincre les électeurs qu'il n'aidera pas à détruire les droits reproductifs lors d'un second mandat

Donald Trump approuve l'affichage de 10 commandements dans les écoles et vendra probablement des tablettes plaquées or avec son visage dessus d'ici la fin de l'année