Le sale petit secret de l'IA : des chercheurs de Stanford révèlent des failles dans les détecteurs de texte

Les chercheurs ont découvert que les détecteurs GPT, utilisés pour identifier si le texte est généré par l’IA, étiquetent souvent à tort les articles écrits par des anglophones non natifs comme étant créés par l’IA. Ce manque de fiabilité présente des risques dans les milieux universitaires et professionnels, notamment dans les candidatures à un emploi et dans les devoirs des étudiants.

Dans une étude récemment publiée dans la revue Motifs, les chercheurs démontrent que les algorithmes informatiques souvent utilisés pour identifier les textes générés par l’IA qualifient souvent à tort les articles écrits par des locuteurs de langue non maternelle comme étant créés par l’intelligence artificielle. Les chercheurs préviennent que les performances peu fiables de ces programmes de détection de texte IA pourraient nuire à de nombreuses personnes, notamment aux étudiants et aux candidats à un emploi.

« Notre recommandation actuelle est que nous devrions être extrêmement prudents et peut-être essayer d’éviter autant que possible d’utiliser ces détecteurs », déclare l’auteur principal James Zou, de l’Université de Stanford. « Cela peut avoir des conséquences importantes si ces détecteurs sont utilisés pour examiner des éléments tels que des candidatures à un emploi, des devoirs d’entrée à l’université ou des devoirs au lycée. »

Les outils d’IA comme le chatbot ChatGPT d’OpenAI peuvent rédiger des essais, résoudre des problèmes scientifiques et mathématiques et produire du code informatique. Les enseignants aux États-Unis sont de plus en plus préoccupés par l’utilisation de l’IA dans le travail des étudiants et nombre d’entre eux ont commencé à utiliser des détecteurs GPT pour filtrer les devoirs des étudiants. Ces détecteurs sont des plateformes qui prétendent pouvoir identifier si le texte est généré par l’IA, mais leur fiabilité et leur efficacité restent à tester.

Zou et son équipe ont testé sept détecteurs GPT populaires. Ils ont rédigé 91 essais en anglais rédigés par des anglophones non natifs pour un test de compétence en anglais largement reconnu, appelé Test of English as a Foreign Language, ou TOEFL, via les détecteurs. Ces plateformes ont étiqueté à tort plus de la moitié des essais comme étant générés par l’IA, un détecteur signalant près de 98 % de ces essais comme étant rédigés par l’IA. En comparaison, les détecteurs ont pu classer correctement plus de 90 % des dissertations rédigées par des élèves de huitième année aux États-Unis comme étant d’origine humaine.

Zou explique que les algorithmes de ces détecteurs fonctionnent en évaluant la perplexité du texte, ce qui explique à quel point le choix des mots est surprenant dans un essai. « Si vous utilisez des mots anglais courants, les détecteurs donneront un faible score de perplexité, ce qui signifie que mon essai sera probablement signalé comme généré par l’IA. Si vous utilisez des mots complexes et plus fantaisistes, il est alors plus probable qu’ils soient classés comme étant écrits par des humains par les algorithmes », dit-il. En effet, les grands modèles de langage comme ChatGPT sont formés pour générer du texte avec une faible perplexité afin de mieux simuler la façon dont un humain moyen parle, ajoute Zou.

En conséquence, des choix de mots plus simples adoptés par des écrivains non natifs anglais les rendraient plus vulnérables au risque d’être étiquetés comme utilisant l’IA.

L’équipe a ensuite placé les essais TOEFL rédigés par des humains dans ChatGPT et l’a invité à modifier le texte en utilisant un langage plus sophistiqué, notamment en remplaçant des mots simples par un vocabulaire complexe. Les détecteurs GPT ont marqué ces essais édités par l’IA comme étant écrits par des humains.

« Nous devons être très prudents avant d’utiliser l’un de ces détecteurs dans des salles de classe, car il existe encore de nombreux préjugés et il est facile de les tromper avec un minimum de conception d’invite », explique Zou. L’utilisation de détecteurs GPT pourrait également avoir des implications au-delà du secteur de l’éducation. Par exemple, les moteurs de recherche comme Google dévalorisent le contenu généré par l’IA, ce qui peut par inadvertance faire taire les écrivains non anglophones.

Même si les outils d’IA peuvent avoir un impact positif sur l’apprentissage des élèves, les détecteurs GPT doivent être encore améliorés et évalués avant d’être utilisés. Zou dit que former ces algorithmes avec des types d’écriture plus diversifiés pourrait être un moyen d’améliorer ces détecteurs.

L’étude a été financée par la National Science Foundation, la Chan Zuckerberg Initiative, la Instituts nationaux de la santéet la Silicon Valley Community Foundation.

Le sale petit secret de l’IA : des chercheurs de Stanford révèlent des failles dans les détecteurs de texte

Une hypothèse classique sur les premiers vertébrés terrestres pourrait être fausse

Une enzyme cérébrale surprise en train de faire quelque chose d’inattendu : elle construit de l’acide polysialique sur elle-même

Comment se déplacent les oiseaux en troupeaux et les bancs de poissons ? Une nouvelle recherche offre une réponse claire

Un tremblement de terre de 2011 a fait rebondir une onde sismique sur le noyau terrestre, poussant le Japon vers l'est.

Les traces d'additifs accélèrent la biodégradation des bioplastiques sans perte de transparence ni de résistance.

Des câbles cryogéniques flexibles pour les réfrigérateurs à dilution pourraient ouvrir la voie à des ordinateurs quantiques pratiques

L’écho ancien de la Chine : les leçons de l’effondrement de la dynastie Qing pour le monde d’aujourd’hui

La plus grande prise de pouvoir de Glenn Youngkin pourrait avoir lieu bien avant 2024

Le rôle des e-mails professionnels dans les entreprises

Vivre sans compte bancaire : est-ce vraiment possible en France ?

Compte bancaire ado : quels gestes adopter en tant que parents ?

L’assurance vie est-il un placement sans risque ?

Réussir sa reconversion professionnelle en communication grâce à la formation en ligne

Le coliving : vers une nouvelle manière d’habiter plus écologique

Comment « Lesbian Jesus » Hayley Kiyoko a transformé l’hymne queer « Girls Like Girls » en long métrage

Une hypothèse classique sur les premiers vertébrés terrestres pourrait être fausse

Une enzyme cérébrale surprise en train de faire quelque chose d’inattendu : elle construit de l’acide polysialique sur elle-même

Les échos radar d'Europe révèlent des secrets sous la glace

Comment se déplacent les oiseaux en troupeaux et les bancs de poissons ? Une nouvelle recherche offre une réponse claire

Une étude révèle que l'urbanisation dans la région de la Grande Baie de Hong Kong intensifie les risques de chaleur extrême et de fortes précipitations.

La joie de la Ferrari Triumph de Lewis Hamilton : « Celle-ci est autre chose »

Un tremblement de terre de 2011 a fait rebondir une onde sismique sur le noyau terrestre, poussant le Japon vers l'est.

Les traces d'additifs accélèrent la biodégradation des bioplastiques sans perte de transparence ni de résistance.

Des sondes extraterrestres se cachent-elles dans notre jardin ? Une nouvelle étude révèle que nous avons à peine regardé

Des câbles cryogéniques flexibles pour les réfrigérateurs à dilution pourraient ouvrir la voie à des ordinateurs quantiques pratiques

Le plaidoyer climatique mené par les scientifiques montre des effets mitigés, sans renforcement clair de la confiance ni réaction négative

Le prince Harry échange sa couleur pour le match de championnat de la finale de la NBA

La Maison Blanche de Trump affirme que les Knicks n'ont pas refusé une invitation : « Fake News »

Avant de partir, restons en contact !