Un ingénieur de l'Université Johns Hopkins a développé un outil d'IA spécialisé qui pourrait faire pour les scientifiques des matériaux ce que Chatgpt a fait pour les codeurs et les écrivains. Le nouveau système, appelé Chatgpt Material Explorer, ou CME, pourrait accélérer la découverte de tout, des batteries avancées aux alliages plus difficiles, selon les résultats publiés dans Intégration des matériaux et de l'innovation manufacturière.
« Chatgpt Materials Explorer, c'est comme avoir un assistant de recherche spécialisé qui est formé spécifiquement pour parcourir d'énormes bases de données, prédire comment un matériel ou un matériau se comportera sans test physique, trier les articles scientifiques pour trouver des études pertinentes pour vos projets, et même analyser le travail et aider à l'écriture scientifique, pour » dit l'inventeur de CME Kamal Choudhary, professeur de sciences et d'ingénierie des matériaux à la Whiting School of Engineering de l'université.
L'innovation clé de l'outil est son accès à de véritables modèles de données scientifiques et de physique, ce qui lui permet de donner des réponses précises aux questions posées par les scientifiques des matériaux. Les expériences de Choudhary avec Chatgpt ont inspiré sa création.
« Je travaille sur de nombreux supraconducteurs, qui sont des matériaux qui conduisent l'électricité sans aucune résistance, » Dit Choudhary, qui est également titulaire d'un rendez-vous conjoint au Département de génie électrique et informatique. « Je demanderais à Chatgpt: « Pouvez-vous concevoir un supraconducteur avec une composition particulière et me montrer la structure cristalline? » Cela m'a donné une réponse très générique, qui s'est avérée être la mauvaise réponse. »
Ce que les choudhary vivaient sont appelés hallucinations – lorsque Chatgpt présente de fausses informations comme factuelles, un événement non rare. Certains experts estiment que Chatgpt a un taux d'hallucination comprise entre 10% et 39%.
« Les hallucinations se produisent parce que Chatgpt n'est pas formé pour comprendre les faits, » Dit Choudhary. « S'il ne trouve pas la réponse exacte en fonction des données qu'elle tire, elle dira quelque chose qui semble plausible. Des sources de données comme Wikipedia ou Le New York Times N'incluez pas souvent les faits actuels et les recherches sur la science des matériaux et peuvent conduire à des réponses incorrectes. CME tire ses informations des bases de données des sciences des matériaux, de sorte que ses réponses peuvent être fiables par des scientifiques des matériaux. »
Choudhary a développé son modèle de langage spécialisé avec la fonctionnat de constructeur ChatGPT, qui permet aux utilisateurs de créer des GPT personnalisés adaptés à leurs besoins. Il a commencé par dire à l'AI, à un large, ce qu'il voulait qu'il fasse et à définir des paramètres pour ses fonctions. Il l'a ensuite configuré, en connectant l'IA aux bases de données et en l'informant sur les types de réponses qu'il peut donner.
« Ces bases de données sont la façon dont ChatGpt obtient ses informations, donc brancher les bases de données pertinentes pour le champ est cruciale pour obtenir la sortie correcte du chatbot, » Dit Choudhary. « Avant, je demandais un chatpt régulier pour la notation de la structure moléculaire de l'ibuprofène, et cela donnerait une réponse incorrecte ou générique. Avec CME, j'obtiendrai la bonne réponse à cela et à bien d'autres questions de science du matériel. »
Les bases de données, notamment le référentiel automatisé du National Institute of Science and Technology – Joint pour diverses simulations intégrées (NIST-Jarvis), les National Institutes of Health-Chemistry Resing Tool Usage to Science (NIH-Cactus) et le projet de matériaux, mettent constamment à jour CME aux résultats des sciences des matériaux les plus récents, dit-il.
« Les matériaux Explorer sont corrects car ces bases de données sont automatiquement mises à jour avec de nouveaux articles; Il se lance et se retire des dernières revues, » Dit Choudhary.
Pour tester sa résistance aux hallucinations, Choudhary a comparé le CME à Chatgpt 4 et ChemCrow, un agent d'IA destiné à résoudre les tâches liées à la chimie. En demandant à la formule moléculaire de l'aspirine à l'interprétation des diagrammes de phase, CME a obtenu les huit réponses correctes, tandis que les autres modèles n'ont donné que cinq réponses précises.
Choudhary travaille maintenant à développer davantage la plate-forme en ajoutant des outils de modélisation avancés, des revues de littérature automatisées, etc. Il développe également une plate-forme open source qui est disponible sur atomgpt.org. Contrairement au modèle de source fermée de CME, qui ne permet pas aux utilisateurs de modifier le code établi par Choudhary, Atom GPT permet aux utilisateurs de sélectionner le code et d'améliorer sa capacité à répondre aux questions de la science des matériaux.
« L'objectif ultime est de faire de ChatGpt Materials Explorer l'assistant de recherche à guichet qui peut aider les scientifiques des matériaux avec des simulations informatiques, une analyse des données et d'autres méthodes qui font progresser le domaine, » Dit Choudhary. « Ce qui a commencé comme un projet amusant le week-end est devenu quelque chose qui pourrait être une ressource de carrière utile pour les scientifiques des matériaux. »


