Dans un Q&A, Gabe Gomes discute du potentiel de combinaison de la créativité humaine avec la capacité de la machine, transformant la recherche chimique.
« Il y a une idée fausse commune que l'utilisation de modèles de gros langues dans la recherche, c'est comme demander à un oracle une réponse. La réalité est que rien ne fonctionne comme ça », explique Gabe Gomes.
Gomes, professeur adjoint de génie chimique et de chimie à l'Université Carnegie Mellon, pense que les modèles de grands langues (LLM) peuvent transformer la recherche chimique, si elles sont adoptées de manière réfléchie. Dans Science informatique de la natureGomes et ses co-auteurs offrent une feuille de route vers des implémentations plus stratégiques de LLMS.
L'état actuel de recherche chimique est généralement séparé en modélisation informatique et en expériences de laboratoire. Les scientifiques pourraient passer des mois à utiliser des ordinateurs pour prédire comment une molécule peut être fabriquée et se comporter. D'autres scientifiques pourraient passer des mois dans le laboratoire à faire et à tester cette molécule. Les deux approches ne sont pas bien intégrées.
« C'est là que les LLM deviennent excitantes », explique Robert Macknight, un doctorat. Étudiant en génie chimique. Les LLM ont le potentiel de supprimer les silos entre les prédictions informatiques et les tests du monde réel, accélérant finalement la découverte.
En 2023, Gomes et son groupe de recherche ont publié Coscientist, un système basé sur LLM qui peut planifier, concevoir et exécuter de manière autonome des expériences scientifiques complexes. Comme les LLM sont de plus en plus mises en œuvre dans la recherche scientifique, Gomes voit le rôle du chercheur se déplacer vers une pensée de niveau supérieur: définir des questions de recherche, interpréter les résultats dans des contextes scientifiques plus larges et faire des sauts créatifs que l'intelligence artificielle (IA) ne peut pas faire. Plutôt que de remplacer la créativité humaine et l'intuition, les systèmes d'IA peuvent amplifier notre capacité à explorer systématiquement l'espace chimique.
Ici, Gomes et Macknight répondent à plusieurs questions sur l'endroit où les LLM peuvent avoir un impact et où ils pourraient échouer.
Comment votre expérience de développement du carécissement a-t-elle influencé vos points de vue de l'avenir de la recherche chimique?
Le développement du cooscientifique nous a révélé que les LLM ont un énorme potentiel pour accélérer le rythme de la recherche chimique, en particulier dans la collecte de données. Cela nous a également montré que les LLM seuls ne suffisent pas. La vraie percée survient lorsque vous les combinez avec des outils externes, comme des bases de données, des instruments de laboratoire ou des logiciels de calcul.
Sans outils, vous êtes limité par ce que le modèle a appris pendant la formation et vous risquez une hallucination. Les outils aident à fonder les réponses du LLM en réalité. L'une des choses qui nous passionnent le plus est le passage à ce que nous appelons les environnements « actifs », où les LLM interagissent avec les outils et les données plutôt que de simplement répondre aux invites.
Quelle est la différence entre le déploiement de LLMS dans un environnement « actif » ou « passif »?
Dans un environnement « passif », les LLM répondent aux questions ou génèrent du texte en fonction de ce qu'ils ont appris pendant la formation. Dans un environnement « actif », les LLM peuvent interagir avec les bases de données et les instruments pour recueillir des informations en temps réel et prendre des actions concrètes. Cette distinction est cruciale en chimie. Un LLM « passif » pourrait halluciner une procédure de synthèse ou vous donner des informations obsolètes.
Un LLM « actif » peut rechercher la littérature actuelle, vérifier les bases de données chimiques, calculer les propriétés à l'aide d'un logiciel spécialisé ou même de contrôler des équipements de laboratoire pour exécuter des expériences réelles. Au lieu d'être limité à ses données de formation, la LLM peut coordonner différents outils et sources de données pour résoudre de vrais problèmes de recherche. Cela transforme la façon dont nous pensons au rôle du chercheur. Au lieu de quelqu'un qui exécute des expériences, le chercheur ressemble davantage à un directeur de la découverte axée sur l'IA.
Quelles considérations uniques y a-t-il pour appliquer les LLM en chimie, par rapport à d'autres domaines?
Premièrement, il y a des considérations de sécurité. Les hallucinations en chimie ne sont pas seulement une gêne. Ils peuvent être dangereux. Si un LLM suggère de mélanger des produits chimiques incompatibles ou fournit de mauvaises procédures de synthèse, vous pourriez avoir de graves risques de sécurité ou des risques environnementaux. Deuxièmement, la chimie a des langages techniques très spécifiques avec lesquels les LLM générales luttent.

Le troisième est le problème de précision. La chimie nécessite un raisonnement numérique exact et les LLM ne sont pas naturellement bons à cela. Une petite erreur dans la représentation moléculaire ou l'interprétation spectrale peut changer complètement un résultat.
Enfin, la recherche chimique est intrinsèquement multimodale. Nous travaillons avec des procédures de texte, des structures moléculaires, des images spectrales et des données expérimentales à la fois. Étant donné que la plupart des LLM sont principalement basés sur du texte, l'incorporation de tous ces types d'informations chimiques est un défi particulier.
Toutes ces contraintes signifient que le domaine de la chimie bénéficie vraiment de l'approche LLM « active » que nous préconisons, où le modèle travaille avec des outils et des bases de données spécialisés plutôt que d'essayer de tout faire de sa formation uniquement.
Quels sont les plus grands défis que vous voyez pour l'adoption des LLM dans la recherche chimique?
Le plus grand défi est la fiabilité perçue. Les chercheurs sont à juste titre prudents quant à l'adoption d'outils d'IA lorsque la sécurité et la précision sont primordiales, et les méthodes actuelles d'évaluation des LLM sont insuffisantes.
Au-delà de la confiance, il y a plusieurs obstacles techniques. L'hallucination est une préoccupation majeure, comme indiqué ci-dessus. Il y a aussi le défi d'intégrer les LLM aux infrastructures de laboratoire existantes et les logiciels chimiques spécialisés, ce qui nécessite souvent une expertise technique importante. Du côté pratique, il y a une courbe d'apprentissage. De nombreux chercheurs manquent d'expérience avec les outils d'IA et peuvent ne pas savoir comment les mettre en œuvre efficacement.
Enfin, il existe des considérations éthiques et des ressources, telles que le coût environnemental de la formation et de la gestion de ces modèles, des biais potentiels dans les connaissances chimiques et des questions sur la façon dont ces outils pourraient changer la nature du travail scientifique lui-même.
Si nous pouvons d'abord améliorer les méthodes d'évaluation pour démontrer que ces systèmes sont dignes de confiance et fiables, nous débloquerons probablement des progrès sur bon nombre de ces autres défis.
Comment proposez-vous de mieux évaluer les capacités LLM dans la recherche chimique?
Les évaluations actuelles testent souvent uniquement la récupération des connaissances. Nous voyons la nécessité d'évaluer les capacités de raisonnement dont la recherche réelle a besoin, et nous avons cofondé une société de conseil pour les évaluations scientifiques des modèles d'IA.
Pour nous assurer que nous testons le raisonnement réel plutôt que la mémorisation, nous devons concevoir des tâches d'évaluation en utilisant des informations disponibles après la formation du modèle. Pour les LLM qui utilisent des outils, nous devons tester s'ils choisissent les bons outils dans les séquences logiques et s'adapter lorsque les outils échouent. Enfin, nous devons incorporer un jugement d'expert humain aux côtés de repères automatisés. Le raisonnement chimique a des nuances subtiles que les tests fixes manquent. L'objectif est d'avoir des cadres qui prédisent à quel point un LLM sera utile dans une véritable recherche chimique, pas seulement dans quelle mesure il fonctionne sur des tests standardisés.
Où voyez-vous les applications les plus prometteuses pour les LLM dans la recherche chimique?
Les LLM peuvent aider les chercheurs à naviguer dans une vaste littérature, à extraire des informations pertinentes et à identifier les lacunes de recherche ou les contradictions entre les articles. Ils montrent également un grand potentiel pour la planification des tâches. Il s'agit notamment de concevoir des expériences et de générer des hypothèses testables.
L'automatisation est un autre domaine clé. Les LLM peuvent se traduire entre le langage naturel et les langages de programmation. En d'autres termes, ils peuvent prendre une description anglaise d'une expérience et la convertir en code exécutable, ce qui facilite le contrôle des équipements de laboratoire et des laboratoires de cloud.
Le fil conducteur est que les LLM excelttent lorsqu'ils orchestrent les outils et sources de données existants. Les implémentations les plus puissantes tirent parti de leurs capacités de langage naturel pour rendre les flux de travail de recherche complexes plus accessibles et intégrés.


