De nombreuses tentatives ont été faites pour exploiter la puissance de la nouvelle intelligence artificielle et des modèles de grandes langues (LLM) pour essayer de prédire les résultats des nouvelles réactions chimiques. Ceux-ci ont eu un succès limité, en partie parce que jusqu'à présent, ils n'ont pas été fondés sur une compréhension des principes physiques fondamentaux, tels que les lois de la conservation de la masse.
Maintenant, une équipe de chercheurs du MIT a trouvé un moyen d'incorporer ces contraintes physiques dans un modèle de prédiction de réaction, et ainsi améliorant considérablement la précision et la fiabilité de ses résultats.
Le nouveau travail est signalé dans le journal Naturedans un article du récent postdoc Joonyoung Joung (maintenant professeur adjoint à l'Université de Kookmin, Corée du Sud); L'ancien ingénieur logiciel Mun Hong Fong (maintenant à l'Université Duke); Nicholas Casetti, étudiante diplômée en génie chimique; Postdoc Jordan Liles; L'étudiant de premier cycle en physique Ne Dassanayake; et l'auteur principal Connor Coley, qui est le professeur de développement de carrière de 1957 dans les départements du MIT en génie chimique et en génie électrique et en informatique.
« La prédiction des résultats de réaction est une tâche très importante », explique Joung. Par exemple, dit-il, si vous voulez faire un nouveau médicament, « vous devez savoir comment le faire. Donc, cela nous oblige à savoir quel produit est susceptible de résulter d'un ensemble donné d'intrants chimiques à une réaction. »
Mais la plupart des efforts précédents pour effectuer de telles prévisions examinent uniquement un ensemble d'entrées et un ensemble de sorties, sans regarder les étapes intermédiaires ou considérer les contraintes pour s'assurer qu'aucune masse n'est gagnée ou perdue dans le processus, ce qui n'est pas possible dans les réactions réelles.
Joung souligne que si les modèles de grands langues tels que Chatgpt ont connu beaucoup de succès dans de nombreux domaines de recherche, ces modèles ne fournissent pas un moyen de limiter leurs résultats à des possibilités physiquement réalistes, par exemple en les obligeant à adhérer à la conservation de la masse. Ces modèles utilisent des «jetons» informatiques, qui dans ce cas représentent des atomes individuels.
Cependant, il dit: « Si vous ne conservez pas les jetons, le modèle LLM commence à fabriquer de nouveaux atomes ou supprime les atomes dans la réaction. »
Au lieu d'être ancré dans une véritable compréhension scientifique, « c'est un peu comme l'alchimie », ajoute-t-il. Alors que de nombreuses tentatives de prédiction de réaction ne regardent que les produits finaux, « nous voulons suivre tous les produits chimiques et comment les produits chimiques sont transformés » tout au long du processus de réaction du début à la fin, dit-il.
Afin de résoudre le problème, l'équipe a utilisé une méthode développée dans les années 1970 par le chimiste Ivar UGI, qui utilise une matrice d'électrons de liaison pour représenter les électrons dans une réaction. Ils ont utilisé ce système comme base de leur nouveau programme, appelé Flower (correspondance de débit pour la redistribution des électrons), ce qui leur permet de garder explicitement la trace de tous les électrons dans la réaction pour s'assurer qu'aucun n'est faussement ajouté ou supprimé dans le processus.
Le système utilise une matrice pour représenter les électrons dans une réaction et utilise des valeurs non nulles pour représenter des liaisons ou des paires d'électrons solitaires et des zéros pour en représenter un absence.
« Cela nous aide à conserver à la fois les atomes et les électrons en même temps », explique Fong. Cette représentation, dit-il, a été l'un des éléments clés de l'inclusion de la conservation de masse dans leur système de prédiction.
Le système qu'ils ont développé est encore à un stade précoce, dit Coley.
« Le système tel quel est une démonstration – une preuve de concept que cette approche générative de l'appariement du débit est très bien adaptée à la tâche de prédiction de réaction chimique. »
Bien que l'équipe soit enthousiasmée par cette approche prometteuse, il dit: « Nous sommes conscients qu'il a des limitations spécifiques en ce qui concerne l'étendue des différentes chimies que cela est vue. » Bien que le modèle ait été formé à l'aide de données sur plus d'un million de réactions chimiques, obtenues à partir d'une base de données US Patent Office, ces données n'incluent pas certains métaux et certains types de réactions catalytiques, dit-il.
« Nous sommes incroyablement enthousiasmés par le fait que nous pouvons obtenir des prédictions aussi fiables de mécanismes chimiques » du système existant, dit-il. « Il conserve la messe, il conserve les électrons, mais nous reconnaissons certainement qu'il y a beaucoup plus d'expansion et de robustesse pour travailler dans les années à venir. »
Mais même dans sa forme actuelle, qui est disponible librement via la plate-forme en ligne GitHub, « nous pensons qu'il fera des prédictions précises et sera utile comme outil pour évaluer la réactivité et cartographier les voies de réaction », explique Coley. « Si nous regardons vers l'avenir de l'avancement de l'état de l'art de la compréhension mécaniste et de la contribution à inventer de nouvelles réactions, nous ne sommes pas tout à fait là. Mais nous espérons que ce sera un tremplin vers cela. »
« Tout est open source », explique Fong. « Les modèles, les données, sont tous là-haut », y compris un ensemble de données précédent développé par Joung qui répertorie de manière exhaustive les étapes mécanistes des réactions connues. « Je pense que nous sommes l'un des groupes pionniers qui font cet ensemble de données et le rendent disponible sur les open source et le rendent cela utilisable pour tout le monde », dit-il.
Le modèle de fleur correspond ou surpasse les approches existantes pour trouver des voies mécanistes standard, dit l'équipe, et permet de généraliser les types de réaction auparavant invisibles. Ils disent que le modèle pourrait potentiellement être pertinent pour prédire les réactions pour la chimie médicinale, la découverte des matériaux, la combustion, la chimie atmosphérique et les systèmes électrochimiques.
Dans leurs comparaisons avec les systèmes de prédiction de réaction existants, Coley dit: « En utilisant les choix d'architecture que nous avons faits, nous obtenons cette augmentation massive de la validité et de la conservation, et nous obtenons une correspondance ou un peu mieux en termes de performances. »
Il ajoute: « Ce qui est unique dans notre approche, c'est que pendant que nous utilisons ces compréhensions du manuel des mécanismes pour générer cet ensemble de données, nous ancrant les réactifs et les produits de la réaction globale dans les données validées expérimentalement de la littérature sur les brevets. »
Ils déduisent les mécanismes sous-jacents, dit-il, plutôt que de simplement les inventer.
« Nous les imputons des données expérimentales, et ce n'est pas quelque chose qui a été fait et partagé à ce type d'échelle auparavant. »
En parlant de la prochaine étape, il dit: « Nous sommes très intéressés à élargir la compréhension du modèle des métaux et des cycles catalytiques. Nous venons de gratter la surface dans ce premier article » et la plupart des réactions incluses jusqu'à présent n'incluons pas les métaux ou les catalyseurs « , donc c'est une direction très intéressée. »
À long terme, il dit: « Une grande partie de l'excitation consiste à utiliser ce type de système pour aider à découvrir de nouvelles réactions complexes et à élucider de nouveaux mécanismes. Je pense que l'impact potentiel à long terme est important, mais c'est, bien sûr, juste une première étape. »


