L'apprentissage de la machine moléculaire (ML) sous-tend les flux de travail critiques dans la découverte de médicaments, la science des matériaux et l'optimisation du catalyseur en prédisant rapidement les interactions et les propriétés moléculaires. Par exemple, dans la découverte de médicaments, les modèles ML prévoient des interactions entre les candidats médicamenteux et les cibles biologiques, améliorant considérablement l'efficacité et accélérant la découverte.
Malgré leur utilité, les représentations moléculaires traditionnelles, y compris les graphiques simplifiés, les coordonnées tridimensionnelles, les formats textuels et les descripteurs mondiaux, ont des limitations inhérentes. Ces méthodes ignorent fréquemment des détails cruciaux quantiques-mécaniques essentiels pour capturer avec précision les propriétés et les comportements moléculaires.
À mesure que les tâches de prédiction deviennent plus complexes, le développement de représentations qui incorporent explicitement des informations moléculaires de niveau quantique est de plus en plus importante.
Dans Intelligence de la machine de la nature, Gabe Gomes, Daniil Boiko et leurs collaborateurs proposent un nouveau type de représentation moléculaire ML qui comprend des interactions quantiques chimiques.
Boiko, un doctorat. Étudiant en génie chimique, et Gomes, professeur adjoint de génie chimique et de chimie à l'Université Carnegie Mellon, montrent une voie pour améliorer les modèles en utilisant moins de données et une approche interprétable et infusée à la chimie. Leur représentation, qui intègre des informations supplémentaires sur les orbitales (liaison naturelle) et leurs interactions, fonctionne mieux que les graphiques moléculaires standard.
Les chimistes informatiques utilisent des orbitales pour décrire l'emplacement et le comportement des électrons dans une molécule. Les effets stéréoélectroniques découlent des relations spatiales entre les orbitales d'une molécule et leurs interactions électroniques, influençant directement la géométrie moléculaire, la réactivité, la stabilité et diverses autres propriétés physiques et chimiques.
Gomes a étudié la relation entre la structure moléculaire et la réactivité au cours de la dernière décennie, avec un accent particulier sur le développement et les applications des effets stéréoélectroniques. Son dernier travail avec Boiko code pour les informations stéréoélectroniques dans un modèle ML moléculaire pour créer des graphiques moléculaires infusés par les stéréoéleclées (SIMGS).
Le calcul des interactions entre les orbitales peut être coûteux en calcul, ce qui rend ces méthodes lents pour les molécules de taille modéré et intraitables pour des molécules plus grandes. Pour aborder cette limitation, Boiko et Gomes ont développé un modèle supplémentaire qui peut rapidement générer la représentation étendue basée sur un graphique moléculaire standard.
Par rapport aux méthodes qui prennent des heures ou des jours, le nouveau modèle fonctionne en quelques secondes. Il est formé sur de petites molécules et peut prédire avec précision les graphiques étendus pour les molécules plus grandes.
« Ce modèle peut être appliqué lorsque des calculs réguliers de chimie quantique ne sont pas possibles, comme pour les peptides et les protéines entiers », explique Boiko. En approximant les sorties des calculs de chimie quantique à l'aide d'un autre pipeline, Boiko et Gomes espèrent que leur modèle débloquera des informations chimiques auparavant inaccessibles.
Dans le développement des modèles, il était important pour Boiko et Gomes que leur nouvelle représentation soit facilement interprétable par les communautés moléculaires de la ML et de la chimie générale. Ils ont créé une application Web pour analyser rapidement les interactions stéréoélectroniques des molécules, et l'outil rend également leurs méthodes plus accessibles.
L'application étend un graphique moléculaire simple avec des informations connues sur les liaisons; calcule différentes cibles, y compris les charges d'atome et les paires solitaires; fournit une description des orbitales obligataires; et produit une carte des interactions orbitales.
« En chimie, nous avons de très petits ensembles de données », explique Boiko. « Sur cette échelle de données, une représentation plus explicite de ce qui se passe dans la molécule est très importante. »
En améliorant les représentations moléculaires existantes et en permettant une génération rapide de nouveaux graphiques informés quantiques, Boiko et Gomes ont considérablement avancé les capacités de l'apprentissage de la machine moléculaire. L'équipe travaille à l'élargissement de la portée de la représentation à l'ensemble du tableau périodique et montrant une myriade d'applications de la spectroscopie à la catalyse.


