Les chercheurs de MIT ont développé SPARROW, un algorithme révolutionnaire conçu pour rationaliser le processus de découverte de médicaments en optimisant la sélection moléculaire pour la synthèse en fonction de la prédiction des coûts et des propriétés.
Le cadre, démontré à travers trois études de cas réelles, intègre efficacement une large gamme de molécules d’entrée et calcule les plans de synthèse les plus rentables, révolutionnant potentiellement la découverte de médicaments et d’autres domaines liés à la chimie.
Révolutionner la découverte de médicaments grâce à l'IA
L’utilisation de l’intelligence artificielle pour accélérer la découverte de médicaments est en plein essor. Les chercheurs déploient des modèles d’apprentissage automatique pour les aider à identifier, parmi des milliards d’options, des molécules susceptibles de posséder les propriétés qu’ils recherchent pour développer de nouveaux médicaments.
Mais il y a tellement de variables à prendre en compte — du prix des matériaux au risque de problème — que même lorsque les scientifiques utilisent l’IA, évaluer les coûts de synthèse des meilleurs candidats n’est pas une tâche facile.
Les innombrables défis liés à l’identification des molécules les plus efficaces et les plus rentables à tester sont l’une des raisons pour lesquelles le développement de nouveaux médicaments prend autant de temps, ainsi qu’un facteur clé des prix élevés des médicaments sur ordonnance.
Pour aider les scientifiques à faire des choix éclairés en matière de coûts, les chercheurs du MIT ont développé un cadre algorithmique permettant d’identifier automatiquement les candidats moléculaires optimaux, ce qui minimise le coût de synthèse tout en maximisant la probabilité que les candidats possèdent les propriétés souhaitées. L’algorithme identifie également les matériaux et les étapes expérimentales nécessaires à la synthèse de ces molécules.
SPARROW : une solution complète
Leur cadre quantitatif, connu sous le nom de Synthesis Planning and Rewards-based Route Optimization Workflow (SPARROW), prend en compte les coûts de synthèse d'un lot de molécules à la fois, car plusieurs candidats peuvent souvent être dérivés de certains des mêmes composés chimiques.
De plus, cette approche unifiée capture des informations clés sur la conception moléculaire, la prédiction des propriétés et la planification de la synthèse à partir de référentiels en ligne et d’outils d’IA largement utilisés.
En plus d’aider les sociétés pharmaceutiques à découvrir de nouveaux médicaments plus efficacement, SPARROW pourrait être utilisé dans des applications telles que l’invention de nouveaux produits agrochimiques ou la découverte de matériaux spécialisés pour l’électronique organique.
L'art et la science de la sélection des composés
« La sélection des composés est aujourd’hui un véritable art, et parfois même un art très réussi. Mais comme nous disposons de tous ces autres modèles et outils prédictifs qui nous donnent des informations sur la façon dont les molécules peuvent se comporter et dont elles peuvent être synthétisées, nous pouvons et devons utiliser ces informations pour guider les décisions que nous prenons », explique Connor Coley, professeur adjoint en développement de carrière de la promotion 1957 dans les départements de génie chimique, de génie électrique et d’informatique du MIT, et auteur principal d’un article sur SPARROW.
Coley est rejointe sur l'article par l'auteur principal Jenna Fromer SM '24. La recherche a été publiée le 17 juin dans Nature Science informatique.
Équilibrer les coûts et les avantages dans la synthèse
En un sens, la question de savoir si un scientifique doit synthétiser et tester une certaine molécule se résume à une question de coût de synthèse par rapport à la valeur de l'expérience. Cependant, déterminer le coût ou la valeur est un problème difficile en soi.
Par exemple, une expérience peut nécessiter des matériaux coûteux ou comporter un risque élevé d’échec. Du point de vue de la valeur, on peut se demander s’il serait utile de connaître les propriétés de cette molécule ou si ces prédictions comportent un niveau élevé d’incertitude.
Parallèlement, les sociétés pharmaceutiques ont de plus en plus recours à la synthèse par lots pour améliorer leur efficacité. Au lieu de tester les molécules une par une, elles utilisent des combinaisons de composants chimiques pour tester plusieurs candidats à la fois. Cependant, cela signifie que les réactions chimiques doivent toutes nécessiter les mêmes conditions expérimentales. L’estimation des coûts et de la valeur est donc encore plus difficile.
Techniques d'optimisation avancées
SPARROW relève ce défi en considérant les composés intermédiaires partagés impliqués dans la synthèse des molécules et en incorporant cette information dans sa fonction coût/valeur.
« Lorsque vous pensez à ce jeu d’optimisation consistant à concevoir un lot de molécules, le coût d’ajout d’une nouvelle structure dépend des molécules que vous avez déjà choisies », explique Coley.
Le cadre prend également en compte des éléments tels que les coûts des matières premières, le nombre de réactions impliquées dans chaque voie de synthèse et la probabilité que ces réactions réussissent dès le premier essai.
Améliorer la conception moléculaire grâce à SPARROW
Pour utiliser SPARROW, un scientifique fournit un ensemble de composés moléculaires qu’il envisage de tester et une définition des propriétés qu’il espère trouver.
À partir de là, SPARROW collecte des informations sur les molécules et leurs voies de synthèse, puis évalue la valeur de chacune d'entre elles par rapport au coût de synthèse d'un lot de candidats. Il sélectionne automatiquement le meilleur sous-ensemble de candidats répondant aux critères de l'utilisateur et trouve les voies de synthèse les plus rentables pour ces composés.
« Il effectue toute cette optimisation en une seule étape, ce qui lui permet de réellement capturer tous ces objectifs concurrents simultanément », explique Fromer.
Polyvalence et application de SPARROW
SPARROW est unique car il peut intégrer des structures moléculaires conçues à la main par des humains, celles qui existent dans des catalogues virtuels ou des molécules jamais vues auparavant qui ont été inventées par des modèles d'IA génératifs.
« Nous disposons de toutes sortes de sources d’idées différentes. L’un des atouts de SPARROW est que nous pouvons prendre toutes ces idées et les mettre sur un pied d’égalité », ajoute Coley.
Les chercheurs ont évalué SPARROW en l'appliquant à trois études de cas. Ces études de cas, basées sur des problèmes réels rencontrés par les chimistes, ont été conçues pour tester la capacité de SPARROW à trouver des plans de synthèse rentables tout en travaillant avec une large gamme de molécules d'entrée.
Ils ont découvert que SPARROW captait efficacement les coûts marginaux de la synthèse par lots et identifiait les étapes expérimentales courantes et les produits chimiques intermédiaires. De plus, il pouvait évoluer pour traiter des centaines de candidats moléculaires potentiels.
« Dans la communauté de l’apprentissage automatique pour la chimie, il existe de nombreux modèles qui fonctionnent bien pour la rétrosynthèse ou la prédiction des propriétés moléculaires, par exemple, mais comment les utilisons-nous réellement ? Notre cadre vise à mettre en évidence la valeur de ces travaux antérieurs. En créant SPARROW, nous espérons pouvoir guider d’autres chercheurs dans leur réflexion sur la sélection descendante des composés en utilisant leurs propres fonctions de coût et d’utilité », explique Fromer.
Orientations et impacts futurs
À l’avenir, les chercheurs souhaitent intégrer davantage de complexité dans SPARROW. Par exemple, ils aimeraient permettre à l’algorithme de prendre en compte le fait que la valeur du test d’un composé peut ne pas toujours être constante. Ils souhaitent également inclure davantage d’éléments de chimie parallèle dans sa fonction coût/valeur.
« Les travaux de Fromer et Coley permettent de mieux adapter la prise de décision algorithmique aux réalités pratiques de la synthèse chimique. Lorsque des algorithmes de conception informatique existants sont utilisés, le travail de détermination de la meilleure façon de synthétiser l'ensemble des modèles est laissé au chimiste médicinal, ce qui entraîne des choix moins optimaux et un travail supplémentaire pour le chimiste médicinal », explique Patrick Riley, vice-président senior de intelligence artificielle chez Relay Therapeutics, qui n’a pas participé à cette recherche. « Cet article montre une voie fondée sur des principes pour inclure la prise en compte de la synthèse conjointe, ce qui, je l’espère, aboutira à des conceptions algorithmiques de meilleure qualité et plus acceptées. »
« Identifier les composés à synthétiser de manière à équilibrer soigneusement le temps, le coût et le potentiel de progrès vers les objectifs tout en fournissant de nouvelles informations utiles est l’une des tâches les plus difficiles pour les équipes de découverte de médicaments. L’approche SPARROW de Fromer et Coley y parvient de manière efficace et automatisée, fournissant un outil utile aux équipes de chimie médicinale humaine et franchissant des étapes importantes vers des approches entièrement autonomes de découverte de médicaments », ajoute John Chodera, chimiste informatique au Memorial Sloan Kettering Cancer Center, qui n’a pas participé à ces travaux.
Cette recherche a été financée, en partie, par le DARPA Programme de découverte moléculaire accélérée, Bureau de la recherche navale et National Science Foundation.