in

Un scientifique s’attaque aux principaux obstacles à l’IA dans la découverte de médicaments

Un scientifique s’attaque aux principaux obstacles à l’IA dans la découverte de médicaments

Le pipeline de développement de médicaments est un processus long et coûteux. L'identification de composés « efficaces » de haute qualité, c'est-à-dire ceux qui présentent une puissance, une sélectivité et des propriétés métaboliques favorables élevées, dès les premiers stades est importante pour réduire les coûts et accélérer le cheminement vers les essais cliniques. Au cours de la dernière décennie, les scientifiques se sont tournés vers l’apprentissage automatique pour rendre ce processus de sélection initiale plus efficace.

La conception de médicaments assistée par ordinateur est utilisée pour sélectionner par ordinateur les composés qui interagissent avec une protéine cible. Cependant, la capacité à estimer avec précision et rapidité la force de ces interactions reste un défi.

« L'apprentissage automatique a promis de combler le fossé entre la précision des méthodes informatiques de référence basées sur la physique et la rapidité des fonctions de notation empiriques plus simples », a déclaré le Dr Benjamin P. Brown, professeur adjoint de pharmacologie à la faculté de médecine des sciences fondamentales de l'université Vanderbilt.

« Malheureusement, son potentiel n'a pas été exploité jusqu'à présent, car les méthodes actuelles de ML peuvent échouer de manière imprévisible lorsqu'elles rencontrent des structures chimiques auxquelles elles n'ont pas été exposées au cours de leur formation, ce qui limite leur utilité pour la découverte de médicaments dans le monde réel. »

Brown est le seul auteur d'un Actes de l'Académie nationale des sciences article intitulé « Un cadre d'apprentissage profond généralisable pour le classement d'affinité protéine-ligand basé sur la structure » ​​qui comble ce « écart de généralisabilité ».

Dans cet article, il propose une approche ciblée : au lieu d'apprendre de la structure 3D entière d'une protéine et d'une molécule médicamenteuse, Brown propose une architecture de modèle spécifique à une tâche qui est intentionnellement limitée pour apprendre uniquement à partir d'une représentation de leur espace d'interaction, qui capture les interactions physicochimiques dépendantes de la distance entre les paires d'atomes.

« En limitant le modèle à ce point de vue, il est obligé d'apprendre les principes transférables de la liaison moléculaire plutôt que les raccourcis structurels présents dans les données d'entraînement qui ne parviennent pas à se généraliser à de nouvelles molécules », a déclaré Brown.

Un aspect clé du travail de Brown était le protocole d'évaluation rigoureux qu'il a développé. « Nous avons configuré nos entraînements et nos tests pour simuler un scénario réel : si une nouvelle famille de protéines était découverte demain, notre modèle serait-il capable de faire des prédictions efficaces ? » dit-il.

Pour ce faire, il a omis de l'ensemble de formation des superfamilles entières de protéines et toutes leurs données chimiques associées, créant ainsi un test stimulant et réaliste de la capacité du modèle à généraliser.

Le travail de Brown fournit plusieurs informations clés pour le domaine :

  1. Les architectures spécialisées spécifiques à des tâches offrent une voie claire pour créer des modèles généralisables à l'aide des ensembles de données aujourd'hui accessibles au public. En concevant un modèle avec un « biais inductif » spécifique qui l’oblige à apprendre d’une représentation d’interactions moléculaires plutôt que de structures chimiques brutes, il généralise plus efficacement.
  2. Des critères de référence rigoureux et réalistes sont essentiels. Le protocole de validation de l'article a révélé que les modèles ML contemporains performants sur des critères standards peuvent montrer une baisse significative des performances lorsqu'ils sont confrontés à de nouvelles familles de protéines. Cela met en évidence la nécessité de pratiques d’évaluation plus strictes sur le terrain pour évaluer avec précision l’utilité dans le monde réel.
  3. Les gains de performances actuels par rapport aux fonctions de notation conventionnelles sont modestes, mais les travaux établissent une base de référence claire et fiable pour une stratégie de modélisation qui n'échoue pas de manière imprévisible, ce qui constitue une étape cruciale vers la création d'une IA fiable pour la découverte de médicaments.

Brown, membre principal du corps professoral du Center for AI in Protein Dynamics, sait qu’il reste encore du travail à faire. Son projet actuel se concentre exclusivement sur la notation (classement des composés en fonction de la force de leur interaction avec la protéine cible), ce qui ne constitue qu'une partie de l'équation de découverte de médicaments basée sur la structure.

« Mon laboratoire s'intéresse fondamentalement aux défis de modélisation liés à l'évolutivité et à la généralisabilité dans la simulation moléculaire et la conception de médicaments assistée par ordinateur. J'espère que nous pourrons bientôt partager des travaux supplémentaires visant à faire progresser ces principes », a déclaré Brown.

Pour l'instant, des défis importants demeurent, mais les travaux de Brown sur la construction d'une approche plus fiable de l'apprentissage automatique dans la conception de médicaments assistée par ordinateur basée sur la structure ont clarifié la voie à suivre.

La princesse Diana a déclaré qu'un film surprenant "avait complété mon éducation"

La princesse Diana a déclaré qu'un film surprenant « avait complété mon éducation »

Nouvelles connaissances sur la façon dont le sel s’accumule sur les surfaces courantes des solvants

Nouvelles connaissances sur la façon dont le sel s’accumule sur les surfaces courantes des solvants