in

Le modèle d’IA OpenFold3 franchit une étape cruciale dans la réalisation de prédictions sur les protéines

Le modèle d’IA OpenFold3 franchit une étape cruciale dans la réalisation de prédictions sur les protéines

Un nouveau modèle d’IA ouvre la boîte noire du principal outil d’intelligence artificielle permettant de prédire la manière dont les protéines interagiront avec de petites molécules, telles que les médicaments.

Le modèle OpenFold3, lancé le 28 octobre, est une reconstruction d'AlphaFold3 de Google DeepMind. Un grand consortium de chercheurs dirigé par Mohammed AlQuraishi de l'Université de Columbia a minutieusement disséqué le code d'AlphaFold3 et a créé un fac-similé de la plateforme d'IA, qui prédit la structure des protéines associées à d'autres molécules, notamment les acides nucléiques et les produits chimiques contenus dans les médicaments. AlphaFold3 ne peut être utilisé que par des particuliers, des organisations non commerciales ou des journalistes. Mais les entreprises – et n’importe qui d’autre – peuvent utiliser le modèle open source OpenFold3 à des fins commerciales, y compris pour le développement de médicaments.

Prédire les appariements protéine-molécule est important dans la conception de médicaments « car c'est ainsi que fonctionne la biologie. La biologie n'est pas constituée de protéines isolées. Ce sont des biomolécules qui interagissent les unes avec les autres », explique Woody Sherman, fondateur et directeur de l'innovation chez Psivant Therapeutics, basé à Boston. Sherman préside également le comité exécutif d'OpenFold.

Les protéines font partie des molécules les plus actives du corps. Les performances de ces bêtes de somme dépendent en grande partie de leur forme. AlphaFold2 a résolu le problème de la prédiction des formes que les protéines adopteront. L’équipe à l’origine du modèle d’IA a partagé le prix Nobel de chimie 2024 pour cette réalisation. AlphaFold3 a introduit des interactions avec d’autres protéines et molécules dans le mélange.

Mais contrairement à AlphaFold2, DeepMind n’a pas initialement ouvert le code d’AlphaFold3 pour que d’autres chercheurs l’explorent, du moins pas jusqu’à ce que des centaines de scientifiques signent une pétition appelant à la transparence. « Il est difficile d'évaluer un produit informatique sans voir les informations brutes », explique Stephanie Wankowicz, biologiste structurale computationnelle à l'Université Vanderbilt et co-auteur de la pétition. Il est nécessaire que d'autres chercheurs disposent du code pour tester l'exactitude et la fiabilité des prédictions et pour savoir quelles autres données sont nécessaires pour améliorer le modèle, explique Wankowicz.

La recréation d'AlphaFold2 a donné aux créateurs d'OpenFold un aperçu du fonctionnement de l'IA, dit-elle. AlphaFold2 a été présenté comme un modèle d'IA qui apprend comment les protéines se replient en fonction de leurs éléments constitutifs d'acides aminés, mais il mémorise en fait les structures protéiques qu'il a vues auparavant et utilise ces souvenirs pour prédire comment des protéines similaires peuvent apparaître, explique Wankowicz. Regarder sous le capot d'AlphaFold3 peut donner des informations similaires sur les paires protéine-médicament.

D'autres équipes ont tenté de reproduire AlphaFold3 et « se sont rapprochées, mais pas très précises », explique Wankowicz.

En effet, il est difficile de reproduire les astuces et ajustements subtils qui sont dans la tête des créateurs d'AlphaFold3 mais qui n'apparaissent pas dans le code ou dans les informations supplémentaires, explique Sherman. Certains sont des paramètres techniques utilisés pour certaines parties du calcul. « Personne ne le précise », dit-il. « Mais les détails comptent, surtout lorsqu'il s'agit de grands modèles et de grandes quantités de données. » L'équipe OpenFold3 a fait de son mieux pour reproduire AlphaFold3, dit-il, mais certaines différences subsistent.

La biologie compte également, dit Sherman. Dans les cellules, les protéines baignent dans l’eau et les ions. Ils vibrent et bougent. Rien de tout cela n’est capturé dans les images statiques créées par les modèles d’IA ou par les instantanés de protéines cristallisées réalisés en laboratoire. L'équipe OpenFold3 espère ajouter de l'eau et des mouvements dynamiques à son modèle pour mieux refléter la manière dont les protéines existent dans la nature, explique Sherman.

Même avant sa sortie officielle, OpenFold3 a été adopté par les sociétés pharmaceutiques. Cinq entreprises se sont regroupées au sein de la Federated OpenFold3 Initiative pour former le modèle d'IA sur des données propriétaires et créer un outil de prédiction plus puissant tout en préservant les secrets de l'entreprise. Ce partenariat a été annoncé le 1er octobre par Apheris, une société basée à Berlin qui gère la plateforme du groupe.

Selon Robin Röhm, cofondateur et directeur général d'Apheris, seulement environ 2 % des structures protéiques des bases de données accessibles au public sur lesquelles AlphaFold3 et OpenFold3 ont été formés sont associées à des molécules ayant des propriétés médicamenteuses. Les sociétés pharmaceutiques disposent de milliers de structures de ce type dans leurs bases de données.

Chaque entreprise de la fédération formera une version d'OpenFold3 sur environ 4 000 à 8 000 paires protéine-médicament dans sa propre bibliothèque, explique Röhm. Apheris regroupe ces IA formées localement dans une version centralisée qui connaît la manière dont environ 20 000 protéines et médicaments interagissent, mais ne contient pas de données exclusives. La version globale retourne dans chaque entreprise pour un nouveau cycle de formation et ainsi de suite.

Malgré l'élargissement des ensembles de données, ne vous attendez pas à des changements spectaculaires dans la découverte de médicaments, dit Sherman. OpenFold3 « est un point de départ », dit-il. « Ce sera la prochaine étape, et la prochaine étape et la prochaine étape où nous allons vraiment commencer à voir cet impact significatif sur la découverte de médicaments. »

Lady Kitty Spencer vole la vedette avec un collier d'aigue-marine de 74,4 carats à Monte Carlo

Lady Kitty Spencer vole la vedette avec un collier d'aigue-marine de 74,4 carats à Monte Carlo

Quand Kate Middleton a sauvé un diadème centenaire du coffre-fort royal

Quand Kate Middleton a sauvé un diadème centenaire du coffre-fort royal