Un nouvel outil en libre accès créé par des chercheurs en ingénierie de l'Université de Toronto offre un moyen systématique d'organiser et de synthétiser les connaissances sur les structures métallo-organiques (MOF), une classe de matériaux ayant des applications dans l'administration de médicaments, la catalyse, la capture du carbone et bien plus encore.
Les structures métallo-organiques (MOF) constituent une classe de matériaux exceptionnellement polyvalente, se distinguant par leur surface ultra-élevée et leur chimie réglable avec précision. Certains MOF ont des surfaces pouvant atteindre 7 000 m²/g, ce qui signifie qu'un gramme de ce matériau contient suffisamment de surface interne pour recouvrir un terrain de football.
Cette structure unique permet un large éventail d’applications prometteuses. Certains peuvent être utilisés comme tamis moléculaires, séparant le dioxyde de carbone des autres gaz afin de pouvoir le capturer et le séquestrer. D’autres s’accrochent à de minuscules molécules, ce qui leur permet d’être détectées à des concentrations extrêmement faibles. D’autres encore peuvent contribuer à accélérer des réactions industriellement importantes ou à administrer des médicaments à certaines zones du corps.
L’importance croissante et le potentiel de transformation des MOF dans la science et la technologie sont soulignés par le fait qu’ils ont fait l’objet du prix Nobel de chimie 2025.
Mais avec l'accélération des études sur les MOF dans plus de 25 domaines d'application, suivre l'ensemble des connaissances en croissance rapide dans ce domaine s'avère de plus en plus difficile, non seulement pour les chercheurs, mais aussi pour les outils d'IA destinés à soutenir la découverte scientifique.
Une équipe dirigée par le professeur Mohamad Moosavi du Département de génie chimique et de chimie appliquée et du Vector Institute a développé un nouveau système pour aider à relever ce défi.
Leur nouvel outil s’appelle Unifying Chemical Data for MOFs, en abrégé MOF-ChemUnity. L'ouvrage a été publié dans le Journal de l'American Chemical Society; l'étude a été sélectionnée pour faire la couverture d'un numéro récent.
« La découverte scientifique commence par la lecture et la synthèse de la littérature, mais cela reste l'une des étapes les plus difficiles à automatiser », explique Moosavi.
« MOF-ChemUnity crée une fondation unifiée sur laquelle les chercheurs et les systèmes d'IA peuvent s'appuyer. »
Une carte structurée des connaissances MOF
La remarquable adaptabilité des MOF les rend adaptés à un large éventail de technologies, mais l’ampleur et la diversité des recherches dans toutes les disciplines ont rendu le domaine de plus en plus complexe à parcourir.
MOF-ChemUnity relève ce défi en utilisant un graphe de connaissances structuré et évolutif qui extrait et relie systématiquement les informations des documents de recherche MOF, des référentiels de structures cristallines et des bases de données informatiques sur les matériaux.
Au cœur du système se trouve un flux de travail multi-agents de modèle de langage étendu (LLM) conçu pour relier les noms chimiques dans la littérature aux structures cristallines correctes. Cela permet de représenter les procédures de synthèse, les propriétés des matériaux et les applications potentielles dans un format cohérent et lisible par machine.

« Un graphe de connaissances connecte des éléments d'information comme un site Web, reliant des éléments tels qu'un MOF, son nœud métallique, son protocole de synthèse et sa propriété d'adsorption à travers leurs relations : » fabriqué à partir de « , » synthétisé « , » utilisé pour » « , explique Moosavi.
« Cela permet à l'IA non seulement de stocker des données, mais aussi de comprendre et de raisonner sur la manière dont les matériaux, les propriétés et les applications sont connectés, exactement ce que permet MOF-ChemUnity. »
Réduire les hallucinations de l’IA grâce à la littérature
L'équipe a démontré l'impact du système en intégrant le graphe de connaissances à de grands modèles de langage pour créer un assistant d'IA basé sur la littérature pour les MOF. Contrairement aux systèmes d’IA standard, qui peuvent produire des déclarations plausibles mais incorrectes, l’assistant informé de la littérature s’appuie sur des enregistrements expérimentaux et informatiques vérifiés.
Lors d'évaluations aveugles effectuées par des experts du MOF de plusieurs institutions, les réponses de l'assistant ont été systématiquement jugées plus précises, interprétables et dignes de confiance que celles produites par les LLM de base tels que GPT-4o.
« Cette approche réduit les hallucinations, qui constituent l'un des principaux obstacles à l'application de grands modèles de langage aux domaines scientifiques », explique Moosavi.
« En ancrant les réponses de l'IA dans une littérature organisée et liée, nous pouvons soutenir un raisonnement scientifique plus fiable. »
Une base pour la future découverte de matériaux
L’équipe de l’Université de Toronto – Moosavi et ses étudiants diplômés, Thomas Pruyn et Amro Aswad, qui ont été des contributeurs clés aux travaux – ont rendu l’ensemble de données et le code librement disponibles sur GitHub, dans le but de soutenir les progrès continus de la science des matériaux et de la recherche basée sur l’IA.
Moosavi affirme que le projet jette les bases d’un changement plus large dans la manière dont les connaissances scientifiques sont organisées et accessibles.
« Ce travail contribuera à briser les cloisonnements dans la recherche scientifique », déclare Moosavi.
« Les chercheurs humains sont limités par le nombre d'articles qu'ils peuvent lire, mais MOF-ChemUnity fait un premier pas vers la mise en place de systèmes d'IA capables de traiter des données dans tous les domaines.
« Cela établit un nouveau paradigme pour la découverte fondée sur la littérature, et nous l'envisageons comme le début de systèmes de connaissances généralisées qui peuvent accélérer la recherche dans de nombreux domaines. »


