Les scientifiques du laboratoire national d’Oak Ridge ont avancé la technologie CRISPR Cas9 pour l’édition du génome microbien en utilisant la biologie quantique et l’intelligence artificielle explicable. Cette percée permet des modifications génétiques plus précises des microbes, élargissant ainsi le potentiel de production de carburants renouvelables et de produits chimiques.
Les recherches du laboratoire national d’Oak Ridge en biologie quantique et en IA ont considérablement amélioré l’efficacité de l’édition du génome CRISPR Cas9 chez les microbes, contribuant ainsi au développement des énergies renouvelables.
Les scientifiques du Laboratoire national d’Oak Ridge (ORNL) ont utilisé leur expertise en biologie quantique, en intelligence artificielle et en bio-ingénierie pour améliorer le fonctionnement des outils d’édition du génome CRISPR Cas9 sur des organismes tels que les microbes qui peuvent être modifiés pour produire des carburants et des produits chimiques renouvelables.
CRISPR est un outil puissant de bio-ingénierie, utilisé pour modifier le code génétique afin d’améliorer les performances d’un organisme ou de corriger des mutations. L’outil CRISPR Cas9 s’appuie sur un guide unique et unique ARN qui ordonne à l’enzyme Cas9 de se lier et de cliver le site ciblé correspondant dans le génome. Les modèles existants permettant de prédire par ordinateur les ARN guides efficaces pour les outils CRISPR ont été construits sur les données de quelques modèles seulement. espècesavec une efficacité faible et incohérente lorsqu’il est appliqué aux microbes.
Recherche CRISPR axée sur les microbes
« De nombreux outils CRISPR ont été développés pour les cellules de mammifères, les mouches des fruits ou d’autres espèces modèles. Rares sont ceux qui se sont concentrés sur les microbes dont les structures et les tailles chromosomiques sont très différentes », a déclaré Carrie Eckert, responsable du groupe de biologie synthétique à l’ORNL. « Nous avions observé que les modèles de conception de la machinerie CRISPR Cas9 se comportent différemment lorsqu’on travaille avec des microbes, et cette recherche valide ce que nous savions de manière anecdotique. »
Les scientifiques de l’ORNL ont développé une méthode qui améliore la précision de l’outil d’édition génétique CRISPR Cas9 utilisé pour modifier les microbes pour la production de carburants renouvelables et de produits chimiques. Ces recherches s’appuient sur l’expertise du laboratoire en biologie quantique, en intelligence artificielle et en biologie synthétique. Crédit : Philip Gray/ORNL, Département américain de l’énergie
Pour améliorer la modélisation et la conception de l’ARN guide, les scientifiques de l’ORNL ont cherché à mieux comprendre ce qui se passe au niveau le plus élémentaire des noyaux cellulaires, où le matériel génétique est stocké. Ils se sont tournés vers la biologie quantique, un domaine reliant la biologie moléculaire et la chimie quantique qui étudie les effets que la structure électronique peut avoir sur les propriétés chimiques et les interactions des nucléotides, les molécules qui forment les éléments constitutifs de ADN et l’ARN.
La façon dont les électrons sont distribués dans la molécule influence la réactivité et la stabilité conformationnelle, y compris la probabilité que le complexe ARN guide-enzyme Cas9 se lie efficacement à l’ADN du microbe, a déclaré Erica Prates, biologiste des systèmes informatiques à l’ORNL.
Utiliser l’IA explicable dans la recherche CRISPR
Les scientifiques ont construit un modèle d’intelligence artificielle explicable appelé forêt aléatoire itérative. Ils ont formé le modèle sur un ensemble de données d’environ 50 000 ARN guides ciblant le génome de E. coli bactéries tout en prenant en compte les propriétés chimiques quantiques, dans une approche décrite dans la revue Recherche sur les acides nucléiques.
Le modèle a révélé des caractéristiques clés des nucléotides qui peuvent permettre la sélection de meilleurs ARN guides. « Le modèle nous a aidé à identifier des indices sur les mécanismes moléculaires qui sous-tendent l’efficacité de nos ARN guides », a déclaré Prates, « nous fournissant une riche bibliothèque d’informations moléculaires qui peuvent nous aider à améliorer la technologie CRISPR. »
Les chercheurs de l’ORNL ont validé le modèle d’IA explicable en menant des expériences de découpe CRISPR Cas9 sur E. coli avec un grand groupe de guides sélectionnés par le modèle.
L’utilisation de l’IA explicable a permis aux scientifiques de comprendre les mécanismes biologiques qui ont conduit aux résultats, plutôt qu’un modèle d’apprentissage profond ancré dans un algorithme de « boîte noire » qui manque d’interprétabilité, a déclaré Jaclyn Noshay, ancienne biologiste des systèmes informatiques de l’ORNL et premier auteur de l’article. .
« Nous voulions améliorer notre compréhension des règles de conception des guides pour une efficacité de coupe optimale en mettant l’accent sur les espèces microbiennes, compte tenu de la connaissance de l’incompatibilité des modèles formés entre les règnes (biologiques) », a déclaré Noshay.
Le modèle d’IA explicable, avec ses milliers de fonctionnalités et sa nature itérative, a été formé à l’aide du supercalculateur Summit de l’Oak Ridge Leadership Computer Facility de l’ORNL, ou OLCF, une installation utilisateur du DOE Office of Science.
Eckert a déclaré que son équipe de biologie synthétique prévoit de travailler avec des collègues en informatique de l’ORNL pour prendre ce qu’ils ont appris avec le nouveau modèle microbien CRISPR Cas9 et l’améliorer davantage en utilisant les données d’expériences en laboratoire ou une variété d’espèces microbiennes.
Faire progresser les outils CRISPR Cas9 pour diverses espèces
La prise en compte des propriétés quantiques ouvre la porte à des améliorations du guide Cas9 pour chaque espèce. « Cet article a même des implications à l’échelle humaine », a déclaré Eckert. « Si vous étudiez un quelconque type de développement de médicaments, par exemple lorsque vous utilisez CRISPR pour cibler une région spécifique du génome, vous devez disposer du modèle le plus précis pour prédire ces guides. »
L’amélioration des modèles CRISPR Cas9 offre aux scientifiques un pipeline à plus haut débit pour relier le génotype au phénotype, ou les gènes aux traits physiques, un domaine connu sous le nom de génomique fonctionnelle. La recherche a des implications pour les travaux du Centre d’innovation en bioénergie (CBI) dirigé par l’ORNL, par exemple pour améliorer les usines de matières premières bioénergétiques et la fermentation bactérienne de la biomasse.
« Nous améliorons considérablement nos prévisions sur l’ARN guide grâce à cette recherche », a déclaré Eckert. « Mieux nous comprendrons les processus biologiques en jeu et plus nous pourrons alimenter nos prévisions en données, meilleures seront nos cibles, améliorant ainsi la précision et la rapidité de nos recherches. »
« L’un des principaux objectifs de nos recherches est d’améliorer la capacité de modifier de manière prédictive l’ADN d’un plus grand nombre d’organismes à l’aide des outils CRISPR. Cette étude représente une avancée passionnante vers la compréhension de la manière dont nous pouvons éviter de commettre des « fautes de frappe » coûteuses dans le code génétique d’un organisme », a déclaré Paul Abraham de l’ORNL, un chimiste bioanalytique qui dirige le domaine d’intervention de l’ingénierie des écosystèmes sécurisés et de la science de la conception du programme de science génomique du DOE. , ou SEED SFA, qui a soutenu la recherche CRISPR. « Je suis impatient de savoir dans quelle mesure ces prédictions peuvent s’améliorer à mesure que nous générons des données de formation supplémentaires et continuons à tirer parti de la modélisation explicable de l’IA. »
Les co-auteurs de la publication comprenaient William Alexander, Dawn Klingeman, Erica Prates, Carrie Eckert, Stephan Irle et Daniel Jacobson de l’ORNL ; Tyler Walker, Jonathan Romero et Angelica Walker du Centre Bredesen pour la recherche interdisciplinaire et l’enseignement supérieur de l’Université du Tennessee, Knoxville ; et Jaclyn Noshay et David Kainer, qui travaillaient respectivement pour ORNL et maintenant pour Bayer et l’Université du Queensland.
Le financement du projet a été fourni par le SEED SFA et le CBI, tous deux faisant partie du programme de recherche biologique et environnementale du DOE Office of Science, par le programme de recherche et de développement dirigé en laboratoire de l’ORNL, et par les ressources de calcul haute performance de l’OLCF et de Compute. et Data Environment for Science, tous deux également soutenus par le Bureau de la science.


