Un outil statistique révolutionnaire mis au point par des chercheurs de l’Université de Chicago améliore la précision de la recherche de variantes génétiques liées aux maladies, offrant ainsi de nouvelles informations sur le cholestérol LDL et les traitements potentiels. Crédit : Issues.fr.com
Modèle statistique développé par Université de Chicago les chercheurs intègrent des données sur le génome et l’expression des gènes pour identifier de manière fiable les gènes responsables.
Un nouvel outil statistique développé par des chercheurs de l’Université de Chicago améliore la capacité de trouver des variantes génétiques responsables de maladies. L’outil, décrit dans un nouvel article publié le 26 janvier 2024 dans Génétique naturellecombine les données des études d’association pangénomique (GWAS) et les prédictions de l’expression génétique pour limiter le nombre de faux positifs et identifier plus précisément les gènes responsables et les variantes d’une maladie.
Les défis de GWAS
GWAS est une approche couramment utilisée pour tenter d’identifier les gènes associés à une gamme de traits humains, y compris les maladies les plus courantes. Les chercheurs comparent les séquences du génome d’un grand groupe de personnes atteintes d’une maladie spécifique, par exemple, avec un autre ensemble de séquences provenant d’individus en bonne santé. Les différences identifiées dans le groupe de maladies pourraient indiquer des variantes génétiques qui augmentent le risque de cette maladie et justifieraient une étude plus approfondie.
Toutefois, la plupart des maladies humaines ne sont pas causées par une seule variation génétique. Au lieu de cela, ils sont le résultat d’une interaction complexe de plusieurs gènes, de facteurs environnementaux et d’une multitude d’autres variables. En conséquence, GWAS identifie souvent de nombreuses variantes dans de nombreuses régions du génome associées à une maladie. La limite de GWAS, cependant, est qu’elle identifie uniquement l’association, et non la causalité. Dans une région génomique typique, de nombreuses variantes sont fortement corrélées les unes aux autres, en raison d’un phénomène appelé déséquilibre de liaison. Ceci est dû au fait ADN est transmis d’une génération à l’autre dans des blocs entiers, et non dans des gènes individuels, de sorte que les variantes proches les unes des autres ont tendance à être corrélées.
Avancer au-delà des limites de GWAS
« Vous pouvez avoir de nombreuses variantes génétiques dans un bloc qui sont toutes corrélées au risque de maladie, mais vous ne savez pas laquelle est réellement la variante causale », a déclaré Xin He, PhD, professeur agrégé de génétique humaine et auteur principal de l’étude. nouvelle étude. « C’est le défi fondamental de GWAS, c’est-à-dire comment passer de l’association à la causalité. »
Pour rendre le problème encore plus difficile, la plupart des variantes génétiques se trouvent dans des génomes non codants, ce qui rend leurs effets difficiles à interpréter. Une stratégie courante pour relever ces défis consiste à utiliser les niveaux d’expression des gènes. Les loci de traits quantitatifs d’expression, ou eQTL, sont des variantes génétiques associées à l’expression des gènes.
La raison d’être de l’utilisation des données eQTL est que si un variant associé à une maladie est un eQTL d’un gène X, alors X est probablement le lien entre le variant et la maladie. Le problème avec ce raisonnement, cependant, est que des variantes proches et des eQTL d’autres gènes peuvent être corrélés avec l’eQTL du gène X tout en affectant directement la maladie, conduisant à un faux positif. De nombreuses méthodes ont été développées pour désigner les gènes à risque de GWAS à l’aide des données eQTL, mais elles souffrent toutes de ce problème fondamental de confusion par les associations proches. En fait, les méthodes existantes peuvent générer des gènes faussement positifs dans plus de 50 % du temps.
Innover dans la recherche génétique avec cTWAS
Dans la nouvelle étude, le professeur He et Matthew Stephens, PhD, professeur Ralph W. Gerard et directeur des départements de statistiques et professeur de génétique humaine, ont développé une nouvelle méthode appelée études d’association causales à l’échelle du transcriptome, ou cTWAS, qui utilise des techniques statistiques avancées pour réduire les taux de faux positifs. Au lieu de se concentrer sur un seul gène à la fois, le nouveau modèle cTWAS prend en compte plusieurs gènes et variantes. À l’aide d’un modèle de régression multiple bayésien, il peut éliminer les gènes et les variantes confondants.
« Si vous regardez un à la fois, vous obtiendrez des faux positifs, mais si vous regardez ensemble tous les gènes et variantes proches, vous avez beaucoup plus de chances de trouver le gène causal », a-t-il déclaré.
L’article démontre l’utilité de cette nouvelle technique en étudiant la génétique des taux de cholestérol LDL. À titre d’exemple, les méthodes eQTL existantes ont désigné un gène impliqué dans la réparation de l’ADN, mais la nouvelle approche cTWAS a mis en évidence une variante différente du gène cible de la statine, un médicament couramment utilisé pour traiter l’hypercholestérolémie. Au total, cTWAS a identifié 35 gènes causals putatifs du LDL, dont plus de la moitié n’ont pas été signalés auparavant. Ces résultats indiquent de nouvelles voies biologiques et des cibles potentielles de traitement pour les LDL.
Orientations futures et disponibilité des logiciels
Le logiciel cTWAS est désormais disponible en téléchargement sur le site Web du laboratoire He. Il espère continuer à travailler dessus pour étendre ses capacités afin d’incorporer d’autres types de données « omiques », telles que l’épissage et l’épigénétique, ainsi que d’utiliser des eQTL provenant de plusieurs types de tissus.
« Le logiciel permettra aux gens d’effectuer des analyses reliant les variations génétiques aux phénotypes. C’est vraiment le principal défi auquel est confronté l’ensemble du secteur », a-t-il déclaré. « Nous disposons désormais d’un bien meilleur outil pour établir ces liens. »
Les autres auteurs de l’étude incluent Siming Zhao, Wesley CrouseSheng Qian et Kaixuan Luo de l’Université de Chicago.


