L’homme de Porsmose de la période néolithique, trouvé en 1947 à Porsmose, au Danemark. Crédit : Musée national danois
Quatre articles de recherche dans Nature suivez les traces génétiques et les origines géographiques des maladies humaines dans le temps. Les analyses fournissent des images détaillées de la diversité humaine préhistorique et de la migration, tout en proposant une explication de l’augmentation du risque génétique de sclérose en plaques (SEP).
En analysant les données du plus grand ensemble de données au monde à ce jour sur 5 000 génomes humains anciens d’Europe et d’Asie occidentale (Eurasie), de nouvelles recherches ont découvert les pools génétiques humains préhistoriques de l’Eurasie occidentale avec des détails sans précédent.
Les résultats sont présentés dans quatre articles publiés dans le même numéro de Nature par une équipe internationale de chercheurs dirigée par des experts de l’Université de Copenhague et les contributions d’environ 175 chercheurs d’universités et de musées du Royaume-Uni, des États-Unis, d’Allemagne, d’Australie, de Suède, du Danemark, de Norvège, de France, de Pologne, de Suisse, d’Arménie et d’Ukraine. , Russie, Kazakhstan et Italie. Les nombreux chercheurs représentent un large éventail de disciplines scientifiques, notamment l’archéologie, la biologie évolutionniste, la médecine, les sciences anciennes. ADN recherche, recherche sur les maladies infectieuses et épidémiologie.
Les découvertes de la recherche présentées dans le Nature les articles sont basés sur des analyses d’un sous-ensemble des 5 000 génomes et comprennent :
- Les vastes implications génétiques d’une barrière culturellement déterminée qui, jusqu’il y a environ 4 000 ans, s’étendait à travers l’Europe, de la mer Noire au sud jusqu’à la mer Baltique au nord.
- Cartographie de la façon dont les gènes de risque pour plusieurs maladies, notamment le diabète de type 2 et Alzheimer maladie, se sont dispersés en Eurasie à la suite de grands événements migratoires il y a plus de 5 000 ans.
- De nouvelles preuves scientifiques de migrations anciennes expliquant pourquoi la prévalence de la sclérose en plaques est deux fois plus élevée en Scandinavie qu’en Europe du Sud.
- Cartographie de deux changements de population presque complets au Danemark, au cours d’un seul millénaire.
Le projet des 5 000 génomes humains anciens
L’ensemble de données sans précédent de 5 000 génomes humains anciens a été reconstruit au moyen d’une analyse des os et des dents rendue disponible grâce à un partenariat scientifique avec des musées et des universités d’Europe et d’Asie occidentale. L’effort de séquençage a été réalisé grâce à la puissance de la technologie Illumina.
L’âge des spécimens va du Mésolithique et du Néolithique jusqu’au Moyen Âge en passant par l’âge du bronze, l’âge du fer et la période viking. Le génome le plus ancien de l’ensemble de données provient d’un individu qui a vécu il y a environ 34 000 ans.
« L’objectif initial du projet sur les génomes humains anciens était de reconstruire 1 000 génomes humains anciens d’Eurasie pour en faire un nouvel outil de précision pour la recherche sur les troubles cérébraux », expliquent les trois professeurs de l’Université de Copenhague qui ont eu l’idée en 2018 de l’ADN. ensemble de données et a initialement décrit le concept du projet :
Eske Willerslev, experte en analyse d’ADN ancien, conjointement à l’Université de Cambridge, et directrice du projet ; Thomas Werge, expert des facteurs génétiques à l’origine des troubles mentaux et directeur de l’Institut de psychiatrie biologique desservant les services de santé mentale de la région de la capitale du Danemark ; et Rasmus Nielsen, expert en analyses statistiques et informatiques de l’ADN ancien, conjointement à Université de Californie, Berkeleyaux Etats-Unis.
L’objectif était de produire un ensemble unique de données génomiques anciennes pour étudier les traces et l’histoire évolutive génétique des troubles cérébraux aussi loin que possible afin d’acquérir une nouvelle compréhension médicale et biologique de ces troubles. Cela devait être accompli en comparant les informations des anciens profils ADN avec les données de plusieurs autres disciplines scientifiques.
Parmi les troubles cérébraux initialement identifiés par les trois professeurs comme candidats à cette étude figuraient des maladies neurologiques telles que la maladie de Parkinson, la maladie d’Alzheimer et la sclérose en plaques, ainsi que des troubles mentaux tels que TDAH et la schizophrénie.
En 2018, les trois professeurs ont ensuite contacté la Fondation Lundbeck – une importante fondation de recherche danoise – pour obtenir un financement afin de compiler l’ensemble spécial de données ADN. Ils ont reçu une subvention de recherche sur cinq ans d’un montant total de 60 millions DKK (environ 8 millions d’euros) pour le projet, qui devait être coordonné à l’Université de Copenhague via un centre nouvellement créé, ensuite baptisé Centre de géogénétique de la Fondation Lundbeck.
« La raison pour laquelle nous avons accordé une subvention de recherche aussi importante à ce projet, comme l’a fait la Fondation Lundbeck en 2018, était que si tout fonctionnait, cela représenterait un moyen novateur de mieux comprendre comment l’architecture génétique sous-jacente. les troubles cérébraux ont évolué avec le temps. Et les troubles cérébraux constituent notre domaine d’intervention spécifique », déclare Jan Egebjerg, directeur de recherche à la Fondation Lundbeck. La Fondation Lundbeck soutient également le consortium iPYSCH, l’une des plus grandes études au monde sur les causes génétiques et environnementales des troubles mentaux tels que l’autisme, le TDAH, la schizophrénie, le trouble bipolaire et la dépression, où l’accent est également mis sur l’élaboration de profils de risque génétiques pour ces troubles. aussi précis que possible.
Les résultats rapportés dans Natureont été étayés par la comparaison de l’ensemble de données génomiques anciennes avec des données génétiques anonymisées du grand consortium danois iPYSCH et des profils ADN de 400 000 individus actuels enregistrés dans la biobanque britannique.
De nombreux défis
Le principe du projet était expérimental, raconte le professeur Werge : « Nous voulions collecter des spécimens humains anciens pour voir ce que nous pouvions en tirer, par exemple en essayant de comprendre une partie du contexte environnemental dans lequel évoluent les maladies et les troubles. Selon moi, le fait que le projet ait pris des proportions si vastes et si complexes qu’il Nature Je voulais le décrire dans quatre articles est tout à fait unique.
Le professeur Willerslev commente que la compilation de l’ensemble des données ADN posait des défis logistiques majeurs : « Nous avions besoin d’accéder à des spécimens archéologiques de dents et d’os humains dont nous savions qu’ils étaient dispersés dans les musées et autres institutions de la région eurasienne, et cela nécessitait de nombreux accords de collaboration. Mais une fois ces données mises en place, les choses ont vraiment décollé : l’ensemble des données était en plein essor et dépasse désormais les 5 000 génomes humains anciens. La taille de l’ensemble de données a considérablement amélioré à la fois la convivialité et la précision des résultats.
Le professeur Nielsen était chargé de planifier les analyses statistiques et bioinformatiques des informations glanées sur les dents et les os anciens dans les laboratoires de l’Université de Copenhague. Et il avait affaire à un volume considérable de données, dans lesquelles l’ADN était souvent gravement dégradé.
« Personne n’avait auparavant analysé autant de génomes anciens. Il nous fallait maintenant trouver comment gérer des volumes de données aussi importants. Le problème était qu’il était très difficile de travailler avec les données brutes, car on se retrouvait avec de nombreuses séquences d’ADN courtes comportant de nombreuses erreurs, et ces séquences devaient ensuite être correctement cartographiées à la bonne position dans le génome humain. À cela s’ajoute le problème de la contamination par tous les micro-organismes présents sur les dents et les os anciens. Imaginez avoir un puzzle composé de millions de pièces mélangées à quatre autres ensembles de puzzles incomplets, puis passer le tout au lave-vaisselle pendant une heure. Reconstituer le tout ensuite n’est pas une tâche facile. L’une des clés de notre succès a finalement été notre collaboration avec le Dr Olivier Delanau de l’Université de Lausanne, qui a développé des algorithmes pour résoudre ce problème», explique le professeur Nielsen.
Intérêt international
Des rumeurs selon lesquelles un vaste ensemble de données anciennes sur le génome humain était en cours de compilation ont rapidement circulé dans les cercles scientifiques. Et depuis 2022, l’intérêt est très élevé, affirment les professeurs Werge, Willerslev et Nielsen :
« Nous répondons constamment aux demandes de chercheurs du monde entier – en particulier ceux qui étudient les maladies – qui demandent généralement l’accès pour explorer l’ensemble de données anciennes sur l’ADN. »
Les quatre Nature les articles démontrent que le vaste ensemble de données de 5 000 génomes sert d’outil de précision capable de fournir de nouvelles informations sur les maladies lorsqu’il est combiné avec des analyses de données actuelles sur l’ADN humain et des apports de plusieurs autres domaines de recherche. Selon le professeur Willerslev, cela est en soi extrêmement étonnant :
« Il ne fait aucun doute qu’un ensemble de données génomiques anciennes de cette taille aura des applications dans de nombreux contextes différents au sein de la recherche sur les maladies. À mesure que de nouvelles découvertes scientifiques dérivées de l’ensemble de données de 5 000 génomes seront publiées, davantage de données seront progressivement mises gratuitement à la disposition de tous les chercheurs. À terme, l’ensemble complet des données sera en libre accès pour tous.


