Il est incroyablement difficile de cerner l'origine de la langue qui a conduit aux mots prononcés partout entre l'Espagne et l'Inde – et ce sera encore plus difficile d'être sûr que nous l'avons bien

Afyonkarahisar, la capitale de la région centrale de l'Anatolie en Turquie
Ceci est un extrait de notre histoire humaine, notre newsletter sur la révolution en archéologie. Inscrivez-vous pour le recevoir dans votre boîte de réception chaque mois.
De temps en temps, je me souviens d'un fait vraiment surprenant. Il est possible de voyager du Royaume-Uni, où je vis, à l'est à travers l'Europe vers l'Ukraine et l'ouest de la Russie (peut-être ne fais pas ce morceau), traverser la mer Caspienne, puis poursuivre l'Est vers l'Inde – et parler toujours aux personnes dont la langue appartient à la même famille.
C'est parce que l'anglais est l'une des plus de 400 langues indo-européennes. Français, allemand, bengali (bangla), sanskrit, albanais, grec et bien d'autres sont tous indo-européens. En d'autres termes, toutes ces langues sont censées descendre d'un parent célibataire, surnommée proto-indo-européenne, qui a été parlée il y a des milliers d'années.
Mais où était la patrie indo-européenne, l'endroit où le proto-indo-européen a été parlé? Et comment cette famille de langue s'est-elle répandue si largement?
Il y a eu beaucoup de recherches à ce sujet récemment, donc, pour me mettre au courant, j'ai lu le nouveau livre Les Indo-Européens ont revisité: comment une révolution scientifique réécrit leur histoire par l'archéologue et linguiste JP Mallory. Il a passé une grande partie de sa carrière à explorer les origines des langues indo-européennes, et le livre est un récit complet de notre recherche de ce lieu mystère. La quête, comme l'explique Mallory, a commencé à la fin des années 1700 lorsque la famille de la langue indo-européenne a été reconnue pour la première fois.
Ce n'est pas une critique, mais je vais vous dire ce que vous devez savoir. Êtes-vous suffisamment intéressé par la patrie des langues indo-européennes pour lire 400 pages sur cette seule question? Si la réponse est oui, c'est le livre à lire: il est complet, à jour, clairement expliqué (sauf pour des morceaux furieusement techniques autour des deux tiers) et parfois drôles. C'est tout ce que vous devez savoir. Cela dit, je vais gâcher la fin.
Un proto-langue perdu
Des linguistes comme William Jones (1746-1794) et James Parsons (1705-1770) ont découvert Indo-Européen en repérant des similitudes entre des langues radicalement différentes. Mallory répertorie certains mots qui ressemblent à des langues apparemment éloignées. Par exemple, «manger» est Ádmi en sanskrit, édō en grec et Edō en latin. Plus tard, lorsque les archéologues ont découvert les langues anatoliennes éteintes qui étaient autrefois parlées dans ce qui est maintenant la Turquie, ceux qui ont également été indo-européens.
Ce que nous n'avons pas, ce sont des enregistrements directs de proto-indo-européen. Il existait à une époque avant l'écriture. Les linguistes peuvent en reconstruire des aspects en comparant les langues indo-européennes les plus éloignées, ainsi que les plus anciens enregistrements écrits, et en travaillant à l'envers – mais vous pouvez probablement imaginer à quel point cela devient incroyable.
Le timing exact de l'origine de la famille indo-européenne est intéressant de noter. Il a commencé à se propager il y a au moins 4500 ans – il pourrait bien avoir été il y a plus de 5000 ans, et certaines estimations le placent il y a plus de 8000 ans.
Il s'agit d'une gamme d'incertitude méchante. Il n'est peut-être pas surprenant qu'il y ait eu un blizzard de suggestions.
Certains peuvent être rejetés en toute sécurité: Mallory mentionne une proposition glorieusement fissurée à partir de 1966 que les locuteurs de proto-indo-européens vivaient au pôle Sud, où «une grande civilisation mondiale avait existé jusqu'à ce que l'Antarctique soit glaciée entre 10 000 et 15 000 ans». (Remarque aux lecteurs: L'Antarctique est devenu glaciaire il y a des millions d'années.)
Cependant, il y a eu beaucoup de suggestions sérieuses. Mallory mentionne, entre autres, le modèle indien, le modèle baltique, le modèle nordique, le modèle STEPPE et le modèle de fermier anatolien. Comme il le dit, «la patrie indo-européenne a définitivement été située», mais c'est parce que la gamme d'idées proposée «Couvre assez bien toutes les options».
À ce stade, vous pensez peut-être: eh bien, la réponse est sûrement évidente? Les langues indo-européennes sont parlées du Royaume-Uni, de la France et de l'Espagne en Occident, en Inde et au Bangladesh à l'Est. La patrie était sûrement quelque part au milieu, et les langues s'étalaient dans toutes les directions? Cela mettrait le point d'origine près de la mer Noire et de la mer Caspienne, peut-être de l'Ukraine ou de la Turquie moderne ou à peu près.
Il s'agit d'un argument incroyablement basique, si simple qu'un enfant de 8 ans y penserait probablement, et cela me fait donc beaucoup de plaisir de vous dire qu'il semble être essentiellement correct. La journaliste Andrea Valentino est allée sur cette zone générale dans un Nouveau scientifique Caractéristique en 2022, car plusieurs lignes de preuves – génétiques et linguistiques – ont pointé de cette façon.
Avec l'avènement des méthodes pour analyser l'ADN ancien, explique Mallory, la recherche de la patrie indo-européenne s'est rétrécie sur trois scénarios concurrents qui le placent tous quelque part dans le centre de l'Eurasie.
Lost Eden
Le modèle de fermier anatolien se concentre, comme vous pouvez l'imaginer, sur les premiers agriculteurs de la région de l'Anatolie – ce qui est maintenant la Turquie. Beaucoup d'entre eux ont déménagé dans les régions voisines, ce qui aurait pu réparer les langues indo-européennes au-dessus de l'Europe et de l'Asie. Cependant, il y a quelques difficultés. Les mouvements des personnes, tels que révélés par la génétique, ne semblent pas s'aligner avec les mouvements des langues. En particulier, les langues anatoliennes ont été les premières à rompre avec les autres langues indo-européennes, ce qui semble étrange si toute la famille des langues a commencé en Anatolie.
Alternativement, les langues indo-européennes auraient pu apparaître dans le Caucase – la région entre la mer Noire et la mer Caspienne, qui comprend aujourd'hui des pays comme l'Arménie et l'Azerbaïdjan. Cela aurait du sens, sauf qu'il devrait y avoir une trace de langues indo-européennes dans tout le Caucase – et il n'y en a pas. Presque toutes les langues parlées là-bas ne sont pas indo-européennes.
Enfin, nous arrivons au modèle STEPPE. Pour être spécifique, la steppe pontique caspienne au nord et à l'est de la mer Noire, couvrant une grande partie de l'Ukraine moderne et de ses voisins. Des étendues d'ADN ancien ont montré qu'il y avait une énorme migration de cette région vers l'Europe occidentale, à partir il y a environ 5300 ans.
Les gens qui déménagent nous sont connus sous le nom de Yamna (en Ukrainien) ou Yamnaya (en russe). En février, j'ai rendu compte d'une paire d'études génétiques qui ont essayé de reconstruire les origines du Yamna. Ils ont conclu que des gens du Caucase se sont déplacés vers le nord-ouest dans ce qui est maintenant l'Ukraine et mélangé avec des chasseurs-cueilleurs locaux, formant une culture appelée Serednii Stih. Un sous-groupe du Serednii Stih est finalement devenu le Yamna.
Cette histoire a eu une conséquence intéressante: elle a offert une explication possible pour les langues indo-européennes atteignant l'Anatolie. Les mêmes groupes du Caucase qui ont contribué à la Yamna peuvent également avoir contribué aux peuples anatoliens.
En bref, nous avons une patrie indo-européenne sur la steppe au nord de la mer Noire, mais avec des liens étroits avec le Caucase et l'Anatolie au sud et au sud-ouest.
Cela m'amène à mon point. (Enfin, je vous entends pleurer.) Dans notre effort quixotique à identifier la patrie des langues indo-européennes, à quelle taille la patrie présumée doit-elle être avant de décider que nous l'avons cloué? À ce stade, l'argument se situe entre trois régions voisines: la steppe, le Caucase et l'Anatolie. Pourquoi doit-il être l'un d'eux? Pourquoi la patrie ne pourrait-elle pas être plus grande?

Les principaux candidats à la patrie des langues indo-européennes
N'oubliez pas que nous parlons d'une période avant les États-nations et les frontières dures. Comme le montre la génétique, les gens se sont déplacés, parfois sur d'énormes distances.
De même, le proto-indo-européen n'existait pas dans le vide. Vraisemblablement, il y avait des milliers d'autres langues parlées à l'époque, tous se bousculant les uns contre les autres et empruntant des mots et se brouillant lorsque les populations se mélangeaient.
Mallory explique si le proto-indo-européen était un «langage mixte», produit lorsque les populations qui parlaient différentes langues se sont réunies. De nombreuses langues contiennent des mots empruntés à plusieurs autres: l'anglais est un mélange déroutant de français, latin, grecque et diverses langues germaniques. Cependant, Mallory dit qu'un véritable langage mixte est un «où tant de sa grammaire, pas de vocabulaire, a été épissée à partir de deux langues», et que celles-ci sont «extrêmement rares».
Pourtant, je me retrouve à me demander à quel point le proto-indo-européen était discret et défini. Dans une certaine mesure, cela dépend de la façon dont notre définition est spécifique. Si nous définissons le proto-indo-européen d'une manière stricte, peut-être qu'il n'a été parlé que dans une zone de 1000 kilomètres carrés de la steppe. Mais les habitants des régions voisines ont peut-être parlé un dialecte similaire.
Tout cela m'amène à soupçonner que le proto-indo-européen était un phénomène émergent, qui a fusionné sur une zone assez grande plutôt que de jaillir complètement formée à partir d'une seule petite région. Je me trompe peut-être – mais au moins je ne suis pas assez stupide pour prétendre qu'il est originaire du pôle Sud.
Enfin, mettons tout cela en perspective. Les chercheurs ont passé plus de 200 ans à essayer de clouer la patrie indo-européenne. Mais il existe de nombreuses autres familles de langues. L'Indo-European a le plus de locuteurs, mais c'est un héritage du colonialisme.
Si vous regardez le nombre de langues au sein d'une famille, le plus grand semble être la famille atlantique-Congo, qui est parlée dans une grande partie de l'Afrique. Il contient plus de trois fois plus de langues que indo-européen.
Pourtant, nous en savons très peu à ce sujet. Si vous recherchez des «langues indo-européennes» sur Google Scholar, vous obtenez plus de 350 000 résultats. «Atlantic-Congo Languages» revient vers 1350. C'est juste une suggestion, mais je pense que ces langues pourraient valoir une étude plus profonde.