NB : ceci est l’adaptation à l’écrit de l’épisode ADN 106 de la série couvrant les tests génétiques. Il fait suite au billet d’introduction, et précède celui concernant le volet santé des résultats.
Nous y voilà. Voyons ensemble ce que votre génome a à raconter sur vos origines (le volet santé, lui, attendra le billet suivant). Pour illustrer la démarche, je vais utiliser mon propre génome, de sorte que vous puissiez facilement reproduire l’exercice avec le vôtre.
Hypothèses de départ
Avant de regarder les résultats, je vous invite à formuler quelques hypothèses sur vos origines, histoire de voir ensuite si elles tiennent la route — ou pas. Un bon point de départ : placer sur une carte les lieux de naissance de vos ancêtres connus, et regarder si certains patronymes dans votre arbre sont aussi des toponymes, des noms de lieux. Dans mon cas, la plupart sont bretons et ne m’apprennent pas grand-chose, à l’exception d’un seul qui suggère qu’au XVIe siècle, un ancêtre aurait quitté les marais de la Brenne pour rejoindre La Rochelle ou l’île de Ré. Une fois cette carte dressée, c’est le moment de ressortir vos cours d’histoire et de vérifier si ces régions ont connu des épisodes migratoires marquants. Dans mon cas, comme plus de la moitié de mon arbre vient de basse Bretagne, je m’attendais à retrouver un peu de Breton insulaire, d’anglo-saxon, et des peuples du Nord de l’Europe (Pays-Bas, Allemagne, Danemark, Suède, Norvège), les premiers ayant été chassés en masse par les seconds aux Ve et VIe siècles, et les derniers ayant non seulement poussé les deux premiers vers l’Armorique (devenue « Bretagne ») du IXe au XIe siècle, mais s’y étant aussi implantés. Bref, être Breton et avoir un peu de tout ça dans les gènes, ça n’aurait rien de surprenant. Du côté de la Loire, avec un toponyme à consonance gallo-romaine, on peut (peut-être, je ne suis pas historien) s’attendre à retrouver quelques gènes venus du pourtour méditerranéen dans les bagages de l’Empire romain, et pourquoi pas des traces des grandes migrations des peuples de l’Est. Voilà donc ce à quoi je pensais m’attendre.
Algorithme du laboratoire
Voyons maintenant ce que le génome a à dire là-dessus. Le premier outil, le plus évident, c’est celui fourni par le labo auprès duquel vous avez passé le test. Vous y trouverez en général une carte, une liste de populations, et le pourcentage de votre ADN qui semblerait venir de chacune d’entre elles. Depuis quelque temps, 23AndMe propose également une estimation du dernier ancêtre qui appartenait aux principales populations identifiées. De toute évidence, les banques de génomes n’avaient pas encore collecté suffisamment de données sur les Bretons en 2016, puisque l’algorithme était convaincu que j’étais Britannique avec quelques ancêtres Français… Ces pourcentages sont à prendre avec des pincettes, comme mentionné dans les billets d’introduction. Les algorithmes construisent des versions plus ou moins crédibles, sans jamais être vraiment sûrs de grand-chose. Confier votre ADN à deux labos différents peut donner des résultats légèrement différents, selon les regroupements de mutations que chacun aura jugés pertinents. Coïncidence de calendrier : pendant que j’écrivais ce script, Julien Meniel publiait une vidéo qui en est l’exemple parfait. Pour aller un peu plus loin, je vous propose de télécharger les données brutes de votre génome sur le site du labo, et de vous rendre sur GedMatch. Oracle
Petite précision importante : sur ce site, le choix est fait par défaut d’autoriser que votre génome apparaisse dans les moteurs de recherche génétiques (enquêtes judiciaires, recherche de liens de parenté, etc.). Je vous invite à vous inscrire sous pseudo (l’option est disponible dès la création du compte) et à vérifier attentivement les options de confidentialité dès que votre génome est chargé. En fait, le mieux c’est même de ne pas y placer ses résulats…
Une fois vos résultats uploadés, vous pouvez accéder au test « Admixture (heritage) ». Pour faire simple, il s’agit du même type d’algorithme que celui du labo. Alors quel intérêt, me direz-vous ? J’en vois principalement deux. Premièrement, avoir un second (voire un troisième) avis permet de distinguer ce qui est relativement solide de ce qui est franchement négociable et varie selon les algorithmes. Deuxièmement, et c’est là que ça devient intéressant, vous allez pouvoir choisir vous-même les populations que vous souhaitez tester. Attention cependant : l’algorithme va tenter de vous caser quelque part, quoi qu’il arrive. Si vous lui demandez de vous situer en Afrique alors que vos ancêtres n’y ont pas remis les pieds depuis 70 000 ans, attendez-vous à des résultats étranges. En revanche, si vous choisissez les bonnes populations de référence, tout devrait bien se passer. Je vous laisse en lien un petit blog qui explique brièvement quelles populations sont couvertes par quels projets (en anglais). Le projet MDLP, par exemple, couvre une bonne partie de la planète, et constitue un bon point de départ si vous ne savez pas vraiment d’où vous venez. Au-delà, vous pouvez partir sur quelque chose de plus ciblé, notamment si vous êtes d’origine africaine, européenne ou juive. Ce sont globalement les trois populations les mieux documentées génétiquement, tout simplement parce que ce sont les plus gros consommateurs de tests ADN : des Américains qui veulent retracer leurs origines européennes ou africaines, des Européens eux-mêmes, et une forte demande de la part d’acheteurs issus de l’immigration juive, beaucoup cherchant à savoir si leurs ancêtres leur ont laissé un peu plus que leur religion. Si vous venez d’ailleurs, il se peut que les données soient moins abondantes sur vos populations d’origine, et donc les résultats un peu moins précis (ce qui, on en convient, n’est déjà pas le point fort de l’exercice). Pour les Européens, le test à privilégier est probablement l’Eurogenes K13 (Free Tools / Admixture (heritage) / Eurogenes + Admixture Proportions (With link to Oracle)). Vous obtiendrez un camembert pas spécialement séduisant, que vous pourrez comparer à vos premiers résultats. Ce n’est pas le camembert qui m’intéresse, mais plutôt ce qui se trouve sous le lien “Oracle4”. Oracle est un algorithme qui teste la proximité de votre ADN avec ce qui est typiquement observé au sein d’un grand nombre de sous-populations, avec un maillage bien plus fin que ce qu’on a vu jusqu’ici. Pour chaque population, il évalue sa conviction que vous en soyez issu, et lui attribue un score : plus le score est bas, plus l’algorithme est convaincu que cette population est une candidate crédible à votre origine. Dans un premier temps, les scores sont affichés pour les 20 populations que l’algorithme a préférées. Dans mon cas, la France arrive en 12e position, coincée entre la Suède et la Norvège. En tête : quelques terres britanniques, puis les Anglo-Saxons, les Jutes, et d’autres joyeux aventuriers représentés par le Nord-Ouest de l’Allemagne, les Pays-Bas, le Danemark, la Suède et la Norvège. Plus bas, vous trouverez plusieurs tentatives de l’algorithme pour améliorer ce score. Jusqu’ici, il a supposé que tous vos ancêtres venaient du même coin depuis des siècles. C’est peut-être vrai, mais peut-être pas. Il va donc partir du principe que vos deux parents viennent de régions différentes, puis tester le cas où l’un d’eux a des origines mixtes, et enfin le cas où chacun de vos quatre grands-parents vient d’une région distincte. À moins que votre arbre généalogique ne soit éparpillé aux quatre coins du globe, vous devriez voir émerger quelques populations qui reviennent régulièrement. Dans mon cas, l’algorithme essaie systématiquement de me caser avec soit une moitié de Britannique (Irlande ou Écosse) complétée d’un quart d’Europe du Nord, soit l’inverse. Le dernier quart est toujours français. Si votre score à quatre ancêtres correspond à quatre fois la population déjà placée en tête du premier top 20, c’est que vous êtes quelqu’un de bien du cru ! À vous de voir si vous y voyez une fierté ou la marque de plusieurs siècles de consanguinité manifeste. Au choix. Dans tous les cas, je trouve que le résultat le plus instructif reste celui à une population, car il correspond à l’hypothèse favorite de l’algorithme sur la provenance de votre ADN. Si tous vos grands-parents sont nés à moins de 1 000 km les uns des autres, c’est sans doute le plus pertinent. Sinon, choisissez la configuration qui correspond à votre situation.
Haplogroupes paternel et maternel
Bon ! Pour en savoir plus, il faut maintenant remonter un peu plus loin dans le temps. Parce que les Jutes, les Saxons, les Bretons et les Armoricains, c’est bien gentil, mais on n’est remonté que d’un ou deux millénaires. Sans aller jusqu’aux origines du genre Homo, on dispose aujourd’hui d’un outil génétique particulièrement utile pour suivre les déplacements de l’espèce Homo sapiens : les haplogroupes.
Petit rappel de ce qui est détaillé dans un billet précédent : au milieu de tous les brassages génétiques qui remettent nos chromosomes en jeu à chaque génération, nous possédons tous un ou deux morceaux de génome relativement stables, dont on sait précisément de quel parent ils proviennent (avec les exceptions habituelles, la biologie étant ce qu’elle est). Ces régions permettent de suivre le déplacement des populations au fil des mutations. Il s’agit du chromosome Y chez les hommes, transmis de père en fils, et des mitochondries chez tout le monde, transmises par la mère. L’ensemble des individus partageant le même état de ces séquences (c’est-à-dire les mêmes mutations) forment ce qu’on appelle un haplogroupe.
Du côté matrilinéaire, nous descendons tous d’une femme à l’origine de l’haplogroupe L, qui vivait vraisemblablement il y a 160 000 ans dans ce qui correspond aujourd’hui à la Tanzanie. [1] [2] L’espèce existait déjà avant elle, mais son ADN mitochondrial a progressivement remplacé tous les autres. Elle est une grand-mère commune à toute l’humanité. Du côté paternel, l’ancêtre commun le plus récent, marquant l’haplogroupe A, est placé selon les hypothèses au Cameroun il y a 250 000 ans, ou plus généralement dans le quart Nord-Ouest ou le centre de l’Afrique, il y a 200 à 300 000 ans. [3] [4] [5]
Depuis ces deux ancêtres, nos chromosomes Y et génomes mitochondriaux ont eu le temps d’accumuler quelques mutations. Chacune d’elles est notée par une lettre ou un chiffre, dans l’ordre chronologique d’apparition. Mon haplogroupe mitochondrial, par exemple, s’appelle L3NRU5a2. Il correspond à une lignée qui a rejoint le Nord-Est de l’Afrique il y a 80 à 100 000 ans, quitté l’Afrique il y a 70 000 ans (soit 30 000 ans après les premiers sapiens à le faire), rejoint le Caucase il y a 60 à 70 000 ans, et fait partie des premières populations à s’avancer en Europe, notamment vers la Baltique puis le Nord-Ouest du continent. Je ne vais pas entrer dans le détail de tous les haplogroupes existants (il y en a beaucoup trop) mais voici une méthode simple pour retracer le parcours de vos propres lignées.
Sur le site du labo, vous devriez trouver la liste des mutations portées par vos mitochondries. Prenez la dernière (L3NRU5a2 dans mon cas), et partez à la recherche d’informations sur cette mutation. Wikipedia est un bon point de départ, et si vous lisez de la littérature scientifique, Google Scholar ou PubMed feront l’affaire. Une fois que vous avez fait le tour, prenez la mutation précédente (L3NRU5a) et répétez l’opération, en vous limitant à la période qui s’étend de l’apparition de cette mutation jusqu’à celle de la suivante. Inutile d’aller plus loin, puisque votre groupe (L3NRU5a2) s’en est séparé à ce moment-là. En remontant ainsi étape par étape jusqu’à l’haplogroupe L, vous aurez une vue d’ensemble de la trajectoire suivie par votre lignée matrilinéaire. Si vous possédez au moins un chromosome Y, vous pouvez faire de même du côté paternel. Sinon, les résultats de votre père, votre frère, ou un oncle ou cousin paternel feront l’affaire (à condition qu’il n’y ait que des hommes entre vous et cette personne dans l’arbre).
Nota bene : gardez en tête que les haplogroupes mitochondrial et Y ne représentent que deux individus par génération dans votre arbre généalogique, et ne permettent donc pas de retracer le parcours de l’ensemble de vos ancêtres.
Populations ancestrales
Pour compléter cette frise chronologique, GedMatch propose également un algorithme qui cherche à vous rapprocher uniquement de populations ancestrales connues. C’est un bon point de départ pour étoffer votre généalogie sur les derniers millénaires : vous pourrez apprendre que vous tenez particulièrement de telle culture connue pour son artisanat, son mode de vie nomade ou sédentaire, sa pratique de la chasse au mammouth ou de l’élevage de chèvres. Cela dit, passé un millier d’années en arrière, tout un continent finit par partager des ancêtres communs. La proximité avec tel ou tel peuple ancestral tient avant tout aux aléas du brassage génétique, bien plus qu’à une filiation directe. Ne voyez ceci que comme une invitation à vous intéresser à l’histoire des peuples.
Avec tout ce qu’on a parcouru, j’espère que vous avez de quoi commencer à construire votre propre carte et frise chronologique. Il reste quelques points à aborder : le cadre légal, et le volet santé. C’est pour le prochain billet !