6.5.08

Diversité du génome humain

Voici quelques années, la plus grande publicité a été faite autour du séquençage du génome humain commencé en 1990. Beaucoup en concluent à tort que l’on connaît désormais le génome de notre espèce. En réalité, le séquençage achevé en 2003 est plutôt un génome de référence, assemblage de plusieurs génotypes différents qui ont été « lus » par bribes. Les progrès de la bio-informatique, notamment l’automatisation de ces séquençages, font que l’on commence à analyser des génotypes individuels pour les comparer à ce génome de référence. Et l’on trouve des différences riches d’enseignement, soit dans l’écriture des gènes, soit dans celle des nombreuses régions non-codantes de l’ADN les entourant.

Un consortium de l’Université de Washington, rassemblant plusieurs plateformes de séquençage, vient ainsi de se pencher sur les génotypes de huit individus, quatre d’origine africaine, deux d’origine européenne et deux d’origine asiatique. L’étude des différences génétiques entre les individus a habituellement pour cible privilégiée les SNP (single polymorphism nucleotid), des variations d’une paire de bases sur l’ADN. (Pour mémoire, les bases en question sont l'adénine (A), la thymine (T), la cytosine (C) et la guanine (G) associées par des liaisons hydrogène et dont la succession forme le code génétique). Ces SNP représentent 90 % des variations d’un génotype à l’autre.

Les chercheurs se sont ici penchés sur les variations du nombre de copies (CNV pou copy-number variant), concernant quelques milliers à quelques millions de paires de bases. Les CNV prennent la forme d’insertions, de suppressions ou d’inversions dans l’écriture des paires de bases sur les chromosomes. Ils ont mis en évidence pas moins de 1695 sites de variations structurelles sur le génome, de taille supérieure à 6000 paires de bases, 525 régions à polymorphisme prononcé (c’est-à-dire très variables d’un individu à l’autre). Ces différences s’ajoutent aux 4 millions de SNP connus (et aux 796 273 variations courtes, de 2 à 100 paires de bases). La prochaine étape consistera à examiner en détail ces séquences pour évaluer leur importance sur l’activité des gènes, sur la susceptibilité aux maladies ou sur la diversité des traits.

Référence :
Kidd J.M. et al. (2008), Mapping and sequencing of structural variation from eight human genomes, Nature 453, 56-64, doi:10.1038/nature06862.

Aucun commentaire: