11.11.08

L'énigme de l'héritabilité manquante

La génomique individuelle se mondialise à son tour : après les stars occidentales (James Watson, Craig Venter), les deux premiers séquençages complets d’individus non-européens sont publiés cette semaine dans Nature : un Chinois de l’ethnie Han et un Africain de l’ethnie Yoruba, dont les gènes ont été respectivement analysés par les équipes de Jun Wang (Institut de génomique de Pékin) et de David Bentley (Illumina Cambridge, Royaume-Uni). Les chercheurs ont utilisé pour cela un nouvel outil de séquençage haut-débit (Illumina GA) : en un seul cycle, ce séquenceur produit trois à quatre fois plus d’informations, déchiffrant par fluorescence des paquets de 35 nucléotides. Le travail sur les deux nouveaux génomes a confirmé la variabilité interindividuelle sur trois niveaux : les SNPs bien connus (polymorphisme d’un seul nucléotide) ; les insertions / délétions de plusieurs nucléotides ; les variations structurelles (lorsque plus de 1000 nucléotides sont insérés ou supprimés d’une séquence ADN) dont les variations du nombre de copies (CNVs, lorsque des segments d’ADN sont dupliqués à l’identique), ayant été récemment impliquées dans de nombreux traits pathologiques ou non.

Dans un papier de commentaire, Brendan Maher pose le problème intéressant des «gènes manquants». De nombreux traits humains ont montré une forte héritabilité : plus de 80% pour certaines formes d’autisme ou de schizophrénie, pour l’intelligence, pour la taille, par exemple. Or, les généticiens peinent à identifier les gènes impliqués. Prenons la taille : son héritabilité est estimée à 80-90% selon les études menées depuis un siècle. Cela signifie que s’il y a 30 cm de différence entre les 5% d’individus les plus petits et les 5% plus grands d’une population, environ 25 cm sont dus aux gènes de ces individus, le reste à leur environnement. Mais si les études menées sur des populations larges (plus de 30.000 personnes) ont effectivement identifié une quarantaine de gènes associés à la taille, l’estimation de leur poids total dans la variation interindividuelle n’excède pas… 5%. Et il en va de même pour de nombreuses autres caractéristiques, dont l’intelligence ou les maladies complexes. Grâce aux études dites d’association sur le génome entier (GWAS pour genome-wide association studies), on peut analyser un grand nombre de gènes et de leurs variantes sur deux cohortes. Mais l’effet cumulatif des variantes ainsi identifiées reste pour le moment très en deçà de l’héritabilité estimée.

Quelles peuvent être les causes de ce fossé entre hérédité (les gènes dont nous sommes porteurs) et héritabilité (la part de ces gènes dans nos différences) ? La plus simple serait une erreur dans les calculs de l’héritabilité elle-même. La plupart des chercheurs sont confiants dans ceux-ci, mais certains doutent que l’ensemble des facteurs environnementaux aient été bien pris en considération. Ainsi, l’épigénétique complique depuis quelques années la séparation entre la part des gènes et celle des milieux : un même gène peut varier son expression lorsque son environnement chimique immédiat (notamment sa liaison avec les histones, molécules de soutien) diffère. Comme le milieu cellulaire des gènes d’un individu connaît des destins très divers, notamment dans l’environnement intra-utérin et les échanges moléculaires avec la mère, il y a peut-être là un facteur de diversité mal évalué. L’autre problème des études d’héritabilité concerne le trait concerné : sous une même dénomination (dépression, autisme, schizophrénie, mucoviscidose…), on classe parfois une batterie de symptômes assez variables d’un individu à l’autre.

Mais la plupart des chercheurs pensent surtout que l’héritabilité manquante provient de carences dans l’information et la modélisation génétiques.

Côté information, la mesure des variations génétiques évoquées plus haut dépend de la quantité et de la qualité des données sur un grand nombre d’individus : avec quatre génomes (presque) complets, on est encore loin d’évaluer la diversité génétique réelle de l’humanité. On identifie souvent des régions associées à des traits (notamment par marqueurs de déséquilibre de liaison, c’est-à-dire association probable entre une partie et une autre partie de l’ADN hérité), mais seule une analyse complète et in situ, nucléotide par nucléotide, permet de comparer des séquences en dernier ressort. Un autre problème est de nature statistique : des variations à très faible pénétrance peuvent échapper au filet des comparaisons intergénomiques pour un trait et une population donnés, de même que des variations à haute pénétrance mais très rares chez les individus.

Côté modélisation, l’héritabilité manquante pourrait provenir de plusieurs sources. L’une d’elle est l’épistasie, c’est-à-dire l’interaction entre les gènes : leur influence n’est pas simplement additive, ou dominante/récessive, mais aussi bien interactive et seule une approche systémique par réseaux de gènes permettra de l’évaluer. Une autre source d’incertitude est l’interaction gène-environnement : dans certains cas, la présence de gènes parfaitement fonctionnels ne suffit pas à l’émergence d’un trait chez l’individu en l’absence de certaines stimulations environnementales. Par ailleurs, au-delà des classiques SNPs, qui représentent 90% des différences sur les parties codantes de l’ADN (exons), on commence seulement à mesurer le poids des variations structurelles du génome, notamment les CNVs qui peuvent surgir de novo (sans que les parents de l’individu les possèdent). De même, les parties non codantes et répétitives de l’ADN, parfois appelées ADN déchet (junk DNA), ne semblent pas si inutiles qu’on le pensait et une équipe singapourienne vient juste de montrer que certains facteurs de transcription des gènes se lient préférentiellement à ces éléments répétés (Bourque G. et al. 2008). On commence donc seulement à mesurer la diversité et la complexité des génomes : les surprises ne manqueront pas dans les prochaines années, à mesure que la génétique quantitative à grande échelle et les analyses qualitatives de cohorte accumuleront des données exploitables.

Références :
Bentley D.R. et al. (2008), Accurate whole human genome sequencing using reversible terminator chemistry, Nature, 456, 53-59, doi:10.1038/nature07517
Bourque et al. (2008), Evolution of the mammalian transcription factor binding repertoire via transposable elements, Genome Research, 18, 1752-1762, doi: 10.1101/gr.080663.108
Maher B. (2008), Personal genomes: The case of the missing heritability, Nature, 456, 18-21, doi:10.1038/456018a
Wang J. et al. (2008), The diploid genome sequence of an Asian individual, Nature, 456, 60-65, doi:10.1038/nature07484

1 commentaire:

Anonyme a dit…

bonjour, pas de message depuis le 11 novembre, suis en manque, espère que tout va bien :-))