20.3.08

« Les vainqueurs ne punissent pas » (mais Zorro a peut-être beaucoup d’enfants)

La théorie des jeux aide les chercheurs à comprendre le fonctionnement des sociétés humaines et son évolution. Un classique du genre est le dilemme du prisonnier. Dans la forme basique, les deux joueurs ont le choix entre l’option « coopérer » (altruiste ou coopérateur) et l’option « faire défaut » (égoïste ou tricheur) : coopérer signifie faire gagner deux unités à l’autre et en perdre une soi-même ; faire défaut signifie gagner une unité et en faire perdre une à l’autre. Donc, quand les deux joueurs coopèrent, ils gagnent chacun une unité ; quand les deux font défaut, ils ne gagnent rien ; quand l’un coopère et l’autre fait défaut, le coopérateur perd deux points et le tricheur en gagne trois. Quand le jeu est réitéré un certain nombre de fois, il se révèle que le meilleur moyen de gagner est de se montrer altruiste, mais de tricher dès que l’autre a triché (stratégie dite du « tit for tat » ou donnant-donnant). Le dilemme du prisonnier aide notamment à modéliser la persistance de stratégies altruistes et égoïstes dans l’espèce humaine, et il connaît beaucoup de variantes plus ou moins sophistiquées (comme l’inclusion des réputations des joueurs).

Des chercheurs dirigés par Martin A. Nowak ont testé sur 104 sujets une version informatique légèrement différente de la version basique du jeu du prisonnier, incluant une troisième option : la punition. Celui qui punit un autre (par exemple s’il a fait défaut) perd un point, mais le joueur puni en perd quatre. Hors laboratoire, cette « punition altruiste » correspond à des situations de vie où l’on fait une action bénéfique pour le groupe mais (potentiellement) coûteuse pour soi (intervenir dans une bagarre, prendre une initiative risquée contre une injustice, etc.). Le jeu de Nowak et de ses collègues permet de voir si cette stratégie a une chance d’émerger dans le comportement d’un groupe (c’est-à-dire si elle apporte des gains lorsque le jeu est réitéré).

Le résultat est assez intriguant. Les joueurs ont utilisé l’option de punition dans 7 % des choix. La coopération est passée de 21 % (dilemme du prisonnier classique sans punition) à 52 %. Cela semble donc tout bénéfice pour le groupe… mais en fait, non : les gains cumulés sont strictement identiques dans les deux cas (pas d’avantage collectif) ; plus un joueur a puni, plus ses gains finaux sont faibles (désavantage individuel et donc mauvaise stratégie évolutive) ; les gagnants sont ceux qui n’ont jamais puni un autre joueur. Les chercheurs suggèrent donc que le comportement de « punition » n’est pas apparu dans l’évolution pour renforcer spécifiquement l’altruisme, car il ne représente pas une option intéressante à long terme pour l’individu qui punit ni pour son groupe, mais plutôt pour d’autres fins, comme imposer la dominance et la soumission. Il se peut aussi que la punition donne d’autres avantages au sein du groupe, mais ceux-ci ne sont pas documentés pour le moment. Il faudrait par exemple analyser la descendance de Zorro ou de Robin des Bois pour voir si leur bonne réputation en tant que « punisseur altruiste maximaliste » leur a permis de séduire un plus grand nombre de partenaire du sexe opposé, sait-on jamais…

Référence :
Dreber A. et al. (2008), Winners don't punish, Nature, 452, 348-351.

Illustration : Guy Williams, interprète de la série Zorro (1957-59), DR.

Aucun commentaire: