Les maths du mème

Au moment même où je publiais mon billet sur la propagation du mème des six choses insignifiantes, un article de PNAS (compte-rendu de l’académie des sciences américaine) proposait une étude et un modèle de la propagation des chaînes d’e-mail.

Nous connaissons tous ces messages, pétitions et autres recettes de cuisine à transmettre : vous recevez un e-mail, qui vous demande d’ajouter votre nom à une liste et de forwarder celle-ci à vos amis.

Liben-Knowell et Kleinberg ont étudié la dynamique d’une telle chaîne de lettres : il s’agissait d’une pétition contre la guerre en Irak en 2002-2003. Ils ont trouvé 637 exemplaires de cette pétition, contenant au total plus de 20 000 noms ! Un outil idéal pour comprendre la propagation de l’information sur les réseaux.

La figure s’étendant tout le long du billet représente  l’arbre généalogique des e-mails transférés. Les conventions sont exactement les mêmes que dans mon billet sur les mèmes : un noeud de l’arbre représente une personne transférant la pétition à ses amis qui sont ses « enfants » dans l’arbre généalogique.

Les auteurs ont étudié la structure statistique de cet arbre et ont relevé la même propriété surprenante dont je parlais dans mon billet sur les mèmes : l’épidémie n’est pas exponentielle. Ainsi même si la plupart des gens forwardent leur pétition à beaucoup de monde, plus de 90% des noeuds n’ont qu’un enfant (ce que je voyais aussi dans mon étude précédente, où en moyenne un père avait 1.07 enfant).  C’est ce qui explique que ce genre de pétitions peut s’étendre sur beaucoup de générations : la propagation est en fait très lente car le nombre de personnes atteinte à la génération n n’est pas exponentiel mais quasiment linéaire. C’est donc un mode de propagation en fait assez inefficace.

Les auteurs soulignent que ce genre de réseau est en fait assez inhabituel. Vous avez sans doute entendu parler de l’histoire des « six degrés de séparation » ou des « six poignées de main »: prenez deux personnes dans le monde, alors en général vous pouvez reconstituer une chaîne d’amis/de connaissances entre ces deux personnes qui n’a pas plus de six personnes dans la chaîne. Un exemple : George Bush et moi. Je connais mon directeur de thèse, qui connaît Edouard Brézin (président de l’académie des sciences), qui connaît Valérie Pécresse, qui connaît Nicolas Sarkozy, qui connaît George Bush. Je suis donc au plus à 5 degrés de séparation de George Bush (en fait je suis probablement même beaucoup plus proche de lui via mes connaissances américaines). Imaginez l’impact d’une épidémie se transmettant par les poignées de main dans un tel réseau ! On aurait dans ce cas-là une propagation exponentielle qui se propagerait rapidement au monde entier. Tout le contraire de cette pétition qui se propage pendant un temps très long.

Les auteurs ont alors essayé de construire un modèle produisant des arbres statistiquement similaires à cette pétition. Le premier modèle est assez naturel : ils ont pris comme base un réseau social typique, puis ont supposé que dans ce réseau social, chaque personne recevant la lettre avait une certaine probabilité de continuer la chaîne et de la transmettre à ses amis. Quels que soient les paramètre choisis, ce modèle échoue à reproduire la caractéristique essentielle de l’arbre qui est que chaque père n’a pas beaucoup plus qu’un enfant en moyenne et que la plupart des pères n’ont qu’un enfant.

Ils ont alors introduit un paramètre supplémentaire dans les équations : le temps. Lorsque l’on reçoit une telle chaîne, si nous répondons, nous ne répondons pas immédiatement. Nous prenons un certain temps. Or, cette dimension temporelle est cruciale pour la dynamique. Lorsqu’une personne reçoit une telle pétition, elle l’envoie à ses amis. Mais tous ces amis ne vont pas transférer l’e-mail simultanément; il y aura une personne du groupe d’ami qui va ajouter son nom sur la liste en premier et va avoir tendance à la transférer … au même groupe d’amis. Puis une seconde personne de ce groupe d’amis, si elle choisit de continuer la chaîne, va ajouter son nom à la suite de la pétition reçue le plus récemment, donc la seconde pétition (et pas celle issue du premier ami). L’effet final est qu’un groupe d’amis ne donne pas naissance à plein de petits arbres indépendants, mais plutôt à une liste linéaire dans laquelle chaque personne n’a pas beaucoup plus qu’un descendant. Le modèle mathématique donne alors des formes d’arbres beaucoup plus proches des arbres réels. 

On observait effectivement un effet similaire  dans la chaîne de mèmes sur les blogs : en tenant compte de tous les liens, on voyait apparaître une carte en couleurs dans laquelle les amis se regroupaient en fonction des intérêts thématiques. Les gens d’un groupe étaient en général taggés préférentiellement pas les personnes du même groupe. Du coup, un « groupe » n’avait collectivement pas tellement de descendants hors du groupe, d’où la faible efficacité de la propagation. Tiens, je réalise d’ailleurs que mon regroupement thématique en couleurs confirme un peu leur modèle mathématique !

Conclusion : comme me le conseillait Titechophie, la prochaine fois, je soumettrai mon billet à PNAS (d’autant que leur étude a été citée dans les editor’s choice de Science…) ;).


Référence

David Liben-Nowell and Jon Kleinberg, PNAS, 2008, vol. 105, no. 12, 4633-4638

5 réflexions au sujet de « Les maths du mème »

  1. Interessant! Pour trouver un modele de propagation semblable a ceux des chaines d’email, a-t-on essaye de modeliser un modele « sans remise »? C’est-a-dire une propagation dans laquelle il est interdit de propager un « meme » a une personne l’ayant deja rrecu (ou soupconnee de l’avoir recu)? J’ai l’impression que c’est le phenomene que tu decris avec des cercles fermes de personnes qui se connaissent toutes entre elles, mais en dehors desquels chacun ne connait finalement que peu de personnes…

  2. @ Xochipili : j’ai l’impression que ça pourrait marcher, sauf qu’il faut voir que les gens propagent le mème, donc en fait une partie de la probabilité de transmettre le mème doit être « transférée » dans la probabilité de ne rien transmettre (car tu transmets à un groupe de gens – un « cluster »- ayant déjà reçu le mème). Cela rend les choses un peu compliquées car cela veut dire que le taux de transmission dépend du réseau local; en fait il faudrait supposer un taux de transmission de cluster à cluster peut-être et supposer qu’à l’intérieur d’un cluster la transmission est linéaire. C’est un peu capillotracté par rapport à une simulation directe je pense, même si ce n’est pas faux.

  3. Ping : Tweets that mention Les maths du mème — tomroud.cafe-sciences.org -- Topsy.com

  4. Ping : Tweets that mention Les maths du mème — tomroud.com -- Topsy.com

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *