La réponse du classement wikio

Le lancement du blog darwin2009 m’a permis de faire pour de bon la petite expérience que j’avais voulu lancer sans succès il y a quelques semaines : avoir une idée des ordres de grandeur entre le nombre de liens et le classement du blog dans wikio.

Voici donc le protocole expérimental :

  • lancer un blog
  • le lier
  • regarder la dépendance entre nombre de liens et classement
  • le cas échéant, regarder l’évolution au cours du temps du classement

Il y a un peu plus d’un mois, j’ai donc lancé au nom du c@fé des sciences un blog sur l’année Darwin sur le site du monde. Je l’ai aussitôt inscrit sur wikio  pour pouvoir suivre l’évolution du blog dans le classement.

Durant ce mois, le blog darwin a été lié par une douzaine d’autres blogs. Outre le mien, le blog darwin a été évoqué sur (je ne compte que les billets pris en compte par wikio selon moi) :

Qu’ils en soient tous remerciés. Cette douzaine de liens sur un mois a propulsé le blog darwin2009 directement à la 9ième place du classement wikio en Science qui correspond à la 1149 places du classement général ( il y a de façon consistante depuis plusieurs mois un facteur 100 entre le classement général et le classement scientifique, ce qui indique probablement qu’il y a environ 1% de blogs « Science » sur la blogosphère française).

On a donc une assez bonne idée de l’ordre de grandeur du nombre de liens nécessaires pour être à une place donnée dans le classement : parti de rien, une douzaine de liens le premier mois vous assure d’être aux alentours du top mille. Dit autrement, le top mille doit être autour de quelques liens (genre 2) par mois en moyenne (le classement wikio est moyenné sur 6 mois) : ce n’est vraiment pas beaucoup 😛 .

La deuxième question que je me suis posée, c’est de savoir comment le classement varie avec le temps. Classiquement, de nombreux indicateurs sur le web (comme la popularité) sont en lois de puissance : on s’attend notamment à ce que le traffic, le nombre de liens  … d’un site internet classé au rang k  (appelons le n(k) ) varie proportionnellement à n(k)=A exp(-alpha k) où A et alpha sont des  paramètres caractéristiques du réseau. En fait, toute la dynamique du classement wikio est contenue (en gros) dans la connaissance du paramètre alpha.

Imaginons par exemple que tout d’un coup, le nombre de liens vers un blog double : quelle est la progression dans le classement ? On a alors le nouveau rang l qui vérifie A exp(-alpha l)=2 A exp(-alpha k), soit 2=exp(alpha (k-l)), soit k-l=ln (2)/alpha . On voit donc que le nombre de rangs gagnés  est de l’ordre de 1/alpha.

Comment estimer alpha ? J’ai déjà deux points de comparaison : le blog darwin et ce blog-ci.  tomroud.cafe-sciences.org a atteint depuis quelques mois une sorte de rythme de croisière  scotché à la sixième place du classement science (enfin 5ième ce mois-ci), ce qui correspond aussi à environ la 500 ième place au classement général. Pour fixer les idées, je suis linké environ une demi-douzaine de fois par mois (en tous cas selon blogsearch, mais cela me paraît coller à ma propre perception). Donc 6-7 liens par mois vous assure la 500ième place dans le classement. En nombre de liens par mois, sur six mois (la période la plus importante prise en compte sur le classement wikio), le blog darwin a environ 2 liens par mois. On voit donc que 500 places correspondent à en gros un facteur 3 sur le nombre de liens, ce qui permet d’estimer alpha autour de 0.002.

Je trouve donc une valeur d’alpha vraiment petite. Utilisant ma formule plus haut, une conséquence de cela est qu’ on gagne environ 350 places en doublant son nombre de liens entrants. Ceci explique notamment que des progressions impressionantes dans le classement wikio ne soient pas rares : si vous regardez le classement général, vous verrez qu’il y a des bonds dans les deux sens de 50 à 100 places. Un gain ou une perte de 100 places correspond, avec un alpha de 0.002, à un gain ou une perte de liens de 20%, ce qui n’est pas beaucoup, particulièrement pour un blog ayant 5 à 10 liens entrants par mois  : un ou deux nouveaux liens en plus par mois suffisent ! C’est d’ailleurs pour cela que les bonds dans le classement sont particulièrement répandus au-delà de la 100ième place, là où le nombre de liens entrants mensuels va devenir de plus en plus petit et où donc un lien gagné par mois compte de plus en plus.

Au final, pour des ordres de grandeurs reliant liens et classement, mon estimation est  :

  • 1000ième place : 2 -3 liens entrants par mois/ douzaine de liens entrants sur six mois
  • 500ième place : 6-7 liens entrants par mois/ quarantaine de liens entrants sur six mois
  • 100ième place : grosse quinzaine de liens entrants par mois/ centaine de liens entrants sur six mois

Cela vous semble-t-il correct ? Ce qui me frappe toutefois est la petitesse de tous ces chiffres : même si je me suis un peu trompé dans une estimation, il me semble assez clair qu’il y a vraiment peu de liens et qu’en conséquence, le classement n’est pas super significatif à mon avis. En particulier, il me paraît assez difficile de lutter contre les effets de cliques des blogueurs qui se linkent les uns les autres; je suis à peu près sûr que si les c@fetiers des sciences par exemple se linkaient tous les uns les autres tous les mois, ils ne seraient pas loin du top 100 général !

Disclaimer :

Bien sûr mon raisonnement ici est assez grossier, et ne tient pas compte de tout un tas de subtilités prises en compte dans la classement wikio : « autorité » des blogs liant pour pondérer le score, décroissance exponentielle des prises en compte des liens pour le classement, etc… Il est aussi possible que mon modèle en loi de puissance soit un peu faux. Mais je crois que ces subtilités sont relativement annexes et que les ordres de grandeurs que je trouve ne sont pas si loin de la réalité, si bien que la dynamique qualitative du classement me semble bien se comprendre.

8 réflexions au sujet de « La réponse du classement wikio »

  1. Comme n’importe quel classement wikio prend un critère principal qui est celui du nombre de liens d’importances sur une durée précise.

    Cependant même si c’est sans doute bien d’être bien positionné sur wikio, un bon classement n’est pas forcément synonyme de beaucoup de visites.

    Parfois j’ai l’impression que le classement s’auto entretient, les blogs en haut de classement faisant un lien vers les autres blog en haut du classement étant plus important que 10 blogs qui font un lien en bas de classement, et pourtant 10 liens correspondent à 10 personnes qui ont trouvé une info intéressante.

    Mais ce test me parait assez réaliste.

    Enfin au final c’est bien d’avoir des visiteurs réguliers plutôt que d’être bien classé de temps en temps dans un classement quel qu’il soit.

  2. Enro> Ce n’est pas un bug de la backlink factory. Le Café de Morlaix n’a effectivement reçu aucun lien.

    C’est lié à la pénurie de lien dont parlait Tom. Il faut bien voir que « Science » est une petite catégorie. Si le Café de Morlaix est 78e dans sa categ, il est en fait presque 20000e dans le classement général. Et là, on est dans la zone des blogs qui n’ont aucun lien du tout. Comme je l’ai expliqué sur mon blog, dans ce cas c’est l’ancienneté qui départage.

    Ce n’est pas bon du tout. Mais que faire ?

    J’ai suggéré à Wikio de ne publier qu’une liste plus réduite (50 par exemple) sur ces petites catégories, car le classement n’a pas beaucoup de sens dans les profondeurs.

  3. @ Hebdo : Jean a mis il me semble un poids logarithmique dans le classement pour pondérer les liens. C’est un effet assez faible pour mettre une hiérarchie dans les liens tout en évitant justement une effet de clique. Je ne suis pas sûr que cela changerait grand chose d’ailleurs de mettre tous les poids à 1, mais bon…

    @ Jean et Enro : oui, cela ne m’étonne pas qu’on arrive vite à des effets « zéro liens ». Mais dans ce cas, puis-je suggérer de prendre en compte non seulement l’ancienneté, mais aussi le meilleur classement passé par exemple ?

    Sinon, merci pour le lien vers la backlink factory que je ne connaissais pas. C’est intéressant de voir la comparaison avec ma liste effectivement : il y a clairement beaucoup moins de liens pris en compte que ce que je pensais, et je ne suis pas sûr à la lumière de cette liste qu’il n’y ait pas un petit effet de clique entre tomroud.cafe-sciences.org et le blog darwin !
    L’autre truc qui me frappe est que manifestement, il est très difficile de prendre en compte les liens depuis les sites d’information (peut-être qu’ils ne sont pas dans le flux RSS). Par exemple, Rue89 a linké mon blog au moins deux fois ces derniers mois (dans les articles que j’ai écrits pour eux !) mais cela n’apparaît pas, franceinter a aussi linké le blog darwin, 20minutes vient aussi de me linker ici, etc… Il est vrai que ces liens n’apparaissent sur aucun outil de « tracking » des liens, que cela soit blogsearch, technorati ou autres. En même temps, ce n’est pas forcément un mal : même si wikio n’attrappe qu’une fraction des liens, cela doit être suffisamment représentatif, en haut du classement en tous cas.

  4. PS : sinon, mon estimation n’a pas l’air trop mauvaise, je vois par exemple dans wikiolabs que les blogs autour de la 100ième place tournent bien autour d’une quinzaine de source par mois ( Apathie ou criticus par exemple).
    En revanche, il semble bien que pour les premières places, il y ait un changement de comportement (ce qui ne m’étonne pas) : Eolas tourne par exemple à environ 90 sources par mois. Je crois que c’est un effet connu de ces statistiques en loi de puissance qu’il se passe des choses bizarres proche de k=0, mais ce serait intéressant de modéliser cela…

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *