Non classé Sciences

Réenchanter la science, collectivement

J’ai profité de la pause de fin d’année pour me plonger dans le relativement fameux « Reinventing Discovery« , de Michael Nielsen, revu et encensé un peu partout. Dans cet essai, Nielsen, un physicien théoricien se consacrant à l’écriture scientifique à l’occasion d’un congé sabbatique, présente sa vision d’une future science en réseau et citoyenne.

La thèse de Nielsen est simple : la prochaine révolution scientifique passera par une science totalement ouverte, participative, citoyenne, utilisant naturellement la force de frappe des réseaux de toutes sortes et notamment le temps de calcul humain évoqué sur ce blog. Nielsen passe l’essentiel de son livre à appuyer ses propos en disséquant moult exemples actuels de cette vision (dont la plupart m’étaient inconnus) :

  • le projet Polymath. Il s’agit ici à la base d’un blog, lancé par Terence Tao, médaille Fields en 2005 à 31 ans. L’idée de Tao était de proposer des problèmes de maths non résolus sur son blog, et d’ouvrir la discussion en commentaires sur la meilleure façon de les résoudre collectivement. Le premier projet Polymath résolu a été mis sur l’arXiv en Octobre 2009
  • le projet Galaxy Zoo. Devant la masse de données produites par Hubble, il est impossible aux astronomes de classifier toutes les galaxies observées, et il est demandé dans ce projet au grand public d’utiliser leur temps de calcul humain pour opérer cette classification. Le projet a rapidement bifurqué vers des directions inattendues grâce aux forums de discussions : ainsi de nouveaux types de galaxies ont été carrément découverts par les internautes, comme les galaxies « petits pois ».
  • Fold-it, dont on a parlé longuement ici.
  • d’autres projets collaboratifs moins scientifiques, comme le match d’échecs Kasparov vs The World. Durant ce match, tous les Internautes étaient libres de voter pour chacun des coups de l’équipe « The World », et le vote majoritaire était retenu. Apparemment, Kasparov a qualifié cette rencontre de plus grand match d’échec de tous les temps. N’y connaissant rien aux échecs, je laisse les spécialistes juger.

Au-delà de la liste d’exemple, Nielsen dissèque assez bien (selon moi) ce qui fait que ces projets collaboratifs peuvent marcher. Il y a bien sûr les projets de parallélisme brut, tels Fold-it ou Galaxy Zoo, où, en somme, les cerveaux humains se substituent aux ordinateurs incapables de traiter des tâches complexes très faciles pour l’intelligence humaine. Ces projets font donc appel à tous les Internautes, et n’importe qui peut ainsi contribuer à la science même sans avoir fait d’études scientifiques. Il suffit donc d’un petit pourcentage d’internautes motivés se passionant pour l’entreprise pour produire des résultats significatifs, les scientifiques professionels jouant le rôle de canalisateurs, d’interpréteurs de résultats ou plus prosaiquement de fournisseurs d’outils d’analyse.

Le deuxième type de projet ressemble plus à un processus de recherche classique, dans lequel Internet joue le rôle de levier en canalisant et concentrant les discussions entre scientifiques. Nielsen dégage quelques critères intéressants pour le succès d’une telle entreprise. L’un d’eux me paraît très intéressant : pour qu’une discussion scientifique sur Internet soit productive, il faut que les différents intervenants puissent identifier de façon quasi objective un progrès ou une bonne idée. Prenons l’exemple des échecs : tout le monde n’est pas capable de jouer comme Kasparov à tous les coups, mais nul besoin d’être Kasparov pour reconnaître un grand coup. De même, un mathématicien amateur n’est peut-être pas capable de produire une démonstration valant une médaille Fields, mais il est capable de reconnaître une grande idée si on la lui présente. Or, continue Nielsen, tous les scientifiques sont de facto hyper spécialisés, et sont capables de produire des idées exceptionnelles sur leur micro-spécialité. Si ces idées sont reconnaissables immédiatement par l’agora des chercheurs, la recherche peut alors avancer à vitesse grand V sur le réseau, dans un processus très darwinien qui est à la fois capable de générer de nombreuses idées (micro-spécialité des chercheurs) et de sélectionner à bon escient celles qui sont les plus prometteuses (reconnaissance objective des avancées par l’intelligence collective).

Si le propos et les exemples sont très intéressants, le scientifique professionel sait évidemment que les choses ne peuvent se passer comme cela dans un monde idéal, et après une brève introduction des problèmes en début de livre, il faut attendre le dernier chapitre pour que Nielsen présente enfin des solutions pour ouvrir la science conformément à ses voeux. Car le problème essentiel aujourd’hui est que la reconnaissance scientifique, celle qui fait qu’on puisse vivre de la science, passe par la publication scientifique nominative. Et que qui dit publication scientifique dit risque de se faire scooper, ce qui est un frein considérable au partage des données et des idées.

Nielsen prend alors un contrepied intéressant en mettant en perspective l’histoire des sciences, et en rappelant les pratiques passées. On apprend notamment qu’il était de bon ton autrefois de ne pas publier ses idées scientifiques, pour des raisons assez similaires à aujourd’hui : la peur de se faire voler ses idées avant d’avoir pu les exploiter complètement. Nielsen raconte notamment cette anecdote que j’ignorais sur la découverte des anneaux de Saturne. Après les avoir observés, Galilée envoya à Kepler (et à d’autres) le message suivant :

smaismrmilmepoetaleumibunenugttauiras

qui était en fait l’anagramme de :

Altissimum planetam tergeminum observavi

(Traduction : j’ai observé que la planète la plus éloignée a une forme triple).

L’idée de Galilée était que sa découverte restait « cachée » dans l’anagramme, mais que si besoin était dans le futur, il pourrait révéler le sens de l’anagramme et ainsi s’assurer de l’antériorité de la découverte.

On a là une espèce de dilemme du prisonnier : chaque scientifique individuellement n’avait pas intérêt à publier seul ses résultats, mais l’intérêt collectif était de favoriser une publication maximale. Nielsen explique que ce sont les mécènes de la science qui ont, de facto, imposé un peu de coercition : en rétribuant la publication scientifique, en en faisant la condition pour la reconnaissance et l’avancement dans la carrière, on a forcé les scientifiques à publier ce qu’ils gardaient dans leur cerveaux ou leurs tiroirs, et à en faire ainsi bénéficier la collectivité. Une fois le processus enclenché et les bonnes pratiques mises en place, plus personne n’avait intérêt à « jouer perso » et c’est ce que Nielsen appelle la première révolution de la science ouverte, structurant les pratiques de publication scientifique actuelle. Nielsen note également que cette problématique reste d’actualité : par exemple, tous les génomes séquencés ne sont pas encore publiés pour des raisons exactement similaires, et il a fallu un protocole d’accord collectif entre scientifiques il y a 15 ans, les principes des Bermudes, pour que les données du génome humain soient mises en accès libre avant même la publication.

Pour ouvrir un peu plus la science et parvenir à la révolution qu’il appelle de ses voeux, Nielson s’inspire du passé. Tout étant question d’incitations financières, son idée est de frapper le nerf de la guerre, et que tout changera le jour où les agences de financement valoriseront les données ouvertes, partagées et plus généralement « l’open science ». Mais la coercition extérieure ne suffira pas : il faut que la communauté soit « mûre » sur le sujet, et que les chercheurs, collectivement, acceptent de « perdre » un peu du pouvoir qu’ils ont sur leurs données pour les partager au plus grand nombre, exactement comme ce qui s’est passé pour les principes des Bermudes [1].

Une autre idée toute aussi intéressante est une vision subtilement différente de la publication scientifique basée sur l’arXiv, ce dépôt de manuscrits scientifiques de physique en accès libre. En fait, Nielsen propose de faire un processus de peer-review ouvert et en temps réel, utilisant ce genre de dépots centralisé comme métrique. Avec un système ouvert, centralisé, et les technologies type « réseau social », il devient alors très facile d’évaluer par exemple l’impact non seulement d’une publication, mais aussi d’un dépôt de données, voire d’un billet de blog ou d’un wiki. Nielson imagine un cercle vertueux où l’ouverture totale permet de devenir en quelque sorte plus influent, ce qui peut être immédiatement évalué et récompensé. Une perspective assez intéressante pour le scientifique blogueur ;). Enfin, Nielsen aborde même des aspects plus techniques, insistant sur le fait que la science en général doit aussi accepter de récompenser les scientifiques faisant des développements d’outils permettant partage et analyses collectives de données. Il rappelle par exemple comment le créateur de l’arXiv, Paul Ginsparg, a été un peu méprisé par ses collègues physiciens au motif qu’il aurait « gâché » son talent de physicien pour créer ce dépôt, alors que, comme le souligne Nielsen, Ginsparg avec l’arXiv, a peut-être plus fait pour la physique en général que n’importe quel physicien de sa génération.

Un livre très intéressant et très stimulant donc, qui fait réfléchir sur nos pratiques à la fois scientifiques et blogosphériques. Sur la forme et l’objectif, je ne peux m’empêcher d’être pessimiste : je ne crois pas qu’on change un système aussi facilement, d’autant que quoi qu’on en dise, le système est en crise. Il n’y a jamais eu autant de pression à publier, jamais eu aussi peu de postes, et l’argent pour les recherches tend à se tarir. Même chez les jeunes professeurs (…), l’état d’esprit ne me semble pas à l’ouverture maximale; la peur du futur et de la tenure clock sont mauvaises conseillères. Sur le fond, je ne peux m’empêcher de voir un biais très « sciences dures » dans le propos de Nielsen. Débattre d’idées mathématiques sur un blog, pourquoi pas. Débattre constructivement de biologie ou d’une science expérimentale, où il n’y a pas forcément de formalisme aussi clair et où une vérification d’idée peut prendre plusieurs semaines me paraît impossible. Nielsen semble aussi oublier que, contrairement à la physique ou aux maths, dans beaucoup de sciences, ce ne sont pas nécessairement les idées brillantes qui ralentissent les progrès scientifiques, mais 1/ les aspects techniques 2/ le manque de moyens humains compétents 3/ une incitation à la prise de risque négative . Du coup la majorité de la science est très « incrémentale », on a tendance à vivre sur ses acquis techniques et humains, et le processus de création purement darwinien décrit plus haut me semble difficile à réaliser. Plus généralement, dans un système reposant sur l’intelligence collective, comment sélectionne-t-on et forme-t-on les scientifiques ? Comment empêche-t-on les « free-riders » de prospérer, ceux qui font plus de communication que de science, ou qui s’appropient les idées des autres, ce qui tue tout le processus sur le long terme ? Qu’on songe par exemple à tout ce qui est déplaisant dans l’écosystème des blogs, n’y a-t-il pas certains risques similaires ? Un autre système est-il vraiment possible ?

[1] D’un strict point de vue économique, c’est d’ailleurs un exemple tout à fait intéressant d’échec d’une approche totalement individualiste : il faut que pour le bien collectif, tout le monde accepte de partager les données. Et une fois que la pratique est mise en place, un scientifique souhaitant garder pour lui seul le fruit de son travail se retrouverait nécessairement mis à l’écart de la société. Une leçon intéressante pour les théories libertariennes, je trouve 😉

Complément : une conférence de Nielsen sur le sujet

About the author

Tom Roud

Nanoblogger scientifique, associate professor incognito (ou presque). Suivi par @mixlamalice

9 Comments

  • Très intéressant… C’est une conversation que nous avons tenue hier avec un collègue géographe. Comment éviter les connotations blessantes de la vulgarisation? Comment décrire nos recherches simplement, en en soulignant les enjeux, le contexte, les résultats? L’idée est qu’il faut débusquer toute la part d’implicite qu’il y a dans notre manière d’exposer les choses. L’écriture scientifique, particulièrement en SHS, est extrêmement allusive mais nous ne nous en rendons pas compte car nous la regardons de l’intérieur…

    • Oui, les implicites rendent toute discussion très difficile. C’est le gros avantage des maths : le langage ne possède aucun implicite, les trolls maths sont faciles à débusquer et à éliminer. Tout peut-il se formaliser de cette façon ? Je ne sais pas, mais c’est pour ça aussi que j’aime faire des modèles mathématiques !

  • Comme toi, je ne crois pas trop au peser-review ouvert. Pour deux raisons :
    – d’un côté nous avons des articles qui ne sont jamais cités (presque 30% pour l’université de Genève qui n’est pourtant pas mauvaise), probablement très peu lus. Qui va passer du temps à faire une review sérieuse dessus ? Personne probablement.
    – de l’autre il y a quelques articles qui sont très visibles et qui vont agréger des centaines de commentaires. Or il suffit de lire les commentaires de nombreux journaux en ligne (non scientifiques) pour voir que très peu sont intéressants. Comment faire le distinguo entre le commentaire d’un spécialiste de la question et d’un candide, avec toutes les nuances entre les 2 (quelqu’un du même domaine mais pas de la même spécialité, un scientifique d’une autre discipline, etc.) ? Si c’est pour que le seul ressort soit l’argument d’autorité, non merci…

    • Oui, totalement d’accord. Et puis l’avantage du peer-review, c’est aussi de filtrer et de hiérarchiser. Tout autre système me paraîtrait augmenter considérablement le rapport signal/bruit.

  • Merci pour ce bon résumé !! J’espère qu’on aura une VF du bouquin (quitte à la crowd sourcé)
    On discute le bouquin chapitre par chapitre au CRI dans un club ouvert aux lecteurs de ton blog
    chapitre 3 ce jeudi 18h.
    Perso ce qui m’intéresse c’est
    1) de créer de nouveaux jeux de type fold it
    2) d’inciter d’autres à faire de même
    3) de voir l’impact de ces jeux sur la capacité à ouvrir la formation par la recherche au plus grand nombre
    a+ pour de nouvelles aventures

      • je ne conais pas son auteur, tu peux nous mettre en contact ?
        en tout cas une question pour ces jeux est de savoir si on peut maximiser simultanément la recherche et l’apprentissage…
        la plupart tente de maximiser la recherche.
        les jeux sérieux l’apprentissage, je pense qu’on doit pouvoir essayer de faire les 2 à la fois car plus les joueurs apprendront mieux ils joueront.
        cela suppose peut-être d’inventer d’autres jeux sur lesquels on peut expérimenter sur la manière dont les joueurs apprenent et découvrent et c’est ce que nous cherchons à faire ces temps ci (en passant par la case recherche de fonds…).

Leave a Comment