Geekeries Non classé Politique de publication

Publication, centralisation, hiérarchisation.

[Réaction à chaud suite à ce débat]

Un peu comme pour la phrase de Rocard sur « la misère du monde », on oublie souvent la deuxième partie du célèbre techno-adage « Information wants to be free »:

Information Wants To Be Free. Information also wants to be expensive. …That tension will not go away.

La publication scientifique est un bon exemple de cette tension entre gratuité et cherté. Imaginez que vous téléchargiez un de mes articles sur la page web de mon groupe. Dans mon cas, si je publie un article, que je passe en cumulé 2 mois de « vraie » recherche/écriture par an en collaboration avec un étudiant en doctorat sur cet article, je peux estimer le coût minimal d’un article scientifique à grosso modo 20 000 dollars (en salaire pur). A cela s’ajoutent les coûts de recherche elles-mêmes (réactifs, ordinateurs, accès à la littérature); sans trop se mouiller la seule écriture d’un article scientifique median doit alors bien coûter au moins le double. Disons 50 000 dollars à la louche.

Ces 50 000 dollars sont directement payés par les contribuables au sens large. Via les droits d’inscription des étudiants ou les impôts finançant les grants de recherche. Bref, un article que je mets « à disposition » pour téléchargement sur ma page personnelle n’est pas du tout gratuit: il est déjà très chèrement payé. Et c’est pour cela que le mouvement Open Access se bat pour que ceux qui paient cette somme colossale aient naturellement et librement accès à tous ces résultats de recherche.

Le souci, c’est que la seule diffusion sur le web ne suffit peut-être pas, tant le rapport signal sur bruit est mauvais. Il y a deux autres aspects dans la diffusion d’articles: la centralisation des données et leur hiérarchisation. A l’époque du papier, ces deux rôles étaient joués par les revues scientifiques. La situation est beaucoup moins claire maintenant. La centralisation de l’information là aussi existe en version Open Access: les sites comme pubmed ou hal permettent simplement de retrouver beaucoup d’articles publiés. Ces sites en particulier sont largement financés par les gouvernements, qui édictent de plus en plus des lois visant à promouvoir l’Open Access. Par exemple, au début de l’année, l’administration Obama a décidé que tous les papiers financés sur fond fédéraux devraient être mis à disposition du grand public, et a invité les agences de financement à mettre au point des solutions pour centraliser hébergement et accès. Il y a aussi des solutions semi-publiques, comme l’arXiv, financé autrefois par l’université Cornell et maintenant par la fondation Simons.

Reste la hiérarchisation. Les revues scientifiques traditionnelles, qui jouaient un grand rôle dans la diffusion, essaient aujourd’hui de survivre largement sur cette notion de hiérarchisation (il y a même pas mal de comm’ autour de ça, via la notion d' »Impact » ). L’idée est que si votre travail est accepté dans une bonne revue, il est lui-même pertinent pour la communauté. Un aspect non négligeable et non négligé par le mouvement Open Access: c’est la raison d’être de la revue étendard du mouvement, PLoS, qui facture ainsi environ 3000$ la publication en ligne d’un article. Cependant, là encore, on peut s’interroger sur qui réalise vraiment cette hiérarchisation. Tout le processus de revue par les pairs -et donc la hiérarchisation implicite des papiers importants- est largement réalisé par la communauté scientifique dans son ensemble.

Le sens de l’histoire est clair: l’Open Access est en train de remporter la bataille sur le principe de l’accès libre aux articles. La centralisation sur des bases de données publiques est aussi en marche.

Le point chaud reste la hiérarchisation des papiers. C’est, pour moi, devenu le business essentiel non seulement des revues (et leurs seules raisons d’être), mais aussi des sites comme Google Scholar ou MyScienceWork qui utilisent vos données pour réaliser la hiérarchisation (sans hébergement) sur leurs propres sites, avec éventuellement d’autres composantes (réseaux sociaux, etc..). La gratuité n’est évidemment qu’apparente: « si c’est gratuit, c’est que vous êtes le produit ».

Comment cette hiérarchisation s’intègre-t-elle dans l’Open Access ? Comme dit plus haut, cette hiérarchisation est largement faite par les scientifiques eux-mêmes via le processus de revue par les pairs, donc là encore, on peut penser que tout cela devrait être largement « gratuit » (car déjà payé en fait). Si l’on veut faire payer cette hiérarchisation, il faut une réelle plus-value à mon avis.

Tout ça nous amène au billet coup de gueule d’Elifsu dans le contexte spécifiquement français de l’organisation de l’Open Access Week. Elifsu pose la question de la contradiction entre la philosophie de l’Open Access, et le fait qu’une entreprise comme My Science Work organise l’événement. L’objection d’Elifsu n’est pas pratique mais philosophique, le clash est bien résumé dans son billet. Tenons-nous en ici à l’aspect philosophique: aurait-on accepté que l’Open Access Week soit organisée en partenariat avec, par exemple, Google France ?

Personnellement, je rejoins tout à fait la vision Open Access, et j’estime que le contribuable n’a pas à payer davantage. Pubmed et l’arXiv font la majorité du travail en ce qui concerne la centralisation et la recherche des publications en ce qui me concerne. Pubmed fait une forme de hiérarchisation puisqu’elle indique les revues, donc clairement une voie pure Open Access existe et doit être encouragée. Mais cela étant dit, je suis également un utilisateur régulier de Google Scholar, plus complet que pubmed pour les publications hors biologie, et qui surtout ajoute des fonctionnalités intéressantes: citations et surtout le service extraordinaire « My Updates » qui répertorie les articles nouveaux pouvant m’intéresser sur la base de mes citations. Ce genre de service représente, à mon sens, une vraie plus-value de Google utile pour mes recherches et qui, pour le coup, ne m’apparaît pas en contradiction avec la philosophie Open Access dans la mesure où c’est du data mining spécifique à Google.

A-t-on besoin de plus, en particulier d’un Facebook pour scientifiques ? Personnellement, j’ai quelques doutes: il n’y aura jamais la masse critique dans mon domaine particulier, et mon réseau physique et mes listes Twitter remplissent le côté social élargi.

About the author

tom.roud

Leave a Comment