Geekeries Informatique Non classé

Calculer l’information

Wolfram, l’homme derrière le génial Mathematica et le moins génial « A New Kind of Science », lance un objet internet non identifié, Wolfram|Alpha.

Wolfram|Alpha n’est pas un moteur de recherche. Si vous y rentrez « Charles Darwin« , on vous dira juste qu’il s’agit d’un naturaliste britannique, avec une petite frise chronologique. Ni Google, ni wikipedia, Wolfram|Alpha a pour ambition de fournir tout ce qui peut être objectif et calculable.
Par exemple Wolfram|Alpha :

On sent la patte « geek » et le fait que Mathematica tourne derrière. J’ai par exemple l’impression que Wolfram|Alpha doit être plus ou moins « programmé » par l’utilisateur, et qu’on ne peut pas y jeter n’importe quoi en le laissant se débrouiller pour qu’il trouve la bonne information comme un vulgaire google. Je me suis aussi amusé à rentrer des formules de maths ou de physique, mais si E=mc^2 est bien reconnu, on ne peut pas en dire autant de formules un peu moins populaires. J’ai trouvé assez étrange de ne rien trouver non plus sur la théorie de l’information compte-tenu de l’objectif du projet. Et enfin, où sont donc les sonneries de téléphone portable ?

Pour conclure, je ne suis pas très optimiste pour ce projet. Je vois bien comment quelqu’un d’un peu matheux pourrait s’en servir comme sous-mathematica online et gratuit   – en tous cas, j’essaierai certainement de l’utiliser sur ce mode, jusqu’ici, j’utilisais plutôt gnuplot voire MATLAB quand je voulais rapidement avoir un ordre de grandeur  graphiquement d’une solution d’un problème quelconque. Mais je ne vois pas très bien l’intérêt pour le grand public, surtout compte-tenu de la popularité de wikipedia ou de google. Peut-être qu’avec le temps, l’utilité de Wolfram|Alpha émergera lentement, ainsi que son public …

Ajout 17 Mai : voir les inclassables mathématiques pour un avis différent.

(Via io9 )

About the author

Tom Roud

Blogger scientifique zombie

25 Comments

  • Je pense que tu es un peu sévère. L’idée de faire répondre un ordinateur à n’importe quelle question posée a été sous-jacente depuis sa création. Il est bien clair que le nombre est l’entité la plus concrète pour l’ordinateur, il est donc naturel que Wolfram commence par cela et que le moteur soit pour l’instant plutôt quantitatif que qualitatif.
    De mon point de vue je pense que ce moteur est révolutionnaire pour deux raisons principales : le moteur est relatif et actif et non absolu et passif comme Google dont le classement par pertinence est le minimum que l’on puisse demander à un moteur de recherche!
    La requête « weather » donne le temps où tu es et « weather tomorrow » le temps qu’il fera demain dans ta ville sans autre information. Il prend donc en compte les données utilisateur dans ses réponses, ce qui me parait être une avancée considérable.
    La requête « president of france when gandhi was 13 » renvoie la réponse correspondante. Je ne connaissais même pas l’existence de ce président. Le moteur permet donc de traiter l’information qu’il détient principalement lorsque celle-ci est chiffrée et je ne doute pas que les possibilités s’étendront rapidement au fur et à mesure.
    Il est donc erroné je pense, de vouloir lui faire faire le même travail que Google car sa valeur ajoutée ne se situe pas dans ce domaine.
    Contrairement à toi, je suis donc très optimiste.

  • Je suis tout à fait d’accord que l’objet est plaisant et révolutionnaire. Et c’est impressionnant qu’il soit capable de traiter des requêtes type « president of france when gandhi was 13 ». Mais j’ai du mal à voir comment en tirer parti au quotidien, à part pour l’aspect mathematica du pauvre. Et surtout, comment le grand public va-t-il réagir ?

  • Je pense qu’il faut plutôt voir l’idée de germe que de produit fini. C’est sans doute ce que alpha signifie et certainement qu’il n’y aura jamais d’oméga. La manipulation et l’utilisation des connaissances en est à ses débuts. Nous nous trouvons devant deux conceptions complémentaires et pas facilement compatibles. Les requêtes de type Google et WolframAlpha paraîtront certainement dater de la préhistoire à nos descendants. Même si nous sommes très habitués à aller à la pêche à l’info avec des mots clés, ce n’est qu’un moyen parmi une grande quantité de façons de le faire. On pourrait par exemple envisager une recherche de type « apophatique » qui est difficile à mettre en oeuvre mais qui pourrait aussi donner de riches infos ( cerner une chose au plus près avec ce qu’elle n’est pas).
    J’ai fait une note un peu plus complète concernant l’aspect actif et relatif de WolframAlpha : http://tinyurl.com/patlor .
    Je pense qu’on manque le coeur du débat si l’on réduit le moteur ou la philosophie sous-jacente de wolfram à la seule mise en valeur de Mathematica.

  • « Je pense qu’on manque le coeur du débat si l’on réduit le moteur ou la philosophie sous-jacente de wolfram à la seule mise en valeur de Mathematica. »

    Apparemment, l’idée est surtout de mettre en valeur NKS (le livre A New Kind of Science), sur le mode « on va inventer des algorithmes simples et minimaux pour faire des tâches très complexes ». En particulier, « calculer » de l’information. NKS en lui-même ne m’avait pas vraiment convaincu, en revanche ce genre d’applications peut être intéressant.

  • Je n’ai pas lu NKS et j’ai été très surpris de trouver un accès direct au livre à partir de la barre de recherche de Wolfram installée sur mon navigateur! Tu ne m’encourages pas trop à le parcourir…

  • C’est-à-dire que NKS est en gros un catalogue d’automates cellulaires, enrobé d’un texte presque métaphysique sur le fait que toutes les lois de la nature sont des automates. Ce n’est pas inintéressant, mais ce n’est pas à mon sens ni aussi nouveau ni aussi profond que Wolfram ne le dit, et il y a un gros écart entre l’ambition du livre (« Une nouvelle forme de science » !) et le contenu scientifique réel vraiment nouveau (quasiment nul à mon avis). Je te conseillerais quand même d’y jeter un coup d’oeil pour te faire ta propre opinion.

  • Je m’y plongerai quand j’aurai terminé la pile de bouquins en cours… Et merci pour le lien,je vais faire un bon dans le classement Wikio. Hi Hi.

  • Ce qui m’intéresserait (mais je suis tordu), ce serait que, si l’input est « E=mc^2 », l’output commence par dire « True. »

  • Hmmm… je ne sais pas. Comme toute théorie scientifique, la relativité restreinte n’est vraie que dans les limites qu’on lui donne. J’aime bien la façon dont Wolfram|Alpha traite le cas : ils disent que c’est l’énergie relativiste et donnent le lien vers le formule plus générale incluant l’implusion (E = sqrt(p^2 c^2+m^2 c^4) ). C’est parfaitement objectif. Par contre, ce que je trouve dommage est que lorsqu’on rentre la formule générale comme Input ( http://www88.wolframalpha.com/input/?i=E+%3D+sqrt(p^2+c^2%2Bm^2+c^4) ), Wolfram|Alpha ne lie pas à la théorie de la relativité, c’est comme E=h nu plus haut. J’avais commencé par rentrer des trucs beaucoup plus méchants (genre sum p_i log p_i) pour voir s’il était capable de relier cela à l’entropie de Boltzmann ou de Shannon, mais j’ai été plutôt déçu de ce point de vue-là, alors que cela me parait plus facile à traiter que des requêtes portant sur des mots.

  • @Fr. Peut etre faut-il rentrer « E==mc^2 » 🙂

    @Tomroud: concernant la facilité relative des requêtes, le gros avantage des requetes basées sur le langage, c’est qu’il y a beaucoup plus de données, et donc que les modèles sous-jacents sont plus performants (j’imagine que les modèles sont statistiques). En general, avoir plus de données aide beaucoup plus que des modèles complexes.

  • Moi je trouves ce « site » très intéressant. J’avoue qu’à première vue, je ne sais pas vraiment comment m’en servir mais je pense que ce n’est qu’une question d’habitude. Comme pour un moteur de recherche d’ailleurs, les résultats sont meilleurs avec des mot-clés clés (oui, c’est fait exprès) et non avec des phrases.
    Pour l’exemple de la météo, c’est super! Pas besoin d’aller sur un site où il y a un paquet d’informations autour (pub, liens vers des articles, etc…). Il fourni l’historique des températures (qui semble d’ailleurs plus ou moins périodique!) et des informations très détaillées sous forme de graphique, moi ça me parle direct; mieux qu’une carte.
    J’ai essayé avec « angular speed » pour voir, il sort les unités de base (temps et angle) ainsi que l’unité « finale » et SI. Rien de bien compliqué, suffit d’apprendre son cours, mais ça peut être pratique pour retrouver les unités SI. Il permet de faire des calculs de pression (très basiques…) aussi.
    Bon, si je comprends bien, ce site est très utile pour trouver une information très précise en sachant déjà ce qu’on veut. Pour tout ce qui est science ça paraît plutôt utile, mais pas uniquement, les informations à propos des villes peuvent être fort pratiques: niveau d’élévation de la ville, météo en ce moment, population, distance par rapport à des références (Nantes pour Angers, par exemple).

    Je crois que c’est un outil qui pourrait s’avérer fort pratique, à nous de savoir le maîtriser. Il est clair qu’il n’est pas là pour surfer tranquille, il faut savoir exactement ce que l’on veut/cherche.

  • Déception également de mon côté — j’ai essayé pourtant d’exploiter la puissance symbolique de l’outil, sur des questions de culture générale. Or il n’a pas réussi à me dire ce que Neil Gaiman et Terry Pratchett ont en commun (ils ont écrit un livre ensemble, donc un AND sur leur bio-bibliographie aurait pu suffire, mais peut-être que toutes ces données ne sont pas toutes dans Wolfram|Alpha) ou qui a joué dans le film Charade (il possède les données mais n’interprète pas correctement ma question). Et je ne vois pas trop quel pourrait être mon usage des autres fonctions. Hum…

  • Le problème Enro, c’est que tu poses des questions auxquelles Google est tout a fait capable de répondre : Pour la première: http://tinyurl.com/ojzmcp
    et pour la seconde :http://tinyurl.com/qd57w5 , Google renvoie des liens pertinents car les réponses sont proches des questions et ne demandent pas de mise en forme. WolframAlpha est le germe qui permet de formuler des réponses à des questions qui ne sont pas juxtaposées à leur réponse, donc l’utiliser pour le tester façon Google est de mon point de vue une erreur méthodologique,tout comme tester Google avec des requêtes type Wolfram ( exemple, « weather tomorrow » ). Le problème c’est qu’il y a une ou deux générations informatiques entre les deux.
    A la question distance Terre-Lune 2010 2499 WolframAlpha répond et cette réponse n’existe pas avec Google ! http://tinyurl.com/o5w6od
    Une approche différentielle me parait plus adaptée, car l’approche comparative est vouée à l’échec dans un sens comme de l’autre !

  • Euh, si je lis bien, à la question « distance terre-lune 2010 2499 », WA répond par :
    – la distance terre-lune à l’heure actuelle multipliée par 2010 (7,4 * 10^8 km)
    – la distance terre-lune à l’heure actuelle multipliée par 2499 (9,2 * 10^8 km)

    … ce qui n’est pas exactement ce que j’attendais comme réponse.

  • C’est vrai que j’ai complètement foiré l’exemple. Moi qui répond d’habitude que très peu aux commentaires, ça m’apprendra. Je fais mille trucs en même temps, je n’ai même pas contrôlé l’ordre de grandeur et je n’ai pas vu que WA n’avait pas compris 2010 et 2499 comme l’année! En plus moi qui suis prof de maths, ça fait désordre!
    Enfin je pense que vous avez quand même compris ce que j’ai voulu dire plus haut sur l’émergence d’un tel type de moteur et l’obligation de ne pas le comparer à Google dans des réponses qui ne sont pas juxtaposées aux questions.
    Vous reprendrez mon exemple avec la bonne syntaxe de OldCola… 😀
    J’ai l’impression qu’avec de la maturité ce type de moteur deviendra incontournable… mais là aussi je me plante peut-être carrément.

  • @OL : OK, mon exemple était trop facile et Google avait la réponse. Mais si on cherche les point commun aux films « Brazil » et « Ronin » (c’est l’acteur Jonathan Pryce), Wolfram|Alpha est perdu tout comme Google…

    Quant à la seconde question, qui attend la liste des acteurs d’un film, c’est typiquement quelque chose que j’attendrais de Wolfram|Alpha : un tableau de donées avec la distribution plutôt qu’une liste de pages qui contiennent plus ou moins la réponse (seule la page imdb étant réellement pertinente par exemple).

    Mais bon, j’imagine que le problème de Wolfram|Alpha, c’est qu’on (en tous cas moi) ne sait pas réellement encore comment l’utiliser…

  • @ OL : ça arrive même aux meilleurs, la preuve !
     » j’imagine que le problème de Wolfram|Alpha, c’est qu’on (en tous cas moi) ne sait pas réellement encore comment l’utiliser… »

    Oui, c’est un peu ce que je veux dire quand on a le sentiment qu’il faut « programmer » Wolfram|Alpha, comme Mathematica en fait; pour cette raison j’ai quelques doutes sur l’adaptation au grand public, c’est un peu trop geek. D’ailleurs, google aussi est « programmable » dans une certaine mesure (genre on peut rentrer des commandes pour orienter les recherches…) mais y a-t-il beaucoup de gens qui utilisent ces possibilités ? La seule commande que j’utilise régulièrement est la recherche limitée à un site…

  • Je pense que ce type d’erreur s’atténuera avec une reformulation obligatoire de la demande. Il est clair qu’à force d’utiliser Google on finit par ne plus trop se méfier des erreurs dans les réponses, (il suffit pour cela d’un peu faire attention dans Wikipédia sur certains sujets et de filtrer les sources ). En l’état, il est vrai que ce moteur est assez limité voir même à la limite d’être utilisable, mais c’était le cas de beaucoup de projets initiaux qui ont ensuite rencontré un succès… exponentiel.

    Il est clair que Wolfram ne pourra pas entreposer chez lui toutes les données nécessaires à l’éventail des requêtes. J’imagine donc que nous allons migrer sur le Web vers l’établissement d’une norme ( plusieurs?) de présentation des connaissances et des infos afin que de tels moteurs puissent puiser directement dans les bases de données. Celui qui aura développé le premier moteur pourra imposer sa norme plus facilement qu’un concurrent. Je pense qu’en cela nous n’en sommes qu’au début de l’histoire. Mais là encore je m’égare peut-être.

    @Enro Pour ta requête « Brazil Ronin » qui est comme une sorte d’intersection, le mieux c’est d’utiliser un méta-moteur, tel Ixquick http://www.ixquick.com/ . Il renvoie par ordre décroissant de pertinence (ce qui est matérialisé par des étoiles) les sites des différents moteurs de recherche utilisés. Bien souvent la réponse de très bonne qualité et en ce concerne « Brazil Ronin », Ixquick renvoie en premier le lien Wikipédia http://fr.wikipedia.org/wiki/Jonathan_Pryce avec 3 étoiles, ce qui est la réponse attendue. C’est vrai que pour battre moteur et méta-moteur, il y a vraiment du travail.

Répondre à david X