Ce post est une contributions spontanée de Clément Ollivier, étudiant et auteur d’un très bon blog (kapecom), qui a été, à juste titre, enthousiasmé par l’intervention de Tim Beners-Lee ( co-fondateur du web avec Robert Caillau) à TED en mars 2009 (vidéo ci-dessous) :
Bonjour, je suis étudiant en BTS de comunication, et fidèle lecteur de votre blog. Il y a peu, j’ai découvert une ‘”idée qui tue” que je voulais partager avec vous…
Dans le web que nous connaissons, nous évoluons en passant de documents à documents, par des liens. Lorsque l’on cherche une information sur un moteur de recherche, on le nourrit de mots-clés, et celui-ci nous propose une liste de documents qu’il juge pertinents. Par exemple, en recherchant des informations sur Nietzsche dans Google, je tomberai en premier lieu sur une page Wikipedia, ensuite sur un groupement d citations. Mais si je me demande quelles villes italiennes le philosophe a traversées, il me sera très long et difficile de compiler les données fournies par des documents divers, et leur extraction sera un travail de fourmi. Sans compter le fait que les données ne seront peut-être tout simplement pas disponibles, car personne n’aura publié un contenu à leur sujet.
Les données : nous y voilà. Le “linked data” consiste à mettre à disposition un maximum de données brutes, et toutes interconnectées, qu’un moteur de recherche peut recouper entre elles pour nous fournir l’information la plus pertinente. Imaginons les possibilités ahurissantes qui s’ouvriraient aux particuliers, aux entreprises, à la comunauté scientifique du monde entier si toutes les bases de données, attachées aux documents présents sur le web ou bien indépendantes, pouvaient dialoguer entre elles …
C’est le futur du web, qu’on appelle déjà 3.0, et celà promet d’être aussi passionnant que l’a été la vie de la toile durant la décennie qui s’achève ! ” Ca s’appelle Linked Data. Je veux que vous le fassiez, je veux que vous le demandiez, et je pense que c’est une idée qui mérite d’être partagée.” (Tim Berners-Lee, créateur du World Wide Web).
Share
Données en vrac : Nietzche (ou Nietzsche ?) ; Gai Savoir ; Naples ; pasteur ; surhomme ; 1844 ; Schopenhauer ; bouddhisme …
C’est fantastique d’imaginer des moteurs qui puissent trier toutes ces données et leur donner une organisation et un sens… Mais comme tout système de tri, de classement, il y aura des règles, des modèles, des cases et des algorithmes. Et l’intervention humaine sera forcément nécessaire. Dieu merci. Mais cette idée me plait beaucoup et pourrait déboucher à un internet plus “sain”…
Cela dit, ça me rappelle un papier d’un type du MIT que j’avais lu il y a une trentaine d’années qui expliquait que l’intelligence artificielle, car il s’agit un peu de ça finalement, était une chimère ; l’intelligence totale et absolue, la reproduction informatique exacte de celle de l’homme. Il citait un exemple “rigolo” : la “représentation” que pourrait donner un ordinateur à une phrase bête comme “Papa achète des jouets à son fils”. Il y a 2 représentations possibles, justes sur le plan analytique. Mais l’homme ne pensera qu’à une seule spontanément…
Nietzsche!
j’ai corrigé la fote d’ortograffe .
Je n’échappe donc pas à la règle qui veut que le publicitaire commet 4% de fautes…
Merci François
si les data sont du savoir,
et que le savoir est du pouvoir,
qui va bien vouloir partager ses data ?
Très intéressantes considérations sur le linked data. J’ajouterai à cette notion le web sémantique qui est -je cite wikipedia- un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles.
Dans le domaine de la recherche grand public, WolframAlpha a fait grand bruit lors de son lancement. En effet, il permet de répondre à des questions et propose une présentation intelligente des données recuillies. Seul problème à l’heure actuelle: il y a un gros travail en aval à effectuer sur les données brutes (formater, harmoniser, mapper, etc). Dans le domaine scientifique, les progrès sont considérables. En effet la littérature scientifique est telle qu’il faut des moteurs de recherche “intelligents” capables d’analyser les contenus. Je vous redirige vers un article expliquant les principes de cette analyse chez novoseek http://blog.novoseek.com/index.php/user-experience/the-importance-of-context-in-text-disambiguation.html/
Cordialement
@nicolasbordas > merci pour l’article
oui le linked data est une idée qui tue
@thomas > là est tout le problème, mais dans ce monde de données, on pourrait penser que le paradigme s’inverse, c’est une hypothèse qui consiste à dire que ce sont ceux qui partagent leurs données qui ont le pouvoir…
C’est vrai que le web sémantique pose encore aujourd’hui pas mal de questions, en termes de conditions de partage des données, et de protections de celles-ci… Pour approfondir le sujet, je vous conseille ce “pearltree”, très complet et didactique!
http://www.pearltrees.com/nicolas/tree/1_18/
Je ne connaissais pas Pearltrees. C’est assez bluffant !
Effectivement ce serait formidable, mais on peut rejoindre aussi un de vos précédents articles sur les dangers de Google. C’est encore un outil de plus pour les moteurs de recherche et un risque de plus pour nous d’être manipulés si un jour cet outil tombe dans de mauvaises mains… Mais bon restons optimistes
Sinon je ne connaissais pas Pearltrees moi non plus et je suis impressionné…
Le Linked Data n’est, encore, que sous forme de théorie. Il arrivera dans quelques temps et je pense qu’avec tous les problèmes que nous avons pu avoir précédemment, nous aurons quelques nouveautés ainsi que des rectifications. Ceci dit, le droit à l’oubli et la question du “pouvoir” seront toujours un problème …
Pour ce qui est de pearltree, il est bon à savoir qu’il est possible d’utiliser une application de synchronisation Pearltress-Twitter. Ce qui veut dire que nous pouvons créer des perles en tweetant des urls sur Twitter et tweeter automatiquement des urls en créant des perles dans Pearltree.
A voir : http://crisedanslesmedias.hautetfort.com/archive/2009/07/02/une-perle-sur-le-blogging.html#
@ Antoine: Oui, tout à fait. Le travail sur le web sémantique et le “linked data” est encore en grande partie l’affaire de passionnés et de start ups, mais de grandes sociétés s’y intéressent déjà, comme IBM… Quant à “l’ogre Google”, certains espèrent que paradoxalement, ce sont ses exigences de rentabilité qui vont freiner son engouement pour cette nouvelle technologie web:
http://www.arkantos-consulting.com/articles-referencement/moteurs-de-recherche/20071002-le-web-semantique-la-fin-de-google.php
A regarder également, cette intervention de David Larlet à ParisWeb (parfois assez technique malheureusement), où il aborde la question de l’identité numérique et du contrôle de celle-ci dans un web de données.
http://www.dailymotion.com/video/x7rppw_david-larlet-identite-20-et-web-sem_tech
@ Nicolas & Antoine: Pearltrees est un outil assez prometteur, car en plus de permettre de partager des liens très facilement, j’ai été vraiment enthousiasmé par sa communauté très vivante. Les utilisateurs se suggèrent en permanence des “perles” en relation avec leurs centres d’intérêt, et les arbres de chacun grandissent grâce à ces échanges.
Petit inconvénient: une ergonomie parfois capricieuse… Le prix du design?
[...] Ollivier dans un commentaire de sa contribution à ce blog début décembre intitulé : “Et si on passait d’un web des documents à un web des données ?”, et dont l’ambition n’est rien moins que d’imaginer, comme le dit [...]
Une adresse intéressante sur le web orienté data pour le journalisme
http://databasejournalism.wordpress.com/2010/01/14/66-visualisations-et-exemples-de-database-journalism/