Les petites cases

L'appropriation et l'utilisation de RDF : un cercle vicieux ?

Avec le buzz autour du concept « vaporware » de Web 2.0, la légitimité du principe de Web sémantique n'est plus remise en cause1. Un article sur le site Developper Works d'IBM déclare même « the future of the Web is semantic ». Pour le monde des bibliothèques aussi, la réflexion est en cours comme le démontre le billet de Manue et le commentaire de Yann suite à mon billet, un peu provocateur, je l'avoue, « Pourquoi utiliser une syntaxe XML pour les métadonnées ? ». Finalement, ce billet ne fait que renforcer mon interrogation sur les raisons de l'échec actuel de RDF.

Dans son billet, Manue demande aux geeks de prouver l'utilité de ces technologies. Ils ont déjà commencé à le faire comme en témoigne cette page dédiée aux bibliothèques numériques sur le site Semantic Web Advanced Developpment for Europe et le travail effectué sur SKOS en relation avec le thesaurus des archives nationales britanniques. Par ailleurs, comme le montre le site SchemaWeb, il existe de nombreux vocabulaires RDF et autres ontologies.

S'agirait-il d'un manque d'outils alors ? Peut-être. Pourtant Ontoware, un « sourceforge » spécialisé dans les logiciels utilisant les technologies du Web sémantique référence 42 projets, sans compter Jena, RAP ou Redland, trois frameworks ou API pour manipuler des fichiers RDF qui ont plusieurs années d'existence et sont soutenus par des grandes compagnies comme IBM ou HP. Si on continue l'investigation, il faut se tourner du côté des tutoriels. Là encore, on trouve beaucoup de références sur le Web comme le prouve la page de Dave Beckett sur les ressources concernant RDF. Alors, reviens cette question lancinante : d'où vient le problème ?

Manue donne un début de réponse dans son billet : « Les geeks ont donc peut-être raison de pleurer en disant que RDF va disparaître faute d'être implémenté » ou « il faudrait d'abord que RDF montre ce qu'il sait faire, prouve qu'il est essentiel pour nous aider à faire ce qu'on fait (ou ce qu’on veut faire) ». Voilà, le problème, ce n'est pas forcément l'implémentation stricte de RDF qui existe comme le démontrent les logiciels cités précédemment, mais des outils simples pour donner accès à ces technologies très complexes et, surtout, des applications concrètes. Or, l'un ne va pas sans l'autre.

Si on regarde du côté des éditeurs RDF dignes de ce nom, je n'ai trouvé pour l'instant que Protégé, éditeur d'ontologie mis au point par le laboratoire Stanford Medical Informatics. Quant aux applications concrètes, des outils sont en train d'apparaître comme :

  1. Piggy Bank, extension Firefox qui récupère les informations sur les sites pour pouvoir les archiver dans un dossier personnel et s'avère évolutif, comme l'expose Alexandre Passant.

  2. Semper Wiki, un wiki personnel sous Gnome qui enregistre les informations au format RDF, mais que je n'ai malheureusement pas pu tester ;

  3. Swoogle, moteur qui permet de rechercher dans les ontologies existantes et dont le slogan est « Search and Metadata for the Semantic Web ».

  4. Voire Flock, dont Olivier a dit le plus grand bien, mais qui me semble un peu léger.

Ils sont effectivement encore peu nombreux pour prouver du bien-fondé de ces nouvelles technologies. Il ne faut pas oublier que si XML a pris finalement assez vite, c'est certainement dû au fait que SGML avait déjà permis d'accomplir un travail important, tant au niveau de sa légitimité, de son appropriation que des outils, sans parler de HTML qui avait magnifiquement préparé le terrain. Et, ce n'est pas le cas de RDF.

Finalement, un cercle vicieux s'est créé, les communautés à qui RDF pourraient rendre de grands services demandent à voir du concret avant de se lancer ce qui est légitime. Or, pour pouvoir mettre en place des applications concrètes, il faut à la fois disposer des technologies adéquats, mais aussi les comprendre et donc disposer du bagage conceptuel ad-hoc, ce qui n'est pas une mince affaire, comme le démontre le commentaire plein d'humour de Nicolas sur le billet de Manue. Du côté des geeks, il leur faut le contenu que pourraient leur fournir ces communautés pour pouvoir développer et tester des outils vraiment accessibles, ce que fait, d'ailleurs, remarquer Yann à la fin de son commentaire.

Il me semble qu'il est maintenant temps de casser ce cercle vicieux et que ces deux communautés se rencontrent pour partager et rassembler concepts, technologies, contenus et idées d'applications. Le W3C offre un éventail complet de recommandations pour créer et manipuler des fichiers RDF : RDF schéma, OWL, SPARQL ou SKOS, les API et les frameworks existent comme je l'ai dit plus haut. Il est temps de rendre accessible toutes ces technologies, car, pour ne donner qu'un exemple, il faut avouer qu'effectuer une requête sur un fichier RDF avec SPARQL ou RDQL est d'une incroyable complexité . Peut-être serait-il intéressant de continuer cette réflexion par des idées et des exemples concrets et d'investir dans des expériences ? Qu'en pensez-vous ?

Quelques notes en passant

1 Cf à ce propos, ce billet de leobard qui montre comment le principe de la folksonomie au cœur du Web 2.0 peut rencontrer les technologies du Web sémantique.

RDF Sparql Causeries —