RDFa

Yahoo apporte des bananes au Web sémantique, 1ère partie

Annoncé, il y un peu plus de 2 mois, « l’écosystème de développement pour la recherche » de Yahoo est maintenant disponible sous le nom de SearchMonkey. Si, avec cette initiative, le but de Yahoo était de reprendre la main sur Google dans le domaine strict de la recherche, il me semble qu’une partie du chemin a été effectuée. Plutôt, que d’attaquer frontalement Google en mettant en œuvre de nouveaux algorithmes de recherche, par exemple, Yahoo a choisi un angle différent jusqu’alors complètement inexploité et, pourtant, oh ! combien important, à savoir la présentation des résultats.

Et, dans ce cadre, aiguillé certainement par le succès de facebook et de sa plate-forme de développement ouvert, le moteur de recherche a mis à disposition des développeurs une plate-forme pour mettre au point des applications qui agrémentent, selon la volonté des utilisateurs, les résultats de la recherche. Pour ce faire, il rend disponible les données de son index, soit les données structurées avec des microformats, RDFa et eRDF (embeded RDF, un système à peu près équivalent à RDFa) et déjà indexées, par défaut, par Yahoo, soit directement l’ensemble des données de la page Web à partir desquelles le développeur peut créer une extraction personnelle.

La plate-forme SearchMonkey comprend donc trois parties (et donc trois billets pour le présenter…) :

  • Une à destination des utilisateurs ;
  • Une à destination des développeurs ;
  • Une à destination des propriétaires de sites.

RDFaiser votre blog, 3ème partie : l’exploitation

Si HTML permet de structurer une page Web dans une visée documentaire, RDFa permet d’en structurer, de manière indépendante, les données. Au final, RDFa ajoute donc une troisième couche aux deux existantes :

  • HTML pour structurer la page Web ;
  • CSS pour structurer la mise en forme de la page Web ;
  • RDFa pour structurer les données de la page Web.

Il est difficile de prévoir aujourd’hui tous les usages possibles de RDFa ; ils restent encore largement à inventer. En effet, et c’est le propre et l’intérêt des technologies du Web sémantique, la modélisation des données en RDF est indépendante des usages qui en sont faits. Malgré tout, il est d’ors et déjà possible d’identifier quelques usages.

RDFaiser votre blog, 2ème partie : la pratique

Dans le précédent billet, j'ai expliqué en quoi RDFa permettait de décrire la structure du message contenu dans une page Web et comment on pourrait facilement générer du RDFa à partir des données structurées dans la base de données de votre CMS. Je vous propose maintenant de passer de la théorie à la pratique.

Ce tutoriel suppose que vous connaissez XHTML et le principe de base de RDF.

RDFaiser votre blog, 1ère partie : la théorie

HTML, de même que XHTML, permet de structurer une page Web selon les principes d'un langage à balises. Les différentes balises indiquent de manière hiérarchique le rôle joué par chaque portion d'information dans le contexte de la page Web.

Ainsi, la structure d'un document HTML, comme tout document XML, ne décrit pas le contenu/le message de la page Web, mais reflète la structure de la page Web en elle-même. C'est pourquoi il me semble erroné de parler de « sémantisation », lorsqu'on encode en HTML ou, plus généralement, en XML.

Par exemple, soient les deux portions de code HTML suivants :

<div class="contenu">
       <p class="normal">
                Le <a href="http://barcamp.org/SemanticCampParis">SemanticWeb camp</a> se déroule à Paris
                le samedi 16 février 2008 à partir de 9h30.
        </p>
</div>

<div class="description">
         <ul>
                <li>
                        Le <strong>SemanticWeb camp</strong> se déroule à Paris
                        le <em>samedi 16 février 2008 à partir de 9h30</em>.
                </li>
         </ul>
</div>

Ces deux bouts de code HTML ne sont pas identiques du point de vue de la structure, pourtant, du point de vue du contenu, ils délivrent la même information, le même message. Si certains pourraient y voir une limitation de XML, il n'en est rien. Ce n'est tout simplement pas son rôle.

Amusons-nous avec RDFa, le retour

Dans ma quête d'exemples simples de l'intérêt du Web sémantique pour tous, ma route ne pouvait ignorer l'extension Firefox Operator, dont la dernière version supporte RDFa, d'autant plus que Charles avait lancé un défi que je me devais de relever.

Le Web sémantique rencontre....

Preuve de la maturité des technologies et des standards du Web sémantique, les chercheurs et promoteurs du domaine vont à la rencontre d'autres communautés pour leur proposer de nouvelles applications, des idées, des tutoriaux, leurs expertises... Bref, des rencontres se produisent qui amènent des projets qui montrent chaque jour un peu plus la pertinence du modèle. Voici une petite sélection repérée ces derniers jours.

La pelote de retour de vacances

Il aura fallu que je sois bloqué chez moi pour finir de vider mon agrégateur de tout ce qui s'était accumulé avant et pendant les vacances. Et, pour finir définitivement cette opération qui m'aura pris pas mal de temps, voici quelques ressources qui ont plus particulièrement retenu mon attention.

Du côté du Web sémantique, les deux sujets à la une restent "linked data" et RDF/A.

Le code de la knowledge box

Plusieurs d'entre vous m'ont demandé le code de la knowledge box. C'est avec plaisir que je vous en fais part, mais autant vous prévenir tout de suite je suis un très mauvais codeur quand il s'agit d'utiliser un langage de programmation. Merci d'avance pour votre indulgence à ce niveau ;-).

Six parties composent la knowledge box :

La pelote spéciale RDFa et autres

Pour finir (provisoirement) avec les billets sur RDFa, je vous propose une petite pelote sur le sujet qui vous prouvera que c'est la techno qui monte et comme il faut vider l'agrégateur, j'y ajouterai deux-trois autres choses.

Pour ceux qui s'intéressent au RDFa, le site à ne pas louper : RDFa.info, tenu par Ben Adida (que je remercie au passage pour le billet et le commentaire sur ma ch'tite knowledge box), Mark Birbeck, Steven Pemberton et Michael Hausenblas. Ce blog centralise toutes les informations qui sortent à droite à gauche sur le sujet (et du coup, la principale source de cette pelote).

RDFa a fait parler de lui dans les différentes conférences dont je vous ai déjà parlé :

Amusons-nous avec RDFa

En vue d'explorer les possibilités de RDFa, j'ai mis au point une petite application. Dans la barre à droite sur ce billet, j'ai ajouté une boîte dite Knowledge box. Son principe est simple. En cliquant sur un terme, le résumé de sa définition dans Wikipedia et un lien vers la page de la Wikipedia francophone s'affichent.

En soi, l'idée n'est pas révolutionnaire et j'aurais pu le faire sans déployer toute l'artillerie des technologies du Web sémantique, mais ce qui me paraît intéressant dans cette expérience, c'est de montrer les atouts de disposer d'une syntaxe normalisée pour repérer des entités, RDFa, qui peut être exploitée de différentes façons, comme je le montrais dans mon précédent billet sur le sujet,

Syndiquer le contenu