Les petites cases

La modularité de la TEI

Suite de la présentation de la TEI : voir « A la découverte de la TEI ».

Parler de DTD TEI ne signifie rien. En effet, la TEI n'est pas une DTD, mais un ensemble de recommandations (« Guidelines ») et d'éléments rassemblés en modules distincts (« tag sets ») dont l'utilisation et le choix forment une DTD particulière. Il n'existe donc pas une DTD TEI mais autant que les combinaisons de modules rendent possibles. Pour reprendre les mots de Lou Burnard, la TEI est un système extensible, modulaire et polymorphe constituant un modèle abstrait1.

Autour d'un module-noyau (« core tagset ») rassemblant les éléments communs à tous les types d'information, s'organisent un jeu de base (« base tagset ») et des modules additionnels (« additional tagset »).

Sept jeux de base sont proposés :

  • TEI.prose pour les textes en prose ;

  • TEI.verse pour les textes en vers ;

  • TEI.drama pour les textes dramatiques : théâtre, scénario... ;

  • TEI.spoken pour la transcription d'interviews ;

  • TEI.dictionnaries pour les dictionnaires et les encyclopédies ;

  • TEI.terminology pour les fichiers terminologiques

  • TEI.general et TEI.mixed permet de combiner selon des modalités précises les six jeux de base précédents

Dix jeux additionnels peuvent être ajoutés à ce jeu de base :

  • TEI.linking offre tous les mécanismes de liens (internes et externes), de mises en perspective de deux parties de texte et pour synchroniser des portions de textes ;

  • TEI.analysis fournit des éléments simples pour la description de l'analyse des textes ;

  • TEI.fs permet de décrire génériquement des « structures fines »2 comme les unités de mesure ou les pourcentages par exemple ;

  • TEI.certainty marque le degré d'incertitude et de probabilité dans le balisage ;

  • TEI.transcr fournit tous les éléments pour la transcription des sources historiques écrites et de bibliographie analytique ;

  • TEI.textcrit permet de décrire les apparats critiques dans les éditions critiques de textes.

  • TEI.names.dates offre les éléments spécifiques et précis pour décrire les dates et les noms de lieux et de personnes

  • TEI.nets offre les éléments pour décrire les graphiques, les diagrammes, les arbres et autres réseaux ;

  • TEI.figures permet de décrire les images, illustrations, tables et formules ;

  • TEI.corpus offre les moyens de décrire des corpus de textes dans un fichier TEI.

Pour comprendre cette modularité, le TEI consortium a mis en place une analogie avec les pizzas. En gros, vous prenez un noyau (pâte à pizza, tomate, mozzarella), puis vous choisissez une base (viande, légume, poisson) et enfin votre garniture (anchois, saumon, jambon....). Et pour construire automatiquement sa DTD sur le Web, il a développé l'application en ligne Pizza chef. Vous choisissez le jeu de base et les modules additionnels qui vous intéresse, en cochant les cases, puis vous cliquez sur le bouton et automatiquement vous pourrez télécharger une DTD adaptée à vos besoins.

A noter que ce système est équivalent dans la prochaine version de la TEI dite P5, le système de génération basé sur les spécifications ODD (« one document does it all ») et appelé Roma permet de télécharger non seulement une DTD, mais aussi un XML schéma ou schéma Relax NG.

Enfin, pour éviter d'étudier tous les modules possibles avant de créer sa DTD, il existe une DTD dite allégée de la TEI contenant tous les éléments de base pour décrire des types d'informations dont les besoins de description ne sont pas très particuliers (les monographies par exemple) : la TEI Lite3 qui est entre autres utilisé pour les thèses par le logiciel Cyberdocs.

Maintenant, que nous avons notre DTD, nous allons pouvoir passer au vif du sujet en découvrant dans le prochain épisode : la structuration générale d'un fichier TEI et le TEIheader.

Quelques notes en passant

1 Lou Burnard, XML+TEI, un mariage fait aux cieux, présentation à la MSH de Lyon, novembre 2001, [en ligne], http://www.tei-c.org/Talks/lyon-3.ppt, consulté le 17 septembre 2001.

2 Si quelqu'un trouve une meilleure traduction pour feature structures, je suis preneur ;-)

3 La documentation de la TEI Lite constitue la seule documentation sur la TEI en français pour l'instant, http://www.tei-c.org/Lite/teiu5_fr.html, par François Rôle.

TEI Geekeries —