Les petites cases

Qu'est-ce-qu'un éditeur doit conserver et préserver ?

Comme promis, je vais partager avec vous ma découverte de PREMIS et mon utilisation de METS.

Pourtant, cette présentation ne sera pas exhaustive et se limitera aux besoins d'un éditeur électronique. Il est important de savoir de quoi on parle et de se demander quels sont les buts poursuivis dans la mise en place d'un système de conservation du document numérique. En discutant avec Manue hier soir, suite à la publication de mon billet, nous nous sommes aperçus que nous avions du mal à nous comprendre. Au bout d'un moment, nous avons compris que nous ne partagions pas les mêmes buts. Il existerait donc des différences entre les objectifs de la conservation pour un éditeur et un bibliothécaire. Vous allez me dire : « c'est logique ». Oui, c'est vrai mais ça va toujours mieux en le disant et en le précisant. Alors finalement, pourquoi conserver, que conserver et donc quelles informations et quelles procédures un éditeur doit mettre en place. Je n'exprime ici que des réflexions que je ne demande qu'à enrichir.

A mon avis, le but d'un éditeur n'est pas à proprement parler la conservation du document numérique, mais la conservation de l'accès aux ouvrages qu'il met en ligne. Cette précision peut vous paraître infime, mais elle a en réalité son importance. En effet, dans le cadre d'une bibliothèque et d'un centre d'archives qui met en place un entrepôt de document numérique, le plus important est de pouvoir conserver le document, c'est à dire pour faire un raccourci les fichiers. Ainsi, ils ne vont migrer des données que dans le cas extrême où ce fichier ne sera plus lisible par les moyens à leur disposition.

Si je reprends mon exemple d'hier avec la TEI, l'institut de conservation (on va faire générique) n'a pas vraiment d'utilité de faire migrer de la version P4 à P5, puisque les fichiers sont en XML et donc leur accès est toujours garanti. Si j'ai bien compris, ils ne migreront que le jour où on ne pourra plus lire du XML. Or, dans ce cas, le but de l'éditeur est tout autre. Prenons une analogie avec le monde papier, un exemple qui ne vous paraîtra pas forcément significatif mais qui vaut ce qu'il vaut. Il y a maintenant deux ans, Pocket a changé la maquette de sa collection Terreur dans lequel on trouve entre autres les ouvrages d'Anne Rice. Au fur et à mesure, Pocket a fait passer l'ensemble des ouvrages de sa collection sur cette nouvelle maquette. Étant donné que c'est une nouvelle édition, cette nouvelle édition a été déposée au dépôt légal. De ce fait, la BnF conserve à la fois l'ancienne édition et la nouvelle édition. En revanche, l'éditeur ne propose à son catalogue que la nouvelle édition. Ce qui l'intéresse, c'est donc de préserver une cohérence éditoriale dans la mise à disposition du texte, ce n'est pas le fait qu'il puisse proposer toutes les éditions et toutes les maquettes des ouvrages qu'il édite, ce travail relève de l'institution de conservation et non de la mission de l'éditeur. Il me semble qu'il en va de même pour l'éditeur électronique. Son but n'est pas de proposer l'accès à l'ensemble des versions d'un ouvrage qu'il soit en TEI P4 ou en P5, mais de pérenniser l'accès à l'ouvrage tout en assurant une cohérence éditoriale.

Mais, il doit aussi assurer aussi une cohérence technique dans son système. Prenons deux exemples. L'éditeur électronique met en place un système d'interrogations qui s'appuient sur les balises XML. Or, la grammaire qu'il utilise évolue, de nouvelles balises apparaissent, d'autres changent. Dans le cadre d'un projet, il a besoin de ces nouvelles balises, mais s'il adopte cette nouvelle grammaire, son système d'interrogation sera obsolète, car il s'appuie sur les balises qui ont changé. Il lui faut donc faire migrer l'ensemble de ces fichiers vers la nouvelle version de la grammaire pour garder l'accès à ses ouvrages grâce à l'interrogation. Il pourrait garder les deux versions de la grammaire, mais cela va rapidement devenir ingérable, un peu à l'image de Pocket qui préfère faire évoluer l'ensemble de sa collection. Un autre exemple : l'éditeur utilise XSLT 1.0, car son système ne gère que ce format et qu'il lui convient. Mais, il s'avère qu'un des ouvrages demande des fonctionnalités qu'il serait bien plus simple d'implémenter en XSLT 2.0. Or, justement la dernière version du logiciel sur lequel s'appuie son système d'affichage de ces ouvrages (son DIP en OAIS) utilise XSLT 2.0. S'il veut pouvoir en profiter, il est donc obligé de migrer l'ensemble de ces feuilles de style 1.0 vers 2.0. Je pense que vous voyez où je veux en venir.

Mais, il y a une objection à formuler par rapport à ces préoccupations, ce que d'ailleurs Manue s'est empressé de me faire remarquer hier soir. Selon cette logique, mon intérêt n'est pas de conserver les anciennes versions des fichiers. Et, là le bat blesse... Et il y a une différence fondamentale par rapport au paradigme papier. Dans ce cadre, les différentes éditions des ouvrages de la collection Terreur de chez Pocket sont conservés à la BnF, un historien du livre pourrait donc dans un siècle faire une étude sur l'évolution des maquettes d'ouvrages dans une collection particulière, ce qui serait intéressant pour comprendre la vision de la société par rapport à cette collection. Mais, étant donné que dans le paradigme du numérique, je ne dépose pas, si je ne conserve pas mes anciennes versions de fichiers, il ne sera pas possible à un historien d'étudier l'évolution technologique de mes ouvrages mis en ligne. Voici donc une nouvelle mission pour l'éditeur électronique : la conservation des différentes versions de ces ouvrages. Mais plusieurs questions : est-ce intéressant ? (si je prends la question de l'historien, évidemment, mais à quel prix) et est-ce à l'éditeur d'assumer cette conservation qui n'a rien à voir avec la conservation de l'accès ? Ne serait-ce pas aux institutions de conservation d'assumer cette tâche en rapport avec les éditeurs. Autant de questions qui restent pour moi sans réponse pour l'instant et qui me pose bien du souci ? En effet, tout cela entre en ligne de compte pour déterminer les métadonnées dont j'ai besoin....Bon, pour l'instant, je vais m'occuper de ce problème d'accès et je garde dans un coin de ma tête cette dernière problématique. Je voudrais bien avoir l'avis des éditeurs, bibliothécaires, archivistes et documentalistes qui se nichent parmi mes lecteurs par blog ou par mails ;-) (oui, je sais, toujours pas de commentaires...)

Causeries Conservation Édition électronique TEI —