18 mai 2006

De Dublin Core vers TEF (XSLT)

TEF est un format d'échange. C'est le véhicule par lequel les établissements disposant d'un outil de gestion des thèses en local pourront échanger leurs métadonnées avec STAR. Cela implique pour ces outils de savoir exporter du TEF - mais pas de gérer TEF comme format interne, encore moins dans toutes sa richesse.

Dans la plupart des cas, exporter du TEF consistera à convertir les données du format XML géré par l'outil vers TEF, et ce au moyen d'une feuille de style de transformation XSLT. Même si d'autres outils émergent sur la scène universitaire française (Castore à Nantes, OGET à Lyon 2, ORI...), les outils les plus courants sont Eprints et DSpace. Sans surprise, ces outils s'appuient essentiellement sur le format Dublin Core.

C'est pourquoi nous publions aujourd'hui un exemple d'XSLT qui part d'un format Dublin Core étendu vers du TEF valide. Il ne peut s'agir d'un XSLT générique, qui marche à tous les coups, en toutes circonstances, et ce pour deux raisons au moins :

  • Les formats de départ seront variés, parce qu'il existe de nombreuses manières différentes de rédiger des métadonnées DC et d'étendre ce coeur DC avec des éléments spécifiques aux thèses ;
  • Il y a des situations diverses : un établissement peut ne gérer que du PDF ; un autre peut produire de l'XML, de l'HTML et du PDF (plusieurs éditions) et diffuser des thèses amputées des illustrations qui posent des difficultés de droit d'auteur (différentes versions). Selon le cas, le programme de conversion pourra varier.

L'XSLT que nous publions à titre d'exemple part d'une situation simple et largement majoritaire : une thèse complète en PDF (une version, une édition, un fichier). Voici une instance de départ, en DC étendu. Voici l'instance d'arrivée, du TEF valide.

Dans le cadre du déploiement de STAR, nous (l'ABES) collaborons avec certains des établissements qui possèdent un outil de gestion des thèses. Nous rendrons publics les XSLT opérationnels issus de cette collaboration, ce qui pourra rendre service à d'autres. Nous commencerons sans doute par Eprints (avec INP Toulouse) et OGET (avec Lyon 2).

Si vous utilisez un autre outil et que vous souhaitez collaborer, contactez star@abes.fr.


Posté par yannnicolas à 11:27 - - Commentaires [0] - Permalien [#]


Commentaires sur De Dublin Core vers TEF (XSLT)

Nouveau commentaire