Ces jours-ci, à l'ABES, nous organisons des séances de formation à STAR. Suite au lancement de STAR, en octobre, nous avons vu remonter des premiers utilisateurs des besoins de formation, qui portaient autant sur le circuit administratif de gestion des thèses ou sur les questions juridiques que sur l'outil proprement dit. Rachel Creppy, de la sous-direction des bibliothèques, a présenté une synthèse très préci(eu)se sur les multiples contraintes juridiques qui pèsent sur les thèses.

La DADVSI et les accords sectoriels

Rachel a notamment commenté les accords sectoriels sur l'utilisation des oeuvres protégées à des fins d'enseignement et de recherche, qui viennent de paraître au BOEN. Vous vous souvenez que la DADVSI prévoit à compter du 1er janvier 2009 des exceptions au droit d'auteur "à des fins exclusives d'illustration dans le cadre de l'enseignement et de la recherche". D'ici là, s'appliquent les accords signés en 2006 par les Ministères de l'Education et de la Culture aves des sociétés de gestion collective. Je vous laisse découvrir la teneur de ces accords, c'est-à-dire la litanie des conditions restrictives qui encadrent ces exceptions - les exceptions aux exceptions semblent la règle... Remarquez bien que 2007 et 2008 sont des années de transition pendant lesquelles doivent remonter "les difficultés d’application qui pourront être rencontrées", avant le vote d'une nouvelle loi.

Le CFC et les métadonnées

Ces exceptions ont pour contrepartie la perception d'une somme forfaitaire de quatre millions d'euros, qui sera répartie aux ayants droit. Qui précisément ? Pour le savoir, "la reproduction numérique d’une œuvre doit faire l’objet d’une déclaration pour permettre d’identifier les œuvres ainsi reproduites. Cette déclaration consiste à compléter le formulaire mis en ligne à l’adresse suivante : http://www. cfcopies.com/declaration-enseignement". Si j'en crois ce formulaire, les métadonnées recueillies seront :

  • le titre
  • l'auteur
  • l'éditeur
  • le nombre de pages réutilisées
  • le public
  • des informations sur l'enseignant et son établissement

Les métadonnées demandées montrent que ce formulaire vise le prof qui alimente son cours, et non le thésard qui incorpore dans sa thèse des extraits de "ressources externes" comme dit TEF. J'imagine qu'un autre formulaire suivra. Bon. Faisons comme si.

Première conclusion : le recueil d'informations sur les ressources externes se fera par une procédure spéciale, et non au cours du circuit de gestion de la thèse qui lui-même recueille, agrège et recycle des métadonnées de toutes sortes, que TEF conditionne sous une enveloppe XML. Cela signifie que les métadonnées portant sur les ressources externes n'auront pas à être encodées par TEF. C'est une bonne nouvelle pour ceux qui craignaient de devoir le faire dans les formulaires de STAR. Ce n'est pas le genre d'informations qu'un agent de la scolarité ou de la bibliothèque devrait avoir à gérer, encore moins à saisir.

Par contre, le thésard devra le gérer. Monsieur Jourdain des métadonnées, il devra saisir des informations sur des oeuvres, qui entreront dans un cycle de traitement du côté du CFC. Alors quelle est la forme d'organisation qui permet de retirer le maximum de bénéfices de cet effort du thésard ? L'organisation qui se profile me paraît assez inefficace :

  1. Si j'ai bien compris les explications de Rachel, le document lui-même devra comprendre la liste des ressources externes. Le thésard devra donc faire un double travail.
  2. Le CFC saura qui utilise quoi, mais pas dans quel contexte. Autrement dit, le formulaire du CFC ne veut pas savoir que c'est dans une nouvelle oeuvre précise (la thèse) que les extraits ont été réutilisés. Cette information n'a pas d'intérêt pour les ayants droit, mais c'est pourtant une information intéressante d'un point de vue scientifique, bibliométrique, voire pratique ...

Le problème est donc que le dispositif juridique oblige la collecte de métadonnées qui s'évaporent ensuite dans la nature - ou plus précisément, qui finissent cloîtrées au CFC, et encore sous une forme dégradée puisqu'y manque la référence à la thèse.

Faut pas gâcher

Une meilleure organisation donnerait peut-être cette séquence :

  1. L'auteur liste dans sa thèse les oeuvres auxquelles il emprunte des extraits. Idéalement de manière structurée (XML), mais par les temps qui courent, plus probablement en texte brut (PDF).
  2. Il copie en bloc cette liste de références dans le formulaire du CFC qui fera les traitements nécessaires pour l'interpréter.
  3. Quelqu'un copie en bloc cette liste dans STAR, qui fera les traitements nécessaires pour l'interpréter. Ou bien , quelqu'un copie cette liste dans une application locale de gestion des thèses, qui l'exporte ensuite dans STAR au sein de notices TEF.
  4. En sortie de STAR, l'ABES publie sur le web l'ensemble des métadonnées de thèse, y compris la mention des oeuvres qui sont réutilisées par une thèse. Naturellement, tout cela en RDF - c'est-à-dire du Dublin Core plus quelques éléments TEF, comme on le verra bientôt. Il y aura bien quelqu'un pour tirer quelque chose de ces données....

Morale

Les métadonnées des thèses nous rappellent une fois encore que l'enjeu est autant leur recyclage infini que leur création initiale. On dit souvent qu'un Web sémantique, c'est-à-dire dopé aux métadonnées, est improbable en raison de leur coût. C'est souvent vrai. Mais ce que montre les thèses, c'est que les métadonnées existent déjà, pour des raisons administratives (délivrance d'un diplôme) ou pour des raisons juridiques (accords sectoriels). Le devoir du bibliothécaire-chiffonnier est de les capter, de les évaluer, éventuellement de les corriger ou de les compléter, de les reconditionner et de les partager. Le bibliothécaire peut lui-même en faire des usages intéressants, mais partagées ouvertement sur le web, elles pourront s'agréger à d'autres métadonnées complémentaires et rencontrer d'autres recycleurs qui leur apprendront de nouvelles grimaces.