29 avril 2006
La solitude du thésard au moment ... de choisir des mots-clés
Si vous errez sur un campus plus ou moins verdoyant, vous y trouverez différents types de chemins. D'un côté, les chemins officiels, tracés à dessein, votés en CA, pavés ou goudronnés. De l'autre, les chemins officieux, coupant allègrement à travers les plate-bandes. Leur contour est net et leur surface pelée, comme à dessein. Pourtant, personne n'a voulu ces chemins alternatifs - pas même un syndicat minoritaire au CA, agissant nuitamment. Ces chemins officieux émergent spontanément, par l'action convergente mais non planifiée de milliers de petits pas.
Que vous empruntiez l'un ou l'autre chemin, vous finirez bien par trouver une bibliothèque. Vous pourrez y interroger le catalogue, à la recherche des thèses portant sur un sujet donné. Le contenu des thèses est décrit par des mots (ou des expressions) : soit des mots tirés d'un vocabulaire contrôlé (type Rameau), soit des mots-clés, librement choisis par l'auteur lui-même. D'un côté, un vocabulaire artificiel, contraignant, réputé rationnel ; de l'autre un vocabulaire libre, voire anarchique, ce qui rend difficile de regrouper des thèses sous une même étiquette.
Peut-on parler d'un vocabulaire officiel et d'un vocabulaire officieux ? La comparaison vaut-elle entre les chemins et les vocabulaires ? Non. Le thésard devant son formulaire est ... seul. A la différence des étudiants qui se suivent et se coordonnent dans les allées du campus, faisant ainsi émerger des itinéraires réguliers qui se matérialisent en chemins de terre tassés et pelés, le thésard ne peut s'appuyer sur les mots-clés des autres. Pas de chemin, ni officiel ni officieux, juste un gazon uniformément piétiné. Chaque thésard pond ses mots-clés dans son coin, ce qui rend impossible l'émergence d'un vocabulaire stable, ne serait-ce qu'au sein d'une discipline.
Ces temps-ci, on appelle folksonomie ce genre de vocabulaire "officieux", émergeant spontanément des interactions entre les "gens". En général, c'est gens, ce sont les lecteurs, ceux qui organisent leurs signets (del.icio.us), les articles scientifiques qu'ils lisent (Connotea) ou les chansons qu'ils écoutent (Last.fm). Mais ces gens pourraient aussi bien être les auteurs (comme dans Flickr), en l'occurrence les auteurs de thèse.
Au lieu de les laisser seuls devant la page blanche des métadonnées, on leur soumettrait un nuage de mots-clés déjà utilisés dans un contexte analogue, tout en leur permettant de taper un mot-clé inédit, si le nuage ne suffit pas. Il reste à cerner la nature de ce "contexte analogue" : thèses de la même discipline ? travaux cités en bibliographie (eux-mêmes tagués via Connotea... en principe) ? Il faudrait tester.
Quelques remarques en vrac :
- Il faudrait analyser les mots-clés de toutes les thèses référencées dans le Sudoc, en mesurer la distribution (par discipline ?), comparer les mots-clés des thèses qui ont la même indexation Rameau, dessiner de bons gros nuages....
- On aurait un point de départ pour offrir ce service de mots-clés assistés, service qui s'améliorerait à mesure qu'on l'utiliserait - il faudrait que j'en parle à l'équipe de l'ABES qui travaille sur STAR ;-).
- Une fois de plus, on manque d'un vocabulaire contrôlé pour désigner les disciplines.
- Quand on décrit une thèse avec un terme issu d'un vocabulaire contrôlé, que ce soit en Dublin Core, en MARC ou en TEF, on mentionne le terme et le vocabulaire d'origine. Qu'en est-il pour un mot-clé issu d'une folksonomie ? Ce qui a un sens, est-ce le mot "apple" ou le couple apple-Flickr ou apple-Connotea ? On retrouve la question du contexte, question qui ne se pose pas pour les mots-clés du thésard solitaire.
18 avril 2006
Article sur les thèses numériques en Australie
Sur le numéro d'avril de D-lib magazine on trouve un article sur les thèses numériques australiennes : The Impact of Mandatory Policies on ETD acquisitions.
This paper analyzes the data now available in Australia's coordinated Electronic Theses and Dissertations (ETD) gateway to show the impact of high-level institutional policy decisions on population of the individual repositories. The paper shows that just like research article repositories, voluntary ETD deposition results in repositories collecting less than 12% of the available theses, whereas mandatory policies are well accepted and cause deposit rates to rise towards 100%. Modeling of the Ph.D. and Master process in Australia is also carried out to indicate the delays and liabilities to be expected if mandatory policies are applied only to newly enrolled candidate
Bonne lecture!
04 avril 2006
Errata (post à mise à jour périodique)
Avant de les intégrer en masse dans le texte de la recommandation, nous listerons ici les erreurs de forme qui se sont glissées dans le texte. (Pour les signaler, vous pouvez nous écrire ou bien les inclure en commentaires de ce post)
- (...) Ainsi, pour reprendre notre cas d'école, si le chef d'établissement impose la confidentialité entre le 1er janvier 2006 et le 31 décembre 2006 et l'auteur une restriction entre le 1er janvier 2007
6et le 30 juin 2008, alors l'état juridique de la thèse est le suivant : pas de diffusion sur Internet entre le 1er janvier 20067et le 30 juin 2008 : (...)
Votre validateur XML refuse le schéma TEF ?
Voir la FAQ sur le site TEF.
03 avril 2006
TEF au Québec
A chaque année son symposium ETD, grand messe très internationale sur les thèses et mémoires électroniques. Après l'Australie et avant la Suède, ETD 2006 aura lieu au Québec, plus précisément à Québec, du 7 au 10 juin. L'accent sera mis sur l'Open Access et les dépôts institutionnels. Le crédo sera : "Ouvrir l'accès à la communication savante".
Voici en vrac les questions qui seront mises en débat à cette occasion :
Quelle place doivent prendre les ETD dans les dépôts institutionnels ? Les ETD peuvent-elles jouer un rôle dans le développement des dépôts institutionnels ? Inversement, les dépôts institutionnels peuvent-ils avoir une influence sur les ETD ? L'Open Access est-il en contradiction avec le droit d'auteur actuel ? Doit-on repenser le droit d'auteur ? Quels sont les enjeux posés par le libre accès ? Quelles sont les alternatives juridiques proposées aux auteurs (Creative commons, Open Sources Licences) ? Quelles sont les répercussions de l'Open Source dans les universités ? Quels sont les enjeux à relever concernant les métadonnées associées aux ETD ?
Autant de questions urgentes que chacun se pose en France, surtout en cette année 2006, année de la DADVSI et des conventions sur le droit d'auteur dans le cadre de l'enseignement et la recherche, année de lancement de HAL, de STAR, de TEF...
Précisément, TEF fera partie du programme d'ETD 2006.
Je promets de faire mon possible pour vous rendre compte du colloque, en léger différé. Si je ne suis pas trop crevé, je trouverai bien un hotspot WiFi. Pardon, je recommence. Si je ne suis pas au coton ou en train de dormir sur la switch, je compte bien me pogner un cocron sans fil, et vous écrire en me tirant une bûche.
(sources linguistiques)
