Posts tagged: Logiciels libres

Les bibliothèques de données, vers des hypercatalogues ?

Les grandes bibliothèques sont en train d’expérimenter un nouveau type de catalogue basé sur le web de données (souvent dénommé « web sémantique ») qui englobe les références des auteurs et de leurs oeuvres.

La BNF avec « data.bnf« , ainsi que l’Europeana, offrent cette nouvelle exploitation des métadonnées.
Si l’on fait par exemple une recherche sur Antonin Artaud sur data.bnf, on trouve sur la page du résultat, outre une biographie succincte du poète, l’ensemble de ses oeuvres entant qu’auteur, mais aussi toutes ses contributions, en tant qu’adaptateur, commentateur, compositeur, dessinateur, acteur, interprète, etc. (la vie du « Momo » était très diversifiée … !). Et ce, sur l’ensemble des ressources BNF (Catalogue général, Gallica, Archives et manuscrits, etc.). La page pointe aussi vers des ressources extérieures (Catalogue collectif de France, Europeana, SUDOC, OCLC), puis enfin vers l’article Antonin Artaud de Wikipedia.

Le Portail Europeana rassemble, quant à lui, toutes les données multimédias sur un auteur ou une oeuvre, recueillies auprès de bibliothèques, de musées, d’archives ou même de particuliers.
Sur le personnage de « James Bond« , on dispose de 25 textes, 80 images, 36 vidéos et 7 fichiers son. Mais si les images et les vidéos se rapportent bien à l’agent secret au service de Sa Gracieuse Majesté (personnage de fiction), près de la moitié des textes concerne les écrits d’un Pr James Bond (plutôt réel), expert en commerce international et développement durable ….
On touche là à la limite actuelle du web sémantique …;-(
Comme l’explique « La petite histoire du web sémantique », citant Tim Berners-Lee dans « La Recherche » en novembre 2007 : « Le terme sémantique prête un peu à confusion car la sémantique s’intéresse au sens du langage pour en déduire des constructions logiques. » En fait, le web sémantique ne cherche pas à réaliser des opérations d’intelligence artificielle basées sur le langage naturel, mais cherche simplement à relier des données entre elles. C’est l’idée du « Linked data » (qu’on peut traduire par « web de données ») qu’une machine ou un être humain pourrait explorer.

Le projet « Linked Open Data » auquel participe l’Europeana, repose sur l’ontologie Yago, une base de connaissance qui unifie le lexique sémantique WordNet et Wikipedia. Sa structure est fondée sur les relations (« signifie », « année de naissance », « a remporté le prix ») entre le sujet et ses attributs.
Exemple : « AlbertEinstein » année de naissance « 1879 » ou « AlbertEinstein » a remporté le « prix Nobel », etc..

Wikipedia est aussi à l’origine de la base de connaissance DBpedia. Cette initiative communautaire, soutenue par l’Université libre de Berlin et l’Université de Leipzig, a pour objectif d’extraire des informations structurées à partir des articles de Wikipedia, notamment sur les villes et les pays. On arrive ainsi à une base de données encyclopédique, où on peut utiliser de nombreux filtres pour sa requête. Exemple : « les scientifiques français nés au XIXe siècle ».
Mais gare aux homonymes, qui possèdent les mêmes nom et prénom (sans même une initiale ou un deuxième prénom), comme pour notre James Bond, l’erreur est au coin de l’ontologie …!

L’utilisation des CMS en bibliothèque : à présent, c’est au tour des catalogues …

Le dernier post de Bibliobsession « Modularité et entrées multiples : « nouvelles » tendances des catalogues de bibliothèques » rappelle que les CMS (système de gestion de contenu) comme Drupal sont de plus en plus adoptés comme portail documentaire comme à la BCU (Bibliothèque Clermont Université) … et très bientôt à la Bibliothèque de Sciences Po, mais aussi que ce logiciel libre peut servir à la gestion de catalogue ! C’est déjà le cas dans les bibliothèques américaines de Palos Verdes et de Ann ArBor. De nombreuses bibliothèques universitaires en Amérique du Nord et dans le monde utilisent Drupal (comme Laval à Québec, Cornell University ou le « Sistema bibliotecario di Ateneo » de l’Università di Studi de Padoue (Italie)). Le site des groupes Drupal pour les bilbiothèques présente un certain nombre de ressources et de services pour les bibliothécaires et webmasters (modules de rechercherche, de maintenance, résolveur de liens. et enfin le module SOPAC, OPAC ‘social’ pour intégrer un catalogue de bibliothèque dans le CMS).
On peut aussi multiplier les blogs thématiques, comme l’a réalisé il y a près d’un an la BU de Nancy : « Nuage de blogs », procédure commentée à l’époque par Silvae de Bibliobsession.

« Le pouvoir est dans le « repository » … ! »

Cette affirmation émane d’Emmanuel Saint-James, l’un d’un des co-auteurs de SPIP, logiciel de CMS libre, très largement utilisé en France depuis une dizaine d’années. Maître de conférence à Pierre & Marie Curie et militant Vert, Emmanuel Saint-James a accompagné le mouvement des logiciels libres depuis ses premiers pas. Mardi 12 avril, dans le cadre de la « Semaine de la Recherche » à Sciences Po, il a tenté avec l’aide de Didier Demazière, sociologue au CSO, spécialisé dans les nouvelles pratiques de travail, de cerner le fonctionnement des communautés qui permettent la maintenance et le développement des logiciels libres. Le « repository » en question est le dépôt des différentes versions de code source, auquel n’ont accès, surtout en écriture, que les quelques « happy few » des fondateurs « historiques » du logiciel.
En effet, comme nous l’ont rappelé les deux chercheurs, le libre se définit, non par la gratuité, comme on le croit souvent, mais par l’accès libre au code source du programme : cela permet, en principe, à tout utilisateur de pouvoir contribuer à l’amélioration du logiciel. Mais cette pratique est assez complexe et cache sous des apparences « anarchisantes », une organisation communautaire assez sophistiquée, car elle implique de coordonner, maintenir et développer un ensemble d’engagements très hétérogènes. Comment faire travailler ensemble et à distance, sans hiérarchie ni contractualisation, une bande de « geeks » et de militants, sans oublier les petits malins (consultants) qui comptent tirer profit des utilisateurs peu versés dans l’informatique à travers des offres de services, et ce dans un environnement de contraintes techniques fortes ? C’est le miracle du « bazar », réseau égalitaire sans hiérarchie ni contrôle, et du « chaudron magique », l’intelligence collective …;-)
Malheureusement, cela n’a pas empêché les conflits et une certaine ‘dilution’ du pouvoir, qui s’est traduite par la création d’un deuxième dépôt pour les extensions (documentation, traduction, tests, etc). Mais, comme l’a déploré E. Saint-James, le ‘coeur’ du logiciel est désormais ‘gelé’ et malgré l’ambiance « cool » et les « Apéros Spip », quelque chose s’est cassé au sein du groupe. Spip ne constitue plus aujourd’hui une bonne réponse politique aux problèmes du moment.
La discussion qui a suivi la conférence a souligné l’émergence de logiciels hybrides, adossés à des collectivités locales ou a des entreprises comme ceux qui se regroupent dans l’ADULLACT.

Staypressed theme by Themocracy