Les métadonnées … Une preuve de confiance pour le numérique !

« Les métadonnées sont un ensemble de données structurées décrivant des ressources physiques ou numériques. Elles sont un maillon essentiel pour le partage de l’information et l’interopérabilité des ressources électroniques. »
Dans cette définition, tirée du « Dublin Core » simplifié et proposée par l’INIST , on remarque l’importance de l’aspect structuré de ces données pour la recherche et le partage de l’information.
Et pourtant ces métadonnées, si précieuses, sont aussi vieilles que le traitement de l’information et on les trouve avec les premières bibliothèques !

La question de la confiance, c’est un des intervenants aux « Entretiens du nouveau monde industriel » (portant cette année sur la confiance et le crédit) qui l’a posée en introduisant le « Carrefour des possibles » au Centre Pompidou le 19 décembre dernier : sur le web, un document qui se présente « nu », sans métadonnées, n’inspire pas confiance. Ce sont les métadonnées, qui, en le qualifiant, en lui donnant un contexte, le socialisent d’une certaine façon et lui permettent de gagner notre confiance …!

Les métadonnées ont aussi été à l’honneur lors des « Retours » des voyages d’étude du GFII, aussi bien pour la foire de Francfort que pour le salon Online de Londres
Ruth Martinez et Michel Vajou ont souligné l’importance de cette notion dans ces manifestations. Elle est devenue un des « buzzwords » de l’année 2011 !
La gestion des données est devenue une priorité stratégique pour les livres numériques : les titres avec des métadonnées complètes connaissent des ventes à 70% plus importantes ! Et cela a un impact sur le classement du site de l’éditeur sur Google …
Des entreprises se spécialisent dans l’enrichissement des contenus, comme TEMIS et on assiste au transfert de fonctions comme le catalogage, l’indexation ou la description, des bibliothèques vers l’édition.
Avec des métadonnées sémantiques, les contenus deviennent attractifs et on les retrouve plus facilement dans les moteurs de recherche et grâce à des pages thématiques … et ils peuvent servir à des publicités contextuelles !
La production éditoriale se tourne de plus en plus vers la catégorisation et le taggage automatique.

Mais là où les métadonnées deviennent un enjeu important dans l’industrie de l’information, c’est dans la corrélation qui existe avec les méthode du « Discovery ». Dans cette nouvelle manière d’explorer les informations, grâce à des graphiques et des cartographies, la métadonnée devient multi-dimensionnelle et dépasse la simple dimension bibliographique. Les métadonnées deviennent le pivot des logiques de navigation : on accède ainsi à un degré de granularité de l’information et le document traité peut être « éclaté » en plusieurs « nano-publications ». On peut ensuite proposer ces contenus sous plusieurs déclinaisons …

Avant que des robots n’annexe ces précieux outils, les professionnels de l’information ont encore quelques cartes à jouer, aussi bien en amont (indexation) qu’en aval (recherche documentaire) dans la construction du web sémantique !

Les « Retours » des voyages d’étude de Francfort et de Londres du GFII ont été très bien résumés dans les comptes-rendus de Michèle Battisti dans Paralipomènes :
Online Information 2011 ou le pouls du marché de l’information professionnelle
Édition scientifique et professionnelle tendances

Open data : la plate-forme gouvernementale est en ligne

Data.gouv.fr, la plate-forme française d’ouverture des données publiques (Open data) a été mise en ligne aujourd’hui (5 décembre 2011).
Les 500 ensembles prévus ont été répartis en 352 000 jeux de données publiques (division des statistiques de l’INSEE sur les 36 000 communes) à partir de 90 producteurs (essentiellement des ministères et des collectivités territoriales : budget, agriculture, environnement, assurance maladie, etc..).

La plate-forme est essentiellement moteur de recherche (recherche simple et recherche avancé) avec quelques suggestions de recherches.

Cette plate-forme a été mise en œuvre par etalab.gouv.fr, la Mission, sous l’autorité du Premier Ministre chargée de l’ouverture des données publiques. L’un des engagements forts d’Etalab était de proposer les données dans un format ouvert et réutilisable : la mission a pour cela publiée une « Licence Ouverte / Open Licence » en octobre 2011 qui facilite la réutilisation des données publiques mises à disposition gratuitement.

La plupart des données proposées étaient déjà accessibles, notamment sur les sites des ministères, mais un nombre important de jeux de données ont été améliorés, grâce à un effort de reformatage, ce qui fait que des données auparavant simplement consultables peuvent à présent être réutilisées.

Seule ombre au tableau de cette initiative d’ouverture : si la gratuité et l’absence de barrière juridique sont bien présentes, au niveau des formats, la plate-forme utilise encore des formats propriétaires, notamment ceux de Microsoft comme Excel, très peu sont en csv (comma-separated values) : format informatique ouvert représentant des données tabulaires sous forme de valeurs séparées par des virgules. (Wikipedia).

Mais, comme le souligne le site « Regards citoyens », l’ouverture de cette plate-forme n’est qu’une première étape : « si de nombreuses données pourraient encore être intégrées, cela ne sera possible que si un maximum de citoyens, d’associations, de journalistes, d’entreprises et d’universitaires s’emparent des données déjà existantes. ».

Data.gouv.fr

OpenData : La moyenne pour un data.gouv.fr sous formats propriétaires
Regards citoyens, 04/12/11

Data.gouv.fr : la France ouvre son portail de partage de données publiques
ZDNet.fr, 05/12/11

Data.gouv.fr : la plate-forme d’open data française est en ligne
Regards sur le numérique, par Arthur Jauffret, 05/12/11

France : data.gouv.fr, les données publiques en accès libre sur le web
RFI.fr , 05/12/11

Staypressed theme by Themocracy