L’un des principes majeurs du partage des données réside dans les conditions qui assurent à une donnée sa compréhension et son interprétation par un utilisateur tiers. Ce qui exige une description claire et précise des données ainsi que des informations sur le contexte de leur production.
Deux notions expriment ces exigences:
* la documentation
* les métadonnées
Si je m’en réfère à la dernière édition du Guide des bonnes pratiques publié par le UK Data Archive (mai 2011, cf fiche), elles peuvent être formulées ainsi. (cf. p. 8-10)
1) documentation.
Une donnée isolée, c’est-à-dire coupée de son contexte de production mais aussi de validité est une donnée inutile. Documenter une donnée revient à noter comment elle a été conçue et saisie, ce qu’elle signifie, à préciser son contenu et sa structure. La documentation est également décisive pour assurer une longue conservation des données.
Une bonne documentation comprend des informations sur:
- le contexte de la collecte de données (historique du projet, ses objectifs, ses hypothèses)
- les méthodes de collecte des données
- la structure des données et les liens entre elles
- la validation des données, les procédures de test, de preuves, etc.
- les éventuels changements dans le temps
- informations sur l’accès et les conditions d’usage ou de confidentialité
2) les métadonnéess sont des éléments de documentation qui ont une signification et un but précis. Ces sont des éléments standardisés qui décrivent l’origine, le but, la référence temporelle, la localisation géographique, le créateur, les conditions d’accès et d’utilisation des données. Les métadonnées sont utilisées comme ressources pour la recherche de données ou comme référence pour les citations.
Ces métadonnées sont généralement structurées et standardisées selon des normes internationalement reconnues (Dublin Core, ISO19115, Data Documentation Initiative (DDI), Metadata Encoding and Transmission Standard (METS) and General International Standard Archival Description (ISAD(G)).
Il y a me semble-t-il des confusions pas encore levées concernant ces notions entre les gestionnaires de données et les archivistes, confusions entretenues en particulier par la numérisation des archives qui en font des documents qui pour être identifiés doivent être eux-aussi accompagnés de métadonnées sans lesquelles ils risqueraient de devenir inaccessibles.
Entre chercheurs ou spécialistes de disciplines différentes, en fonction des impératifs de la recherche elle-même, la précision de la documentation et des métadonnées demeurent un enjeu important et non tranché sur le fond. En particulier, les exigences de précision dans la définition des données peuvent varier d’une discipline à l’autre en fonction aussi de la complexité des données qui sont conservées.
BM/15.08.2011