RESEARCH DATA MANAGEMENT
E-LEARNING PLATFORMModule 2-3
Archivage à long terme
Si les données doivent être conservées sur une période prolongée (par exemple plus de 10 ans), nous risquons de ne plus être en mesure de les lire et de les comprendre. Pour éviter ceci, les données doivent être gérées. Les pages expliquent ce que cela implique concrètement.
All cartoons courtesyof JørgenStamp,
Digitalbevaring.dk.CC BY 2.5.
35 min
Objectifs d’apprentissage
- Les participant-e-s sont conscients qu’il faut prendre certaines mesures préventives si l’on souhaite rendre les données accessibles sur le long terme.
- Ils savent que les données doivent être archivées dans un format durable.
- Ils sont conscients que les données vont changer au fil du temps, et que certaines mesures préventives particulières doivent donc être entreprises pour conserver leur authenticité et leur intégrité.
- Ils sont conscients que les données doivent être accompagnées de nombreuses informations supplémentaires afin qu’elles soient encore compréhensibles dans le futur.
SCENARIO
Dans le cadre d’un projet de recherche, Andreas a récolté une grande quantité de données sur l’utilisation des médias en Suisse. Il part du principe que ces données seront à nouveau utiles dans quelques années pour des études longitudinales, c’est la raison pour laquelle il souhaite les archiver à long terme.
Andreas s’informe sur les mesures préventives à adopter afin que les données puissent encore être utilisées dans quelques années, et tombe par la même occasion sur les services que sa bibliothèque propose pour garantir l’authenticité de ses données.
LOOK
Liens vers des listes de formats adaptés à l’archivage
- Les formats adaptés à l’archivage pour les Archives fédérales suisses :
https://www.bar.admin.ch/bar/fr/home/archivage/versement-de-documents/documents-numeriques.html - Les formats adaptés à l’archivage selon le Centre de coordination pour l’archivage à long terme de documents électroniques (CECO) : http://www.kost-ceco.ch/wiki/whelp/Cfa/index.php
- Les recommandations de la UK Data Archive : http://data-archive.ac.uk/create-manage/format/formats-table
Validation des formats
Pour la validation des formats, il existe plusieurs services, tels que :
- La base de données de formats PRONOM, des Archives nationales britanniques :
http://nationalarchives.gov.uk/PRONOM/Default.aspx - Droid – outil de « détermination » du format : http://digital-preservation.github.io/droid/
- JHOVE – outil de validation du format : http://sourceforge.net/projects/jhove/
Le modèle de référence OAIS
- En anglais: http://public.ccsds.org/publications/archive/650x0m2.pdf
- En allemand: http://files.d-nb.de/nestor/materialien/nestor_mat_16-2.pdf
- Version 1.0: http://pin.association-aristote.fr/lib/exe/fetch.php/public/documents/norme_oais_version_francaise.pdf (traduction français)
Données de KommTech (en allemand)
Exercice
- Sur la base des données du projet KommTech, créez un paquet d’information (vous pouvez simplement simuler)
- Définissez quelles données doivent être intégrées au paquet.
- Si nécessaire, créez des documents supplémentaires.
- Enregistrez les données dans un format adapté à l’archivage (par exemple depuis Word vers PDF/A, depuis Excel vers CSV).
- Analysez : quelles informations ont été perdues avec l’ingest ? (Portez une attention particulière aux colonnes en jaune de la feuille Excel.)
- Réfléchissez : les objets peuvent-ils encore être utilisés ?
- Quelles mesures doivent être entreprises pour les rendre plus facilement utilisables ?
TAKEAWAYS
Takeaways
L’archivage à long terme de données requiert des mesures diverses qui, ensemble, garantissent que les données puissent encore être lues et utilisées à l’avenir.
Il faut notamment faire attention aux aspects suivants :
- Les données doivent se présenter sous un format acceptable pour l’archive à laquelle elles sont confiées.
- La migration des données vers un format adapté à l’archivage peut s’accompagner de pertes d’informations. Prenez les mesures nécessaires pour minimiser l’impact de ces pertes (par exemple en documentant ce qui a été perdu).
- Les données sont souvent difficiles à comprendre sans documentation. Ajoutez-y les informations nécessaires à un futur utilisateur pour lui permettre de travailler avec ces données.
- Les données et les métadonnées doivent être regroupées dans un paquet d’information. Ensemble, elles permettent une réutilisation future.