RESEARCH DATA MANAGEMENT
E-LEARNING PLATFORMModule 3-2
Préparer pour la réutilisation
Comme l’a montré le module 2-4, l’archivage à long terme se fait pour un avenir où l’on ne pourra plus interroger personne sur la signification des données. Les données doivent être auto-explicatives pour le futur utilisateur. A cet effet, elles doivent être bien préparées et accompagnées d’informations supplémentaires. Ce module montre à quoi doivent ressembler ces informations supplémentaires et comment elles peuvent être ajoutées aux données. Vous apprendrez aussi que cette étape implique un certain effort qui ne peut être investi pour toutes les données. Une évaluation anticipée des données est donc nécessaire. De possibles critères d’évaluation seront abordés également.
All cartoons courtesyof JørgenStamp,
Digitalbevaring.dk.CC BY 2.5.
35 min
Objectifs d’apprentissage
- Les participant-e-s sont conscients que les données pourront être utiles dans le futur uniquement si elles sont accompagnées de suffisamment d’informations supplémentaires.
- Ils savent à quoi doivent ressembler ces informations supplémentaires.
- Ils savent que toutes ces métadonnées ainsi que les données à proprement parler sont regroupées en un paquet d’information.
- Ils savent que le traitement des données pour le futur constitue un effort substantiel qui ne peut être investi que pour les jeux de données les plus importants.
- Ils ont des critères pour déterminer s’il vaut la peine de préparer les données pour un archivage à long terme.
SCENARIO
Manuela – chercheuse pour une haute école – offre ses données à Barbara, la personne responsable des données de la recherche au sein de son institution, pour qu’elles soient conservées et publiées. Barbara lui explique qu’il faut bien décrire les données, si celles-ci doivent encore pouvoir être utilisées dans x années. Sans quoi les chercheurs réussiront peut-être à ouvrir les données, mais seront difficilement capables de les réutiliser.
Ensemble, Barbara et Manuela réfléchissent aux informations à ajouter aux données et à une manière le plus simple possible d’effectuer cette opération. Elles réalisent vite que cette préparation des données est liée à un effort important. Elles délibèrent alors afin de déterminer pour quelles données cet effort vaut la peine, et quelles données ne seront au contraire conservées que 10 ans, comme l’exige la revue dans laquelle Manuela a publié les résultats de son activité de recherche.
LOOK
Lignes directrices
‘Five steps to decide what data to keep: a checklist for appraising research data v.1’. Edinburgh: Digital Curation Centre. http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-what-data-keep
‘How to Appraise and Select Research Data for Curation’. DCC How-to Guides. Edinburgh: Digital Curation Centre. http://www.dcc.ac.uk/resources/how-guides/appraise-select-data
‘Data appraisal at the UK Data Archive’. http://data-archive.ac.uk/media/3453/RDE_MRDOctober_Triage.pdf
Exercice, partie 1
Réfléchissez à des critères qui peuvent vous aider dans l’évaluation.
- Quelles données voulez-vous archiver à long terme ?
- Quelles données mettriez-vous dans un dépôt, prêtes à être réutilisées ?
- Quelles données conserveriez-vous uniquement sous forme de bit stream ?
- Quelles données ne conserveriez-vous tout simplement pas ?
Consignez ces critères.
Exercice, partie 2
Vous recevez une livraison de deux jeux de données.
Utilisez à présent les critères d’évaluation que vous avez développés en première partie d’exercice. Décidez quels documents et quelles données vous souhaitez conserver, et pour combien de temps.
Jeu de données 1 :
Données d’un doctorant. Thème de la thèse : Le quotidien des femmes dans les années 1950.
On vous livre :
- La thèse elle-même
- Un ensemble d’article de journaux
- Le fil conducteur des entretiens
- Des interviews, fichiers audio
- Des transcriptions d’interviews
- Une évaluation quantitative des interviews (tableau Excel)
- Une base de données avec des notes de lecture
- Des extraits / données de diverses statistiques officielles
Jeu de données 2 :
Données d’une étude pilote sur le niveau de formation des adultes en Suisse.
On vous livre :
- Brouillon : but de l’étude
- Le formulaire du questionnaire
- Les règles de codage
- La préparation des données
- Des graphiques interprétant les données
- Des publications
- Le design de l’enquête future
TAKEAWAYS
Takeaways
Pour permettre la réutilisation des données, ces dernières doivent être bien préparées et décrites en détails. Si cela n’est pas fait, les données seront peut-être bel et bien disponibles à l’avenir, mais risquent de ne plus être compréhensibles. La description des données demande néanmoins un tel effort qu’elle ne peut être réalisée pour toutes les données.
En général, on peut retenir que plus les données doivent être conservées longtemps, plus elles doivent être traitées en profondeur et plus leur public-cible sera large.
Par conséquent, chaque dépôt de données se doit de définir des critères déterminant quelles données selon quel effort seront traitées.