RESEARCH DATA MANAGEMENT

E-LEARNING PLATFORM

Module 6

Etude de cas : Institut de plurilinguisme

Ce module présente l’exemple concret d’une institution suisse où une solution de gestion des données de la recherche (pour les sciences humaines) a été mise en place et fonctionne.

All cartoons courtesyof JørgenStamp,
Digitalbevaring.dk.CC BY 2.5.

  35 min

Objectifs d’apprentissage

Dans ce module, vous apprendrez

  • les phases possibles pour l’introduction d’un système de gestion des données de recherche
  • l’importance des étapes de précatalogage pour la gestion des données de la recherche
  • comment les données de la recherche peuvent être cataloguées.

SCENARIO

Moritz est bibliothécaire au centre de documentation de l’Institut de plurilinguisme et du Centre scientifique de compétence sur le plurilinguisme. En vue d’améliorer l’offre de services, il est chargé d’élaborer et d’implémenter une solution pour la gestion des données de la recherche.

 

Slide 1

Ce module est une étude de cas pour la mise en place d’une archive pour données de la recherche.

Slide 2

En trois étapes, le module vous montre comment arriver de l’idée à l’archive, et comment l’ingest des données est possible dans le contexte d’une structure très spécifique.

Slide 3

Comme vous pouvez le voir, le contexte organisationnel de l’Institut est particulièrement complexe et difficile à appréhender:

Il s’agit d’un centre de documentation faisant partie d’un centre de compétences (qui fait lui-même partie d’un institut) et se trouvant en lien avec la bibliothèque d’une faculté. En outre il se situe entre deux grandes institutions, l’université et la haute école pédagogique.

Vous ne devez pas comprendre tout cela dès maintenant, mais saisir que la complexité du contexte a des conséquences sur l’exploitation et la gestion des données.

Slide 4

Comme vous pouvez le voir, d’un côté les ressources humaines sont limitées, d’un autre côté les services sont nombreux. En plus d’une bibliothèque, ceux-ci comprennent aussi des prestations numériques, dont une archive pour données de la recherche.

Slide 5

La mise en place de ce service a pris environ une année et demie. Sur la base d’une étude et d’un concept, le choix d’un produit a été relativement rapide à effectuer. Environ une année après le début du projet, les plans de gestion des données (DMP) et un guide de bonnes pratiques pour l’archivage des données de recherche ont été introduits. Enfin, le catalogage des données a commencé.

Slide 6

Au cœur du processus se trouvent bien sûr les données de la recherche et les formes sous lesquelles elles se manifestent.

A l’Institut de plurilinguisme, la recherche se concentre essentiellement dans les domaines de la psycholinguistique, la didactique des langues et la sociolinguistique.

Ce tableau montre un panorama des formes que peuvent prendre les données et de leur relation avec l’Open Data.

Comme vous pouvez le voir, les données sont très hétérogènes.

Slide 7

La deuxième partie du module s’attarde sur le processus allant du plan de gestion des données (DMP) au précatalogage.

Ce processus est particulièrement important, car il implique ensemble chercheurs et bibliothécaires. La dernière étape, celle de l’ingestion des données et du catalogage, doit être préparée de manière optimale.

Slide 8

En guise de récapitulation et pour placer le DMP dans son contexte, voici ci-dessus le cycle de vie des données.

Le plan de gestion des données se trouve au début du cycle de vie et sert à préparer ce cycle et à l’accompagner.

Slide 9

Slide 10

Il est utile pour les chercheurs, les organismes de financement, mais aussi pour les bibliothécaires. L’utilité pour ces derniers peut néanmoins surprendre.

Slide 11

Voici quelques raisons expliquant pourquoi le DMP est important pour les bibliothécaires.

Slide 12

Suite à ces éléments théoriques, voici deux DMP en guise d’exemples. Mis côte à côte, vous pouvez facilement les comparer.

Slide 13

Dans la partie suivante sont présentées brièvement les étapes du précatalogage.

Ici, les chercheurs et les bibliothécaires se mettent ensemble et préparent l’ingestion et le catalogage.

Slide 14

Sur cette diapositive, vous voyez le plan de classement (structure des dossiers) prévu à l’Institut de plurilinguisme, selon lequel les chercheurs doivent organiser l’ensemble des données à archiver. Ils peuvent effectuer ce travail seul ou directement avec un bibliothécaire.

Comme vous le voyez, le dossier contient le fichier Metadata.docx (de type readme.txt), aidant à la compréhension des données.

Slide 15

Slide 16

La dernière étape de la solution implémentée à l’Institut du plurilinguisme est le catalogage.

Slide 17

Slide 18

Pour cela, il peut être utile de comprendre quelles parties concernent les données au sein de la structure des dossiers en place.

Pour cela, il existe un espace bien délimité dans le système, prévu pour les données de la recherche. Il se subdivise en trois parties: la description des données, l’explication des méthodes utilisées et les données elles-mêmes. Cette dernière partie se divise à son tour en une sous-structure pour les divers types de données, tels que questionnaires, code-book, et les jeux de données. Les jeux de données contiennent alors les fichiers bruts.

Slide 19

Dans le cas de l’Institut de plurilinguisme, il a été décidé d’acquérir un logiciel clé en main permettant de gérer l’ensemble des services.

Ci-dessus apparaît une capture d’écran de ce système, accompagnée d’explications sur les contenus et les fonctionnalités, dont l’accès à l’archive des données de recherche.

Slide 20

Les métadonnées sont cruciales pour l’accès aux données. Elles peuvent être très diverses.

Pour le catalogage, on peut distinguer celles qui sont indispensables, facultatives et non pertinentes.

Cette diapositive présente dans le désordre toutes sortes d’éléments de métadonnées possibles.

Slide 21

Ici, vous voyez les mêmes éléments triés selon les trois classes (indispensable, facultatif, non pertinent).

On constate que beaucoup sont indispensables.

Slide 22

Aussitôt les données et métadonnées à disposition, le catalogage peut commencer.

Slide 23

Pour ce faire, vous trouverez en-dessous de cette introduction un exemple concret de catalogage.

Slide 25

LOOK

Vue d’Ensemble « Etude de cas : Institut de plurilinguisme »

Vous trouvez ici deux exemples de plan de gestion des données, qui ont été comparés précédemment dans la présentation théorique.

Par ailleurs, voici quelques captures d’écran du système choisi pour le catalogage des données de recherche, afin de montrer la complexité et la nécessité d’un traitement harmonisé de ces données.

Les champs marqués en vert indiquent les éléments de l’exemple allant dans les champs correspondants.

Pour mieux comprendre, voici encore un document rassemblant l’ensemble des éléments du jeux de données.

Si vous êtes intéressés par la création de ce module de cours dans la forme où il a été enseigné pour la première fois (en présence), nous vous recommandons la lecture du travail de Master suivant :

LONATI, Sara: Didacticiel pour la gestion des données de recherche au sein de l’institut de plurilinguisme de Fribourg. Mémoire de Master: Haute Ecole de gestion de Genève 2016; MASID 47.

TAKEAWAYS

Takeaways

Dans ce module, vous avez appris

  • que des solutions clé en main sont nécessaires pour faire l’inventaire et cataloguer des données de recherche
  • qu’une phase de précatalogage est indispensable avant le catalogage à proprement parler
  • que tout ceci doit être précédé d’un plan de gestion des données bien rédigé et actualisé.
Citation
LONATI, Sara et SOMMET, Moritz. Module 6: Etude de cas : Institut de plurilinguisme. In: MASTRANDREA, Elena, PRONGUÉ, Nicolas, SCHNEIDER, René et STETTLER, Niklaus, Manuel de gestion des données de la recherche [en ligne]. HTW Chur – HEG Genève, 2017. Disponible à l’adresse: http://www.researchdatamanagement.ch/fr/module-6/