RESEARCH DATA MANAGEMENT

E-LEARNING PLATFORM

Module 4-3

Publication

« Publish or perish ». Telle est la devise de la recherche académique.

Néanmoins, la publication des résultats scientifiques se limite encore et toujours, dans une grande majorité, aux monographies, recueils, articles de revues et actes de congrès. Mais qu’en est-il des données ? Comment et sous quelle forme peuvent-elles être publiées ?

 

All cartoons courtesyof JørgenStamp,
Digitalbevaring.dk.CC BY 2.5.

  35 min

Objectifs d’apprentissage

Dans ce module, vous apprendrez :

  • sous quelles formes les données apparaissent en lien avec des publications
  • ce qu’est un data paper
  • quelles sont les plus-values qui vont de pair avec la publication d’un data paper

SCENARIO

Ursina est biologiste vient de terminer sa thèse dans le domaine de la biodiversité marine auprès d’une Haute école suisse. Juste après la remise de son travail, elle a téléchargé ses données sur PANGAEA, un dépôt pour données issues des sciences de la vie et de la terre. Elle se demande à présent comment elle peut mettre en valeur ses données récemment acquises de manière ciblée dans le cadre d’une publication spécifique, afin de faciliter une éventuelle réutilisation.

Slide 1

Ce module traite de la publication des données de recherche.

Mais tout d’abord, reprenons le chemin des données, de leur création jusqu’à la publication académique classique.

Slide 2

Tout commence par les données brutes (DB).

Celles-ci la plupart du temps être traitées afin de pouvoir être réutilisées. On parle alors de données nettoyées (DN), ou en anglais «tidy data».

Dans l’idéal, les deux sets de données doivent être conservés avec un code book ainsi qu’une documentation, qui décrivent le passage des données brutes aux données nettoyées.

La suite du cycle des données de la recherche voit en principe la création de métadonnées décrivant le jeu de données dans sa forme et son contenu.

L’article scientifique classique (AS) ne mentionne les données, en général, que brièvement et ne cite que certaines données qui ont mené à la confirmation d’une hypothèse.

Le data paper (DP) adopte une position particulière; il décrit les données en détail et fait référence à l’endroit où elles sont accessibles dans leur ensemble. Il peut aussi les inclure directement, si le jeu de données est de petite taille.

Slide 3

La pyramide de la publication des données donne un autre aperçu très compact des possibilités de publication des données.

Les jeux de données brutes sont souvent sauvegardés sur un quelconque disque dur, au sein d’un institut de recherche, et ne sont en général pas du tout publiés.

Quand les données sont accessibles publiquement, par exemple dans des dépôts (collections de données) ou des bases de données structurées, il est possible de créer des publications ayant pour objet les données elles-mêmes, à l’instar des data papers déjà mentionnés. Il est également possible de faire référence à ces données librement accessibles depuis un article scientifique classique.

Dans le cas de nouvelles opérations ou de visualisations découlent aussi de nouvelles explications sur les données en constante évolution.

Parfois, l’article ou le data paper contient directement les données mêmes.

Source : http://www.alliancepermanentaccess.org/wp-content/uploads/downloads/2011/11/ODE-ReportOnIntegrationOfDataAndPublications-1_1.pdf

Slide 4

Avec l’importance croissante des données de la recherche, de nouvelles formes de publications apparaissent, dites les data papers.

Ce contexte a même vu la fondation de revues entièrement dédiées aux data papers, dites les data journals.

Slide 5

Il est intéressant de remarquer que la publication scientifique classique accuse certains manques. Nosek et Bar-Anan (2012) les résument avec les mots-clés no, slow, incomplete, inaccurate et unmodifiable.

Slide 6

Nous vous donnons ici quelques explications sur ces mots-clés.

Slide 7

Les data papers représentent un instrument permettant de pallier ces déficits. Ce sont des documents de métadonnées (indexables par les moteurs de recherche) décrivant un ou plusieurs jeux de données choisis et accessibles en ligne.

Les data papers doivent – tout comme les articles scientifiques traditionnels – respecter certains standards académiques.

Slide 8

Cette diapositive montre un schéma conceptuel sur la composition et le contexte d’un data paper.

Les data papers sont des articles scientifiques.

Ils sont publiées dans des data journals, qui appartiennent eux-mêmes à la catégories des revues scientifiques.

Un data paper décrit un jeu de données et contient également un renvoi vers la source concrète, à savoir le dépôt, où ce jeu de données a été publié.

Aussi bien le data paper que le jeu de données ont des identifiants (pérennes) et un contenu décrit au moyen de métadonnées.

Source : http://fr.slideshare.net/MariekeGuy/the-rise-of-the-data-journal

Slide 10

Nous vous donnons ici à titre illustratif les informations d’un data paper. Vous trouverez un lien vers l’article dans la rubrique «Look» ce module.

Prenez le temps d’analyser plus un détail un data paper.

Slide 11

Dans les pages suivantes, nous avons synthétisé brièvement les éléments de valeur ajoutée les plus importants des data papers.

Slide 12

Slide 13

Les deux derniers aspects sont particulièrement importants. La publication implique le désir que les données soient retrouvées dans le futur.

Parmi un flux de données accessibles en ligne croissant constamment, les données peuvent être trouvées uniquement grâce aux moteurs de recherche.

A terme, des systèmes de recommandation seront nécessaires; en se basant sur des énoncés à propos d’une question de recherche, ils permettront de retrouver des jeux de données sur lesquels le travail de recherche pourra s’appuyer.

Slide 14

Les data papers peuvent donc contribuer à neutraliser ou mitiger les déficits de la publication scientifique.

LOOK

Exemple « Data Paper »

Lien vers un data paper : http://openarchaeologydata.metajnl.com/articles/10.5334/joad.ac/

En suivant ce lien, vous trouverez un data paper publié autour d’un jeu de données archéologiques. Comme vous le verrez rapidement, il s’agit d’une publication à part entière, consacrée à la description des données, des méthodes utilisées et du potentiel de réutilisation. Le data paper comprend également des liens vers les données à proprement parler, publiées en l’occurrence sur Zenodo sous licence CC-BY 3.0.

TAKEAWAYS

Takeaways

Les données de la recherche sont – selon les phases du cycle de recherche ou selon les domaines du continuum des données – constamment réintégrées dans d’autres contextes et prennent sans cesse de nouvelles formes.

Selon les phases et les domaines, de nouvelles formes de publication apparaissent.

Les data papers offrent une bonne opportunité de relier directement les jeux de données avec des articles scientifiques. Il s’agit de publications à part entière et citables, qui ne demandent pas trop d’effort à rédiger.

De plus, ils représentent aussi le premier pas logique après le versement des données dans un dépôt à moyen terme.

Citation
SCHNEIDER, René. Module 4-3: Publication. In: MASTRANDREA, Elena, PRONGUÉ, Nicolas, SCHNEIDER, René et STETTLER, Niklaus, Manuel de gestion des données de la recherche [en ligne]. HTW Chur – HEG Genève, 2017. Disponible à l’adresse: http://www.researchdatamanagement.ch/fr/module-4-3/