RESEARCH DATA MANAGEMENT
E-LEARNING PLATFORMModul 2-1
Die Daten auf dem Lebensweg
In diesem Modul folgen wir den Forschungsdaten auf ihrem Lebensweg. Wir sehen, dass die Daten in unterschiedlichen Phasen in je eigenen Systemen vorgehalten und verwaltet werden. Dabei wird deutlich, dass die Daten mit jedem Schritt ‘in die Öffentlichkeit¨umfangreicher beschrieben und dokumentiert sein müssen. Die Publikation der Daten erfordert eine sehr genaue Dokumentation, ohne die Forschungsdaten nicht nachgenutzt werden können.
All cartoons courtesyof JørgenStamp,
Digitalbevaring.dk.CC BY 2.5.
35 min
Lernziele
- Datalibrarians betreiben die Infrastruktur für das Datenmanagement.
- Sie wissen, wie diese Infrastruktur beschaffen sein muss, um die grundlegenden Ziele des Forschungsdatenmanagements zu erreichen.
- Sie sind mit der Architektur eines Forschungsdatenportals vertraut.
SCENARIO
Barbara übernimmt in einer Hochschulbibliothek die Aufgabe, das Forschungsdatenmanagement der Hochschule aufzubauen. Sie überlegt sich, in welchen Systemen die Forschungsdaten bislang vorliegen und wie diese idealerweise verwaltet werden könnten. Dabei wird ihr deutlich, dass die Daten im Laufe ihres Lebenszyklus zunehmend ‚öffentlicher‘ werden und daher auch umfangreicher dokumentiert werden müssen.
LOOK
Metakataloge für Metadaten
Versuche, die im Web verstreuten Forschungsdaten zusammenzuführen, nehmen zu. Immer mehr wird versucht Metakataloge für Metadaten (oder Repositorien selbst) zu erstellen. Eine solche zusätzliche Einspeisung von Metadaten kann manuell oder maschinell geschehen. Die ist vergleichbar mit den diversen Versuchen Bibliothekskataloge via Metakatalog zugänglich zu machen, z.B. Swissbib in der Schweiz.
Metadatenkataloge verweisen in der Regel auf eine „Landingpage“, also „Ursprungsplattform“ bzw. das Repository bzw. dessen Katalog, von welchem die Metadaten stammen. Diese Landingpages enthalten üblicherweise die meisten Metadaten sowie die Daten selbst bzw. die Information wie ggf. Zugang erhalten werden kann.
Ein Beispiel für einen solchen Metakatalog in der Schweiz ist openresearchdata.ch, welcher versucht alle offenen Forschungsdaten (Open Data), zu verzeichnen.
Beispiele: Use Cases
- USE CASE 1: Institutional Repository (institutionsgebunden)
- A: Alle Daten sind öffentlich zugänglich
- B: Nicht alle Daten öffentlich zugänglich
- USE CASE 2: Disciplinary Repository/Data Centre (themengebunden)
- USE CASE 3: Multidisciplinary Repository/Data Centre (themenunabhängig)
Ausgangslage:
- Alle Daten dürfen veröffentlicht werden
- Die HTW hat ein eigenes Repository mit dazugehörigem Datenkatalog
Mögliche Lösung:
- Die Daten werden im HTW-Repository und die gesamten dazugehörigen Metadaten im Datenkatalog gespeichert
- Für eine bessere Auffindbarkeit werden die wichtigsten Metadaten zusätzlich in openresearchdata.ch erfasst; verweist auf den Datenkatalog des HTW-Repositorys (Landing Page)
Ausgangslage:
- Nicht alle Daten dürfen veröffentlicht werden
- Die HTW hat ein eigenes Repository mit dazugehörigem Datenkatalog
Mögliche Lösung:
- Die öffentlichen Daten werden im HTW-Repository und die gesamten dazugehörigen Metadaten im Datenkatalog gespeichert
- Die nicht zu veröffentlichen Daten werden auf einem separaten, von aussen nicht zugänglichen Server der HTW abgelegt. Die gesamten dazugehörigen Metadaten werden jedoch im öffentlichen Datenkatalog hinterlegt
- Für eine bessere Auffindbarkeit werden die wichtigsten Metadaten von öffentlichen und nicht öffentlichen Daten zusätzlich in openresearchdata.ch erfasst; verweist auf den Datenkatalog des HTW-Repositorys (Landing Page)
Ausgangslage:
- Alle Daten dürfen veröffentlicht werden
- Die HTW hat zwar ein eigenes Repository und besitzt einen Datenkatalog, jedoch existiert ein externes Repository, das spezialisiert ist auf Daten aus dem Bereich Kommunikation
Mögliche Lösung:
- Die gesamten Daten und Metadaten werden in einem externen, disziplinären Repository mit dazugehörigem Datenkatalog gespeichert
- Für eine bessere Auffindbarkeit werden die wichtigsten Metadaten zusätzlich in openresearchdata.ch erfasst und auf den Datenkatalog des Disciplinary Repositorys verwiesen (Landing Page)
- Der Datenkatalog der HTW verzeichnet nur die Metadaten und verweist auf das Disciplinary Repository (Landing Page)
Ausgangslage:
- Alle Daten dürfen veröffentlicht werden
- Die HTW hat kein eigenes Repository und verzeichnet normalerweise auch sonst noch keine Daten
- Es existiert kein disziplinäres Repository
Mögliche Lösung:
- Die gesamten Daten und Metadaten werden in einem externen, multidisziplinären Repository mit dazugehörigem Datenkatalog gespeichert
- Für eine bessere Auffindbarkeit werden die wichtigsten Metadaten von öffentlichen und nicht öffentlichen Daten zusätzlich in openresearchdata.ch erfasst und auf den Datenkatalog des multidisziplinären Repositorys verwiesen (Landing Page)
Übung 1
Schauen Sie sich die untenstehenden Beispiele von Datenkatalogeinträgen an. Welchem der eben vorgestellten Use Cases entsprechen die Einträge (am ehesten)?
- https://heidata.uni-heidelberg.de/dataset.xhtml?persistentId=doi:10.11588/data/10011
- http://datacite.org/10.6084/M9.FIGSHARE.1352064
- http://www.da-ra.de/dara/study/web_show?res_id=4751&lang=de&mdlang=de&detail=true http://dss.princeton.edu/cgi-bin/dataresources/newdataresources.cgi?term=2
- https://beta.openaire.eu/search/dataset?datasetId=datacite____::d2828f42d0f1c5eab5ad930cb2901e27
Lösung anzeigen
- zu Use Case 1B
- zu Use Case 3
- zu Use Case 2
- zu Use Case 1A
Übung 2
Sie haben zwei Beispiele vor sich: Vergleichen Sie diese! Was weist auf gutes, aktives Datenmanagement hin? Wo wurde vermutlich wenig aktives Datenmanagement betrieben? Was erleichtert die Nachnutzung bzw. was für Information fehlt für eine Nachnutzung? Wo sehen Sie Probleme für eine Nachnutzung und weshalb? Wie könnten diese Probleme gelöst werden?
Betrachten Sie hierfür nicht nur die Metadaten, welche im Katalog abgebildet sind, sondern schauen Sie sich auch die Daten selbst näher an, sofern dies möglich ist.
Hinweis: Dokumente im Format .md (markdown) können mit einem Texteditor geöffnet werden. Für eine korrekte Darstellung kann beispielsweise http://dillinger.io/ verwendet werden.
Beispielpaar A:
Beispielpaar B:
Beispielpaar C:
TAKEAWAYS
Takeaways
- Daten können sich in einer von drei Domains befinden:
- Private Research Domain
- Shared Reasearch Domain bzw. Collaboration Domain
- Public Domain bzw. Publication Domain
- (Meta-) Daten können sich in vier Quadranten befinden: public data, public metadata, private data, private metadata.
- Bezüglich Speicherung kann zwischen a) internen Speichern und Katalogen, welche sich in-house, also innerhalb der eigenen Institution, befinden und b) externen Speichern und Katalogen, welche sich in der Cloud, also bei anderen Institutionen, Organisationen oder Firmen befinden, unterschieden werden.
- Anders als bei den anderen Domains ist es in der Public Domain möglich, wenn nicht sogar üblich, Daten und Metadaten an verschiedenen Orten zu speichern. Dabei können die Metadaten (seltener auch die Daten selbst) in mehreren Verzeichnissen vorhanden sein (siehe Metakataloge für Metadaten).
Quellen
Lewis, John A. (2014): Research Data Management Technical Infrastructure: A Review of Options for Development at the University of Sheffield. figshare. Verfügbar unter : http://dx.doi.org/10.6084/m9.figshare.1202230
Lewis, Stuart (2013, 06. Dezember): The four quadrants of Research Data Curation Systems. [Blog]. Verfügbar unter: http://libraryblogs.is.ed.ac.9999999999uk/blog/2013/12/06/the-four-quadrants-of-research-data-curation-systems/
OpenRepos2012 (2012, 12. Juli): Anthony Beitz, Institutional Infrastructure for Research Data Management, 00:57:56 – 01:31:14. [Video]. Verfügbar unter: https://www.youtube.com/watch?v=JMZZsF92lTk