RESEARCH DATA MANAGEMENT
E-LEARNING PLATFORMModul 3-2
Daten Nutzen – welche Daten wie für die Nachnutzung aufbereiten?
Wie in Modul 2-4 gezeigt, bedeutet Langzeitarchivierung Archivierung für eine Zukunft, in der niemand mehr zur Bedeutung der Daten befragt werden kann. Die Daten müssen für die künftigen NutzerInnen selbsterklärend sein. Dazu müssen diese gut aufbereitet und mit Zusatzinformation versehen werden. In diesem Modul zeigen wir auf, welcher Art die zusätzliche Information sein muss und wie diese den Daten mit auf den Weg gegeben wird. Sie lernen aber auch, dass diese Aufbereitung mit Aufwand verbunden ist und nicht für alle Daten geleistet werden kann. Daher drängt sich eine frühzeitige Bewertung der Daten auf. Wir diskutieren mögliche Kriterien für diese Bewertung.
All cartoons courtesyof JørgenStamp,
Digitalbevaring.dk.CC BY 2.5.
35 min
Lernziele
- Die TeilnehmerInnen sind sich bewusst, dass die Daten in Zukunft nur nutzbar sein werden, wenn ihnen genügend Zusatzinformation mitgegeben wird.
- Sie wissen, welcher Art diese Zusatzinformation sein muss.
- Sie wissen, dass all diese Information zusammen mit den ursprünglichen Nutzdaten zu einem Informationspaket geschnürt wird.
- Sie wissen, dass die Aufbereitung der Daten für die Zukunft aufwändig ist und daher nur für wertvolle Datensätze vorgenommen werden kann.
- Sie haben Kriterien, um zu bestimmen, ob die Daten für die Langzeitarchivierung aufbereitet werden sollen oder nicht.
SCENARIO
Manuela – Forschende an der Hochschule – bietet der Forschungsdatenverantwortlichen der Hochschulbibliothek Barbara ihre Daten zur Aufbewahrung und Publikation an. Barbara erklärt Manuela, dass die Daten, wenn sie auch in x Jahren noch nutzbar sein sollen, gut beschrieben sein müssen. Andernfalls gelingt es künftigen Forschenden zwar vielleicht, die Daten zu öffnen doch werden sie diese kaum weiterverwenden können.
Zusammen überlegen sich Barbara und Manuele welche Zusatzinformation den Daten mitgegeben werden muss und wie diese möglichst einfach mitgegeben werden können. Schnell erkennen sie, dass diese Aufbereitung der Daten mit erheblichem Aufwand verbunden ist. Daher überlegen sie sich gemeinsam, für welche Daten sich dieser Aufwand lohnt und welche Daten nur 10 Jahre aufbewahrt werden sollen, wie das von der Zeitschrift, in der die Resultate der Forschung von Manuela publiziert werden sollen, gefordert wird.
LOOK
Guidelines
‚Five steps to decide what data to keep: a checklist for appraising research data v.1‘. Edinburgh: Digital Curation Centre. http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-what-data-keep
‚How to Appraise and Select Research Data for Curation‘. DCC How-to Guides. Edinburgh: Digital Curation Centre. http://www.dcc.ac.uk/resources/how-guides/appraise-select-data
‚Data appraisal at the UK Data Archive‘. http://data-archive.ac.uk/media/3453/RDE_MRDOctober_Triage.pdf
Übung Teil 1
Überlegen Sie sich Kriterien, die Ihnen als Hilfsmittel für die Bewertung dienen können.
- Welche Daten wollen Sie einer Langzeitarchivierung zuführen?
- Welche Daten würden Sie in Ihr Repository aufnehmen und für die Nachnutzung aufbereiten?
- Welche Daten würden Sie nur in Form einer bit stream preservation aufbewahren?
- Welche Daten würden Sie gar nicht aufnehmen?
Halten Sie Ihre Kriterien fest.
Übung Teil 2
Sie erhalten das Angebot von 2 Datenbeständen.
Wenden Sie die Bewertungskriterien, die Sie im 1. Teil der Übung entwickelt haben, nun an.
Entscheiden Sie sich, welche Unterlagen und Daten Sie wie lange aufbewahren wollen.
Datenbestand 1:
Daten eines Dissertanten. Thema der Arbeit: Der Frauenalltag in den 1950er Jahren.
Angeboten werden Ihnen:
- Die Disseration
- Sammlung von Zeitungsartikeln
- Interviewleitfaden
- Interviews, Audio-files
- Transkriptionen der Interviews
- Quantitative Auswertung der Interviews (Excel-Tabelle)
- Eine Datenbank mit Lektüre-Notizen
- Auszüge / Auswertungen aus div. offiziellen Statistiken
Datenbestand 2:
Daten einer Pilotstudie zum Bildungsstand von Erwachsenen in der Schweiz.
Angeboten werden Ihnen:
- Draft: Ziel der Untersuchung
- Erhebungsbogen
- Codierungsregeln
- Aufbereitung der Daten
- Graphiken zu den Auswertung
- Publikationen
- Design für die künftigen Erhebungen
TAKEAWAYS
Takeaways
Um die Nachnutzung von Daten zu ermöglichen, müssen diese gut aufbereitet und umfassend beschrieben werden. Geschieht dies nicht, besteht die Gefahr, dass die Daten in Zukunft wohl noch vorhanden, doch nicht mehr verstanden werden können. Diese Beschreibung der Daten ist so aufwändig, dass sie nicht für alle Daten geleistet werden kann.
Generell kann festgehalten werden, dass Daten aufwändiger aufbereitet werden müssen, je länger die Daten zur Verfügung gestellt werden sollen und je breiter die designierte Nutzerschaft ist.
Jedes Datenrepositorium muss sich daher Kriterien erarbeiten, in denen definiert ist, welche Daten mit welchem Aufwand aufbereitet werden sollen.