RESEARCH DATA MANAGEMENT
E-LEARNING PLATFORMModul 2-3
Langzeitarchivieren
Sollen Daten über einen längeren Zeitraum aufbewahrt werden (z.B. mehr als 10 Jahre) besteht die Gefahr, dass wir sie nicht mehr öffnen und nicht mehr verstehen können.
All cartoons courtesyof JørgenStamp,
Digitalbevaring.dk.CC BY 2.5.
35 min
Lernziele
- Die TeilnehmerInnen sind sich bewusst, dass spezielle Vorkehrungen getroffen werden müssen, wenn die Daten für längere Zeit verfügbar sein sollen.
- Sie wissen, dass Daten in einem Format archiviert werden müssen, das lange haltbar ist.
- Sie sind sich bewusst, dass Daten im Laufe der Zeit verändert werden müssen und dass daher spezielle Vorkehrungen zu treffen sind, um Authentizität und Integrität zu erhalten.
- Sie sind sich bewusst, dass den Daten viele Informationen mitgegeben werden müssen, damit sie auch in Zukunft noch verständlich sind.
SCENARIO
Andreas hat im Rahmen eines Forschungsprojekts viele Daten zur Mediennutzung in der Schweiz erhoben. Er geht davon aus, dass diese Daten für Langzeitstudien in einigen Jahren wieder nützlich sein werden. Daher möchte er sie langzeitarchivieren.
Andreas informiert sich, welche Vorkehrungen er machen muss, dass die Daten auch in Zukunft noch genutzt werden können und erfährt dabei auch, was die Bibliothek unternimmt, um die Authentizität seiner Daten zu gewährleisten.
LOOK
Kataloge archivtauglicher Formate
- Die archivtauglichen Formate des Schweiz Bundesarchivs: https://www.bar.admin.ch/bar/de/home/archivierung/ablieferung/digitale-unterlagen.html
- Archivtaugliche Formate gemäss der Koordinationsstelle digitale Langzeitarchivierung, KOST: http://www.kost-ceco.ch/wiki/whelp/KaD/index.php
- Die Empfehlungen vom UK Data Archive: Quelle: UK Data Archive, File Formats Table: http://data-archive.ac.uk/create-manage/format/formats-table
Validierung der Formate
Zur Validierung der Formate stehen verschiedene Dienste zur Verfügung, z.B.
- Formatdatenbank des britischen Nationalarchivs PRONOM: http://www.nationalarchives.gov.uk/PRONOM/Default.aspx
- Droid-Tool zur ‘Bestimmung’ des Formats: http://digital-preservation.github.io/droid/
- JHOVE-Tool zur ‚Validierung‘ des Formats: http://sourceforge.net/projects/jhove/
OAIS Referenzmodell
KommTech-Studie (Übungsmaterial)
Übung
- Erstellen Sie aus den Daten des KommTech-Projekts ein Informationspaket
(Sie können nur simulieren)- Definieren Sie, welche Daten in das Paket gehören
- Falls nötig erstellen Sie zusätzliche Dokumente
- Speichern Sie die Daten in einem archivtauglichen Format (z.B.: Word in PDF/A; Excel in CSV)
- Analysieren Sie: Welche Informationen sind mit dem Ingest verloren gegangen? Achten Sie dabei insbesondere im Excel-Sheet auf die gelb markierten Spalten)
- Überlegen Sie sich: Sind die Objekte noch brauchbar?
- Welche Massnahmen sind zu ergreifen, um die Daten brauchbarer zu machen?
TAKEAWAYS
Takeaways
Langzeitarchivierung von Daten erfordert verschiedene Massnahmen, die zusammen garantieren, dass die Daten auch in Zukunft noch lesbar und nutzbar sind.
Insbesondere gilt es zu beachten:
- Die Migration von Daten in ein archivtaugliches Format kann mit Informationsverlusten einhergehen. Treffen Sie Massnahmen, um diesen Verlust klein zu halten (z.B. indem Sie dokumentieren, was verloren ging).
- Daten sind oft nicht selbsterklärend. Geben Sie den Daten die Information mit auf den Weg, die ein künftiger Nutzer braucht, um mit diesen arbeiten zu können.
- Daten und Metadaten sollten in einem Informationspaket zusammengefasst werden. Daten und Metadaten zusammen erlauben eine spätere Nutzung.