RESEARCH DATA MANAGEMENT
E-LEARNING PLATFORMModul 2-2
Forschungsdaten beschreiben
In diesem Modul lernen Sie einen Standard zur Beschreibung von Daten kennen, der zur Interoperabilität zwischen verschiedenen Datenkatalogen beiträgt. Die Beschreibung von Datasets mit dem Vokabular ‚Data Catalog Vocabulary (DCAT) trägt dazu bei, dass Datensets gefunden werden können – nicht zuletzt bei Suchen, die über verteilte Kataloge gestartet werden. Insbesondere im Bereich der Forschungsdaten ist das Kriterium, dass über viele Kataloge gesucht werden kann, von grosser Bedeutung, da viele Daten von institutionellen Repositories zur Verfügung gestellt werden.
All cartoons courtesyof JørgenStamp,
Digitalbevaring.dk.CC BY 2.5.
35 min
Lernziele
- Die TeilnehmerInnen kennen die Aufgaben der Datalibrarians
- Sie wissen, dass Datalibrarians Forschungsdaten verzeichnen
- Sie kennen den Standard DCAT zur Beschreibung von (Forschungs-)daten
- Sie sind sich bewusst, dass ein generischer Katalog die Daten nur oberflächlich beschreiben kann, dass aber häufig detailliertere Beschreibungen notwendig sind.
SCENARIO
Im Zuge ihres neuen Jobs als Forschungsdatenmanagerin an ihrer Hochschule soll Barbara auch ein Portal aufbauen, das die Suche der Daten ermöglicht. Da an der Hochschule Forschende sehr unterschiedlicher Disziplinen wirken, erweist es sich schnell als unmöglich, ein Schema zur Beschreibung all dieser Daten zu definieren.
Barbara entschliesst sich, für einen Katalog, der lediglich das Auffinden der Daten gewährleistet. Detaillierter werden die Daten auf den jeweiligen Landing Pages – vorzugsweise Webseiten, die von einzelnen Disziplinen betrieben werden, beschrieben.
In dem von W3C standardisierten Data Catalog Vocabulary findet Barbara ein Vokabular, das sich für die Beschreibung von Daten gut eignet und weit verbreitet ist.
LOOK
Links auf den Forschungsdaten-Katalog aus dem swissuniversities-Projekt „[email protected]“
KommTech-Studie (Übungsmaterial)
Übung 1
- Beschreiben Sie die Daten von KommTech nach dem DCAT Application Profile for Swiss data portals
- Beschreiben Sie das Dataset mit folgenden Metadaten:
Title | |
Description | |
Publisher | |
ContactPoint | |
Theme | |
Issued | |
Distribution | |
Relation | |
Keyword | |
Landing Page | |
SeeAlso |
Übung 2
- Beschreiben Sie eine Distribution mit folgenden Metadaten:
Title | |
Description | |
Modified | |
DownloadURL | |
ByteSize | |
mediaType | |
Format | |
Coverage |
TAKEAWAYS
Takeaways
Ein disziplinübergreifer Katalog muss sich somit auf diejenigen Eigenschaften der Daten konzentrieren, die einen möglichst guten allgemeinen Eindruck zu vermitteln vermögen. Tiefergehende Beschreibungen sind z.B. auf den LandingPages resp. auf erläuternden Begleittexten zu platzieren.
Besondere Eigenschaften eines Vokabulars zur Beschreibung von Forschungsdaten sind:
Die Differenzierung der Beschreibung zwischen Dataset und Distribution – die wird der Tatsache gerecht, dass Datasets unterschiedliche Repräsentationen haben können.
Der Verweis auf die LandingPage, auf der zusätzliche, spezifischere Beschreibungen zu platzieren sind.
Metadaten, die nicht nur das Objekt, sondern auch die in den Daten erfasste ‚Realität‘ beschreiben (räumliche und zeitliche Abdeckung)
Darüber hinaus werden Daten jedoch weitgehend gleich beschrieben wie andere Digitale Objekte. Daher kann DCAT auch die meisten Vokabularbegriffe von Dublin Core übernehmen.