RESEARCH DATA MANAGEMENT
E-LEARNING PLATFORMModul 3-1
Daten verlinken
Um die notwendige Kooperation mit den Forschenden zu erreichen, müssen Data Librarians eine Vorstellung haben, wie Daten nachgenutzt werden können und welche Anforderungen die Daten dazu erfüllen müssen. In diesem Modul soll daher anschaulich gemacht werden, welcher Nutzen aus publizierten Forschungsdaten gezogen werden kann und welches die Voraussetzungen dafür sind. Insbesondere soll der Nutzen von verlinkten Daten aufgezeigt werden.
All cartoons courtesyof JørgenStamp,
Digitalbevaring.dk.CC BY 2.5.
35 min
Lernziele
Sie lernen in diesem Modul
- die grundlegenden Konzepte von verlinkten Daten.
- die Abfragesprache SPARQL und den Nutzen von verlinkten Daten kennen.
- Sie werden erkennen, dass die Verlinkung von Daten neue Erkenntnisse ermöglicht.
SCENARIO
Stefan ist wissenschaftlicher Mitarbeiter an einer Hochschule und beschäftigt sich mit dem Thema Innovationsentwicklung.
Für seine Studie stehen verschiedene Daten zur Verfügung, die jedoch aus unterschiedlichen Datenbanken und Repositorien stammen und daher sehr heterogen sind. Um mit den Daten arbeiten zu können, müssen die Daten zuerst bereinigt und transformiert werden. Dies ist sehr aufwendig und braucht viel Zeit und Know How, da die Daten meistens in verschiedenen Formaten und Datenmodellen vorliegen und teilweise auch nicht genügend Metadaten vorhanden sind. Stefan überlegt sich, ob es eine Möglichkeit für eine vereinfachte Datenintegration gibt und entdeckt dabei das Potential von verlinkten Daten.
LOOK
Linked Data Training Resources
„The Program for Cooperative Cataloging’s Standing Committee on Training“ hat einen Bericht über verfügbare Linked Data Training Resources veröffentlicht:
Übung
Unter dem folgenden Link finden Sie ein SPARQL Tutorial mit praktischen Übungen:
TAKEAWAYS
Takeaways
Wir haben gesehen, dass wir Daten verlinken und mit SPARQL komplexe Abfragen schreiben können.
Voraussetzungen:
- die Daten sind auffindbar und interpretierbar
- die Daten sind vollständig und ausreichend dokumentiert
- die Datenqualität stimmt
- die Daten sind in RDF vorhanden
- die verwendeten Ontologien müssen bekannt sein