RESEARCH DATA MANAGEMENT

E-LEARNING PLATFORM

Modul 7-2

TEI Perspektiven und Werkzeuge

In diesem Modul stellen wir Ihnen die Grundelemente der Text Encoding Initiative (TEI) vor.

Wir gehen auch der Frage nach, inwieweit der Editionsprozess sich verändert und welche Werkzeuge zur Transkription, Kollation und Publikation zur Verfügung stehen.

All cartoons courtesyof JørgenStamp,
Digitalbevaring.dk.CC BY 2.5.

  35 min

Lernziele

In diesem Modul lernen Sie

  • welche Rolle TEI im editorischen Prozess spielt,
  • welchen Veränderungen der editorische Prozess unterworfen ist.

SCENARIO

Das wichtigste Leitmotiv in der Neuausrichtung des Editionsprojekts, für das Luc arbeitet, lautet Interoperabilität. Neben TEI, das schon im Vorläuferprojekt Anwendung gefunden hat, geht Luc der Frage nach, wie und mit welchen Werkzeugen Interoperabilität sowie die Aspekte von Open Access, Open Data und Open Source im Projekt gewährleistet werden können.

 

Folie 1

In diesem Modul geben wir Ihnen eine Einführung in das weite Feld der Editionen.

Folie 2

Wir beginnen mit Definitionen und einer Klärung darüber, was wissenschaftliche bzw. digitale Editionen sind.

Anschliessend sprechen wir über die Grundzüge von TEI und beenden die Präsentation mit einem Ausblick.

Folie 3

In diesem Teil des Moduls wollen wir uns der Text Encoding Initiative (TEI) widmen.

Folie 4

Auslöser für die Text Encoding Initiative war der Umstand, dass in den achtziger Jahren fast jedes Projekt sein eigenes binäres Format verwendete.

TEI war demnach der Versuch eine gemeinsame Metasprache für alle diese Projekte zu schaffen.

Folie 5

TEI basiert dabei vollständig auf XML, vereinfacht kann man sagen, es ist eine Art XML für Texte.

Folie 6

XML bringt neben vielen Vorteilen auch einige Nachteile mit sich.

Dies liegt vor allen Dingen im hierarchischen Aufbau von XML begründet.

Folie 7

TEI ist auch kein Standard, es handelt sich letztlich um eine Reihe von Empfehlungen, die modular aufgebaut sind.

TEI-Dokumente können zudem sehr reichhaltige Header haben.

(Siehe die Beispiele auf der Seite von e-codices. Wählen Sie dazu eines der dort digitalisierten Dokumente und wählen Sie nach «Show Description» den Button «Show XML».)

http://www.tei-c.org/Guidelines/P5/

http://www.e-codices.unifr.ch/en

Folie 8

Auf dieser Seite zeigen wir Ihnen zur Illustration einer Codierung in XML.

Wie Sie sehen, wird hier versucht, die Struktur des Dokuments genau wiederzugeben.

Folie 9

Wohingegen in diesem Fall versucht wird, Erläuterung zur Kodierung seitens des Verfassers zu geben.

Folie 10

Dieses Beispiel zeigt, wie es mit TEI möglich ist, unklare Stellen zu markieren.

Folie 11

Die Kodierung dieses TEI-Dokuments versucht den Schreibprozess des Autors zu dokumentieren.

Folie 12

TEI erlaubt auch die Integration von Anmerkungen und Kommentaren, die dem ursprünglichen Dokument zugefügt wurden.

Folie 13

Jedes Dokument bietet unterschiedliche Möglichkeiten der Behandlung.

Im diesem Fall zeigt es genau die typographische Gestaltung der Buchseite.

Folie 14

In diesem Fall gibt es Erläuterungen, um das Originaldokument verständlicher zu machen.

Folie 15

In diesen Fällen gewinnt der kritische Apparat an Bedeutung.

Er erlaubt die Trennung von Daten und Werkzeugen und ermöglicht es, die Daten unter jeweils anderer Perspektive zu betrachten.

Folie 16

Für die kritische Bearbeitung der Daten ist dabei das TEI-Schema von Bedeutung, das die Trennung von Daten und Funktion ermöglicht.

Folie 17

Eng mit dem Schema hängt auch die Anpassung des TEI-Dokuments zusammen. Eine TEI-Anpassung  ist ein Dokument aus dem ein Schema generiert werden kann.

Das Schema definiert, welche Elemente und Attribute des TEI-Systems man benutzen will.

http://www.tei-c.org/Guidelines/Customization/

http://www.tei-c.org/Roma/

Folie 18

Im folgenden Abschnitt wollen wir uns der Text Encoding Initiative (TEI) widmen.

Folie 19

Digitalisierung heisst aber nicht immer nur Vereinfachung. Ganz im Gegenteil der Herausgeberprozess von heute ist ungleich komplexer und in einigen Fällen sogar komplizierter geworden.

Zudem sind noch nicht alle Fragen gelöst und die Entwicklungen schreiten in sehr grossem Tempo voran. Was heute State-of-the-Art ist, kann morgen schon veraltet sein.

Folie 20

Dies betrifft die Quellensuche …

Folie 21

… genau so wie den Zugriff auf die Quellen …

http://eebo.chadwyck.com

https://www.hathitrust.org/

Folie 22

… die Verfahren …

http://www.impact-project.eu/

Folie 23

… und die Werkzeuge zur Transkription.

Zur Illustration dieses letzten Punkts, haben wir im Teil dieses Moduls, der diesem inhaltlichen Teil folgt, eine Reihe von Werkzeugen zur Transkription zusammengestellt.

Folie 24

Dies gilt auch für den Abgleich von Textvarianten.

Sowohl, was die Apparatur, als auch was die digitale Arbeitsumgebung betrifft, können Sie hier sehen, wie komplex die heutigen Arbeitsbedingungen sind.

Folie 25

Zudem existieren eine ganze Werkbank unterschiedlicher Instrumente, von denen wir Ihnen ebenfalls im Anschluss an diese Präsentation einige Beispiele zur Kollation, d.h. zum Abgleich der Textvarianten zusammengestellt haben.

Folie 26

Zu guter letzt gibt es eine Vielzahl unterschiedlicher Medien auf denen digitale Editionen präsentiert werden können.

Folie 27

Auch für die Publikation von TEI gibt es verschiedene Werkzeuge. Sie finden einen tabellarischen Überblick im Anschluss an diese Präsentation.

Folie 28

Gegenwärtig werden vor allen Dingen zwei Themen diskutiert. Linked Open Data und IIIF (sprich Triple I F).

Beide haben – genau so wie TEI, das in gewisser Hinsicht ein Vorläufer des semantischen Web war – sehr viel mit ungehindertem Datenaustausch zu tun.

Bei IIIF geht es vor allen Dingen um die Interoperabilität der Bilddaten, bei LOD vor allen Dingen um die Interoperabilität der Metadaten.

https://ddmal.github.io/diva.js/

Folie 29

Parallel dazu ist auch die Offenheit der Daten von Bedeutung.

Hier geht es hauptsächlich um Zugang für alle, den Verzicht auf Autorenrechte und Nachhaltigkeit bei der Erstellung von Algorithmen und digitalen Werkzeugen.

Folie 30

Was TEI betrifft, sollten einige Vorsichtsmassnahmen getroffen werden, die wir Ihnen abschliessend zusammengefasst haben.

Folie 31

‣Women Writers Project, RESOURCES FOR TEACHING AND LEARNING TEXT ENCODING

http://www.wwp.northeastern.edu/outreach/

‣Digital.Humanities@Oxford, Initiation à l’encodage XML-TEI

http://tei.it.ox.ac.uk/Talks/2011-02-aix/

TEI By Example project

http://teibyexample.org/TBE.htm

Folie 32

LOOK

Überblick „TEI Werkzeuge“

An dieser Stelle haben wir Ihnen in drei Blöcken verschiedene Werkzeuge zusammengestellt:

  1. Eine Reihe geläufiger Werkzeuge zur Transkription.
  1. Eine Reihe von Werkzeugen zur Kollation.
  1. Ein Vergleich von Werkzeugen zur Publikation.
Übung
  1. Laden Sie die untenstehende TEI-Datei herunter.
  1. Validieren Sie die Syntax dieser Datei, indem Sie
    1. entweder auf den Online-Validierungsservice der Website „TEI By Example“ gehen. Der Inhalt der Datei muss dann kopiert und in den weissen Bereich eingefügt werden. Danach auf „Validate!“ klicken.
    2. entweder Ihre eigene XML-Software verwenden, falls Sie eine haben (z.B.: Oxygen).
  2. Ist das Dokument wohlgeformt und gültig? Wenn nicht, versuchen Sie, die Fehler zu korrigieren.
    Um die Fehler zu korrigieren, lesen Sie die Ergebnisse der Validierung aufmerksam durch, und bearbeiten Sie die XML-Datei, indem Sie

    1. entweder Ihren eigenen XML-Editor verwenden.
    2. entweder einen Online-Editor verwenden (z.B.: tutorialspoint).
    3. entweder Veränderungen direkt im weissen Bereich vornehmen.
  3. Validieren Sie erneut die Datei, bis sie gültig geworden ist.

Achtung! Es kann sein, dass der Online-Validator zu einem Fehler führt, falls die Upload-Funktion verwendet wird. Wir empfehlen, das Kopieren/Einfügen in den weissen Bereich zu verwenden.

Lösung

Die Datei ist nicht gültig und enthält drei Fehler.

  • Der erste Fehler ist syntaktischer Natur: die Elemente sind falsch verschachtelt. Das Element „body“ enthält einen falschen End-Tag.

Zeile 20: <body /> mit <body> ersetzen

Jetzt ist das Dokument wohlgeformt (die XML-Syntax ist korrekt), erfüllt jedoch die TEI-Kriterien noch nicht.

  • Gemäss TEI darf das Element „class“ nicht leer sein.

Zeile 22: die ganze Zeile löschen <class>unknown</class>

  • Gemäss TEI darf das Element „div“ kein Attribut mit dem Namen „addition“ enthalten.

Zeile 27: das Attribut addition=“unknown“ löschen.

Jetzt ist die Datei gültig!

Lösung: XML-File_solution

TAKEAWAYS

Takeaways

In diesem Modul haben Sie gelernt, was die Text Encoding Initiative ist, nämlich eine Reihe von Empfehlungen für den Markup von Text, sowie ein flexibles Werkzeug für die Trennung von Inhalt und Funktion.

Sie haben auch gelernt, dass eine breite Palette von Werkzeugen für jeden Schritt des editorischen Prozesses existiert.

 

Bitte zitieren als
PUGIN, Laurent. Modul 7-2: TEI Perspektiven und Werkzeuge. In: MASTRANDREA, Elena, PRONGUÉ, Nicolas, SCHNEIDER, René und STETTLER, Niklaus, Kursbuch Forschungsdaten [online]. HTW Chur – HEG Genève, 2017. Verfügbar unter: http://www.researchdatamanagement.ch/modul-7-2/