Jump to ContentJump to Main Navigation
Show Summary Details
More options …

Bibliothek Forschung und Praxis

Ed. by Bonte, Achim / Degkwitz, Andreas / Horstmann, Wolfram / Kaegbein, Paul / Keller, Alice / Kellersohn, Antje / Lux, Claudia / Marwinski, Konrad / Mittler, Elmar / Rachinger, Johanna / Seadle, Michael / Vodosek, Peter / Vogt, Hannelore / Vonhof, Cornelia

3 Issues per year

Online
ISSN
1865-7648
See all formats and pricing
More options …
Volume 40, Issue 2

Issues

Technische und infrastrukturelle Lösungen für digitale Editionen: DARIAH-DE und TextGrid

Sibylle Söring
  • Corresponding author
  • Niedersächsische Staats- und Universitätsbibliothek, Abteilung Forschung und Entwicklung, Platz der Göttinger Sieben 1, D-37073 GöttingenGermany
  • Email
  • Other articles by this author:
  • De Gruyter OnlineGoogle Scholar
Published Online: 2016-07-01 | DOI: https://doi.org/10.1515/bfp-2016-0040

Zusammenfassung

Digitale Editionen bilden heute eine der Kernanwendungen der Digital Humanities. Während die Methodendiskussion der Disziplin im Rahmen des digital turn sich zunehmend stabilisiert, fehlen Modelle und Standards für ihre technische und infrastrukturelle Umsetzung. Virtuelle Forschungsumgebungen wie TextGrid und digitale Infrastrukturen wie DARIAH-DE verfolgen den Ansatz, aufeinander abgestimmte digitale Werkzeuge und Dienste anzubieten, die die Generierung geisteswissenschaftlicher Forschungsdaten nach internationalen, nachhaltigen Standards ermöglicht. Durch die Integration von TextGrid in die Infrastruktur von DARIAH-DE bietet sich Editionswissenschaftlern eine breite Angebotspalette von digitalen Werkzeugen und Editoren über die Bild-Text-Verlinkung, Raum-Zeit-Visualisierung und Annotation bis hin zur Web-Publikation und der langfristigen Archivierung in einem Repository.

Abstract

Today, digital editions are referred to as one of the core applications of Digital Humanities. While the discipline’s methodological discussion in the context of the digital turn recently has been slowing down, models and standards for their technological and infrastructural implementation are missing. Virtual research environments such as TextGrid and digital infrastructures such as DARIAH-DE aim at offering digital tools and services in a modular, intra- and interoperable way, allowing for humanistic research data in accordance to international, sustainable standards. The integration of TextGrid into the DARIAH-DE infrastructure offers a broad portfolio of digital tools, editors and services to scholarly editors and edition philologists, such as text-image linking, geo-spatial referencing and visualisation, text and image annotation, web publication and sustainable archiving in a repository.

Schlüsselwörter: Digitale Editionen; Editionswissenschaften; Digital Humanities; Virtuelle Forschungsumgebungen; Digitale Forschungsinfrastrukturen

Keywords: Digital editions; scholarly editing; Digital Humanities; virtual research environments; digital research infrastructures

Editionen gehören, welchen Anspruch sie auch immer haben, zu wissenschaftlichen Großunternehmen, sind zeit-, arbeits-, personal- und kostenintensiv.

Bodo Plachta1

Digitale Editionen bilden seit Jahrzehnten eine Kernanwendung der Digital Humanities – ihr „Brot- und Buttergeschäft“.2 Das hat verschiedene Gründe. Den Transfer der Editionsphilologie, einer heute über 100-jährigen Disziplin, ins digitale Medium haben theoretische Arbeiten begleitet, die seit vielen Jahren Bestand haben.3 Das von ihnen vorgeschlagene Fundament liefert den Standard, an dem sich auch heutige digitale Editionen und – so steht zu vermuten – auch diejenigen der nahen Zukunft messen lassen müssen. In jüngerer Zeit sind darüber hinaus, nach Arbeiten der U. S.-amerikanischen Kollegen um die Jahrtausendwende, auch im deutschsprachigen Raum Initiativen entstanden, die die Entwicklung von Kriterienkatalogen und Systeme zur Qualitätsbeurteilung digitaler Edition zum Gegenstand haben, um „Editionen im akademischen Diskurs zu verhandeln, eine best practice zu etablieren und die Methodendiskussion voranzutreiben“.4

Zu diesen spezifisch disziplinenhistorischen Rahmenbedingungen kommt der Umstand, dass im Zuge der Digitalisierung des kulturellen Erbes heute eine schier unübersehbare Fülle an Material bereitsteht, das erschlossen, ediert und verfügbar gemacht werden will. Mit der digitalen Transformation und der umfassenden Digitalisierung des Kulturellen Erbes hat die Erschließung literarischer und historischer Quellen, ihre Herausgabe und Publikation, einen fundamentalen Wandel und zugleich einen neuen Aufschwung erfahren: Nicht nur eröffnen sich mit dem digitalisierten Material bislang nicht dagewesene Dimensionen einer (weltweiten) Zugänglichkeit und Präsentation, auch die Methoden, Verfahren und Technologien zur Erschließung, Verfügbarmachung, Recherche, Analyse und Nachnutzung des Materials sehen sich durch digitale Angebote und Infrastrukturen wesentlich neuen Möglichkeiten gegenüber. Die Bestände der großen wissenschaftlichen Bibliotheken sind heute weitgehend digitalisiert, Schätze in Archiven und privaten Nachlässen warten darauf, gehoben zu werden, wenngleich schwierige oder gar ungeklärte rechtliche Rahmenbedingungen ihrer (kostenlosen) digitalen Bereitstellung im öffentlichen virtuellen Raum hier häufig Stolpersteine bilden, die schon in der Antragsphase ein Forschungsvorhaben vereiteln können.5

Und noch ein weiterer Umstand begründet den Aufschwung, den die Editionsphilologie mit dem digital turn erfahren hat. Mit der Auszeichnungssprache der Text Encoding Initiative, XML/TEI, steht ein seit rund drei Jahrzehnten bewährtes, kontinuierlich erweitertes und überarbeitetes Kodierungssystem für die maschinenlesbare Erschließung unterschiedlichster geisteswissenschaftlicher Quellen und Textsorten zur Verfügung, das, entwickelt von Fachwissenschaftlern für Fachwissenschaftler, einen verlässlichen Standard für die digitale Erschließung solcher Quellen bietet. Verfügbar ist heute darüber hinaus eine Vielzahl sowohl kommerzieller wie auch Open Source nutzbarer digitaler Tools und Dienste, die die editorische Arbeit unterstützt, erleichtert und ergänzt, darunter Kollationierungs-Software, Transkriptions- und Annotationswerkzeuge sowie Anwendungen zur Verknüpfung von Text- und Bilddaten. Best-Practice-Empfehlungen für technische Workflows,6 etablierte Modelle, Gold-Standards, Vorbilder indessen bilden nach wie vor ein Desiderat: Wie kann das Zusammenspiel solcher Angebote optimal gewährleistet werden? Wie kann z. B. die Nachnutzbarkeit von im Rahmen digitaler Editionen generierter Forschungsdaten unterstützt und gewährleistet werden? Wie können dynamische Darstellungsformen technisch umgesetzt werden? Wie können Anwender in der Verwendung interoperabler Standards unterstützt werden? Welche Lizenzierung bietet sich bei der Online-Publikation einer digitalen Edition an? Kann der Code selbst lizenziert werden und mehr noch: Wie können nicht nur die Forschungsdaten selbst, sondern – vor dem Hintergrund sich rasant weiterentwickelnder Web-Technologien – auch ihre Präsentationsschicht (Portal, Webseite, Online-Plattform) versioniert, referenziert und langfristig archiviert werden?

Die beiden vom Bundesministerium für Bildung und Forschung (BMBF) geförderten virtuellen Forschungsumgebungen bzw. -infrastrukturen TextGrid und DARIAH-DE haben zum Ziel, Geisteswissenschaftlern solche Angebote, Technologien und Dienste in aufeinander abgestimmter, modular nutzbarer und vorhabenspezifisch erweiter- und anpassbarer Form zur Verfügung zu stellen. Im Zentrum steht dabei, solche Entwicklungen anzubieten, die die Nutzung etablierter technologischer Standards ermöglichen, und die es erlauben, Forschungsdaten – Quellen, ihre Erschließung, Text- und Bilddaten – interoperabel, d. h. kompatibel zu anderen, externen Datenquellen aufzubereiten und online verfügbar zu machen: Offene Standards (Dateiformate, Schnittstellen, Protokolle) ermöglichen den Austausch und die Nachnutzung der Tools auch in anderen Zusammenhängen bzw. Umgebungen. Neben diesem Anspruch der technischen Nachhaltigkeit richtet sich der Fokus beider Forschungsverbünde auf die strukturell-organisatorische Nachhaltigkeit: Ziel ist es, digitale Werkzeuge, Dienste und die zugehörige digitale Infrastruktur auch nach Ablauf der Bundesförderung stabil, langfristig und dauerhaft zur Verfügung zu stellen, sodass nicht nur die langfristige Verfügbarkeit von z. B. im Rahmen digitaler Editionsprojekte generierter Forschungsdaten gewährleistet werden kann, sondern auch eine kontinuierliche Pflege und Anpassung bestehender Tools und Dienste an aktuelle, innovative Entwicklungen sichergestellt ist. Nicht nur für Langzeitprojekte mit Laufzeiten von bis zu 15 Jahren, die heute die Arbeit mit den jeweiligen Angeboten beginnen, ist diese Gewährleistung von zentraler Bedeutung.

TextGrid7 ist ein seit 2006 entwickeltes, aus zehn institutionellen und universitären Partnern bestehendes Verbundprojekt, das bis Juni 2015 vom BMBF gefördert wurde. Der Aufbau einer Virtuellen Forschungsumgebung für die Geistes- und Kulturwissenschaften reagierte auf eine zunehmende Nachfrage seitens der Humanwissenschaften nach digitalen Werkzeugen v. a. des philologischen Edierens und kollaborativen Arbeitens. Im Sommer 2011 stand die erste stabile Version 1.0 zum kostenfreien Download bereit, im Mai 2012 die Version 2.0. Schwerpunkt der dritten Förderphase (2012–2015) war die Etablierung eines nachhaltigen Dauerbetriebs: Software, Archiv und damit das gesamte Angebot wurden in Zusammenarbeit mit Anwendern, Fachwissenschaftlern und Fachgesellschaften und in Kooperation mit DARIAH-DE auf eine nachhaltige und langfristige Basis gestellt. Einen zusammenfassenden Überblick über Vorgeschichte, Projektphasen und Zukunftsperspektiven des Projekts bietet der Beitrag „TextGrid – Eine Geschichte“ aus dem 2015 erschienenen Sammelband „TextGrid: Von der Community — für die Community. Eine Virtuelle Forschungsumgebung für die Geisteswissenschaften“.8

Heute bietet TextGrid Editionswissenschaftlern eine vielseitige digitale Arbeitsumgebung, die den editorischen Forschungsprozess mit verschiedenen Open-Source-Werkzeugen und Diensten in einem geschützten virtuellen Raum – dem TextGrid Laboratory9 – unterstützt (vgl. Abb. 2). Dazu zählt neben dem XML-Editor etwa ein Text-Bild-Link-Editor, der z. B. die Verknüpfung von Faksimiles – auch ausschnitts- und zonenweise – via XML mit Textdaten wie etwa einer Transkription ermöglicht (vgl. Abb. 1), sowie ein Metadaten-Editor zur komfortablen Erfassung und Generierung von Metadaten nach internationalen Standards. Mit SADE – Scalable Architecture for Digital Editions,10 einem zunächst von der Berlin-Brandenburgischen Akademie der Wissenschaften entwickelten und seit 2012 von verschiedenen Institutionen, darunter TextGrid, erweiterten Publikationsframework für XML/TEI-Daten, bietet TextGrid heute zudem eine Instanz, die es TextGrid-Nutzern ermöglicht, ihre Daten in einem eigenen Web-Portal zu veröffentlichen. TextGrid bietet hier die kostenfreie Nutzung eines Templates ebenso wie die Möglichkeit, die betreffende Webseite selbst zu gestalten.11

Ein avanciertes Rollen- und Rechtemanagement erleichtert außerdem die kollaborative Erschließung von Quellen an verteilten Orten nach individuellen Parametern sowie unabhängig von spezifischen Betriebssystemen: Die Open-Source-Software ist für Windows, Mac OS X und Linux verfügbar. Weitere, für den Gebrauch mit TextGrid optimierte Open-Source-Tools und -Services können über den ins TextGridLab eingebundenen MarketPlace integriert werden.

Der Text-Bild-Link-Editor in TextGrid
Abb. 1:

Der Text-Bild-Link-Editor in TextGrid

Mit seinen beiden Hauptkomponenten TextGrid Laboratory und TextGrid Repository unterstützt TextGrid den gesamten wissenschaftlichen Arbeitsprozess im Rahmen der Erstellung digitaler Editionen: Das digitale Ausgangsmaterial – in der Regel Text- und/oder Bilddateien/Faksimiles – wird zunächst in die (geschützte) Virtuelle Forschungsumgebung (TextGrid Laboratory) geladen, dort mit maschinenlesbaren Strukturdaten angereichert (XML/TEI) und texttechnologisch erschlossen. Dazu gehören z. B. Kommentare, Annotationen, Apparate, Register sowie die Verknüpfung von Text- und Bilddaten. Anschließend stehen für die Forschungsdaten drei Publikationswege bereit: die Veröffentlichung im Rahmen einer digitalen Edition (Internet-Portal), die nachhaltige Archivierung der Forschungsdaten und ihrer verschiedenen Ausgabeformate im digitalen Langzeitarchiv TextGrid Repository und schließlich, nach Erzeugung von Druckdaten aus den entsprechenden XML/TEI-Anreicherungen im TextGrid Laboratory, die Publikation in Buchform (print).

Das TextGrid Repository,12 ein Langzeitarchiv für geisteswissenschaftliche Forschungsdaten, bietet die Möglichkeit, vielfältige digitale Materialien – u. a. XML/TEI-kodierte Texte, Bilder und Datenbanken – sicher zu speichern, zu publizieren, facettiert zu durchsuchen und mit anderen Portalen und Archiven zu verbinden. Zum stetig wachsenden Bestand zählen mit der Digitalen Bibliothek von TextGrid12a heute z. B. Werke von rund 600 Autoren deutschsprachiger Belletristik (Prosa, Lyrik, Dramen) und Sachliteratur von den Anfängen des Buchdrucks bis zum frühen 20. Jahrhundert, die in verschiedenen Ausgabeformaten (z. B. XML, ePub, PDF) gespeichert, publiziert und durchsucht werden können. Mit verschiedenen Werkzeugen, wie etwa zur Bildbetrachtung und -verwaltung (so u. a. Digilib oder die den internationalen IIIF-Standard13 unterstützenden Anwendungen Mirador sowie Shared Canvas) oder zur quantitativen Textanalyse (DigiVoy14), können die Texte weiter erforscht, angereichert und visualisiert werden.

Das TextGrid Repository ermöglicht neben dem Import von Daten aus dem TextGrid Laboratory auch den direkten Upload,15 der – v. a. bei umfangreichen Datensammlungen – über die Workflow-Bibliothek koLibRI (kopal Library for Retrieval and Ingest16) erleichtert wird. Die automatisierte Zuweisung von persistenten Identifiern (PIDs) für jedes im TextGrid Repository veröffentlichte digitale Objekt gewährleistet seine langfristige, eindeutige und zitierfähige Referenzierung gemäß den Empfehlungen zur Sicherung guter wissenschaftlichen Praxis der Deutschen Forschungsgemeinschaft (DFG).17

Vom analogen oder digitalen Ausgangsmaterial zu zitierfähigen Forschungsdaten einer digitalen Edition: Workflow und Anwendungen in der Virtuellen Forschungsumgebung TextGrid
Abb. 2:

Vom analogen oder digitalen Ausgangsmaterial zu zitierfähigen Forschungsdaten einer digitalen Edition: Workflow und Anwendungen in der Virtuellen Forschungsumgebung TextGrid

Die gemeinsame Ausrichtung beider Projekte, digitales Arbeiten in den Geistes- und Kulturwissenschaften zu unterstützen, bietet die Grundlage für zahlreiche Synergieeffekte, die – auf technologischer ebenso wie auf informations- bzw. fachwissenschaftlicher Basis – seit mehreren Jahren erfolgreich umgesetzt werden. Ziel ist dabei, Geistes- und Kulturwissenschaftlern ein umfassendes, dauerhaftes und aufeinander abgestimmtes Angebot liefern zu können, das den Digital Humanities eine fächerübergreifende Perspektive für die Generierung, Bearbeitung und nachhaltige Bereitstellung von Forschungsdaten bietet.

Die zum Ende der Förderung durch das BMBF erfolgte Migration zahlreicher technologischer Kernkomponenten von TextGrid wie etwa der Nutzerverwaltung und Repository-Technologien in die ebenfalls vom BMBF geförderte digitale Forschungsinfrastruktur DARIAH-DE gewährleistet die dauerhafte und langfristige Nutzung der Angebote von TextGrid auf neuestem technologischen Stand. So basiert z. B. die technische Infrastruktur des DARIAH-DE-Repositoriums weitestgehend auf der des TextGrid Repository, so dass eine gemeinsame Codebasis entstand, deren modularer Charakter weiter entwickelt und ausgebaut wurde.18

Die TextGrid Community ist in den letzten Jahren beständig gewachsen. Neben individuellen Schulungen werden, seit 2015 auch in Zusammenarbeit mit DARIAH-DE, regelmäßige Nutzertreffen und Workshops angeboten, die neben Einführungen in die Arbeit mit dem TextGridLab und themen- bzw. anwendungsspezifischen Workshops nicht zuletzt auch den Austausch zwischen digitalen Forschungsvorhaben aus den Geisteswissenschaften befördern.

Neben Einzelforschern und Nachwuchsprojekten nutzen heute zahlreiche, auch langfristige Editionsvorhaben TextGrid für ihre Arbeit, so etwa die Genetisch-kritische Hybrid-Edition von Theodor Fontanes Notizbüchern19 (Universität Göttingen), die Bibliothek der Neologie20 (Universität Münster) oder das auf 15 Jahre angelegte Akademienprojekt Textdatenbank und Wörterbuch des Klassischen Maya21 (Universität Bonn).22

Durch die Kooperation der beiden Forschungsverbünde TextGrid und DARIAH-DE können Editionswissenschaftler heute mit nur einem Login von beiden Angebotspaletten profitieren. Dabei bieten sich verschiedene, modulare Nutzungsszenarien an, die von der Anwendung spezifischer Editoren im TextGrid Lab über die Nutzung technisch-infrastruktureller Angebote von DARIAH-DE (Hosting Services, Bereitstellung Virtueller Maschinen sowie von Speicherplatz, Authentifizierungs- und Autorisierungsinfrastruktur (AAI)) bis hin zur Publikation von Forschungsdaten im Repository und/oder über ein eigenes Portal mithilfe von SADE reichen. Zahlreiche TextGrid-Editionsprojekte nutzen zudem den DARIAH-DE Geo-Browser23 für die Analyse und Visualisierung von Raum-Zeit-Relationen im Rahmen ihrer Quellen und/oder Sammlungen. Insbesondere im Rahmen von Brief-Editionen bzw. Korrespondenzen bieten sich hier vielfältige Möglichkeiten zur Darstellung solcher Bezüge. Hinzu kommen DARIAH-DE-spezifische Angebote wie die kostenfreie Nutzung eines kommerziellen Content-Management-Systems (Wiki) sowie kollaborativer Text-Editoren wie Etherpad, die die gemeinsame, verteilte Arbeit, die Koordination und Dokumentation im Rahmen von Forschungsverbünden erleichtern.

Last, not least bildet die Forschung zu und Weiterentwicklung von DH-Methoden und -verfahren, ein Kernaspekt von DARIAH-DE,24 Editionswissenschaftlern, die mit TextGrid arbeiten, einen weiteren, wesentlichen Punkt, von den Arbeiten des Verbunds unmittelbar zu profitieren. In diesem Rahmen werden digitale Forschungsmethoden und -verfahren dokumentiert, Anforderungen analysiert, externe Tools bereitgestellt und z. T. auch weiterentwickelt. So wird derzeit an einer Adaption und Implementierung des Annotationswerkzeugs annotator.js25 gearbeitet, die dann auch im Rahmen von TextGrid zur Verfügung stehen wird. Das jüngst in Zusammenarbeit mit dem Deutschen Institut für Archäologie entstandene Portal Forschungslizenzen26 informiert anhand aktueller geisteswissenschaftlicher Forschungsprojekte über Rechte und Lizenzen bei der Freigabe von Forschungsdaten. Die Relevanz beider Forschungsfelder für die Erstellung ebenso wie für die Publikation digitaler Editionen liegt auf der Hand. Die genannten Community-Angebote (Workshops, Schulungen, Webseite) bilden das Forum, solche Forschung für eigene Vorhaben zu nutzen, aber auch, sie aktiv mitzugestalten und vom Austausch mit anderen Anwendern zu profitieren.

Literaturverzeichnis

Footnotes

About the article

Published Online: 2016-07-01

Published in Print: 2016-07-01


Citation Information: Bibliothek Forschung und Praxis, Volume 40, Issue 2, Pages 207–212, ISSN (Online) 1865-7648, ISSN (Print) 0341-4183, DOI: https://doi.org/10.1515/bfp-2016-0040.

Export Citation

© 2016 Walter de Gruyter GmbH, Berlin/Boston.Get Permission

Comments (0)

Please log in or register to comment.
Log in