Jump to ContentJump to Main Navigation
Show Summary Details
More options …

Bibliotheksdienst

Editor-in-Chief: Michalke, Karin / Ihrig, Hartmuth

Online
ISSN
2194-9646
See all formats and pricing
More options …
Volume 52, Issue 7

Issues

Ein Metadatenmodell für gemischte Sammlungen

Susanne Al-Eryani
  • Niedersächsische Staats- und Universitätsbibliothek Göttingen Papendiek14 (Historisches Gebäude, Raum 0.202) 37073 GöttingenDeutschland
  • Email
  • Other articles by this author:
  • De Gruyter OnlineGoogle Scholar
/ Gudrun Bucher
  • Niedersächsische Staats- und Universitätsbibliothek Göttingen Papendiek14 (Historisches Gebäude, Raum 0.202) 37073 GöttingenDeutschland
  • Email
  • Other articles by this author:
  • De Gruyter OnlineGoogle Scholar
/ Stefanie Rühle
  • Niedersächsische Staats- und Universitätsbibliothek Göttingen Papendiek14 (Historisches Gebäude, Raum 0.202) 37073 GöttingenDeutschland
  • Email
  • Other articles by this author:
  • De Gruyter OnlineGoogle Scholar
Published Online: 2018-06-12 | DOI: https://doi.org/10.1515/bd-2018-0066

Zusammenfassung

Im Rahmen des DFG-geförderten Projekts „Entwicklung von interoperablen Standards für die Kontextualisierung heterogener Objekte am Beispiel der Provenienz Asch“ wurde ein Semantic Web und Linked Open Data fähiges Metadatenmodell entwickelt, das es ermöglicht, institutionsübergreifend Kulturerbe und dessen Provenienz zu kontextualisieren.

Abstract

In the course of the DFG-promoted project “Development of interoperable standards for the contextualization of heterogeneous objects, taking the example of the Asch provenance”, a metadata model has been developed that is compatible with Semantic Web and Linked Open Data and makes it possible to contextualize cultural heritage and its provenance across institutions.

Schlüsselwörter: Metadatenmodell; Metadatenstandard; digitales Kulturerbe; Provenienzinformationen

Keywords: metadata model; metadata standard; digital cultural heritage; provenance information

1 Einleitung

Die Ausbreitung des Web 3.0 bzw. Semantic Web stellt neue Herausforderungen an die Maschinenlesbarkeit von Daten und damit an die Aufbereitung von Metadaten. Im Semantic Web soll die Mehrdeutigkeit von Begriffen maschinenlesbar erschlossen werden. Menschen sind, im Gegensatz zu Maschinen, in der Lage, aus dem Kontext zu erschließen, ob z. B. mit ‚Venus‘ der Planet, die römische Göttin oder der Name eines Kinos oder Friseursalons gemeint ist. Im Semantic Web wird der verwendete Begriff um die entsprechende Information in maschinenlesbarer Form ergänzt, was zur deutlichen Verbesserung von Suchergebnissen führt. Metadaten von digitalisierten Objekten für das Semantic Web nutzbar zu machen, gehört zu den aktuellen Herausforderungen, denen sich das von der Deutschen Forschungsgemeinschaft geförderte Projekt „Entwicklung von interoperablen Standards für die Kontextualisierung heterogener Objekte am Beispiel der Provenienz Asch“ (kurz: ASCH) stellte. Es wurde von der Niedersächsischen Staats- und Universitätsbibliothek Göttingen in Zusammenarbeit mit dem Institut für Ethnologie der Universität Göttingen im Zeitraum vom 01.09.2014 bis 28.02.2018 durchgeführt und hatte die Entwicklung eines Metadatenmodells für die Kontextualisierung von digitalisierten Objekten unterschiedlichster Art sowie die Validierung dieses Modells am Beispiel von Objekten der Sammlung des Barons von Asch zum Ziel. Das Modell sollte die Möglichkeit zur einheitlichen strukturierten Beschreibung von Provenienzinformationen und zur Veröffentlichung der Daten als Linked Open Data bieten, da beides sich als Desiderat bei bisher verwendeten Modellen herauskristallisiert hatte.

Zum Erschließen von Sammlungen gehört neben der Beschreibung der Objekte auch die Recherche über deren Ursprung sowie über den Sammler und das Zustandekommen der Sammlung. Die Provenienzforschung zur Aufklärung illegitimer oder moralisch unrechtmäßiger Aneignungen ist hier nur ein Sonderfall. Da Objekte nur zu uns sprechen, wenn sie in einen Kontext gestellt werden, sind Forschungen zur Biographie der Objekte, d. h. über die unterschiedlichen Kontexte, in denen sie uns im Laufe der Zeit begegnen, notwendig. Provenienzforschung dient dazu, dem Objekt Informationen unterschiedlichster Art zu entlocken und es in bestimmte Zusammenhänge einzuordnen. Darüber hinaus kann Provenienzforschung Hinweise auf Echtheit des Objekts und Korrektheit der vorgenommenen Zuschreibungen geben. Die Zugehörigkeit zu einer namhaften Sammlung kann für Authentizität und Qualität bürgen (muss es aber nicht). Um Objekte sinnvoll in Ausstellungen präsentieren zu können, sind Informationen zu ihrer Herkunft nötig, nicht zuletzt, weil Sammeln das Herauslösen eines Objektes aus seinem ursprünglichen kulturellen Kontext bedeutet. Das Objekt verliert durch diesen Prozess seinen eigentlichen Sinn. Indem man es in eine Gruppe von als zusammengehörig betrachteten Objekten einfügt, wird ihm neuer, meist veränderter Sinngehalt zugeschrieben1. Durch den Eintritt in die Meta-Welt eines Museums erhält jedes Objekt eine neue Existenz, verbunden mit dem Herauslösen aus ursprünglichen Gebrauchszyklen, Aufenthaltsorten oder der Entfernung aus dem Warentausch. Es wird dadurch potenziell unbegrenzt vieldeutig, weil es eine Fülle von Assoziationen, Vorstellungen und Empfindungen auslöst2. Dieses allgemeine Verständnis von Provenienzforschung als Basis jedweder Interpretation von Objekten wurde bei der Erarbeitung des nun vorliegenden Metadatenmodells zugrunde gelegt. Eine weitere Herausforderung für das Projekt war die Überwindung des an Institutionen gebundenen Ansatzes bei der Beschreibung der Provenienz mit Metadaten. Es sollte ein möglichst generisches Modell entwickelt werden, in dem gleichermaßen Objekte aus den Beständen von Archiven, Bibliotheken und Museen erfasst werden können. Bislang verwendet jede der klassischen Kulturerbe-Institutionen domain-spezifische Metadatenstandards. So nutzen Bibliotheken MARC 21 und MODS (Metadata Object Description Schema), Archive arbeiten mit EAD (Encoded Archival Description) und EAC-CPF (Encoded Archival Context for Corporate Bodies, Persons, and Families), und in den Museen wird LIDO (Lightweight Information Describing Objects) verwendet. Für die Beschreibung von Provenienzinformationen kommen zudem verschiedene Modelle zur Anwendung, die unterschiedliche Aspekte aus der Biographie eines Objekts in den Vordergrund stellen. So spielt in der Bibliothekswelt vor allem die strukturierte Beschreibung von Provenienzmerkmalen und die Verknüpfung derselben mit der Beschreibung der Exemplare eine wichtige Rolle,3 während die Museumswelt Provenienz in Form von aufeinander folgenden Ereignissen, die ein Objekt durchlebt, beschreibt.4 Diese zwei unterschiedlichen Ansätze wurden im ASCH Modell zusammengeführt. Gleichzeitig wurden verschiedene, weitläufig verwendete Metadatenstandards gemischt, um es interdisziplinär nachnutzbar zu machen. Zwar erlauben das von der DDB entwickelte Wer-Was-Wo-Wann Modell und das Eropeana Data Model (EDM) sowohl die objekt- als auch die ereignisorientierte Beschreibung von Ressourcen. Die Erschließung von Provenienzinformationen ist jedoch nur oberflächlich möglich, und die eindeutige Verknüpfung von Aussagen zur Provenienz mit Evidenzen ist bisher nicht vorgesehen. Diese Lücke soll das ASCH Modell schließen.

2 Die Sammlung

Für den Test des Datenmodells wurden jene heute auf sieben verschiedene Institute aufgeteilten Sammlungsbestände ausgewählt, die in den Jahren 1771 bis 1806 durch Baron Georg Thomas von Asch (1729-1807) der Göttinger Universität aus St. Petersburg übersandt wurden. Die sogenannte „Asch-Sammlung“ beinhaltet Bücher, Manuskripte, Landkarten, Stadtansichten, Münzen, Medaillen, Gemälde, Kupferstiche, Gesteine, Meteoriten, Mineralien und Fossilien, ausgestopfte Tiere, Pflanzensamen, menschliche Schädel sowie Ethnographika aus dem Russischen Reich und angrenzenden Gebieten und erfüllt damit in hervorragender Weise die Anforderung der Heterogenität. Nach ihrer Ankunft in Göttingen wurden die einzelnen Objekte entweder dem „Academischen Museum“ der Universität übergeben oder in den Bestand der Bibliothek aufgenommen. Heute ist die Sammlung auf verschiedene Institutionen innerhalb Göttingens aufgeteilt. So verfügen die Universitätsbibliothek, das Universitätsarchiv, das Archäologische Institut, das Kunstgeschichtliche Seminar, das Institut für Ethnologie, das Zentrum für Anatomie (Blumenbach’sche Schädelsammlung), das Geowissenschaftliche Zentrum sowie das Institut für Zoologie über einzelne Objekte daraus.

Georg Thomas von Asch wurde am 12. April 1729 in St. Petersburg geboren. Sein Vater, Friedrich Georg von Asch, stammte aus Schlesien, war 1707 von Peter I. nach Russland berufen worden und schaffte dort binnen kurzer Zeit den Aufstieg zum Postdirektor. Da die Familie recht vermögend war, wurde Georg Thomas hauptsächlich von Hauslehrern erzogen und konnte ein Medizinstudium in Deutschland aufnehmen. Drei Jahre studierte er in Tübingen (1744-1747), wechselte aber zur Promotion nach Göttingen und wurde Schüler des bedeutenden Mediziners Albrecht von Haller (1708-1777), zu dem er auch nach seinem Weggang aus Göttingen freundschaftliche Beziehungen aufrechterhielt. Seine Göttinger Zeit scheint von Asch tief geprägt zu haben. Nach abgeschlossener Promotion kehrte er nach St. Petersburg zurück und übernahm hohe und höchste Staatsämter. 1752 wurde er Stadtphysikus in St. Petersburg, 1763 berief Zarin Katharina II. ihn in die oberste medizinische Verwaltungsbehörde, im ersten Russisch-Türkischen Krieg (1768-1774) wurde er zum Generalstabsarzt befördert, und 1777 erfolgte die Ernennung zum Staatsrat. Im gleichen Jahr wurde er als Auswärtiges Mitglied in die Göttinger Akademie der Wissenschaften aufgenommen, und 1779 nahm die Kaiserliche Akademie der Wissenschaften in St. Petersburg ihn als Ehrenmitglied auf.

Ende Oktober des Jahres 1771 wandte von Asch sich erstmals mit einem zu diesem Zeitpunkt noch sehr formell gehaltenen und in französischer Sprache abgefassten Brief an Christian Gottlob Heyne (1729-1812). Heyne war 1763 als Professor der Poesie und Beredsamkeit an die Universität Göttingen berufen worden und wurde am 4. Januar 1764 zusätzlich zum Leiter der Göttinger Universitätsbibliothek ernannt. In seiner Dienstzeit gelang es ihm, den Bestand der Bibliothek von etwa 50.000 Bänden auf 160.000 Bände zu erweitern und zur größten öffentlichen Bibliothek Deutschlands auszubauen5.

Erfolgte der Briefwechsel zwischen von Asch und Heyne bis 1777 nur sporadisch, so intensivierte er sich ab 1778 deutlich und wurde zunehmend persönlicher. Nach seiner Aufnahme in die Gesellschaft der Wissenschaften zu Göttingen (1777) schrieb von Asch regelmäßiger nach Göttingen. Hatte er seine Briefe bis dahin in offiziellem Duktus auf Französisch geschrieben, wechselte er nun zur deutschen Sprache und einem freundschaftlicheren Ton. Von Asch begann nun regelmäßig nicht nur Bücher und Manuskripte, sondern auch Objekte aus all den oben genannten Objektgruppen nach Göttingen zu schicken. Da er selbst nur wenig reiste, stützte er sich bei der Zusammenstellung der Sammlung auf ein weit verzweigtes Netz von Bekannten und Korrespondenten, die ihm Objekte aus dem gesamten Russischen Reich zukommen ließen.

Bei aller Unterschiedlichkeit was Beschaffenheit und Ursprung der einzelnen Objekte anbelangt, haben sie gemeinsam, dass sie durch Baron Georg Thomas von Asch zusammengetragen und nach Göttingen gesandt wurden (Provenienz Asch). Wie bereits erwähnt, wurde die Sammlung im späten 19. Jahrhundert und im Verlauf des 20. Jahrhunderts gemäß dem damaligen Wissenschaftsverständnis einzelnen Fachdisziplinen zugeordnet und auf unterschiedlichste Institutionen verteilt. In den jeweiligen wissenschaftlichen Disziplinen werden den Objekten heute sehr unterschiedliche Bedeutungen zugesprochen. Manchen kommt großer wissenschaftsgeschichtlicher Wert zu, andere, insbesondere die in der Ethnologischen Sammlung, sind für die Erforschung von Kulturwandel relevant, wieder andere finden nur wenig Beachtung.

3 Die Evidenzen

Wie bereits erwähnt soll das Modell ermöglichen, Provenienzinformationen durch die Verknüpfung mit Evidenzen abzusichern. Im Hinblick auf die Asch-Sammlung handelt es sich dabei um die in Göttingen erhalten gebliebenen Briefe, die Georg Thomas von Asch an den Bibliotheksdirektor Christian Gottlob Heyne (1729-1812) geschrieben hatte, Briefe anderer Absender die Sendungen von Aschs betreffend, von Asch angefertigte Verzeichnisse seiner Sendungen, Notizen zu einzelnen Objekten sowie Objekt-Etiketten, die teilweise von Asch selbst geschrieben und mitgeschickt wurden, teilweise aber auch erst in Göttingen angefertigt wurden.

In den 126 erhalten gebliebenen Briefen von Aschs und den 148 Verzeichnissen, die er entweder den Paketen nach Göttingen oder teilweise auch den Briefen beigelegt hatte, werden die verschickten Objekte erwähnt und zum Teil detailliert beschrieben. Zusammen mit Notizen, Beilagen, Etiketten und Inventarbüchern lässt sich für viele Objekte nachvollziehen, zu welcher Zeit und über welchen Weg sie von St. Petersburg nach Göttingen gelangten. Um die Struktur dieser Textdokumente zu beschreiben, wurde auf der Grundlage von TEI Simple ein ASCH TEI-Schema6 entwickelt und die Verwendung der TEI-Elemente für den gegebenen Kontext dokumentiert. Die handschriftlichen Dokumente aus dem Nachlass des Barons von Asch wurden transkribiert und die Texte unter Verwendung des Schemas ausgezeichnet. Gleichzeitig wurden die Texte hinsichtlich der auszuzeichnenden Entitäten analysiert und entschieden, welche davon mit Informationen hinterlegt werden sollten. Durch entsprechende Kodierung der ausgewählten Entitäten (Personen, Körperschaften, Ortsangaben, Objekte) wurde eine Verlinkung zu externen Ressourcen hergestellt (z. B. aus der Gemeinsamen Normdatei, Geonames und der Sammlungsdatenbank der Universität Göttingen7), die weiterführende Informationen liefern. Kernstück des TEI-Modells ist die Verlinkung zwischen der im TEI beschriebenen Evidenz und den in der Evidenz erwähnten Objekten.

Folgendes Beispiel veranschaulicht die Erarbeitung der Bausteine für diesen Arbeitsschritt: Das Schamanengewand der Ewenken, beherbergt in der Ethnologischen Sammlung der Universität Göttingen, ist ein in der Öffentlichkeit oft zitiertes Objekt. Seine digitale Reproduktion ist im Sammlungsportal der Universität Göttingen verzeichnet (Abb. 1)8. Erwähnung findet das Schamanengewand u. a. in einem Brief des Barons von Asch an Heyne vom 20./31.07.1788 (Abb. 2)9. Der Text dieses Dokuments wurde transkribiert, und im TEI-Format wurde das Objekt mittels einer verknüpften XML-Registerdatei mit dem hierfür in der Sammlungsdatenbank hinterlegten eindeutigen Identifikator codiert. Durch die Verknüpfung mit dieser externen Ressource sind weitere Informationen zum Objekt abrufbar.

Die Einbeziehung externer Ressourcen ermöglicht also eine Anreicherung der Provenienzinformationen und stellt die Entitäten in einem breiteren Kontext dar. Durch das Einbinden von Listen in das TEI-Dokument konnte eine Struktur für eine anreicherbare Dokumentation geschaffen werden.

Schamanengewand der Ewenken. Georg-August-Universität Göttingen/Ethnologische Sammlung; Harry Haase (Fotograf), 2009.
Abb. 1:

Schamanengewand der Ewenken. Georg-August-Universität Göttingen/Ethnologische Sammlung; Harry Haase (Fotograf), 2009.

Brief des Barons von Asch an Heyne.
Abb. 2:

Brief des Barons von Asch an Heyne.

Eintrag in der Registerdatei.
Abb. 3:

Eintrag in der Registerdatei.

4 Vorgehensweise im Projekt

4. 1 Empirische Erhebung, Datenanalyse, Datenevaluation

Im Rahmen von Interviews mit Experten aus Geistes- und Naturwissenschaften sowie eines internationalen Workshops mit dem Titel „Scientific Questions about Provenance and their Requirements for Future Web and Database“ wurde ermittelt, welche Anforderungen unterschiedliche Wissensdisziplinen an digitalisierte Objekte stellen und welche Rolle diese in der Forschung spielen. Bei der Einladung von Spezialisten für den Workshop wurde darauf geachtet, dass sie dem institutsübergreifenden Ansatz entsprechend aus verschiedenen Einrichtungen (Bibliotheken, Archive, Museen) kamen und unterschiedliche Disziplinen repräsentierten (Anatomie, Humanbiologie, Archäologie, Bibliothekswissenschaft, Botanik, Ethnologie, Geologie/Mineralogie, Informatik, Kunstgeschichte, Musikwissenschaft, Zoologie). In Form eines World Cafés (Diskussionen in Kleingruppen mit wechselnder Zusammensetzung) befassten sich die 34 Teilnehmer des Workshops mit den Aspekten Herkunft/Entstehung, Zuschreibung, Besitzgang und Evidenz und diskutierten jeweils zu den Themen Forschungsfragen, Erfahrungen, Anforderungen und Visionen.

Ergänzend zum Workshop wurden Einzelinterviews mit Spezialisten geführt, die nicht am Workshop teilgenommen hatten. Während dieser Interviews und der Analyse der Datenbestände der sieben Göttinger Sammlungen, die Objekte aus der „Asch-Sammlung“ besitzen, zeigte sich, dass sehr unterschiedliche Datenmodelle in den einzelnen Institutionen verwendet werden, und dass die meisten Einrichtungen noch am Beginn der strukturierten Beschreibung ihrer Objekte in Datenbanken stehen. Häufig wurde auf das Fehlen von brauchbaren kontrollierten Vokabularen sowie auf fehlende Felder in den Datenbanken für spezielle Belange hingewiesen. In den meisten Fällen werden für die Beschreibung von Objekten spezielle Termini und Kategorien benötigt. Diese Lücken werden i. d. R. durch individuelle Entwicklungen geschlossen, was allerdings die mangelnde Interoperabilität der Daten zur Folge hat. Außerdem erwies sich die Bedeutung, die Fragen der Provenienz zugemessen wird, in den einzelnen Wissenschaften als sehr unterschiedlich und es zeigte sich, dass die Forschung nicht nur unterschiedlichste strukturierte Aussagen über die Provenienz von Objekten benötigt, sondern auch strukturierte, maschinenlesbare und nachvollziehbare Aussagen über die Herkunft der Provenienzinformationen.

4.2 Formulierung von Anwendungsfällen (use cases)

Die Ergebnisse aus den Interviews und dem Workshop verdeutlichten die Heterogenität von Entitäten und Beziehungen, die für die Beschreibung der Ressourcen in den verschiedenen Disziplinen benötigt werden. Es wurde deutlich, dass jede Wissenschaft ihr spezifisches Metadatenschema für die Beschreibung der Objekte benötigt. Das gesammelte Material wurde anonymisiert, geclustert und generalisiert. Daraus wurden zunächst 31 case studies zusammengestellt. Dabei handelt es sich um kurze, aus Datenschutzgründen fiktive Geschichten, die die Verwendung von Metadaten in verschiedenen Kontexten beschreiben. Diese case studies wurden in kleinere Einheiten aufgeteilt, die eine spezifische Nutzung von Metadaten beschreiben, sogenannte scenarios. Es erfolgte eine Konzentration auf solche scenarios, die für viele der Disziplinen relevant waren, wie z. B. „ein Nutzer benötigt Informationen über alle Ereignisse in der Biographie eines Objekts während einer bestimmten Zeitspanne“ . Jeder case study lassen sich ein oder mehrere scenarios zuordnen, die genau die Aktionen und Ziele eines Nutzers beschreiben. Aus diesen scenarios wurden schließlich die Anforderungen an das Modell extrahiert und als use cases formuliert:

  • UC 1 Information über Ressourcen

  • UC 2 Identifikation von Ressourcen

  • UC 3 Information über die Lebensgeschichte von Ressourcen

  • UC 4 Information über Wandel in Gebrauch und Rezeption von Ressourcen

  • UC 5 Untermauerung der Informationen durch Evidenzen

  • UC 6 Zuverlässigkeit von Aussagen

  • UC 7 Zugang zu Ressourcen

  • UC 8 Wiederverwendbarkeit der Daten.

4.3 Analyse der Anforderungen (requirements)

Die genaue Betrachtung der use cases, die ein oder mehrere scenarios umfassen, ermöglichte ein abstrakteres Verständnis der Interaktionen zwischen Akteur und dem System zu entwickeln. Die Grundstruktur eines scenarios besteht aus einem Akteur und einem oder mehreren Zielen, die dieser verfolgt. Um dieses Ziel zu erreichen, müssen eine oder mehrere bestimmte Anforderungen erfüllt sein. Diese wurden in folgende Gruppen unterteilt:

  • Anforderungen, die den Nutzer betreffen,

  • Anforderungen an die Metadaten,

  • Anforderungen an das System.

Insgesamt wurden über 80 Anforderungen (requirements) identifiziert. Dies sei an einem Beispiel verdeutlicht. Ein scenario könnte beinhalten, dass ein Nutzer Informationen über eine Person oder Körperschaft benötigt. Das Ziel wäre dann, Informationen über eine Person oder Körperschaft (wann, wo, was) zu finden. Die sich daraus ergebenden Anforderungen an das Modell lauten:

  • Beschreibungen einer Person/Körperschaft müssen maschinenlesbar sein.

  • Personen/Körperschaften müssen mit eindeutigen, maschinenlesbaren und persistenten Identifikatoren bezeichnet sein.

  • Personen/Körperschaften müssen mit Namen und biografischer Information identifizierbar sein.

Die Analyse der Anforderungen bildete schließlich die Grundlage für die Entwicklung des Datenmodells.

4.4 Identifizierung von Entitäten und deren Beziehungen und Eigenschaften

Neben den Anforderungen, die sich aus der Analyse der Erhebungen ergaben, wurden zudem die Objekte aus den verschiedenen Sammlungen analysiert und klassifiziert. Dabei wurde entsprechend den Anforderungen von Linked Data jedes Objekt als Entität behandelt, die durch einen URI10 eindeutig identifiziert werden muss. Unter Berücksichtigung der Anforderungen der unterschiedlichen Wissensbereiche bei der Beschreibung ihrer Objekte wurden Klassen definiert, die diese Unterschiede widerspiegeln. So erhielt die Klasse Item („a real world thing“), die die Oberklasse für alle Objekte ist, die Unterklassen Artifact (etwas von Menschen Geschaffenes) und Natural Item (etwas, das in der Natur vorkommt und nicht vom Menschen geschaffen ist). Für Artifact konnten dann weitere Unterklassen eingeführt werden, wie z. B. Text, Kunstwerk oder Münze. Entsprechend wurde Natural Item mit weiteren Unterklassen versehen, wie Organismus oder anorganisches Objekt. Die Unterklassen sind nach den jeweiligen Bedürfnissen der einzelnen Wissensgebiete erweiterbar.

Für die Beschreibung der Provenienz sind aber nicht nur die Objekte von Bedeutung, sondern auch andere Entitäten wie Ereignisse, die im Dasein des Objekts eine Rolle spielten, Personen und Organisationen, die an den Ereignissen beteiligt waren, sowie Ort und Zeit an/zu denen das Ereignis stattfand. Auch für diese Entitäten wurden Klassen definiert: Event (etwas, das geschehen ist und Einfluss auf die Biographie der Ressource genommen hat), Agent (eine Person, Organisation oder Gruppe, die agiert oder agieren könnte), Place (ein geographischer Ort), Time (ein bestimmter Zeitpunkt).

Auf der Grundlage der unter 3. erhobenen Anforderungen wurden im nächsten Schritt die Eigenschaften selektiert, die die Erfüllung dieser Anforderungen unterstützen, und die Beziehungen, die zwischen den verschiedenen Entitäten existieren. Aus diesen Informationen ergab sich ein Datenmodell, dass für die Beschreibung der Provenienz domainübergreifend eine einheitliche Struktur vorsieht. Diese Struktur orientiert sich an der Aneinanderreihung von Ereignissen im Leben eines Objekts und kann für alle Arten von Objekten verwendet werden. Für die Objekte selbst sieht das Modell unterschiedliche Beschreibungsstrukturen vor, abhängig davon, welcher Klasse die Objekte zuzuordnen sind. So können einem Objekt nicht nur mehrere Ereignisse zugeordnet werden, sondern man kann die Objektbeschreibungen zu unterschiedlichsten Objekten unter ein- und demselben Ereignis zusammenführen. Nehmen wir zum Beispiel eine Münze und einen ausgestopften Vogel, die beide in einem bestimmten Paket von Baron von Asch nach Göttingen verschickt wurden. Voraussetzung ist, dass sowohl die Objekte als auch die Ereignisse über einen URI eindeutig identifiziert werden.

Modell für die Kontextualisierung von numismatischen Objekten und Organismen durch gemeinsame Events.
Abb. 4:

Modell für die Kontextualisierung von numismatischen Objekten und Organismen durch gemeinsame Events.

Die Verbindung zwischen den Informationen über das Ereignis und den Evidenzen zu diesem Ereignis (z. B. Briefe, Tagebücher, Provenienzmerkmale) erfolgt ebenfalls durch eine einfache Verlinkung, die in diesem Fall voraussetzt, dass sowohl das Ereignis als auch die Evidenz durch URIs eindeutig identifizierbar sind. Nehmen wir zum Beispiel einen Brief, der die Information enthält, wann das Paket verschickt wurde und an wen es adressiert ist.

Modell für die  Kontextualisierung von Events mit Texten, die Informationen zu dem Event enthalten.
Abb. 5:

Modell für die Kontextualisierung von Events mit Texten, die Informationen zu dem Event enthalten.

4.5 Entwicklung von Anwendungsprofilen

Es erfolgte ein Abgleich der ermittelten Klassen und Eigenschaften mit einschlägigen Standards. Um eine anwendungsübergreifende einheitliche Beschreibung zu gewährleisten, wurde auf verschiedene Metadatenstandards zurückgegriffen: Dublin Core http://dublincore.org/documents/dces/ (dc), http://dublincore.org/documents/dcmi-terms/ (dcterms), Europeana Data Model (edm) https://pro.europeana.eu/page/edm-documentation; The PROV Ontology (prov) https://www.w3.org/TR/2013/REC-prov-o-20130430/; CIDOC Conceptual Reference Model (crm) http://cidoc-crm.org/get-last-official-release; Darwin Core (dwc) http://rs.tdwg.org/dwc/terms/index.htm; Nomisma Ontology (nms) http://nomisma.org/ontology.

Das „Mixing and Matching“ der verschiedenen Standards erfolgt in Anwendungsprofilen, wobei für jede der definierten Klassen ein eigenes Profil erstellt wurde. Diese Profile sind jederzeit erweiterbar und sollen in Zukunft die Grundlage bilden für verschiedene Erfassungsmasken, die es ermöglichen, Objekte unterschiedlichster Art sowie die dazugehörigen Ereignisse zu katalogisieren und miteinander zu verknüpfen. Für die Beschreibung der Entität Ereignis wurden verschiedene Linked Data fähige Standards untersucht (u. a. CIDOC CRM und W3C PROV-O), schließlich wurde jedoch eine eigene Ontologie für die Beschreibung der Provenienz-Ereignisse entwickelt. Diese Ontologie definiert die Klassen und Elemente, die auf der Grundlage der in Schritt 3 (Analyse der Anforderungen) ermittelten Requirements als relevant betrachtet werden. Um die Interoperabilität dieser Ontologie mit den oben genannten Modellen zu gewährleisten, wurden die Terme – soweit möglich – auf Terme aus CIDOC CRM und PROV-O gemappt.

4.6 Test des Datenmodells

Der Test des Datenmodells erfolgte in einer AMPLE-basierten Datenbank in drei Instanzen: ASCH Items, ASCH Provenance und ASCH Statement. Es wurden Objekte aus 6 verschiedenen Sammlungen erfasst und insgesamt 20 Objektdatenstätze, 69 Provenienzdatensätze und 20 Statementdatensätze angelegt. Die Provenienzdatensätze dienen der Dokumentation von Objektbiografien und umfassen solche Ereignisse wie Entstehung, Herkunft, Erwerb oder Verlust. Sie beschreiben somit die Provenienz von Objekten und ermöglichen, mehrere Objekte ein und demselben Ereignis hinzuzufügen. Die Statementdatensätze dienen dazu, die Glaubwürdigkeit einzelner Aussagen zur Provenienz mit strukturierten Informationen zu belegen. Nehmen wir zum Beispiel die Aussage, Baron von Asch habe das Paket mit der Münze und dem ausgestopften Vogel am 5. April 1775 über Lübeck nach Göttingen geschickt, und diese Aussage ließe sich über einen der Briefe, die von Asch an Heyne geschickt hat, nachweisen. Über den Statementdatensatz besteht nicht nur die Möglichkeit, die einzelne Aussage mit dem Brief zu verknüpfen, sondern auch die Möglichkeit, dieses Statement näher zu beschreiben und ggf. Zweifel an der Glaubwürdigkeit zu äußern. Wir haben es somit an dieser Stelle mit der Beschreibung der Provenienz von Aussagen über die Provenienz von Objekten zu tun. Auch hierfür wurde im Rahmen des Projekts ein Datenmodell entwickelt, dass sich vor allem an den vom W3C entwickelten Standards RDF und PROV-O orientiert. Die im Modell realisierte eventorientierte Beschreibung dient somit nicht nur der einheitlichen Beschreibung der Provenienz unterschiedlichster Objekte, sondern unterstützt auch die strukturierte Beschreibung von Aussagen über Provenienz.

Modell für die Kontextualisierung von Aussagen mit Texten, die die Aussagen verifizieren.
Abb. 6:

Modell für die Kontextualisierung von Aussagen mit Texten, die die Aussagen verifizieren.

5 Ergebnis

Das Modell ermöglicht das Zusammenspiel unterschiedlicher Objektbeschreibungen durch „Andocken“ an gemeinsame Entitäten. Voraussetzung dafür ist, dass die Objektbeschreibungen LoD und RDF konform sind, d. h. dass sie standardisierte, strukturierte Daten, kontrollierte Werte mit URIs und unbeschränkt verwendbare Daten (Open Data) beinhalten. Die Einbindung von bereits vorhandenen Standards unterstützt die Nutzung der Daten in einem breiten Kontext.

Das entwickelte Metadatenmodell ermöglicht die Nachnutzung der Daten in unterschiedlichen Zusammenhängen wie die Darstellung in übergreifenden Kulturportalen und domainspezifischen Portalen. Darüber hinaus dient es der Kontextualisierung digitalisierter Objekte aus unterschiedlichen Institutionen (Bibliothek, Archiv, Museum). Es orientiert sich an den spezifischen Anforderungen verschiedener fachlicher Communities (sowohl aus den Geistes- als auch den Naturwissenschaften), ist interoperabel und nachhaltig nutzbar, was eine Veröffentlichung der Daten als Linked Open Data sowie fachspezifische und fächerübergreifende Metadatenanwendungen einschließt. Die Interoperabilität wird durch Nachnutzung vorhandener Standards ermöglicht. Entscheidend für das Modell war die Kombination aus der Verwendung eines einheitlichen Standards zur Beschreibung der Provenienz mit heterogenen Möglichkeiten der Objektbeschreibungen.

Begleitend zum Projekt wurde ein öffentlich zugängliches Wiki geführt, in dem Details zu den jeweiligen Schritten nachzulesen sind: http://asch.wiki.gwdg.de.

Footnotes

  • 1

    Feest, Christian: Ethnologische Museen. In: Waltraud Kokot und Dorle Dracklé (Hrsg.): Wozu Ethnologie? Berlin 1999, S. 199-216, hier: S. 202. 

  • 2

    Vgl. Waidacher, Friedrich: Handbuch der allgemeinen Museologie. 3., unv. Aufl. Wien 1999, S. 49. 

  • 3

    S. z. B. die „Empfehlungen zur Provenienzverzeichnung der Arbeitsgemeinschaft Handschriften und Alte Drucke in der Sektion IV des dbv“ vom 13. Dez. 2012 (https://provenienz.gbv.de/images/6/6d/DBV_Empfehlungen_zur_Provenienzverzeichnung.pdf) [Zugriff: 18.04.2018], oder die Datenbank „Material Evidence in Incunabula“ des „Consortium of Europeana Research Libraries“ (https://www.cerl.org/resources/mei/main) [Zugriff: 18.04.2018].  

  • 4

    Dieser Ansatz ist auch der Kern des vom International Council of Museums entwickelten Datenmodells CIDOC CRM sowie des daraus abgeleiteten Standardaustauschformats LIDO. 

  • 5

    Rohlfing, Helmut: Christian Gottlob Heyne und die Göttinger Universitätsbibliothek. In: Balbina Bäbler und Hein-Günther Nesselrath (Hrsg.): Christian Gottlob Heyne. Werk und Leistung nach zweihundert Jahren. Abhandlungen der Akademie der Wissenschaften zu Göttingen. Neue Folge Band 32, 2014. S. 145-157. 

  • 6

    TEI Simple ist ein Subset des von der Text Encoding Initiative entwickelte XML Formats TEI P5 und ein häufig genutzter Standard zur Auszeichnung von Volltexten. S. dazu auch https://github.com/TEIC/TEI-Simple [Zugriff: 18.04.2018]. 

  • 7

    Die Sammlungsdatenbank der Universität Göttingen verzeichnet zurzeit 115 Objekte der Provenienz von Asch. 

  • 8

    https://hdl.handle.net/21.11107/2b88bf2b-486f-4d52-9431-5072e5934f69 [Zugriff: 18.04.2018]. 

  • 9

    http://resolver.sub.uni-goettingen.de/purl?139212 [Zugriff: 18.04.2018]. 

  • 10

    Ein Uniform Resource Identifier identifiziert eine jede Ressource eindeutig durch eine eindeutige Abfolge von Zeichen. 

About the article

Susanne Al-Eryani

Susanne Al-Eryani

Gudrun Bucher

Dr. Gudrun Bucher

Stefanie Rühle

Stefanie Rühle


Published Online: 2018-06-12

Published in Print: 2018-06-26


Citation Information: Bibliotheksdienst, Volume 52, Issue 7, Pages 548–564, ISSN (Online) 2194-9646, ISSN (Print) 0006-1972, DOI: https://doi.org/10.1515/bd-2018-0066.

Export Citation

© 2018 by De Gruyter.Get Permission

Comments (0)

Please log in or register to comment.
Log in