Jump to ContentJump to Main Navigation
Show Summary Details
More options …

Bibliotheksdienst

Editor-in-Chief: Michalke, Karin / Ihrig, Hartmuth

Online
ISSN
2194-9646
See all formats and pricing
More options …
Volume 52, Issue 7

Issues

Datenbezieherumfrage 2017: Ergebnisse

Susanne Oehlschläger / Jochen Rupp
Published Online: 2018-06-12 | DOI: https://doi.org/10.1515/bd-2018-0063

Zusammenfassung

Für die Informationsversorgung im deutschsprachigen Raum und für den weltweiten Nachweis von Publikationen aus Deutschland und in deutscher Sprache spielen die kostenfrei bereitgestellten Metadaten der Deutschen Nationalbibliothek (DNB) eine wichtige Rolle.

Um die Dienstleistungen rund um die Metadaten bedarfsorientiert optimieren zu können, hat die DNB 2017 eine Online-Befragung ihrer Datenkundinnen und -kunden durchgeführt, um von ihnen zu erfahren, wie sie die Daten nachnutzen, welche Inhalte sie vorrangig benötigen, und welche Anforderungen und Wünsche sie an die Daten bzw. deren Bereitstellung haben.

Abstract

For the supply of information in the German-speaking area and for a listing of publications from Germany and in German language which are accessible from all over the world, the metadata supplied free of charge by the German National Library (Deutsche Nationalbibliothek, DNB) play an important role.

In order to be able to optimize the services around the metadata according to the users’ needs, the German National Library has conducted an online survey in 2017, asking its data users how they are reusing the data, which contents they see as a matter of priority and which demands they have concerning the data or the way they are provided.

Schlüsselwörter: Metadaten; Online-Befragung; Deutsche Nationalbibliothek

Keywords: metadata; online survey; German National Library

1 Einleitung

Für die Informationsversorgung im deutschsprachigen Raum und für den weltweiten Nachweis von Publikationen aus Deutschland und in deutscher Sprache spielen die Metadaten der Deutschen Nationalbibliothek (DNB) eine wichtige Rolle. Im Zuge der kontinuierlichen Anpassung und Optimierung der Datendienste der DNB hat die weitere Verbesserung der Daten für die Nutzung durch Datenbezieher, Suchmaschinen und Semantic-Web-Anwendungen hohe Priorität.

Über WWW- bzw. SFTP-Server und verschiedene Schnittstellen bietet die Deutsche Nationalbibliothek fortlaufend und retrospektiv verschiedene Metadaten in maschinenlesbaren Datenformaten an. Im Einzelnen handelt es sich dabei um die Deutsche Nationalbibliografie, den Neuerscheinungsdienst (ND), die Zeitschriftendatenbank (ZDB) sowie die Gemeinsame Normdatei (GND). Alle Metadaten sind in den Formaten MARC 21 und MARC21-xml, ein großer Teil in verschiedenen RDF-Serialisierungen und die Titeldaten auch in DNB Casual verfügbar. Seit Herbst 2015 werden die physischen Bestände der Deutschen Nationalbibliothek nach dem Standard „Resource Description and Access“ (RDA) erschlossen. Mit Ausnahme der Reihe O (Online-Publikationen) sind alle Reihen der Deutschen Nationalbibliografie und der Neuerscheinungsdienst (ND) zusätzlich als PDF-Version in Anlehnung an die Darstellung nach der International Standard Book Description (ISBDtags) lieferbar. Generell bietet die Deutsche Nationalbibliothek seit Mitte 2015 alle Titel- und Normdaten kostenfrei unter „Creative Commons Zero“-Bedingungen (CC0 1.0) zur freien Nachnutzung an. Lediglich die aktive Bereitstellung der Daten durch die Deutsche Nationalbibliothek ist kostenpflichtig. Dazu ist der Abschluss eines Vertrages erforderlich.

Deutsche Nationalbibliografie: Volumen pro Jahr.
Abb. 1:

Deutsche Nationalbibliografie: Volumen pro Jahr.

In der Zeit von 13. April bis 12. Mai 2017 hat die Deutsche Nationalbibliothek Bibliotheken, Bibliotheksverbünde und Firmen, die sie zu ihren Datenkunden zählt, mithilfe eines Online-Tools anonym befragt. Um die Dienstleistungen rund um die Metadaten bedarfsorientiert optimieren zu können, sollte ermittelt werden, wie sie die Daten beziehen und nachnutzen, welche Inhalte sie vorrangig benötigen, und welche Anforderungen und Wünsche sie an die Daten bzw. deren Bereitstellung haben. Dazu wurden an 1.028 E-Mail-Adressen Einladungen mit einem einmaligen, individuellen Hyperlink zur Teilnahme an der Online-Umfrage gesendet.

Ergänzend zur Befragung fand am 30. Mai 2017 der 4. Datenbezieher-Workshop am Rande des 106. Deutschen Bibliothekartages in Frankfurt am Main statt, bei dem 37 Teilnehmerinnen und Teilnehmer u. a. aus Verbundzentralen, Universitätsbibliotheken, Softwarefirmen und Archiven die Möglichkeit hatten, ihre Wünsche und Anregungen direkt vorzubringen.

In der anonym durchgeführten Online-Befragung gab es vier Abschnitte mit Fragen, die entweder für die Abteilung Datendienste oder den Fachbereich Erwerbung und Erschließung der Deutschen Nationalbibliothek relevant sind. Zusätzlich bestand die Möglichkeit, freiwillig Kontaktdaten für eventuelle Rückfragen anzugeben. Insgesamt erhielt die Deutsche Nationalbibliothek 135 Antworten, was einer Rücklaufquote von 13% entspricht.

Allen, die sich an der Befragung beteiligt haben, sei an dieser Stelle ausdrücklich gedankt!

2 Fragen zum Bezug der Metadaten

Zunächst wurde erfragt, welche Metadaten bezogen werden, wobei Mehrfachantworten möglich waren. Hier wurden die Daten der GND mit Abstand am häufigsten (67%) genannt, dicht gefolgt von den Daten zu Monografien und Periodika des Verlagsbuchhandels (Reihe A) der Deutschen Nationalbibliografie (59%). Mit etwas Abstand folgen die Daten der Zeitschriftendatenbank (40%), des Neuerscheinungsdienstes (36%) sowie der Monografien und Periodika außerhalb des Verlagsbuchhandels (Reihe B) der Deutschen Nationalbibliografie (33%) sowie die Bestandsdaten der Zeitschriftendatenbank (29%). Deutlich seltener werden die Reihen H (Hochschulschriften), M (Musikalien), O (Online-Publikationen), T (Musiktonträgerverzeichnis) und C (Karten) genannt.

Auf die Frage, auf welchem Weg die Daten bezogen werden, wurden folgende Antworten gegeben: Normdaten der GND werden am häufigsten über die SRU-Schnittstelle (27%) bezogen. Rund ein Viertel (25%) beziehen die Normdaten indirekt über Bibliotheksverbünde oder Dienstleister, 19% über die (teilweise kostenpflichtige) Datenbereitstellung über FTP/WWW-Server und 16% über die Schnittstelle OAI-PMH. Der Datenshop im DNB-Katalog wird seltener genutzt (9%).

Titeldaten der Deutschen Nationalbibliothek werden überwiegend über Verbünde und Dienstleister bezogen (31%), danach erfolgt erst der direkte Bezug über die Angebote der DNB: SRU-Schnittstelle (21%), die kostenpflichtige Datenbereitstellung über FTP/WWW-Server (20%) und die Schnittstelle OAI-PMH (12%). Auch hier wird der Datenbezug über den Datenshop weniger genutzt (10%).

Dass ein nennenswerter Anteil der Antwortenden die Daten nicht über die DNB direkt bezieht, sondern mittelbar über Verbünde und Dienstleister, muss bei der Bewertung der Umfrageergebnisse berücksichtigt werden.

Bei den Datenformaten stehen das klassische Bibliotheks-Austauschformat MARC 21 und seine XML-Variante ganz oben in der Gunst derjenigen Datenkunden, die sich an der Befragung beteiligten: 84% der Normdaten und 91% der Titeldaten werden so bezogen, das Format RDF wird von dieser Gruppe derzeit nur in 16% bzw. 8% der Fälle nachgefragt.

3 Fragen zur Nutzung der Metadaten

Für Erwerbungszwecke werden die Metadaten der Reihen A und B der Deutschen Nationalbibliografie am häufigsten genutzt, gefolgt von den Normdaten der GND und den Titelmeldungen des Neuerscheinungsdienstes sowie der Zeitschriftendatenbank. Die Reihen O, M, C und H wurden nur selten genannt, die Reihe T überhaupt nicht. Als besonders wichtig für die Erwerbung werden dabei die Elemente Haupttitel/Titelzusatz, Person(en), Internationale Standardnummern (wie ISBN, ISSN, EAN), Verlag, Erscheinungsdatum, Schlagwörter, Verlagsort, Körperschaft(en) und Sachgruppe(n) genannt. Als weniger relevant in diesem Zusammenhang werden die Datenelemente Permalink zur Titelvollanzeige im DNB-Katalog, DDC-Notation(en) und Link zum Inhaltstext sowie Sprachangabe angesehen.

Auch für die Erschließung werden am häufigsten die Daten der Reihen A und B sowie die Normdaten genutzt, wobei die Reihe B an erster Stelle genannt wurde. Seltener wurden die Reihen O, M, C und H genannt. Auch hier wurden die Metadaten der Reihe T der Deutschen Nationalbibliografie nicht erwähnt. Für Erschließungszwecke werden ebenfalls die Elemente Haupttitel/Titelzusatz, Person(en), Internationale Standardnummern (wie ISBN, ISSN, EAN) als besonders wichtig angesehen. Es folgen Schlagwörter, Körperschaft(en), Werktitel, Gesamttitelangabe, Verlag, Verlagsort, Verantwortlichkeitsangabe. Deutlich weniger relevant sind für die Erschließung die Angaben Sprache, DDC-Notation(en), Link zum Inhaltsverzeichnis/-text, Permalink zur Titelvollanzeige im DNB-Katalog und Preis.

3.1 Übernahme von Elementen der Inhaltserschließung

Insgesamt 104 (77%) derjenigen, die sich an der Umfrage beteiligten, gaben an, dass sie die inhaltliche Erschließung der Titeldaten der Deutschen Nationalbibliothek vollständig oder zumindest teilweise übernehmen. Sie wurden um weitere Präzisierungen gebeten: 39% übernehmen die Sachgruppen für die klassifikatorische Erschließung. Ebenfalls 39% übernehmen die DDC-Notationen der Titeldaten. Dieser Prozentwert erscheint angesichts der oben genannten geringen Relevanzbeurteilung von DDC-Notation(en) überraschend hoch. Als Erklärung können einige der optionalen Kommentare hilfreich sein: „Wir löschen sie bei der Übernahme nicht, benötigen sie aber auch nicht.“, „Werden eigentlich nicht benötigt“, „Wir verwenden eine andere Systematik als die DDC, daher brauchen wir diese Erschließung nicht“, „Zur Vorselektierung“, „Wir nehmen die DDC gelegentlich zur Findung der von uns genutzten DK-Signatur“ oder „Die Daten werden übernommen, aber z.Zt. nicht ausgewertet“.

Ungefähr gleich groß (40%) ist die Gruppe derer, die die Gattungsbegriffe der Titeldaten für die verbale Erschließung übernehmen. 88% und damit der größte Teil derjenigen, die angaben, inhaltserschließende Daten zu übernehmen, verwenden die Schlagwörter der Titeldaten für die verbale Inhaltserschließung. Aus einigen Kommentaren wird deutlich, dass den Schlagwörtern eine hohe Bedeutung beigemessen wird. Einige wünschen sich eine Ausweitung der verbalen Inhaltserschließung. Rund 60% aller Antwortenden nutzen die Angebote zur Kataloganreicherung mittels Inhaltsverzeichnis (TOC) und 63% mittels Inhaltstext (Verlagsangabe).

3.2 Gründe für die Nichtnutzung

Für Überlegungen, wie die Daten bzw. Datendienste optimiert werden könnten, ist es u. a. wichtig zu erfahren, aus welchen Gründen bestimmte Daten bisher nicht genutzt wurden. Deshalb wurde auch danach gefragt, warum die Befragten ggf. die Titeldaten bzw. die Normdaten nicht für ihre Erschließung nutzen. In einem Freitext-Feld konnten optional Kommentare eingetragen werden.

Während sich die Aussagen bei den Titeldaten überwiegend unter dem Stichwort mangelnde Qualität (zu ungenau, unvollständig, zu spät vorhanden und zu wenige Daten) zusammenfassen lassen, waren die Aussagen dazu, weshalb Normdaten nicht für die Erschließung genutzt werden, deutlich heterogener. Manche Institutionen haben Hausregeln, andere kritisieren dublette Datensätze in der GND und wieder andere sind technisch nicht dazu in der Lage, Normdaten zu übernehmen.

4 Zufriedenheit mit den Titeldaten und Verbesserungsvorschläge

Von den 83 Beziehern der Titeldaten der Deutschen Nationalbibliothek zeigten sich 75 (90%) mit der Qualität der Daten sehr zufrieden (48%) oder zufrieden (42%), nur 10% gaben an, weniger zufrieden zu sein. Das ist insgesamt ein sehr gutes Ergebnis.

Obwohl sich diese Frage ausdrücklich auf die Reihen der Deutschen Nationalbibliografie und nicht auf die Titeldaten des Neuerscheinungsdienstes1 bezogen hat, wurde bei den optionalen Kommentaren dessen mangelnde Qualität kritisiert. Aber es wurde auch festgestellt, dass „Die DNB-Titeldaten […] durch ihre sehr gute Qualität und ihre Vollständigkeit für uns eine der wichtigsten Datenquellen“ sind.

5 Erwartung an Metadaten?

Weitergehende Anmerkungen und Verbesserungsvorschläge zu Titel- und Normdaten konnten frei formuliert werden. Ein Themenfeld war dabei die Datenqualität. Für eine Reihe der Antwortenden ist ein „hoher Standard der Titelaufnahme insbesondere im Hinblick auf die Korrektheit der Angaben“ wichtig. In einigen Fällen wurde darauf hingewiesen, dass die Daten der DNB teilweise oder vollständig ohne weitere Überprüfung übernommen werden. Andere wiederum beschreiben, dass sie die Titelaufnahmen nacharbeiten müssten, weil die DNB nicht alle vom Regelwerk her möglichen Datenfelder belege. Auch wurde eine Möglichkeit vermisst, fehlerhafte Daten online zu melden. Aus den Antworten wird deutlich, dass Datenqualität häufig mit einer regelgerechten Titelbeschreibung gleichgesetzt wird, sowohl im Hinblick auf die formale als auch die inhaltliche Erschließung.

Vielfach wurde eine umfangreichere verbale Inhaltserschließung gewünscht: mehr Schlagwörter, Verschlagwortung deutscher Dissertationen, von Kinder- und Jugendliteratur und Belletristik, Verbesserung der automatisch erstellten Schlagwörter. Aber auch weitere klassifikatorische Inhaltserschließung, zum Beispiel mit RVK-Notationen, und rückwirkende Inhaltserschließung sowie darüber hinaus weitere Verlagsangaben wie Kurzbeschreibungen und Klappentexte wurden vereinzelt angesprochen. In einigen Antworten wird der Wunsch nach einer einheitlichen inhaltlichen Erschließung in allen Reihen der Deutschen Nationalbibliografie deutlich. Als unzulänglich wurden hier die Daten der Reihen O und T genannt. Für Musikmedien wünschten sich einige eine tiefere Erschließung.

Aber es gab auch Lob für die Titeldaten der Deutschen Nationalbibliothek. Die Stimmen reichten hier von „Wir können die Metadaten sehr gut verwenden. „Fast alle Suchen führen zum Treffer“ über „Schaut aktuell gut aus“, „Für eine kleinere Stadtbibliothek übersteigt das Angebot unsere Bedürfnisse“ oder „Ein sehr wertvoller Dienst, der uns hilft, die Datenbestände kleiner und mittlerer Bibliotheken mit begrenztem Budget auf qualitativ hohem Niveau zu halten und zu vereinheitlichen“. Diese Aussagen korrelieren insofern gut mit der hohen Zufriedenheit der Befragten mit der Qualität der nationalbibliografischen Daten von 90%.

Bei den Normdaten der GND steht ebenfalls die Qualität im Vordergrund. Hier wurden insbesondere die Dubletten durch Namenssätze (Tn) und Personensätze (Tp) häufig als problematisch angesehen. Mehrfach wurde angemerkt, dass die Datenqualität für Musikalien und Tonträger unzureichend sei, und die Daten zu Musiklabels und Musikverlagen verbessert werden sollten. Ebenso wie bei den Titeldaten ist auch bei den Normdaten Aktualität ein wichtiges Thema.

Weitere Anregungen bezogen sich auf die Vereinfachung der Redaktionsverfahren für die GND oder die Verbesserung der Vorgehensweise bei Änderungsvorschlägen, also Themen von eher organisatorischer Natur. Manche Wünsche widersprechen dem gültigen Regelwerk RDA, nach dem die Daten erstellt werden, andere beziehen sich auf die Umsetzung der Daten im Format MARC 21. Hier gibt es beispielsweise Probleme bei normierten Sucheinstiegen für Entitäten in nichtlateinischen Schriften, oder es wird die Aufnahme weiterer Datenfelder gewünscht. Mehrere Kommentare beziehen sich auf die Handhabung gelöschter Datensätze. Außerdem wurden Visualisierungen der GND vorgeschlagen.

Auch die Normdaten der GND haben erfreulicherweise viel Lob erhalten: „Ich finde die Normdatei wunderbar!“, „Hinsichtlich der Qualität der übernommenen GND-Daten gibt es keine Anmerkungen bzw. Verbesserungsvorschläge.“, „Die sind in Ordnung.“, „Sie sind gut gepflegt.“, „Wir sind mit dem Konzept der Datenlieferung sehr zufrieden. Die Verfügbarkeit der GND ist sehr gut.“ Positiv hervorgehoben wurde auch die Möglichkeit, andere Normdaten oder Identifier anzugeben, wie zum Beispiel OCRID (Open Researcher and Contributor ID), oder auch die Verknüpfung zu Wikipedia.

6 Fazit

Leider hat sich nur ein sehr kleiner Kreis von rund 13% der angeschriebenen Datenkundinnen und Datenkunden der Deutschen Nationalbibliothek an der Online-Befragung beteiligt, was bei der Ergebnisbewertung berücksichtigt werden muss.

Ein wichtiges Ergebnis der Befragung ist die Erkenntnis, dass der fortlaufende Just-in-time-Datenbezug über die kostenfreie OAI-PMH-Schnittstelle noch nicht bei allen Teilnehmern in vollem Umfang implementiert ist. Dort, wo das nicht der Fall ist, können nicht die aktuellen Metadaten bzw. Normdaten genutzt und neue Metadaten und Änderungen nur mit Zeitverzögerung übernommen werden.

Unklar und überraschend ist, dass die Angabe der Ausgabezeichnung als relevanter eingeschätzt wird als die Angabe von DDC-Notationen. Im Widerspruch dazu steht die Aussage von immerhin 39% derjenigen, die die Inhaltserschließung der DNB nutzen, dass sie die DDC-Notationen der Titeldaten für die klassifikatorische Erschließung übernehmen. Die Angaben innerhalb der optionalen Kommentare lassen vermuten, dass diese Daten aus Gewohnheit übernommen werden. Mit dem gleichen Prozentsatz werden Sachgruppen aus dem Titeldaten übernommen, wobei diese in ihrer Relevanz für Zwecke der Erwerbung und Erschließung höher eingeschätzt werden als DDC-Notationen. Fast alle Antwortenden (88%) übernehmen die Schlagwörter der Titeldaten für die verbale Erschließung, dies korrespondiert mit einem hohen Wert bei der Relevanzbewertung.

Als positiv und insofern als Bestärkung in ihrem Bestreben, die GND auszubauen, sieht die Deutsche Nationalbibliothek deren starke Nutzung an. Das Problem der dubletten Datensätze war bereits bekannt, an Lösungen wird gearbeitet. So wurde beispielsweise Ende Januar 2018 das Verfahren eingestellt, Namenssätze in der GND maschinell zu erzeugen und mit Titeldaten der DNB zu verknüpfen.

Wenngleich die DNB gehofft hatte, dass sich deutlich mehr Datenkunden an der Online-Umfrage beteiligen, um damit noch aussagekräftigere Antworten zu erhalten, liefern die Ergebnisse erste wichtige Anhaltspunkte über die Nutzung und die Bewertung ihrer Datendienste und Angebote. Es sollen künftig regelmäßig Online-Befragungen durchgeführt werden. Die nächste Umfrage ist für 2019 vorgesehen.

Footnotes

  • 1

    Der Neuerscheinungsdienst basiert auf den Meldungen der Verlage an das Verzeichnis Lieferbarer Bücher (VLB) und wird von der DNB als reiner Informationsdienst zu Vorankündigungen und neu erschienenen Titeln angeboten. Er ist daher kein Bestandteil der Deutschen Nationalbibliografie. 

About the article

Published Online: 2018-06-12

Published in Print: 2018-06-26


Citation Information: Bibliotheksdienst, Volume 52, Issue 7, Pages 518–526, ISSN (Online) 2194-9646, ISSN (Print) 0006-1972, DOI: https://doi.org/10.1515/bd-2018-0063.

Export Citation

© 2018 by De Gruyter.Get Permission

Comments (0)

Please log in or register to comment.
Log in