Jump to ContentJump to Main Navigation
Show Summary Details
More options …

Bibliothek Forschung und Praxis

Ed. by Bonte, Achim / Degkwitz, Andreas / Horstmann, Wolfram / Kaegbein, Paul / Keller, Alice / Kellersohn, Antje / Lux, Claudia / Mittler, Elmar / Rachinger, Johanna / Seadle, Michael / Umlauf, Konrad / Vodosek, Peter / Vogt, Hannelore / Vonhof, Cornelia

Online
ISSN
1865-7648
See all formats and pricing
More options …
Volume 38, Issue 3

Issues

David gegen Goliath – Digitalisierung in Regionalbibliotheken

Gregor Neuböck
Published Online: 2014-11-26 | DOI: https://doi.org/10.1515/bfp-2014-0062

Zusammenfassung

Die Digitalisierung urheberrechtsfreier Bücher ist in vielen Bibliotheken seit einigen Jahren ein großes Thema, das mehr oder weniger erfolgreich bearbeitet wird. Die Großen stellen immer die Masse der von ihnen digitalisierten Werke in den Vordergrund und scheinen so den kleinen und mittleren Bibliotheken kaum mehr Raum zur Entwicklung und Rechtfertigung eigener Digitalisierungsprojekte zu lassen. Die Oberösterreichische Landesbibliothek in Linz hat ein kleines Projekt inklusive aller dazu notwendigen Komponenten eigenständig realisiert und damit gezeigt, dass man sich auch als Regionalbibliothek profilieren kann.

Abstract

In recent years, the digitalisation of copyright-free books has been and still is being carried out successfully in many libraries. The greatest challenge is the amount of work which digitalisation involves not only in foreground but also behind the scenes. However, there is not much space for small and medium-sized libraries to develop and create their individual digitalisation projects. The Oberösterreichische Landesbibliothek in Linz has independently and very successfully implemented a small digitisation project including all necessary components. It has shown that even small or regional libraries can successfully carry out this work.

Schlüsselwörter: Retrodigitalisierung; Digitalisierungsprojekt; Oberösterreichische Landesbibliothek

Keywords: Retro-digitisation; digitisation; Upper Austrian Federal State Library

Die Oberösterreichische Landesbibliothek hat sich im Jahre 2009 dazu entschlossen, ein eigenes Digitalisierungsprojekt, die „Digitale Landesbibliothek Oberösterreich“ (DLOÖ)1, http://digi.landesbibliothek.at, inklusive aller notwendigen Komponenten aufzubauen. In den einzelnen Abschnitten seien zu Beginn eine kurze Chronologie der Entwicklung der einzelnen Komponenten sowie die für unsere Entscheidungen relevanten Punkte dargestellt. Im dritten Teil stelle ich unseren Digitalisierungsworkflow mit GOOBI vor, bevor ich mich näher mit den Gründen für unsere kleinen Erfolge auf dem heißumkämpften Gebiet der Digitalisierung beschäftige. Als letzten Punkt gibt es noch einige statistische Zahlen zur DLOÖ.

1 Chronologie der Entwicklung der einzelnen Komponenten der DLOÖ

Ende 2009 wurde an der Oberösterreichischen Landesbibliothek begonnen, ein Digitalisierungsprojekt zu entwickeln. Zunächst setzten wir uns mit Standards im Bereich der Digitalisierung auseinander. Dazu zählten insbesondere Dateiformate für Bilder, Meta- und Strukturdaten, sowie OCR-Daten. Zusätzlich wurden verschiedene Bibliotheken und Firmen kontaktiert und besucht, die schon Erfahrungen in diesem Bereich vorweisen konnten.

Im Jahr 2010 legten wir dann unsere Kriterien für eine geeignete Software fest und entschieden uns Ende 2010 für die Open Source-Software2 GOOBI.

Mangels geeigneter Personalressourcen lagerten wir die technischen Arbeiten an GOOBI an die Fa. Intranda in Göttingen aus.

Ab März 2011 begannen wir nach gerade mal einer eineinhalbtägigen Einschulung mit der operativen Arbeit auf einem gehosteten3 Webspace, und schon kurze Zeit später erschienen unsere ersten urheberrechtsfreien Bücher im Internet.

In den ersten 8 Monaten, der einem Probebetrieb gleichzusetzen war, scannten wir unsere Bücher auf einem Flachbettscanner der Marke Canon 9000F Mark II. Dementsprechend veröffentlichten wir in diesem Zeitraum nur kleinformatige Bücher, die in sehr gutem Zustand waren.

Gegen Ende des Jahres 2011 hatten wir einen eigenen Server inklusive Sicherungsserver sowie einen Auflichtscanner der Marke CopyBook A2+ angeschafft.

Der Grund für diesen doch entscheidenden Schritt war die hohe Auflösung, mit der wir unsere Werke bis auf den heutigen Tag digitalisieren. Bis auf wenige Ausnahmen, wie z. B. großformatige Kartenbeilagen, scannen wir ausschließlich auf 600 dpi4. Die damit verbundenen großen Datenmengen zwangen uns trotz Fast-Internet zu eine Inhouse-Lösung. Schon kleine Bücher benötigen bei dieser Auflösung mehrere GB5 Speicherplatz. Ab Dezember hatten wir ein kleines Digitalisierungs-LAN6 aufgebaut. Nun konnten die Bilder direkt vom Scanner in die GOOBI-Vorgangsordner eingespielt werden. Zusätzlich wurde ein 27 Zoll iMac angeschafft, der wegen seiner großen Bilddiagonale und der sehr guten Darstellung von Bildern zur Qualitätskontrolle verwendet wird.

Im Dezember 2012 kauften wir von VESTIGIA – The Manuscript research Centre of Graz University – den Traveller7. Dieser dient uns zur Digitalisierung von Büchern, deren Öffnungswinkel aus konservatorischen Gründen nicht mehr als 180 Grad betragen darf. Meist handelt es sich dabei um mittelalterliche Handschriften.

Seit Herbst 2013 besitzen wir sowohl für GOOBI als auch für unseren Viewer8 einen eigenen physischen Server. Zusätzlich werden diese beiden Systeme über einen Sicherungsserver gesichert. Als Datensicherung setzen wir zwei große NAS9 mit Raid10 Level 5 ein, auf denen alle Daten zusätzlich doppelt gesichert werden. Gegen Stromausfälle wird das gesamte System mit zwei USV11 abgesichert.

GOOBI und der Viewer werden seit ihrer Implementierung einer ständigen Weiterentwicklung bezüglich Anforderungen und Standards unterzogen. In enger Zusammenarbeit mit der GOOBI-Community und unserer Betreuungsfirma werden die beiden Komponenten entsprechend den Marktanforderungen und technischen Änderungen angepasst.

2 Unsere Entscheidungskriterien für die einzelnen Komponenten der DLOÖ

Aus Platzgründen gehe ich hier nur auf die Entscheidungsgründe im Bereich der Digitalisierungssoftware und des Scanners ein. Alle anderen Komponenten wie z. B. NAS, Server, USV usw. werden von mir hier nicht behandelt. Gerne bin ich aber jederzeit bereit, weitere Informationen per Mail zuzusenden.

Ganz zu Beginn muss ich darauf verweisen, dass neben unseren funktionalen Kriterien auch der Preis mitbestimmend war.

Für GOOBI entschieden wir uns, da es plattformunabhängig ist. Das bedeutet, man benötigt im Gegensatz zu vielen Konkurrenten, die einen lokal installierten Software-Client12 benötigen, nur einen Internetzugang und einen Browser, um im Produktionssystem arbeiten zu können. Fehlende Lizenzgebühren senken die laufenden Kosten, und durch die gute Konfigurierbarkeit des Systems entwickelte sich GOOBI für uns zu einer Art Schweizermesser der Digitalisierung. Heute digitalisieren wir unterschiedlichste Werktypen wie z. B. Monographien, Zeitungen, Bandserien, Handschriften, Karten, Urkunden und Inkunabeln. Zur Einbindung externer Dienstleister, z. B. zur Digitalisierung sensibler Handschriften, wird von uns ein spezifischer Benutzerzugang eingerichtet. Die Bilder werden dann über das Internet vom Dienstleister in GOOBI hochgeladen, noch bevor die Handschriften wieder im eigenen Tresor zurück sind. Manchmal benötigten wir für Wissenschaftler einen exklusiven Zugang zu einer bestimmten Handschrift, damit besonderes Expertenwissen in deren Beschreibung einfließen kann. Der Zugang wird in wenigen Minuten für den Wissenschaftler exklusiv eingerichtet und unabhängig von Zeit und Raum kann dieser sofort an der Handschrift arbeiten. Dadurch profitieren nicht nur wir durch die Anreicherung der Handschriften, sondern auch die Wissenschaft weltweit durch den freien Zugang.

Da wir ein sehr kleines Team von teilweise wechselnden Personen sind, ist die Browserbasiertheit sowie die Möglichkeit zum Anlegen unterschiedlicher Benutzergruppen und Benutzer ohne Lizenzgebühren oder andere Einschränkungen von großem Vorteil.

Schlussendlich ist auch die große Community, die mittlerweile GOOBI einsetzt oder weiterentwickelt, ein wichtiges Entscheidungsargument gewesen. So wird eine nachhaltige Entwicklung der Software garantiert und vorangetrieben, die zusätzlich noch durch den Verein „GOOBI DIGITALISIEREN IM VEREIN“13 rechtlich auf solide Beine gestellt wurde. Im Verein sind viele verschiedene Bibliotheken vertreten, die sich die Weiterentwicklung von GOOBI zur Aufgabe gemacht haben.

Die Entscheidung für unseren Scanner basierte im Prinzip auf einigen wichtigen Grundlagen, die nur von wenigen Herstellern erfüllt werden konnten. Wir benötigten 600 dpi optisch über eine Fläche von A2 in Farbe. Ein weiteres wichtiges Argument für das CopyBook von i2s betraf die Geräuschentwicklung, die doch sehr belastend für die Arbeit von Scanoperatoren sein kann. Dadurch, dass dieser Scanner mit einer Kamera arbeitet und kein Zeilenscanner ist, hat er kaum bewegliche Teile, dementsprechend hat er einen geringen Geräuschpegel und wenig Teile, die sich abnutzen können.

3 Der Digitalisierungsworkflow der DLOÖ

GOOBI bietet die Möglichkeit, eine beliebige Anzahl an verschiedenen Arbeitsschritten miteinander zu verknüpfen. Wir an der Oberösterreichischen Landesbibliothek haben derzeit folgende Schritte im Digitalisierungsworkflow verwirklicht: bibliographische Aufnahme, Scannen, Qualitätskontrolle, automatischer Kopier- und Tiffheaderschritt, Struktur- und Metadaten, OCR14, URN15-Generierung, Export in DMS16, URN-Eintragung und Archivierung. Die einzelnen Schritte können entweder automatisch oder manuell ablaufen und optional einer Validierung unterzogen werden. Der jeweils nächste Schritt kann erst nach erfolgreichem Abschluss des Vorgängerschrittes begonnen werden. Den einzelnen Arbeitsschritten können Benutzergruppen bzw. Benutzer zugeordnet werden. Man spricht in diesem Zusammenhang vom Prinzip des aufgeräumten Schreibtisches. Jeder Benutzer sieht nur die ihm zugeordneten Arbeitsschritte. Der Scanoperator sieht bei uns ausschließlich den Arbeitsschritt Scannen. Sobald dieser erfolgreich beendet ist, verschwindet dieser Vorgang für den Scanoperator. Genau so ergeht es dem Metadatenbearbeiter. Hat dieser seine Arbeit erfolgreich abgeschlossen, verschwindet der Vorgang aus seinem Arbeitsbereich.

Da bei den einzelnen Schritten Fehler passieren können, hat GOOBI ein internes Kommunikationssystem, bei dem ein Vorgang von einem Benutzer an einen anderen Bearbeitungsschritt zurückgeschickt werden kann. Dieses interne Kommunikationssystem kann aber für Anmerkungen aller Art verwendet werden. Wenn der Metadatenbearbeiter entdeckt, dass Bilder nicht korrekt gescannt wurden oder fehlen, kann er den Vorgang an die Stelle des Scannens zurückschicken und gleichzeitig eine Nachricht hinterlassen, die es dem Scanoperator erleichtert, den Fehler zu erkennen und zu korrigieren.

Was ich persönlich am meisten an der Arbeit mit GOOBI schätze, ist die große Unabhängigkeit, die mir diese Software gibt. Wird ein Buch oder eine Zeitschrift oder was auch immer zur Digitalisierung angefragt, so kann ich jeden Workflowschritt selber bestimmen, und manchmal dauert es nur wenige Stunden bis ein angefragtes Buch online ist.

4 Wie man sich von den großen Bibliotheken abgrenzen kann?

Wie kann man als mittelgroße oder kleine Regionalbibliothek mit den großen mithalten oder sogar noch besser sein? Ganz einfach, indem man Dinge einfach besser macht und hohe Qualitätskriterien festlegt. In der DLOÖ gibt es kaum diese Mega-Digitalisierungsprojekte, bei denen nach mehreren Monaten Vorbereitungszeit 500 000 Seiten oder mehr online gehen. Vielmehr achten wir darauf, beinahe täglich einzelne Werke zu veröffentlichen.

Durch die riesige Menge an Digitalisaten werden große Bibliotheken automatisch zu einem niedrigeren Qualitätsniveau gezwungen. Genau dort setzen wir als Landesbibliothek an. Nachdem wir unseren Workflow zum Laufen gebracht hatten, legten wir hausinterne Qualitätsrichtlinien zur Digitalisierung fest. Alle unsere Werke werden mit 600 dpi Farbe gescannt, nur großformatige Karten werden mit 400 dpi gescannt. Bei der Erfassung der Struktur- und Metadaten bilden wir das Inhaltsverzeichnis ab, zusätzlich werden noch Bilder, Tabellen, Gedichte, Noten, Briefe, Einbände und viele weitere Strukturelemente erfasst. Das Inhaltsverzeichnis und alle Unterstrukturelemente werden später nach dem Export im Viewer als verlinkte Navigation links vom Bild dargestellt. Alle erfassten Teile können selektiv in Faksimile-Qualität als PDF heruntergeladen werden.

Als Folge der intensiven Struktur- und Metadatenvergabe ist das Ranking unsere Digitalisate regelmäßig auf vorderen Plätzen.

Auch bei uns läuft jedes Buch, gleich ob es in Antiqua- oder Frakturschrift gedruckt wurde, durch einen automatisierten OCR-Schritt. Über diesen Volltext werden unsere Bücher von Suchmaschinen leichter aufgefunden. Der Volltext wird gerne als Killerargument gegen die hohe Erfassungstiefe eingesetzt, so als sei diese unnütz oder eine unnötige Fleißaufgabe. An unseren Zugriffsstatistiken sehe ich, wie sich Besucher oft mehrere Stunden von Navigationspunkt zu Navigationspunkt bewegen, und das alles bei Büchern, die schon digitalisiert vorliegen. Was ist der Hintergrund dafür, dass Benutzer schon digitalisierte Bücher bei uns betrachten und nicht z. B. bei Google-Books? Viele große Bibliotheken wie Nationalbibliotheken oder eben Google-Books bieten kaum oder keine Strukturelemente bei digitalisierten Büchern an, dies sei so, als ob man bei einem Printbuch das Inhaltsverzeichnis herausreißt. Stellen Sie sich ihre Bibliothek mit Büchern ohne Inhaltsverzeichnis vor!

Neben der Qualität der Meta- und Strukturdaten ist auch die Bildqualität entscheidend. Insbesondere bei unseren Handschriften, http://digi.landesbibliothek.at/viewer/fullscreen/471/28/, kommt dies ganz deutlich zum Ausdruck. Hier werden über die Zoomfunktion Details sichtbar, für die man beim Original eine Lupe bräuchte. Auch bei großformatigen Karten, Illustrationswerken, http://digi.landesbibliothek.at/viewer/fullscreen/AC00969620/13/, oder Atlanten, http://digi.landesbibliothek.at/viewer/fullscreen/AC05371191/265/, ist dies der Fall.

Als weiteren Service bieten wir das Vorziehen von angefragten Büchern im Digitalisierungsprozess an. Damit diese rasch verfügbar sind, werden die Bücher nur mit Metadaten versehen und sofort exportiert. Erst in weiterer Folge werden Inhaltsverzeichnisse strukturell abgebildet und später nachträglich exportiert, so werden Kunden rasch zufriedengestellt und trotzdem bleibt eine hohe Qualität garantiert.

Die konsequente Weiterentwicklung unseres Portals wird einerseits für GOOBI durch die Community, andererseits für den Viewer durch eine intensive und laufende Zusammenarbeit mit unserer Betreuungsfirma Intranda gewährleistet.

Zuletzt haben wir eine neue Suche, http://digi.landesbibliothek.at/viewer/search/, entwickelt, die neben der Standardsuche eine differenzierte Suche, eine Jahressuche und eine Jahresansicht bietet.

Bei Handschriften haben wir ein Beschreibungsfeld realisiert. In diesem können HTML-Tags für Verlinkungen, Listen, Hervorhebungen, usw. verwendet werden. So können mit der Zeit auf wissenschaftlicher Basis detaillierte Handschriftenbeschreibungen wachsen. Die Zugriffe sind natürlich über Benutzername und Passwort geschützt.

Benutzer mit einem OpenID-Konto17 haben die Möglichkeit, sich eigene Sammlungen (Bücherregale) zu erstellen. So können je nach eigenem Interesse bestimmte Werke rasch auffindbar gemacht werden.

Die Normdatenanbindung direkt aus GOOBI heraus wird momentan gerade realisiert und Tools zum Crowdsourcing18 stehen ebenfalls kurz vor ihrem Einsatz.

5 Zahlen und Fakten

Neben dem fallweisen Einsatz von Praktikanten als Scanoperatoren arbeiten entsprechend ein Vollzeitäquivalent meist 2–3 verschiedene Personen an der DLOÖ.

Die Oberösterreichische Landesbibliothek besitzt ca. 50 000 alte Drucke und ca. 1 000 Handschriften. Diese Schätze sowie landeskundlich relevante und urheberrechtsfreie Literatur stehen im Vordergrund unserer Digitalisierungsambitionen. Identitätsstiftende Literatur wird plötzlich wieder online gelesen, nachdem manche Bücher vielleicht 80 Jahre oder länger nicht entlehnt wurden! Seit 2012 digitalisieren wir zusätzlich Literatur mit dem Schwerpunkt 1. Weltkrieg. Diese Entscheidung hat unsere Zugriffszahlen stark erhöht, was ich angesichts der meist schon digitalisierten Werke auf die unter Punkt 4 angeführten Fakten zurückführe. Die Oberösterreichische Landesbibliothek setzt die Digitalisierung auch als Bestandsschutz ein. Werke, die digitalisiert sind, können nicht mehr entlehnt werden. Gerade Werke um die Jahrhundertwende sind meist in einem sehr schlechten Zustand. Auch Beschädigungen wie Anmerkungen mit Kugelschreiber, mit Rasierklingen herausgeschnittene Seiten oder plötzlich fehlende Beilagen können durch die Digitalisierung hintangehalten werden.

Auch als Archivierungsstrategie ist es nicht unklug, Werke mehrmals zu digitalisieren. In den USA geht man im Bereich der Archivierung teilweise ganz andere Wege. Dort sucht man im Bereich der Archivierung nicht nach dem „Stein der Weisen“ mit immer ausgefeilteren Systemen, sondern geht davon aus, dass wenn ein Werk in verschiedenen Bibliotheken digital aufliegt, die Wahrscheinlichkeit für Erhaltung und Reproduzierbarkeit am besten gegeben ist.

Zum Schluss noch einige Bemerkungen zur Entwicklung unserer Zugriffe: Seit Dezember 2011 haben wir eine statistische Auswertung zur Verfügung. Damals, so sei erwähnt, hatten wir nur wenige Dutzend Werke online. Heute sind mehr als 2 500 Werke online, die bis auf die Handschriften durchgängig im Volltext vorliegen.

Im Dezember 2011 hatten wir ca. 20–40 Zugriffe pro Tag bzw. 250 Seitenansichten. Im Mai 2014 waren es ca. 250–300 Besucher pro Tag oder ca. 4 000 Seitenansichten aus mehr als 100 Ländern weltweit, und die Entwicklung setzt sich fort.

Quellen

Footnotes

  • 1

    Die digitale Landesbibliothek steht einerseits für den gesamten Digitalisierungsworkflow der Oberösterreichischen Landesbibliothek: http://goobi.landesbibliothek.at, andererseits ist dies auch der Name unseres Präsentationssystem http://digi.landesbibliothek.at. Im weiteren Text wird die Abkürzung DLOÖ verwendet. 

  • 2

    Open-Source-Software bietet einen offenen Quelltext an, der verändert und frei genutzt werden darf. Lizenzrechtlich werden dabei die Lizenzbedingungen der Open-Source-Initiative anerkannt. 

  • 3

    Unter Webhoster versteht man Internetdienstanbieter, die in erster Linie Webspace zur Verfügung stellen. Oft werden aber auch noch weitere Dienste wie z. B. E-Mail oder Datenbanken bereitgestellt. 

  • 4

    DPI steht für dots per inch und ist ein Maß für die Punktdichte. Diese bestimmt entscheidend die Qualität von Bildern. 

  • 5

    1 GB entspricht dem Speicherplatzbedarf von 1 000 000 000 Byte. 

  • 6

    LAN ist ein lokales Rechnernetzwerk, bei dem in unserem Fall Server, Scanner und einige ausgewählte Computer eingebunden sind. 

  • 7

    Traveller ist ein mobiler Digitalisierungstisch entwickelt unter der Federführung von DI Manfred Mayer, Universität Graz. 

  • 8

    Als Viewer bezeichnen wir hier unser Präsentationssystem, basierend auf einer Eigenentwicklung der Fa. Intranda. 

  • 9

    NAS ist ein netzwerkgebundener Dateiserver, der in einem Rechnernetz Speicherkapazität zur Verfügung stellt. 

  • 10

    RAID steht für redundante Anordnung unabhängiger Festplatten, RAID 5 ist eine Anordnung von Festplatten mit einem guten Kompromiss zwischen Datendurchsatz, Redundanz und Kosten. 

  • 11

    USV ist eine unterbrechungsfreie Stromversorgung. Sie wird eingesetzt, um bei Störungen im Stromnetz die Versorgung unserer Server zu garantieren. 

  • 12

    Software-Client ist ein Computerprogramm das benötigt wird, um auf das Produktionssystem zugreifen zu können. 

  • 13

    GOOBI DIGITALISIEREN IM VEREIN: http://www.goobi.org/. 

  • 14

    OCR steht für die automatisierte Texterkennung innerhalb von Bildern. 

  • 15

    URN ist ein eindeutiger und dauerhafter Name für Ressourcen. Mit diesem wird der Fehler 404 vermieden, da einer Ressource immer nur genau ein persistenter Identifier zugeordnet wird. 

  • 16

    DMS: Abkürzung für Dokumentenmanagement-System im Text auch als Viewer bezeichnet. 

  • 17

    OpenID ist ein dezentrales Authentifizierungssystem, das nur eine einmalige OpenID von einem Anbieter benötigt. Danach kann man sich bei verschiedensten System ohne Passwort und Benutzername anmelden. 

  • 18

    Beim Crowdsourcing werden ursprünglich interne Arbeiten an die Internetcommunity ausgelagert (z. B. die Verbesserung von OCR-Ergebnissen). 

About the article

Published Online: 2014-11-26

Published in Print: 2014-12-19


Citation Information: Bibliothek Forschung und Praxis, Volume 38, Issue 3, Pages 439–443, ISSN (Online) 1865-7648, ISSN (Print) 0341-4183, DOI: https://doi.org/10.1515/bfp-2014-0062.

Export Citation

© 2014 Walter de Gruyter GmbH, Berlin/München/Boston. This work is licensed under the Creative Commons Attribution-NonCommercial-NoDerivatives 3.0 License. BY-NC-ND 3.0

Comments (0)

Please log in or register to comment.
Log in