Jump to ContentJump to Main Navigation
Show Summary Details
More options …

Bibliothek Forschung und Praxis

Ed. by Bonte, Achim / Degkwitz, Andreas / Horstmann, Wolfram / Kaegbein, Paul / Keller, Alice / Lux, Claudia / Mittler, Elmar / Rachinger, Johanna / Seadle, Michael / Umlauf, Konrad / Vodosek, Peter / Vogt, Hannelore / Vonhof, Cornelia

Online
ISSN
1865-7648
See all formats and pricing
More options …
Volume 43, Issue 3

Issues

Erkennung von handschriftlichen Unterstreichungen in Alten Drucken

Recognition of Handwritten Underlines in Historical Printings

Alexander Gehrke
  • Corresponding author
  • Universität Würzburg, Lehrstuhl für Künstliche Intelligenz und Angewandte Informatik, Am Hubland, D-97074WürzburgGermany
  • Email
  • Other articles by this author:
  • De Gruyter OnlineGoogle Scholar
/ Nico Balbach
  • Universität Würzburg, Lehrstuhl für Künstliche Intelligenz und Angewandte Informatik, Am Hubland, D-97074WürzburgGermany
  • Email
  • Other articles by this author:
  • De Gruyter OnlineGoogle Scholar
/ Yong-Mi Rauch / Andreas Degkwitz / Frank Puppe
  • Universität Würzburg, Lehrstuhl für Künstliche Intelligenz und Angewandte Informatik, Am Hubland, D-97074WürzburgGermany
  • Email
  • Other articles by this author:
  • De Gruyter OnlineGoogle Scholar
Published Online: 2019-12-03 | DOI: https://doi.org/10.1515/bfp-2019-2083

Zusammenfassung

Die Erkennung handschriftlicher Artefakte wie Unterstreichungen in Buchdrucken ermöglicht Rückschlüsse auf das Rezeptionsverhalten und die Provenienzgeschichte und wird auch für eine OCR benötigt. Dabei soll zwischen handschriftlichen Unterstreichungen und waagerechten Linien im Druck (z. B. Trennlinien usw.) unterschieden werden, da letztere nicht ausgezeichnet werden sollen. Im Beitrag wird ein Ansatz basierend auf einem auf Unterstreichungen trainierten Neuronalen Netz gemäß der U-Net Architektur vorgestellt, dessen Ergebnisse in einem zweiten Schritt mit heuristischen Regeln nachbearbeitet werden. Die Evaluationen zeigen, dass Unterstreichungen sehr gut erkannt werden, wenn bei der Binarisierung der Scans nicht zu viele Pixel der Unterstreichung wegen geringem Kontrast verloren gehen. Zukünftig sollen die Worte oberhalb der Unterstreichung mit OCR transkribiert werden und auch andere Artefakte wie handschriftliche Notizen in alten Drucken erkannt werden.

Abstract

The recognition of handwritten artefacts like underlines in historical printings allows inference on the reception and provenance history and is necessary for OCR (optical character recognition). In this context it is important to differentiate between handwritten and printed lines, since the latter are common in printings, but should be ignored. We present an approach based on neural nets with the U-Net architecture, whose segmentation results are post processed with heuristic rules. The evaluations show that handwritten underlines are very well recognized if the binarisation of the scans is adequate. Future work includes transcription of the underlined words with OCR and recognition of other artefacts like handwritten notes in historical printings.

Schlüsselwörter: Brüder Grimm Privatbibliothek; Erkennung handschriftlicher Artefakte; Convolutional Neural Network; regelbasierte Nachbearbeitung

Keywords: Grimm brothers personal library; handwritten artefact recognition; convolutional neural network; rule based post processing

Literaturverzeichnis

  • Bai, Z.-L.; Huo, Q. (2004): Underline Detection and Removal in a Document Image Using Multiple Strategies, In: Proc. of the 17th int. conf. on pattern recognition (ICPR04), 2, 578–81.Google Scholar

  • Denecke, L.; Teitge, I. (1989): Die Bibliothek der Brüder Grimm. Annotiertes Verzeichnis des festgestellten Bestandes. Weimar/Stuttgart.Google Scholar

  • Friemel, B. (2005): Die Grimm-Bibliothek. In: Die Brüder Grimm in Berlin. Bilder, Studien, Dokumente. [Ausstellungskatalog], 97–114.Google Scholar

  • Kaur, T.; Mittal, R. (2016): Hand-Drawn Annotation and Underline Detection and Removal in Scanned Documents Using Artificial Neural Network & Fuzzy C-Means Clustering. In: European Journal of Advances in Engineering and Technology, 3 (1), 12–20.Google Scholar

  • Long, J.; Shelhamer, E.; Darrell, T. (2015): Fully convolutional networks for semantic segmentation. In: Proc. of the IEEE Conference on Computer Vision and Pattern Recognition, 3431–40.Google Scholar

  • Pratihar, S.; Bhowmick, P.; Sural, S.; Mukhopadhyay, J. (2012): Detection and removal of hand-drawn underlines in a document image using approximate digital straightness. In: Proc. Workshop on Document Analysis and Recognition (DAR ‘12), 124–31.Google Scholar

  • Rauch, Y. (2018): Verborgene, verteilte und rekonstruierte Büchersammlungen: Gelehrtenbibliotheken an der Friedrich-Wilhelms-Universität zu Berlin. In: Autorschaft und Bibliothek, Göttingen, 62–81.Google Scholar

  • Rovina, Bahila, S.; Kumar, S. (2015): A Review: Detection And Removal Of Hand-Drawn Annotation Lines. In: Int. Journal of Advances in Science Engineering and Technology (IJASEAT), 3 (3), 136–40.Google Scholar

  • Wick, C.; Puppe, F. (2018): Fully Convolutional Neural Networks for Page Cegmentation of Historical Document Images. In: 13th IAPR Int. Workshop on Document Analysis Systems (DAS), 287–92.Google Scholar

About the article

Alexander Gehrke

Universität Würzburg, Lehrstuhl für Künstliche Intelligenz und Angewandte Informatik, Am Hubland, D-97074 Würzburg.

Nico Balbach

Universität Würzburg, Lehrstuhl für Künstliche Intelligenz und Angewandte Informatik, Am Hubland, D-97074 Würzburg.

Yong-Mi Rauch

Humboldt Universität Berlin, Universitätsbibliothek, Unter den Linden 6, D-10099 Berlin.

Andreas Degkwitz

Humboldt Universität Berlin, Universitätsbibliothek, Unter den Linden 6, D-10099 Berlin.

Frank Puppe

Universität Würzburg, Lehrstuhl für Künstliche Intelligenz und Angewandte Informatik, Am Hubland, D-97074 Würzburg.


Published Online: 2019-12-03

Published in Print: 2019-11-30


Citation Information: Bibliothek Forschung und Praxis, Volume 43, Issue 3, Pages 447–452, ISSN (Online) 1865-7648, ISSN (Print) 0341-4183, DOI: https://doi.org/10.1515/bfp-2019-2083.

Export Citation

© 2019 Walter de Gruyter GmbH, Berlin/Boston.Get Permission

Comments (0)

Please log in or register to comment.
Log in