Skip to content
Licensed Unlicensed Requires Authentication Published by De Gruyter April 24, 2014

Automatische Extraktion von Fachterminologie aus Volltexten

Automatic extraction of technical terms from full texts

  • Juliane Bredack EMAIL logo and Klaus Lepsky
From the journal ABI Technik

Zusammenfassung

Fachterminologie in wissenschaftlichen Texten liegt häufig in Form von Phrasen oder Mehrwortgruppen vor. Vorgestellt wird ein algorithmisches Verfahren zur Identifikation und Extraktion fachtermi­nologischer Mehrwortgruppen. Besonderer Schwerpunkt ist die Einbindung von Funktionswörtern der deutschen Sprache, um die Extraktion komplexer Mehrwortkonstruktionen zu ermöglichen. Eingesetzt wurde das automatische Indexierungssystem Lingo. Die Ergebnisse für eine Extraktion kunsthistorischer Fachterminologie aus dem Reallexikon zur Deutschen Kunstgeschichte belegen die Tauglichkeit des Verfahrens.

Abstract

Technical terminology can often be found in scientific texts as phrases or multi-word groups. We present an algorithmic method for detecting and extracting technical multi-word groups. A special focus lies on function words of the German language in order to allow the extraction of complex multi-word constructions. For the study Lingo, an automatic indexing system, was used. The potential of the method is shown by the results of an extraction of art-historical terminology from the Reallexikon zur Deutschen Kunstgeschichte.

Published Online: 2014-4-24
Published in Print: 2014-4-1

© 2014 by Walter de Gruyter Berlin Boston

Downloaded on 29.3.2024 from https://www.degruyter.com/document/doi/10.1515/abitech-2014-0002/html
Scroll to top button