Zusammenfassung
Fachterminologie in wissenschaftlichen Texten liegt häufig in Form von Phrasen oder Mehrwortgruppen vor. Vorgestellt wird ein algorithmisches Verfahren zur Identifikation und Extraktion fachterminologischer Mehrwortgruppen. Besonderer Schwerpunkt ist die Einbindung von Funktionswörtern der deutschen Sprache, um die Extraktion komplexer Mehrwortkonstruktionen zu ermöglichen. Eingesetzt wurde das automatische Indexierungssystem Lingo. Die Ergebnisse für eine Extraktion kunsthistorischer Fachterminologie aus dem Reallexikon zur Deutschen Kunstgeschichte belegen die Tauglichkeit des Verfahrens.
Abstract
Technical terminology can often be found in scientific texts as phrases or multi-word groups. We present an algorithmic method for detecting and extracting technical multi-word groups. A special focus lies on function words of the German language in order to allow the extraction of complex multi-word constructions. For the study Lingo, an automatic indexing system, was used. The potential of the method is shown by the results of an extraction of art-historical terminology from the Reallexikon zur Deutschen Kunstgeschichte.
© 2014 by Walter de Gruyter Berlin Boston