Jump to ContentJump to Main Navigation
Show Summary Details
More options …

Zeitschrift für germanistische Linguistik

Deutsche Sprache in Gegenwart und Geschichte

Ed. by Ágel, Vilmos / Feilke, Helmuth / Linke, Angelika / Lüdeling, Anke / Tophinke, Doris


CiteScore 2018: 0.30

SCImago Journal Rank (SJR) 2018: 0.169
Source Normalized Impact per Paper (SNIP) 2018: 0.571

Online
ISSN
1613-0626
See all formats and pricing
More options …
Volume 47, Issue 1

Issues

Redewiedergabe – Schritte zur automatischen Erkennung

Speech, Thought and Writing Representation – Towards Automatic Detection

Dr. Annelen Brunner
Published Online: 2019-04-10 | DOI: https://doi.org/10.1515/zgl-2019-0007

Abstract

This contribution presents a quantitative approach to speech, thought and writing representation (ST&WR) and steps towards its automatic detection. Automatic detection is necessary for studying ST&WR in a large number of texts and thus identifying developments in form and usage over time and in different types of texts. The contribution summarizes results of a pilot study: First, it describes the manual annotation of a corpus of short narrative texts in relation to linguistic descriptions of ST&WR. Then, two different techniques of automatic detection – a rule-based and a machine learning approach – are described and compared. Evaluation of the results shows success with automatic detection, especially for direct and indirect ST&WR.

Literatur

  • Breiman, Leo (2001): Random Forests. Machine Learning 45(1), 5–32.Web of ScienceGoogle Scholar

  • Breiman, Leo & Adele Cutler (o. J.): Random Forests. https://www.stat.berkeley.edu/~breiman/RandomForests (6.12.2018).

  • Brunner, Annelen (2015): Automatische Erkennung von Redewiedergabe. Ein Beitrag zur quantitativen Narratologie (Narratologia 47). Berlin u. a.: De Gruyter.Google Scholar

  • Brunner, Annelen, Stefan Engelberg, Fotis Jannidis, Ngoc Duyen Tanja Tu & Lukas Weimer (2018): Projektvorstellung: Redewiedergabe. Eine literatur- und sprachwissenschaftliche Korpusanalyse. Konferenzabstracts der DHd 2018. Kritik der digitalen Vernunft, 458–460. Köln. http://dhd2018.uni-koeln.de/wp-content/uploads/boa-DHd2018-web-ISBN.pdf (6.12.2018).

  • Chiticariu, Laura, Yunyao Li & Frederick R Reiss (2013): Rule-Based Information Extraction is Dead! Long Live Rule-Based Information Extraction Systems! Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing, 827–832. Seattle. http://www.aclweb.org/anthology/D13-1079 (6.12.2018).

  • Chollet, François (2018): Deep Learning with Python. Shelter Island: Manning.Google Scholar

  • Cunningham, Hamish, Valentin Tablan, Angus Roberts & Kalina Bontcheva (2013): Getting More Out of Biomedical Documents with GATE’s Full Lifecycle Open Source Text Analytics. PLoS Computational Biology 9(2). https://doi.org/10.1371/journal.pcbi.1002854 (6.12.2018).Web of Science

  • Eisenberg, Peter (2013): Grundriss der deutschen Grammatik. Bd. 2: Der Satz / unter Mitarb. von Rolf Thieroff. 4. aktualisierte und überarb. Aufl. Stuttgart, Weimar: Metzler.Google Scholar

  • Estabrooks, Andrew, Taeho Jo & Nathalie Japkowicz (2004): A Multiple Resampling Method for Learning from Imbalanced Data Sets. Computational Intelligence 20(1). 18–36. https://doi.org/10.1111/j.0824-7935.2004.t01-1-00228.x (6.12.2018).

  • Fabricius-Hansen, Cathrine (2001): Wessen Redehintergrund? Reportive Modalität aus textorientierter kontrastiver Sicht (Deutsch – Norwegisch – Englisch). Reports of the project Languages in Contrast (Språk in kontrast) 14. 1–27.Google Scholar

  • Fludernik, Monika (1993): The fictions of language and the languages of fiction. The linguisitic representation of speech and consciousness. London, New York: Routledge.Google Scholar

  • Genette, Gérard (2010): Die Erzählung (UTB 8083). 3., durchges. und korrigierte Aufl. Paderborn: Fink.Google Scholar

  • Gius, Evelyn & Janina Jacke (2016): Zur Annotation narratologischer Kategorien der Zeit. Guidelines zur Nutzung des CATMA-Tagsets (Version 2.0). Hamburg. http://heureclea.de/wp-content/uploads/2016/11/guidelinesV2.pdf (6.12.2018).

  • Harras, Gisela, Edeltraud Winkler, Sabine Erb & Kristel Proost (2004): Handbuch deutscher Kommunikationsverben. Teil 1: Wörterbuch. Berlin u. a.: De Gruyter.Google Scholar

  • Helbig, Gerhard & Joachim Buscha (2011): Deutsche Grammatik. Ein Handbuch für den Ausländerunterricht. Berlin u. a.: Langenscheidt.Google Scholar

  • Hirschmann, Hagen (2015): Modifikatoren im Deutschen. Ihre Klassifizierung und varietätenspezifische Verwendung (Studien Zur Deutschen Grammatik 89). Tübingen: Stauffenburg.Google Scholar

  • Ide, Nancy & James Pustejovsky (Hrsg.) (2017): Handbook of Linguistic Annotation. Vol. 1. Dodrecht: Springer.Google Scholar

  • Jannidis, Fotis, Leonard Konle, Albin Zehe, Andreas Hotho & Markus Krug (2018): Analysing Direct Speech in German Novels. Konferenzabstracts der DHd 2018. Kritik der Digitalen Vernunft, 114–118. Köln. http://dhd2018.uni-koeln.de/wp-content/uploads/boa-DHd2018-web-ISBN.pdf (6.12.2018).

  • Jockers, Mattew (2013): Macroanalysis. Digital Methods and Literary History. Champaign: University of Illinois Press.Google Scholar

  • Kaufmann, Gerhard (1976): Die indirekte Rede und mit ihr konkurrierende Formen der Redeerwähnung (Heutiges Deutsch. Reihe III: Linguistisch-didaktische Untersuchungen des Goethe-Instituts 1). München: Hueber.Google Scholar

  • Leech, Geoffrey & Mick Short (2013): Style in fiction. A linguistic introduction to English fictional prose. 2. Aufl. London u. a.: Routledge.Google Scholar

  • Liaw, Andy & Matthew Wiener (2002): Classification and Regression by randomForest. R News 2/3. 18–22. https://www.researchgate.net/publication/228451484_Classification_and_Regression_by_RandomForest (6.12.2018).

  • Manning, Christopher D., Prabhakar Raghavan & Hinrich Schütze (2008): Introduction to Information Retrieval. New York: Cambridge University Press.Google Scholar

  • Martínez, Matías & Michael Scheffel (2016): Einführung in die Erzähltheorie (C. H. Beck Studium). 10. Aufl. München: C. H. Beck.Google Scholar

  • Moretti, Franco (2005): Graphs, Maps, Trees. Abstract Models for a Literary History. London: Verso.Google Scholar

  • Schiller, Anne, Simone Teufel, Christine Stöckert & Christine Thielen (1999): Guidelines für das Tagging deutscher Textkorpora mit STTS (Kleines und großes Tagset). Institut für Maschinelle Sprachverarbeitung (Universität Stuttgart) / Seminar für Sprachwissenschaft (Universität Tübingen). http://www.ims.uni-stuttgart.de/projekte/corplex/TagSets/stts-1999.pdf (6.12.2018).

  • Schmid, Helmut (1994): Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of the International Conference on New Methods in Language Processing. Manchester, UK. http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger1.pdf (6.12.2018)

  • Schmid, Helmut (1995): Improvements on Part-of-Speech Tagging with an Application to German. Proceedings of the ACL SIGDAT-Workshop. Dublin, Ireland. http://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger2.pdf (6.12.2018)

  • Schmid, Helmut & Florian Laws (2008): Estimation of Conditional Probabilities With Decision Trees and an Application to Fine-Grained POS Tagging. COLING 2008. Manchester, UK. http://www.cis.uni-muenchen.de/~schmid/papers/Schmid-Laws.pdf (6.12.2018)

  • Schöch, Christof, Daniel Schlör, Stefanie Popp, Annelen Brunner & José Calvo Tello (2016): Straight talk! Automatic Recognition of Direct Speech in Nineteenth-century French Novels. Digital Humanities 2016, 346–353. Jagiellonian University & Pedagogical University, Kraków. http://dh2016.adho.org/static/data/132.html (6.12.2018).

  • Semino, Elena & Mick Short (2004): Corpus stylistics. Speech, writing and thought presentation in a corpus of English writing. London, New York: Routledge.Google Scholar

  • Stanzel, Franz K. 2008. Theorie des Erzählens (UTB 904). 8. Aufl. Göttingen: Vandenhoeck & Ruprecht.Google Scholar

  • Steen, Gerard J., Aletta G. Dorst, J. Berenike Herrmann, Anna A. Kaal, Tina Krennmayr & Trijntja Pasma (2010): A Method for Linguistic Metaphor Identification. Amsterdam, Philadelphia: John Benjamins.Google Scholar

  • Strecker, Bruno (2009): Er sagte, dass er aus Ulm kommt, komme, käme oder kommen würde? – Mit dass eingeleitete indirekte Redewiedergabe (Teil 1). https://grammis.ids-mannheim.de/fragen/160 (6.12.2018).

  • Wehde, Susanne (2000): Typographische Kultur: eine zeichentheoretische und kulturgeschichtliche Studie zur Typographie und ihrer Entwicklung (Studien und Texte zur Sozialgeschichte der Literatur 69). Tübingen: Niemeyer.Google Scholar

  • Weinrich, Harald (2005): Textgrammatik. 3. Aufl. Hildesheim u. a.: Olms.Google Scholar

  • Witten, Ian A., Eibe Frank & Mark A. Hall. 2011. Data Mining. Practical Machine Learning Tools and Techniques. 3. Aufl. Amsterdam u. a.: Morgan Kaufmann.Google Scholar

  • Wöllstein, Angelika & Dudenredaktion (Hrsg.) (2016): Duden. Die Grammatik. 9. Aufl. Bd. 4. Berlin: Dudenverlag.Google Scholar

  • Zifonun, Gisela, Ludger Hoffmann & Bruno Strecker (1997): Grammatik der deutschen Sprache (Schriften des Instituts für Deutsche Sprache 7). Bd. 3. Berlin u. a.: De Gruyter.Google Scholar

About the article

Published Online: 2019-04-10

Published in Print: 2019-04-08


Citation Information: Zeitschrift für germanistische Linguistik, Volume 47, Issue 1, Pages 216–248, ISSN (Online) 1613-0626, ISSN (Print) 0301-3294, DOI: https://doi.org/10.1515/zgl-2019-0007.

Export Citation

© 2019 Walter de Gruyter GmbH, Berlin/Boston.Get Permission

Comments (0)

Please log in or register to comment.
Log in