Skip to content
Licensed Unlicensed Requires Authentication Published by De Gruyter March 30, 2015

Maschinelle Textanalyse im Zeichen von Big Data und Data-driven Turn – Überblick und Desiderate

  • Noah Bubenhofer EMAIL logo and Joachim Scharloth

Literatur

Anderson, Chris (2008): The End of Theory: The Data Deluge Makes the Scientific Method Obsolete. In: Wired Magazine 16(07). Abgerufen am 4.9.2014 von http://archive.wired.com/science/discoveries/magazine/16-07/pb_theory.Search in Google Scholar

Anthes, Gary (2010): Topic Models Vs. Unstructured Data. In: Communications of the ACM (53), 16–18.Search in Google Scholar

Antos, Gerd (1989): Textproduktion. Ein einführender Überblick. In: Antos, Gerd/Krings, Hans P. (Hg.): Textproduktion: ein interdisziplinarer Forschungsüberblick. Tübingen, 5–57.10.1515/9783110962109.5Search in Google Scholar

Atkins, Sue/Clear, Jeremy/Ostler, Nicholas (1992): Corpus Design Criteria. In: Literary and Linguistic Computing 7(1), 1–16.10.1093/llc/7.1.1Search in Google Scholar

Bamman, David/Underwood, Ted/Smith, Noah (2014): “A Bayesian Mixed Effects Model of Literary Character”, ACL, 370–379.10.3115/v1/P14-1035Search in Google Scholar

Bartsch, Sabine (2004): Structural and functional properties of collocations in english: a corpus study of lexical and pragmatic constraints on lexical co-occurrence. Tübingen.Search in Google Scholar

Bauer, Matthias/Ernst, Christoph (2010): Diagrammatik/Einführung in ein kultur- und medienwissenschaftliches Forschungsfeld. Bielefeld.10.1515/9783839412978Search in Google Scholar

Belica, Cyril/Steyer, Kathrin (2008): Korpusanalytische Zugänge zu sprachlichem Usus. In: Vachková, Marie (Hg.): Beiträge zur bilingualen Lexikographie. Prag, 7–24.Search in Google Scholar

Beaugrande, Robert-Alain de/Ulrich Dressler, Wolfgang (1981): Einführung in die Textlinguistik (= Konzepte der Sprach- und Literaturwissenschaft 28). Tübingen.10.1515/9783111349305Search in Google Scholar

Benzécri, Jean-Paul (1973): L’Analyse des correspondants: introduction, théorie, applications diverses notamment à l’analyse des questionnaires, programmes de calcul. [S.l.].Search in Google Scholar

Berry, David M. (Hg.) (2012): Understanding Digital Humanities. Abgerufen am 4.3.2014 von http://slub.eblib.com/patron/FullRecord.aspx?p=868344.10.1057/9780230371934Search in Google Scholar

Berry, Michael W./Kogan, Jacob (2010): Text Mining Applications and Theory. Hoboken, NJ.10.1002/9780470689646Search in Google Scholar

Biber, Douglas/Jones, James K. (2005): Merging corpus linguistic and discourse analytic research goals: Discourse units in biology research articles. In: Corpus Linguistics and Linguistic Theory 1(2), 151–182.10.1515/cllt.2005.1.2.151Search in Google Scholar

Blei, David M./Ng, Andrew Y./Jordan, Michael I. (2003): Latent dirichlet allocation. In: Journal of Machine Learning Research (3), 993–1022.Search in Google Scholar

Bluhm, Claudia/Deissler, Dirk/Scharloth, Joachim et al. (2000): Linguistische Diskursanalyse: Überblick, Probleme, Perspektiven. In: Sprache und Literatur in Wissenschaft und Unterricht 88, 3–19.10.30965/25890859-031-02-90000003Search in Google Scholar

Bögel, Tina/Hautli-Janisz, Annette/Sulger, Sebastian/Butt, Miriam (2014): Automatic Detection of Causal Relations in German Multilogs. In: Proceedings of the EACL 2014 Workshop on Computational Approaches to Causality in Language (CAtoCL), Association for Computational Linguistics. Gothenburg, Sweden, 20–27.10.3115/v1/W14-0703Search in Google Scholar

Bondi, Marina/Scott, Mike (2010): Keyness in texts. Amsterdam, Philadelphia.10.1075/scl.41Search in Google Scholar

Bubenhofer, Noah (2015): Kollokationen, n-Gramme, Mehrworteinheiten. In: Roth, Kersten/Wengeler, Martin/Ziem, Alexander (Hg.): Handbuch Sprache in Politik und Gesellschaft. Berlin, New York (Sprachwissen).Search in Google Scholar

Bubenhofer, Noah (2009): Sprachgebrauchsmuster. Korpuslinguistik als Methode der Diskurs- und Kulturanalyse. Berlin, New York (Sprache und Wissen, 4).Search in Google Scholar

Bubenhofer, Noah/Dussa, Tobias/Ebling, Sarah et al. (2009): „So etwas wie eine Botschaft.“ Korpuslinguistische Analysen der Bundestagswahl 2009. Sprachreport (4), 2–10.Search in Google Scholar

Bubenhofer, Noah/Konopka, Marek/Schneider, Roman (2014): Präliminarien einer Korpusgrammatik. Tübingen (Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache CLIP, 4).Search in Google Scholar

Bubenhofer, Noah/Scharloth, Joachim (2011): Korpuspragmatische Analysen alpinistischer Literatur. In: Elmiger, Daniel/Kamber, Alain (Hg.): La linguistique de corpus – de l’analyse quantitative à l’interpretation qualitative/Korpuslinguistik – von der quantitativen Analyse zur qualitativen Interpretatino. Neuchâtel (Travaux neuchâtelois de linguistique, 55), 241–259.10.26034/tranel.2011.2801Search in Google Scholar

Bunescu, Razvan C./Mooney, Raymond J. (2006): Extracting Relations from Text: From Word Sequences to Dependency Paths. In: Kao, Anne/Poteet, Stephen R. (Hg.): Natural Language Processing and Text Mining. London, 29–44.Search in Google Scholar

Burger, Harald (1998): Phraseologie. Eine Einführung am Beispiel des Deutschen. Berlin (Grundlagen der Germanistik, 36).Search in Google Scholar

Busse, Dietrich/Hermanns, Fritz/Teubert, Wolfgang (Hg.) (1994): Begriffsgeschichte und Diskursgeschichte. Methodenfragen und Forschungsergebnisse der historischen Semantik. Opladen.Search in Google Scholar

Busse, Dietrich/Teubert, Wolfgang (2013): Linguistische Diskursanalyse: neue Perspektiven. Auflage: 2013. Wiesbaden.10.1007/978-3-531-18910-9Search in Google Scholar

Brinker, Klaus (Hg.) (1991): Aspekte der Textlinguistik (= Germanistische Linguistik 106/107). Hildesheim, Zürich, New York.Search in Google Scholar

Carstensen, Kai-Uwe/Ebert, Christian/Ebert, Cornelia et al. (2010): Computerlinguistik und Sprachtechnologie. 3. Aufl. Heidelberg, Berlin. Abgerufen am 14.1.2013 von http://www.springer.com/spektrum+akademischer+verlag/informatik/informatik+und+it+%C3%BCbergreifend/book/978-3-8274-2023-7.10.1007/978-3-8274-2224-8Search in Google Scholar

Carstensen, Kai-Uwe/Ebert, Christian/Ebert, Cornelia et al. (2009): Computerlinguistik und Sprachtechnologie: Eine Einführung. 3. überarb. u. erw. Aufl. München.10.1007/978-3-8274-2224-8Search in Google Scholar

Chen, Chun-houh/Härdle, Wolfgang/Unwin, Antony (Hg.) (2008): Handbook of data visualization. (Springer handbooks of computational statistics). Abgerufen am 4.3.2014 von http://sfx.ethz.ch/sfx_locater?sid=ALEPH:EBI01&genre=book&isbn=9783540330370&id=doi:10.1007/978-3-540-33037-0 Online via SFX.10.1007/978-3-540-33037-0Search in Google Scholar

Cheng, Winnie/Greaves, Chris/Warren, Martin (2006): From N-Gram to Skipgram to Concgram. In: International Journal of Corpus Linguistics. 11, 411–433 (23).10.1075/ijcl.11.4.04cheSearch in Google Scholar

Dürscheid, Christa/Elspaß, Stephan/Ziegler, Arne (2011): Grammatische Variabilität im Gebrauchsstandard – das Projekt „Variantengrammatik des Standarddeutschen“. In: Konopka, Marek/Kubczak, Jacqueline/Waßner, Ulrich H. (Hg.): Grammatik und Korpora 2009. Tübingen, 123–140.Search in Google Scholar

Evert, Stefan (2009): 58. corpora and collocations. In: Lüdeling, Anke/Kytö, Merja (Hg.): Corpus Linguistics. Berlin, New York (Handbücher zur Sprach- und Kommunikationswissenschaft, 29), 1212–1248.Search in Google Scholar

Feilke, Helmuth (2000): Die pragmatische Wende in der Textlinguistik. In: Brinker, Klaus (Hg.): Text- und Gesprächslinguistik/Linguistics of Text and Conversation. Berlin, New York (Handbücher zur Sprach- und Kommunikationswissenschaft/Handbooks of Linguistics and Communication Science, 16), 64–82.10.1515/9783110194067-010Search in Google Scholar

Feilke, Helmuth (1996): Sprache als soziale Gestalt. Ausdruck, Prägung und die Ordnung der sprachlichen Typik. Frankfurt am Main.Search in Google Scholar

Feilke, Helmuth (2003): Textroutine, Textsemantik und sprachliches Wissen. In: Linke, Angelika/Ortner, Hanspeter/Portmann-Tselikas, Paul R. (Hg.): Sprache und mehr. Ansichten einer Linguistik der sprachlichen Praxis. Tübingen (Reihe Germanistische Linguistik), 209–230.10.1515/9783110911985.209Search in Google Scholar

Feilke, Helmuth/Linke, Angelika (2008): Oberfläche und Performanz – Zur Einleitung. In: Feilke, Helmuth/Linke, Angelika (Hg.): Oberfläche und Performanz. Berlin, New York, 3–18.Search in Google Scholar

Fix, Ulla (2008): Nichtsprachliches als Textfaktor: Medialität, Materialität, Lokalität. In: Zeitschrift für Germanistische Linguistik 36/3, 343–354.10.1515/ZGL.2008.031Search in Google Scholar

Firth, John Rupert (1957): Modes of meaning. In: Papers in Linguistics 1934–1951. London, 190–215.Search in Google Scholar

Floridi, Luciano (2008): Foundations of Information Ethics. In: The Handbook of Information and Computer Ethics. Hg v. Kenneth Einar Himma und Herman T. Tavani. Hoboken, New Jersey, 3–23.10.1002/9780470281819.ch1Search in Google Scholar

Francis, Nelson W./Kučera, Henry (1964): Brown Corpus Manual. Manual of Information to Accompany A Standard Corpus of Present-Day Edited American English for Use with Digital Computers. Providence, Rhode Island. Abgerufen am 4.3.2014 von http://www.hit.uib.no/icame/brown/bcm.html.Search in Google Scholar

Friendly, Michael (2005): Milestones in the History of Data Visualization: A Case Study in Statistical Historiography. In: Weihs, Claus/Gaul, Wolfgang (Hg.): Classification: The Ubiquitous Challenge. New York, 34–52.10.1007/3-540-28084-7_4Search in Google Scholar

Geyken, Alexander (2007): The dwds corpus: a reference corpus for the german language of the 20th century. In: Fellbaum, Christiane (Hg.): Collocations and Idioms: Linguistic, lexicographic, and computational aspects. London, 23–42.Search in Google Scholar

Graham, Shawn/Weingart, Scott/Milligan, Ian (2012): Getting Started with Topic Modeling and MALLET. Abgerufen am 4.3.2014 von http://programminghistorian.org/lessons/topic-modeling-and-mallet.10.46430/phen0017Search in Google Scholar

Harweg, Roland (1968): Pronomina und Textkonstitution. München.Search in Google Scholar

Hausmann, Franz Josef (1985): Kollokationen im deutschen Wörterbuch. Ein Beitrag zur Theorie des lexikographischen Beispiels. In: Bergenholtz, Henning/Mugdan, Joachim (Hg.): Lexikographie und Grammatik. Akten des Essener Kolloquiums zur Grammatik im Wörterbuch 1984. Tübingen (Lexicographica Series Maior), 118–129.Search in Google Scholar

Hermanns, Fritz (1995): Sprachgeschichte als Mentalitätsgeschichte. Überlegungen zu Sinn und Form und Gegenstand historischer Semantik. In: Gardt, Andreas/Mattheier, Klaus/Reichmann, Oskar (Hg.): Sprachgeschichte des Neuhochdeutschen. Gegenstände, Methoden, Theorien. Tübingen, 69–101.10.1515/9783110918762.69Search in Google Scholar

Heyer, Gerhard/Quasthoff, Uwe/Wittig, Thomas (2005): Wissensrohstoff Text. Text Mining: Konzepte, Algorithmen, Ergebnisse. Bochum: W3L.Search in Google Scholar

Koppel, Mosche/Schler, Jonathan/Argamon, Shlomo (2009): “Computational Methods in Au­thorship Attribution”, JASIST 60 (1): 9–26, doi:10.1002/asi.20961.10.1002/asi.20961Search in Google Scholar

Keim, Daniel A./Kohlhammer, Jörn/Ellis, Geoffrey et al. (2010): Mastering the information age – solving problems with visual analytics. Goslar. Abgerufen am 4.3.2014 von http://www.vismaster.eu/book/.Search in Google Scholar

Krämer, Sybille (2009): Operative Bildlichkeit. Von der ,Grammatologie‘ zu einer ,Diagrammatologie‘? In: Heßler, Martina/Mersch, Dieter (Hg.): Logik des Bildlichen. Zur Kritik der ikonischen Vernunft. Bielefeld (Metabasis, 2), 94–123.Search in Google Scholar

Kupietz, Marc/Belica, Cyril/Keibel, Holger et al. (2010): The german reference corpus dereko: a primordial sample for linguistic research. In: Proceedings of the 7th conference on International Language Resources and Evaluation. Valletta, Malta, 1848–1854.Search in Google Scholar

Kupietz, Marc/Keibel, Holger (2008): Gebrauchsbasierte Grammatik: Statistische Regelhaftigkeit. In: Konopka, Marek/Strecker, Bruno (Hg.): Deutsche Grammatik. Regeln, Normen, Sprachgebrauch. Berlin, New York, 33–50.Search in Google Scholar

Manning, Christopher D./Schütze, Hinrich (2002): Foundations of statistical natural language processing. 5. Aufl. Cambridge, Massachusetts.Search in Google Scholar

Mehler, Alexander/Wolff, Christian (2005): Einleitung: Perspektiven und Positionen des Text Mining. In: LDV-Forum. 20(1), 1–18.10.21248/jlcl.20.2005.67Search in Google Scholar

Michel, Jean-Baptiste/Shen, Yuan Kui/Aiden, Aviva Presser et al. (2011): Quantitative Analysis of Culture Using Millions of Digitized Books. In: Science 331(6014), 176–182.Search in Google Scholar

Perkuhn, Rainer/Belica, Cyril (2006): Korpuslinguistik – Das unbekannte Wesen. Oder Mythen über Korpora und Korpuslinguistik. In: Sprachreport 22(1), 2–8.Search in Google Scholar

Perkuhn, Rainer/Keibel, Holger/Kupietz, Marc (2012): Korpuslinguistik. Stuttgart.10.36198/9783838534336Search in Google Scholar

Rieder, Bernhard/Röhle, Theo (2012): Digital Methods: Five Challenges. In: Berry, David M. (Hg.): Understanding Digital Humanities. Basingstoke, 67–84.Search in Google Scholar

Risch, John/Kao, Anne/Poteet, Stephen et al. (2008): Text visualization for visual text analytics. In: Simoff, Simeon/Böhlen, Michael/Mazeika, Arturas (Hg.): Visual Data Mining. Berlin, Heidelberg (Lecture Notes in Computer Science), 154–171.10.1007/978-3-540-71080-6_11Search in Google Scholar

Rohrdantz, Christian/Hautli, Annette/Mayer, Thomas et al. (2012): Towards tracking semantic change by visual analytics. Abgerufen am 4.3.2013 von http://kops.ub.uni-konstanz.de/handle/urn:nbn:de:bsz:352-186381.Search in Google Scholar

Rohrdantz, Christian/Koch, Steffen/Jochim, Charles et al. (2010): Visuelle Textanalyse. In: Informatik-Spektrum 33(6), 601–611, doi: 10.1007/s00287-010-0483-x.10.1007/s00287-010-0483-xSearch in Google Scholar

Schäfer, Roland/Bildhauer, Felix (2012): Building Large Corpora from the Web Using a New Efficiant Tool Chain. In: Calzolari, Nicoletta/Choukri, Khalid/Declerck, Thierry et al. (Hg.): Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC’12). Istanbul, 486–493.Search in Google Scholar

Scharloth, Joachim/Bubenhofer, Noah (2011): Datengeleitete Korpuspragmatik: Korpusvergleich als Methode der Stilanalyse. In: Felder, Ekkehard/Müller, Marcus/Vogel, Friedemann (Hg.): Korpuspragmatik. Thematische Korpora als Basis diskurslinguistischer Analysen von Texten und Gesprächen. Berlin, New York, 195–230.10.1515/9783110269574.195Search in Google Scholar

Scharloth, Joachim/Eugster, David/Bubenhofer, Noah (2013): Das Wuchern der Rhizome. Linguistische Diskursanalyse und Data-driven Turn. In: Busse, Dietrich/Teubert, Wolfgang (Hg.): Linguistische Diskursanalyse. Neue Perspektiven. Wiesbaden, 345–380.Search in Google Scholar

Schmidt, Siegfried J. (1976): Texttheorie. Probleme einer Linguistik der sprachlichen Kommunikation (= UTB 202). 2. Auflage. München.Search in Google Scholar

Schiller, Anne/Teufel, Simone/Thielen, Christine (1995): Guidelines für das Tagging deutscher Textcorpora mit STTS. Stuttgart.Search in Google Scholar

Scott, Mike/Tribble, Chris (2006): Textual patterns: key words and corpus analysis in language education.10.1075/scl.22Search in Google Scholar

Sinclair, John (1991): Corpus, Concordance, Collocation. Oxford.Search in Google Scholar

Spitzmüller, Jürgen/Warnke, Ingo H. (2011): Diskurslinguistik: eine Einführung in Theorien und Methoden der transtextuellen Sprachanalyse.10.1515/9783110229967Search in Google Scholar

Stachowiak, Herbert (1973): Allgemeine Modelltheorie. Wien, New York: Springer-Verlag.10.1007/978-3-7091-8327-4Search in Google Scholar

Stamatatos, Efstathios (2009): A Survey of Modern Authorship Attribution Methods Journal of the American Society for Information Science and Technology, 60(3), 538–556.10.1002/asi.21001Search in Google Scholar

Stefanowitsch, Anatol/Gries, Stefan Thomas (2003): Collostructions: Investigating the Interaction of Words and Constructions. In: International Journal of Corpus Linguistics. 8(2), 209–243.10.1075/ijcl.8.2.03steSearch in Google Scholar

Steyer, Kathrin (2000): Usuelle Wortverbindungen des Deutschen. Linguistisches Konzept und lexikografische Möglichkeiten. In: Deutsche Sprache 28, 101–125.Search in Google Scholar

Steyer, Kathrin (2013): Usuelle Wortverbindungen: Zentrale Muster des Sprachgebrauchs aus korpusanalytischer Sicht. Tübingen.Search in Google Scholar

Steyer, Kathrin/Brunner, Annelen (2009): Das UWV-Analysemodell. Eine korpusgesteuerte Methode zur linguistischen Systematisierung von Wortverbindungen. (Online publizierte Arbeiten zur Linguistik OPAL, 1).Search in Google Scholar

Steyer, Kathrin/Lauer, Meike (2007): „Corpus-Driven“: Linguistische Interpretation von Kookkurrenzbeziehungen. In: Eichinger, Ludwig M./Kämper, Heidrun (Hg.): Sprach-Perspektiven. Germanistische Linguistik und das Institut für Deutsche Sprache. Tübingen (Studien zur deutschen Sprache), 493–509.Search in Google Scholar

Stjernfelt, Frederik (2007): Diagrammatology: an investigation on the borderlines of phenomenology, ontology, and semiotics. Dordrecht/London.Search in Google Scholar

Teubert, Wolfgang (2005): My version of corpus linguistics. In: International Journal of Corpus Linguistics 10 (1), 1–13.10.1075/ijcl.10.1.01teuSearch in Google Scholar

Tognini-Bonelli, Elena (2001): Corpus linguistics at work. Amsterdam (Studies in Corpus linguistics, 6).10.1075/scl.6Search in Google Scholar

Tufte, Edward R (1983): The visual display of quantitative information. Cheshire, Conn.Search in Google Scholar

Tukey, John W (1977): Exploratory Data Analysis. Reading, Masachusetts [etc.] (Addison Wesley Series in Behavioral Science. Quantitative Methods).Search in Google Scholar

Vogel, Friedemann (2010): Linguistische Imageanalyse (LIma). Grundlegende Überlegungen und exemplifi zierende Studie zum öffentlichen Image von Türken und Türkei in deutschsprachigen Medien. In: Deutsche Sprache (4), 345–377.Search in Google Scholar

Warnke, Ingo H (2007): Diskurslinguistik nach Foucault – Dimensionen einer Sprachwissenschaft jenseits textueller Grenzen. In: Warnke, Ingo H (Hg.): Diskursanalyse nach Foucault. Theorie und Gegenstände. Berlin, New York (Linguistik – Impulse & Tendenzen), 3–24.10.1515/9783110920390.3Search in Google Scholar

Weiss, Sholom M./Indurkhya, Nitin/Zhang, Tong/Damerau, Fred J. (2005): Text Mining: Predictive Methods for Analyzing unstructured Information. New York.10.1007/978-0-387-34555-0Search in Google Scholar

Wiedemann, Gregor (2013): Opening up to Big Data: Computer-Assisted Analysis of Textual Data in Social Sciences [54 paragraphs]. Forum Qualitative Sozialforschung/Forum: Qualitative Social Research, 14(2), Art. 13, http://nbn-resolving.de/urn:nbn:de:0114-fqs1302231.Search in Google Scholar

Online erschienen: 2015-3-30
Erschienen im Druck: 2015-3-1

© 2015 Walter de Gruyter GmbH & Co. KG, Berlin/Boston

Downloaded on 25.2.2024 from https://www.degruyter.com/document/doi/10.1515/zgl-2015-0001/html
Scroll to top button