Jump to ContentJump to Main Navigation
Show Summary Details
More options …

European Journal of Applied Linguistics

Founded by Knapp, Karlfried

Editor-in-Chief: Bührig, Kristin / ten Thije, Jan D.


Agenzia Nazionale di Valutazione del Sistema Universitario e della Ricerca: Classe A

Online
ISSN
2192-953X
See all formats and pricing
More options …

Types and annotation of reply relations in computer-mediated communication

Laura HerzbergORCID iD: https://orcid.org/0000-0003-3339-8572 / Dr. Harald Lüngen
Published Online: 2019-09-12 | DOI: https://doi.org/10.1515/eujal-2019-0006

Abstract

This paper presents types and annotation layers of reply relations in computer- mediated communication (CMC). Reply relations hold between post units in CMC interactions and describe references from one given post to a previous post. We classify three types of reply relations in CMC interactions: first, technical replies, i. e. the possibility to reply directly to a previous post by clicking a ‘reply’ button; second, indentations, e. g. in wiki talk pages in which users insert their contributions in the existing talk page by indenting them and third, interpretative reply relations, i. e. the reply action is not realised formally but signalled by other structural or linguistics means such as address markers ‘@’, greetings, citations and/or Q-A structures. We take a look at existing practices in the description and representation of such relations in corpora and examples of chat, Wikipedia talk pages, Twitter and blogs. We then provide an annotation proposal that combines the different levels of description and representation of reply relations and which adheres to the schemas and practices for encoding CMC corpus documents within the TEI framework as defined by the TEI CMC SIG. It constitutes a prerequisite for correctly identifying higher levels of interactional relations such as dialogue acts or discussion trees.

Zusammenfassung

Der vorliegende Artikel stellt Typen und Annotationsebenen von Antwortrelationen in der internetbasierten Kommunikation (IBK) vor. Antwortrelationen bestehen zwischen Posts in IBK-Interaktionen und beschreiben Referenzen, die zwischen einem Initialbeitrag und einem Folgebeitrag bestehen. Wir klassifizieren drei Arten von Antwortrelationen in IBK-Interaktionen: erstens, technische Antwortrelationen, welche dadurch gekennzeichnet sind, dass durch das Betätigen einer „Antwort“-Schaltfläche eine Antwort initiiert wird, bspw. in Blogs; zweitens, Einrückungen, z. B. auf Wikipedia-Diskussionsseiten, in denen Benutzer ihre Beiträge in die entsprechende Stelle des Diskussionsverlaufs einfügen, indem sie ihre Beiträge einrücken und drittens, interpretative Antwortrelationen, bei denen die Antwort nicht formal realisiert wird, sondern durch andere strukturelle oder linguistische Mittel signalisiert werden, wie z. B. dem Adressierungsmarker „@“, Begrüßungs- und Verabschiedungsformeln, Zitaten und/oder Frage-Antwort-Strukturen. Wir analysieren die bestehenden Praktiken bei der Beschreibung und Darstellung solcher Relationen in Korpora und geben Beispiele für Chat, Wikipedia-Diskussionsseiten, Twitter und Blogs. Anschließend präsentieren wir einen Annotationsvorschlag, der die verschiedenen Ebenen der Beschreibung und Darstellung von Antwortrelationen kombiniert und sich an die Praktiken zur Kodierung von IBK-Korpusdokumenten innerhalb der Text Encoding Initiative (TEI), wie sie von der TEI CMC SIG definiert wurde, hält. Die Annotation von Antwortrelationen stellt eine Voraussetzung für die korrekte Identifizierung höherer interaktionaler Ebenen, wie z. B. die Klassifizierung von Dialogakten oder Baumstrukturen, dar.

Resumen

Este documento introduce tipos y capas de anotación de las relaciones de respuesta en la comunicación mediada por ordenador (CMC). Las relaciones de respuesta se mantienen entre las unidades de mensaje de las interacciones de CMC y describen referencias de un mensaje dado a un mensaje anterior. Clasificamos tres tipos de relaciones de respuesta en las interacciones de CMC: primero, las respuestas técnicas, es decir, la posibilidad de responder directamente a un mensaje anterior usando el botón “responder”; segundo, hendiduras, por ejemplo, en las páginas de discusión de Wikipedia en las que los usuarios insertan sus contribuciones en la página de conversación existente al indentarlos, y la tercera, relaciones interpretativas de respuesta, es decir, la acción de respuesta no se realiza formalmente, sino que se señala por otros medios estructurales o lingüísticos, como los marcadores de dirección ‘@’, saludos, citas y/o estructuras de pregunta y respuesta. Vamos a mirar a las prácticas existentes en la descripción y representación de tales relaciones en los corpus y ejemplos de chat, páginas de discusión de Wikipedia, Twitter y blogs. A continuación, proporcionamos una propuesta de anotación que combina los diferentes niveles de descripción y representación de las relaciones de respuesta y que se adhiere a los esquemas y prácticas para codificar documentos de corpus CMC dentro del marco TEI, tal como se define en el TEI CMC SIG. Esto forma un prerrequisito para identificar correctamente los niveles más elevados de relaciones interaccionales, como los actos de diálogo o los árboles de discusión.

Keywords: reply relations; corpus annotation; computer-mediated communication; CMC; Text Encoding Initiative; TEI

Stichworte: Antwortrelationen; Antwortstrukturen; Korpusannotation; internetbasierte Kommunikation; IBK; Text Encoding Initiative; TEI

Palabras clave: relaciones de respuesta; anotación de corpus; comunicación mediada por computadora; CMC; Text Encoding Initiative; TEI

References

  • Beißwenger, Michael. 2007. Sprachhandlungskoordination in der Chat-Kommunikation. Berlin. New York: de Gruyter (Reihe Linguistik – Impulse & Tendenzen 26).Google Scholar

  • Beißwenger, Michael, Maria Ermakova, Alexander Geyken, Lothar Lemnitzer & Angelika Storrer. 2012. DeRiK: A German Reference Corpus of Computer-Mediated Communication. Proceedings of Digital Humanities 2012. 259–263.Google Scholar

  • Beißwenger, Michael, Eric Ehrhardt, Axel Herold, Harald Lüngen & Angelika Storrer. 2016. (Best) Practices for Annotating and Representing CMC and Social Media Corpora in CLARIN-D. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. 7–11. Google Scholar

  • Chanier, Thiery, Celine Poudat, Benoit Sagot, Georges Antoniadis, Ciara Wigham, Linda Hriba, Julien Longhi & Djamé Seddah. 2014. The CoMeRe corpus for French: structuring and annotating heterogeneous CMC genres. In Michael Beißwenger, Nelleke Oostdijk, Angelika Storrer & Henk van den Heuvel (eds.), Building and Annotating Corpora of Computer-Mediated Communication: Issues and Challenges at the Interface of Corpus and Computational Linguistics. Special Issue, Journal of Language Technology and Computational Linguistics (JLCL 2/2014).Google Scholar

  • Ferschke, Oliver, Iryna Gurevych & Yevgen Chebotar. 2012. Behind the Article: Recognizing Dialog Acts in Wikipedia Talk Pages. Proceedings of the 13th Conference of the European Chapter of the Association for Computational Linguistics. 777–786. Google Scholar

  • Grumt Suárez, H., Natali Karlova-Bourbonus & Henning Lobin. 2016. A Discourse-structured Blog Corpus for German: Challenges of Compilation and Annotation. In Michael Beißwenger, Michael Wojatzki & Torsten Zesch (eds.), NLP4CMC III: 3rd Workshop on Natural Language Processing for Computer-Mediated Communication (Bochumer Linguistische Beiträge 17), 1–5. Bochum: University of Bochum. Google Scholar

  • Ho-Dac, Lydia-Mai, Veronika Laippala, Céline Poudat & Ludovic Tanguy. 2016. French Wikipedia Talk Pages: Profiling and Conflict Detection. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. 34–38. Google Scholar

  • Holmer, Torsten. 2008. Discourse structure analysis of chat communication. Language@Internet 5. Article 9. Google Scholar

  • Laniado, David, Riccardo Tasso, Yana Volkovich & Andreas Kaltenbrunner. 2011. When the Wikipedians Talk: Network and Tree structure of Wikipedia Discussion Pages. International AAAI Conference on Web and Social Media, Fifth International AAAI Conference on Weblogs and Social Media. 177–184. Google Scholar

  • Lüngen, Harald, Michael Beißwenger, Eric Ehrhardt, Axel Herold & Angelika Storrer. 2016. Integrating corpora of computer-mediated communication in CLARIN-D: Results from the curation project ChatCorpus2CLARIN. In Stefanie Dipper, Friedrich Neubarth & Heike Zinsmeister (eds.), Proceedings of the 13th Conference on Natural Language Processing (KONVENS 2016). (= Bochumer Linguistische Arbeitsberichte (BLA) 16), 156–164.Google Scholar

  • Margaretha, Eliza, Harald Lüngen. 2014. Building Linguistic Corpora from Wikipedia Articles and Discussions. Journal of Language Technology and Computational Linguistics. 59–82.Google Scholar

  • Poudat, Céline, Jin Kun & Thierry Chanier. 2014. Wikiconflits, un corpus extrait de Wikipédia: principe et méthode d’élaboration. In Céline Poudat, Natalia Grabar, Jin Kun & Camile Paloque-Berges (eds.), Corpus Wikiconflits, conflits dans le Wikipédia francophone. Banque de corpus CoMeRe. Ortolang.fr: Nancy. [cmr-wikiconflits-tei-v4.1-manuel.pdf; http://hdl.handle.net/11403/comere/cmr-wikiconflits ].

  • Schmidt, Thomas. 2011. A TEI-based approach to standardising spoken language transcription. Selected Papers from the 2008 and 2009 TEI Conferences. Journal of the Text Encoding Initiative 1 [https://journals.openedition.org/jtei/142].Google Scholar

  • Schröck, Jasmin, Harald Lüngen. 2015. Building and Annotating a Corpus of German-Language Newsgroups. In Michael Beißwenger & Torsten Zesch (eds.), NLP4CMC 2015. 2nd Workshop on Natural Language Processing for Computer-Mediated Communication / Social Media. Proceedings of the Workshop. 17–22. Google Scholar

  • TEI Consortium. 2019. TEI P5: Guidelines for Electronic Text Encoding and Interchange. Version 3.5.0. [https://tei-c.org/guidelines/p5/].Google Scholar

About the article

Published Online: 2019-09-12

Published in Print: 2019-09-02


Citation Information: European Journal of Applied Linguistics, Volume 7, Issue 2, Pages 305–332, ISSN (Online) 2192-953X, ISSN (Print) 2192-9521, DOI: https://doi.org/10.1515/eujal-2019-0006.

Export Citation

© 2019 Walter de Gruyter GmbH, Berlin/Boston.Get Permission

Comments (0)

Please log in or register to comment.
Log in