Sprach- und literaturwissenschaftliche Fakultät - Korpuslinguistik und Morphologie

Kobalt-DaF

Kobalt DaF

Kobalt-DaF ist als ein wissenschaftliches Netzwerk entstanden, das SprachwissenschaftlerInnen verbindet, die gemeinsam Eigenschaften von schriftlichen Lernertexten untersuchen. Die Beteiligten sind ausgewiesene Experten der Fachgebiete Deutsch als Fremdsprache bzw. Korpuslinguistik und bringen unterschiedliche Expertisen in das Netzwerk ein: Es handelt sich um Fachleute in der Spracherwerbsforschung sowie Fachdidaktik Deutsch als Fremdsprache, um Fachleute in der Erstellung und Nutzung annotierter Korpora sowie für statistische Auswertungen. Hier geht es zur Mitgliederliste.

 

Im Rahmen des Netzwerks wurde ein reichhaltig annotiertes Lernerkorpus "Kobalt-DaF" mit argumentativen Texten von chinesischen, russischen und schwedischen MuttersprachlerInnen sowie Vergleichstexten von deutschen MuttersprachlerInnen erstellt. Mit diesem Korpus können verschiedenste grammatische Phänomenanalysen durchgeführt werden und Korrelationen sowie Transfer-Effekte aus den jeweiligen Erstsprachen der Probanden phänomenübergreifend sichtbar gemacht werden.

Das Korpus steht der Forschungsgemeinschaft frei zur Verfügung (s.u.: "Online-Abfrage").

 

Informationen zum Kobalt-DaF-Korpus:

 

Zusammenstellung

  • Fortgeschrittene Lernende (OnDaF-Test: ~B2)
  • Argumentative Essays zur Fragestellung:
    "Geht es der Jugend heute besser als früher?"
  • Ziel: 20 Texte pro Erstsprache (L1)
  • Erstellungszeit: 90 Min. (~500 Wörter)

Die Texte wurden von Mitgliedern des Netzwerks an
Universitäten und Schulen in China, Weißrussland,
Schweden und Deutschland erhoben.

 

Annotation

Die Annotationen orientieren sich grundlegend an der Falko-Datenaufbereitung (Reznicek et al. 2012, s.u.). Die folgende Liste gibt eine Übersicht über die im Kobalt-DaF-Korpus vorhandenen Annotationsebenen:


Online-Abfrage

Sie können das Kobalt-Korpus online im ANNIS-Suchinterface abfragen:
Link zum Kobalt-DaF-L2-Subkorpus

Referenzen

  • Shadrova, Anna (2020): Measuring coselectional constraint in learner corpora: A graph-based approach. Univ.-Dissertation: Humboldt-Universität zu Berlin, http://dx.doi.org/10.18452/21606.
  • Reznicek, Marc; Lüdeling, Anke & Hirschmann, Hagen (2013): Competing Target Hypotheses in the Falko Corpus. A Flexible Multi-Layer Corpus Architecture. In: Ana Díaz-Negrillo (Hg.): Automatic Treatment and Analysis of Learner Corpus Data: John Benjamins. [pdf]
  • Reznicek, Marc; Lüdeling, Anke; Krummes, Cedric; Schwantuschke, Franziska; Walter, Maik; Schmidt, Karin; Hirschmann, Hagen; Andreas, Torsten (2012): Das Falko-Handbuch. Korpusaufbau und Annotationen Version 2.01. Tech. Rep. [pdf]
  • Schiller, Anne; Teufel, Simone; Stöckert, Christine & Thielen, Christine (1999): Guidelines für das Tagging deutscher Textkorpora mit STTS (Kleinen und großes Tagset). Technischer Bericht. Universität Stuttgart; Universität Tübingen. [pdf]
  • Telljohann, Heike; Hinrichs, Erhard; Kübler, Sandra & Zinsmeister, Heike (2012): Stylebook for the Tübingen Treebank of Written German (TüBa-D/Z). Technischer Bericht. Universität Tübingen. [pdf]
  • Zinsmeister, Heike; Reznicek, Marc; Ricart Brede, Julia; Rosén, Christina; Skiba, Dirk (2012): Das Wissenschaftliche Netzwerk "Kobalt-DaF". In: Zeitschrift für Germanistische Linguistik 40 (3), S. 457–458.