Sprach- und literaturwissenschaftliche Fakultät - Sprachgeschichte

DDD ─ Referenzkorpus Altdeutsch (750-1050) (DFG,2008-2015)


 

Ausführliche Informationen finden Sie auf der Webseite des Projektes:

http://www.deutschdiachrondigital.de/

 


 

Forschungsprojekt

  • Titel: "DDD ─ Referenzkorpus Altdeutsch (750-1050)"
  • Projektleitung: Karin Donhauser (Humboldt-Universität zu Berlin), Jost Gippert (Universität Frankfurt am Main), Rosemarie Lühr (Universität Jena)
  • Fördereinrichtung:DFG, 2008-2015

 

Mitarbeiter

  • Berlin: Sonja Linde, Julia Richling, Silke Unverzagt, Daniel Brauer, René Czeszinski, Annerose Schultz
  • Frankfurt: Roland Mittmann
  • Jena: Natalia Mull, Fransis Gieseke, John Reichelt, Laura Sturm

 

Kurzbeschreibung

Das Referenzkorpus Altdeutsch erfasst und annotiert die ältesten Sprachdenkmäler des Deutschen vom Beginn der kontinuierlichen schriftlichen Überlieferung um 750 bis etwa 1050 mit einem Umfang von ca. 650 000 Textwörtern. Aufgenommen werden alle in dieser Zeit überlieferten Texte des hochdeutschen und des niederdeutschen Sprachraumes in einer möglichst genauen Wiedergabestufe. Dabei werden die handschriftengetreuesten gedruckten Texteditionen zugrundegelegt. Die Annotation erfasst die Wortarten und die Morphologie, an syntaktischer Information werden zunächst nur die Satzgrenzen aufgenommen.

Mit der Erstellung des Referenzkorpus wird die Basis gelegt zur Erstellung eines sprachstufenübergreifenden tiefenannotierten Korpus historischer Texte des Deutschen (Deutsch Diachron Digital). Die Kooperation mit dem Projekt Referenzkorpus Mittelhochdeutsch (1050-1350) der Universitäten Bonn (Thomas Klein) und Bochum (Klaus-Peter Wegera) gewährleistet die Kompatibilität der unabhängig voneinander durchgeführten Annotationen, so dass die Korpora zu einem späteren Zeitpunkt zusammengefügt werden können. Aufgrund der Überführbarkeit der annotierten Information in das Stuttgart-Tübingen Tagset (STTS) ist gewährleistet, dass sich die historischen Korpora auch mit den Suchabfragen, wie sie für die Gegenwartssprache erarbeitet worden sind, bearbeiten lassen. Vorgesehen ist zudem der Einbau der Texte in die Datenbank ANNIS, die innerhalb des SFB 632 unter Leitung von Manfred Stede und Anke Lüdeling entwickelt wird.