Korpus "Deutsch in Namibia"
Das Korpus „Deutsch in Namibia (DNam)“ entstand im Zeitraum 2016-2021, im DFG-Projekt „NamDeutsch: Die Dynamik des Deutschen im mehrsprachigen Kontext Namibias“ (WI 2155/9-1 und SI 750/4-1, Leitung: Heike Wiese und Horst Simon, in Kooperation mit Marianne Zappen-Thomson) an der Universität Potsdam (bis 2019) und an der HU Berlin (seit 2019), an der FU Berlin und an der UNAM Windhoek.
Das Korpus dokumentiert den Sprachgebrauch in formellen und informellen Situationen und die Spracheinstellungen innerhalb der deutschen Minderheit in Namibia. Die Daten liegen als Audiodaten mit alignierten und annotierten Transkriptionen vor, ergänzt durch Metadaten der Sprecher:innen (biographische Daten, Angaben zu Sprachkompetenz und Sprachgebrauch).
Mehr Details zum DNam-Korpus.
Neben dem Hauptkorpus gibt es ein Ergänzungskorpus DNam-Wenker, das „Wenker"”-Daten zum Namibiadeutschen umfasst: Über einen Online-Fragebogen wurden Übertragungen der 40 klassischen „Wenker-Sätze“ ins Namibiadeutsche erhoben, ergänzt durch einen Personenfragebogen zu biographischen, sozialen und soziolinguistischen Daten der Sprecher:innen.
Mehr Details zu DNam-Wenker.
Hauptkorpus: DNam
Förderung
DFG-Projekt „NamDeutsch: Die Dynamik des Deutschen im mehrsprachigen Kontext Namibias“, WI 2155/9-1 und SI 750/4-1.
Zugang zum Korpus
Das Korpus ist über die Datenbank für Gesprochenes Deutsch (DGD) online frei zugänglich.
Hier ist ein kurzes Tutorial zur Verwendung von DGD, mit Dank an Dr. Thomas Schmidt:
Korpusumfang und Teilkorpora
Gesamtumfang: 226 Aufnahmen, 18:39 Stunden, 110 Sprecher:innen
Set-up der Erhebung | Tokens | Dauer (hh:mm:ss) | Sprecher:innen | Aufnahmen |
Freie Gespräche | 115.004 | 9:15:00 | 65 | 21 |
Sprachsituationen | 51.509 | 4:41:30 | 103 | 198 |
Semi-strukturierte Interviews | 57.879 | 4:42:15 | 15 | 7 |
Gesamt | 224.392 | 18:38:45 | 110 | 226 |
Die Aufnahmen, die für das Korpus transkribiert wurden, sind Teil einer größeren Datensammlung. Auswahlkriterien waren:
- ausgewogenes Sample von Set-ups (ähnliche Gewichtung der drei Set-ups) und Sprecher:innen (Farmer:innen – Stadtbewohner:innen; Schüler:innen von Privat- und Staatsschulen; Sprecher:innen aus unterschiedlichen Gebieten Namibias); Vorzug für Sprecher:innen, die in Namibia geboren wurden; breites Spektrum in Bezug auf Bildungsniveau, Berufe und Altersgruppen
- bei freien Gesprächen keine Berücksichtigung von Gesprächen mit langen und häufigen Gesprächspausen, vielen metasprachlichen Kommentaren, wenigen Teilnehmer:innen und/oder reiner Abhandlung der vorgegebenen Themen
Datenerhebung
Aufnahmezeitraum: 2017
Aufnahmeorte: deutschsprachige Schulen, Farmen, Privathäuser, öffentliche Räume in (der Umgebung von) Windhoek, Witvlei, Omaruru, Swakopmund und Otjiwarongo
Wenn Sie auf eine Stadt klicken, werden Ihnen Metadaten zu den Sprecher:innen in der DGD-Veröffentlichung des Korpus' angezeigt.
Witvlei
Die Datenerhebung erfolgte in drei unterschiedlichen Set-ups:
Sprecher:innen
Die Metadaten der Sprecher:innen umfassen
- biographische Informationen: Geschlecht, Geburtsjahr, Beruf, für Schüler:innen: Schule, Geburtsort (Land, Ort), Angabe, wo aufgewachsen (Land, Region, Ortsname)
- soziolinguistische Informationen: Sprachen der Mutter und des Vaters, Sprachen der Eltern untereinander
Gruppe | Anzahl | Anzahl männlich | Anzahl weiblich | Alter |
Kinder (nicht Schüler:innen) | 3 | 3 | 0 | 6, 14, 17 |
Schüler:innen | 81 | 43 | 38 | 14-18, Durchschnitt: 16 (7 ohne Altersangabe) |
Erwachsene | 26 | 13 | 13 | 26-75, Durchschnitt: 48 (1 ohne Altersangabe) |
Gesamt | 110 | 59 | 51 | 6-75, Durchschnitt: 24 |
Annotation, Transkription, Anonymisierung/Siglen
Annotationsebenen
Die Daten liegen mit Annotation als Audiodateien und in Form von Transkripten vor. Die Transkripte sind mit sechs Annotationsebenen versehen:
- Transkriptionsebene (trans): ursprüngliche Transkriptionsebene (literarische Umschrift)
- Tokenisierte Transkriptionsebene (trans_tok): Aufteilung der Transkription in einzelne Tokens
- Normalisierte Ebene (norm): Transkription nach standardsprachlicher Orthographie; keine Veränderung nicht-standardsprachlicher Äußerungen (z.B. in Bezug auf Kasus oder Genus)
- Wortarten/Part-Of-Speech-Tagging (pos): basierend auf STTS 2.0, ergänzt um drei korpusspezifische Tags (ATM: hörbares Atmen, META: Doppelklammer bei Transkription paraverbaler Äußerungen „((lacht))“, SOART: Kontraktion von son und Flexionsformen)
- Lemmaebene (lemma): Wortlemma
- Annotation kontaktsprachlicher Tokens (FW): Informationen zu Gebersprache, Umfang der Integration und Existenz eines Lexikoneintrags in der Onlineversion des "Duden"-Wörterbuchs (2020). Diese Annotationsebene ist noch nicht im DGD verfügbar, wird aber in zukünftigen Releases verfügbar gemacht. Die Annotationsrichtlinien für die kontaktsprachlichen Tokens finden Sie hier.
Folgende Abbildung illustriert die Transkriptionsebenen in einem EXMARaLDA-Transkript:
Transkription
Die orthographische Transkription erfolgte mit dem Partitur-Editor von EXMARaLDA (Schmidt, 2016), die Annotationsrichtlinien sind eine leichte Modifizierung der cGAT-Konventionen (Schmidt et al. 2015). Die Annotationsrichtlinien mit den Abweichungen von den cGat-Konventionen finden Sie hier. Die Transkription folgt weitgehend der Standardorthographie, erfasst aber gleichzeitig typische Phänomene der gesprochenen Sprache (z.B. Elisionen, Kontraktionen, Wortabbrüche, Gesprächspausen) sowie paraverbale und nonverbale Informationen. Die ersten Versionen der Transkriptionen wurden jeweils von einem weiteren Teammitglied kontrolliert, Abweichungen wurden mit der/dem ursprünglichen Transkribentin/en besprochen und aufgelöst. Eine finale Kontrolle erfolgt durch eine deutschsprachige Namibianerin.
Anonymisierung und Siglen
- Anonymisierung von Personennamen, spezifischen Ortsangaben (z.B. Farmen) sowie aller Aussagen, die Rückschlüsse auf die Identität von Personen erlauben
- Maskierung in den Audiodateien
- Anonymisierung durch vier Arten von Siglen im Korpus, die teilweise metasprachliche Informationen enthalten
- Siglen für Sprecher:innen:
Sprecher:in ID-Nummer Geschlecht Altersgruppe NAM 006 W 1 -
001 - 2xx
eine Zahl pro Sprecher:in
-
M
männlich
-
W
weiblich
-
1
unter 21
-
2
21 - 40
-
3
41 - 60
-
4
über 60
-
- Siglen für die Forscher:innen (z.B. RES1-RES4)
- Siglen für einzelne Tokens, die anonymisiert wurden: Anfangsbuchstabe des anonymisierten Ausdrucks + dreistellige Zahl, z.B. N001
- Siglen für anonymisierte Äußerungen, die aus mehreren Tokens bestehen: Phrase „anonymisierte_Äußerung“ + dreistellige Zahl, z.B. anonymisierte_Äußerung001
- Siglen für Sprecher:innen:
Projektbeteiligte
PIs: Heike Wiese, Horst J. Simon
Kooperationspartner:innen: Marianne Zappen-Thomson, Thomas Schmidt, Hans Boas
Projektmitarbeiter:innen: Christian Zimmer, Janosch Leugner, Yannic Bracke, Britta Stuhl, Laura Perlitz
Studentische Hilfskräfte: Jones Anam, Christian Anders, Alexandra Fosså, Semra Kizilkaya, Carina Schüffler, Claudia Czarniak, Philipp Klaußner, Jula Kostka, Anika Kroll-Tjingaete, Johanna Pott, Britta Stuhl
Zitierweise
Zimmer, Christian; Wiese, Heike; Simon, Horst J.; Zappen-Thomson, Marianne; Leugner, Janosch; Bracke, Yannic; Stuhl, Britta; Perlitz, Laura, & Schmidt, Thomas: DNam-Korpus zum Deutschen in Namibia.
Literatur
Wiese, Heike; Simon, Horst J.; Zimmer, Christian & Schumann, Kathleen (2017). German in Namibia: A vital speech community and its multilingual dynamics. In Péter Maitz & Craig A. Volker (Hg.), Language Contact in the German Colonies. S.221-245.
Zimmer, Christian; Wiese, Heike; Simon, Horst J.; Zappen-Thomson, Marianne; Leugner, Janosch; Bracke, Yannic; Stuhl, Britta, & Schmidt, Thomas (2020). Das Korpus Deutsch in Namibia (DNam): Eine Ressource für die Kontakt- Variations- und Soziolinguistik. Deutsche Sprache 3: 210-232.
Ergänzungskorpus zum DNam: DNam-Wenker
2013/14 wurden “Wenker”-Daten zum Namibiadeutschen über eine Online-Plattform erhoben.
Die Erhebung wandte sich an Deutschnamibier:innen aller Altersgruppen und diente dazu, breite Daten zu bestimmten Bereichen von Lexikon und Grammatik zu gewinnen, die durch dieses klassische Werkzeug der germanistischen Dialektforschung eine weite Vergleichbarkeit mit anderen, auch älteren Studien zu dialektalen Formen im Deutschen gewährleisten. Um möglichst viele Sprecher:innen zu erreichen, entwickelten wir einen Online-Fragebogen mit den 40 ursprünglichen „Wenker-Sätzen“, ergänzt durch einen einleitenden Text zum Namibia-Deutschen, dem Forschungsprojekt und den „Wenker-Sätzen“ sowie einen Personenfragebogen zu biographischen, sozialen und soziolinguistischen Daten am Ende.
Hier finden Sie den genauen Wortlaut der Aufgabenstellung in der online durchgeführten Umfrage und hier die 40 abgefragten Wenker-Sätze.
Durch umfangreiche Medienarbeit und Dissemination in der deutschsprachigen Gemeinschaft über Radio, Zeitung, Kirchengemeinden und Schulen konnten über 200 Teilnehmer:innen gewonnen werden; damit ist ca. ein Prozent der Sprechergemeinschaft erfasst. Für die engagierte Unterstützung bei der Dissemination von Informationen zur „Wenker“-Umfrage danken wir der Delta-Schule und der Deutschen Höheren Privatschule (DHPS) Windhoek, Wilfried Hähner vom „Hitradio Namibia“ und der „Allgemeinen Zeitung Windhoek“ und dem damaligen Bischof der evangelisch-lutherischen Kirche in Namibia, Bischof Hertel.
Die Ergebnisse der Wenker-Namdeutsch-Umfrage stehen als Excel-Tabelle unter der CC BY 3.0-Lizenz frei zur Verfügung.
Wenker-Namdeutsch by Heike Wiese is licensed under a Creative Commons Attribution 3.0 Germany License.
Dokumentation
Nicht alle Umfragenteilnehmer:innen haben den Fragebogen vollständig ausgefüllt. In den entsprechenden Datensätzen sind die leeren Felder mit „NA“ markiert. Die Angaben der Proband:innen wurden ohne Änderungen übernommen, bis auf drei Bereiche, die aus Datenschutzgründen verändert wurden:
- Angaben zum Beruf wurden entfernt
- Das Geburtsjahr wurde als Zeitspanne von zehn Jahren angegeben
- Bei der Frage nach dem Wohnort im Umfragezeitraum wurde für alle namibischen Städte das Land „Namibia“ angegeben. Alle Datensätze mit einem Wohnort außerhalb von Namibia wurden aus der Tabelle entfernt. Datensätze ohne Angabe zum Wohnort wurden beibehalten.
Mitarbeit / Unterstützende
Heike Wiese, Hans C. Boas, Horst J. Simon, Marianne Zappen-Thomson, Laura Perlitz, Oliver Bunk
Zitierweise
Wiese, Heike (2014): DNam-Wenker. Ein Korpus mit 'Wenker'-Sätzen zum Namibiadeutschen.