Korpus &quot;Deutsch in Namibia&quot;

Deutsch in multilingualen Kontexten | Deutsch in Namibia

Korpus "Deutsch in Namibia"

Straßenzug in Namibia mit mehrsprachigen Schildern: Luisen Apotheke/Pharmacy/Apteek, Otto Mühr & Co.

Foto: Heike Wiese

Mehrsprachiges Apothekenschild in Windhoek.

Das Korpus „Deutsch in Namibia (DNam)“ entstand im Zeitraum 2016-2021, im DFG-Projekt „NamDeutsch: Die Dynamik des Deutschen im mehrsprachigen Kontext Namibias“ (WI 2155/9-1 und SI 750/4-1, Leitung: Heike Wiese und Horst Simon, in Kooperation mit Marianne Zappen-Thomson) an der Universität Potsdam (bis 2019) und an der HU Berlin (seit 2019), an der FU Berlin und an der UNAM Windhoek.

Das Korpus dokumentiert den Sprachgebrauch in formellen und informellen Situationen und die Spracheinstellungen innerhalb der deutschen Minderheit in Namibia. Die Daten liegen als Audiodaten mit alignierten und annotierten Transkriptionen vor, ergänzt durch Metadaten der Sprecher:innen (biographische Daten, Angaben zu Sprachkompetenz und Sprachgebrauch).

Mehr Details zum DNam-Korpus.

Neben dem Hauptkorpus gibt es ein Ergänzungskorpus DNam-Wenker, das „Wenker"”-Daten zum Namibiadeutschen umfasst: Über einen Online-Fragebogen wurden Übertragungen der 40 klassischen „Wenker-Sätze“ ins Namibiadeutsche erhoben, ergänzt durch einen Personenfragebogen zu biographischen, sozialen und soziolinguistischen Daten der Sprecher:innen.

Mehr Details zu DNam-Wenker.

Hauptkorpus: DNam

Förderung

DFG-Projekt „NamDeutsch: Die Dynamik des Deutschen im mehrsprachigen Kontext Namibias“, WI 2155/9-1 und SI 750/4-1.

Zugang zum Korpus

Das Korpus ist über die Datenbank für Gesprochenes Deutsch (DGD) online frei zugänglich.

Hier ist ein kurzes Tutorial zur Verwendung von DGD, mit Dank an Dr. Thomas Schmidt:

Korpusumfang und Teilkorpora

Gesamtumfang: 226 Aufnahmen, 18:39 Stunden, 110 Sprecher:innen

Set-up der Erhebung	Tokens	Dauer (hh:mm:ss)	Sprecher:innen	Aufnahmen
Freie Gespräche	115.004	9:15:00	65	21
Sprachsituationen	51.509	4:41:30	103	198
Semi-strukturierte Interviews	57.879	4:42:15	15	7
Gesamt	224.392	18:38:45	110	226

Die Aufnahmen, die für das Korpus transkribiert wurden, sind Teil einer größeren Datensammlung. Auswahlkriterien waren:

ausgewogenes Sample von Set-ups (ähnliche Gewichtung der drei Set-ups) und Sprecher:innen (Farmer:innen – Stadtbewohner:innen; Schüler:innen von Privat- und Staatsschulen; Sprecher:innen aus unterschiedlichen Gebieten Namibias); Vorzug für Sprecher:innen, die in Namibia geboren wurden; breites Spektrum in Bezug auf Bildungsniveau, Berufe und Altersgruppen
bei freien Gesprächen keine Berücksichtigung von Gesprächen mit langen und häufigen Gesprächspausen, vielen metasprachlichen Kommentaren, wenigen Teilnehmer:innen und/oder reiner Abhandlung der vorgegebenen Themen

Datenerhebung

Aufnahmezeitraum: 2017

Aufnahmeorte: deutschsprachige Schulen, Farmen, Privathäuser, öffentliche Räume in (der Umgebung von) Windhoek, Witvlei, Omaruru, Swakopmund und Otjiwarongo

Wenn Sie auf eine Stadt klicken, werden Ihnen Metadaten zu den Sprecher:innen in der DGD-Veröffentlichung des Korpus' angezeigt.

Witvlei

Die Datenerhebung erfolgte in drei unterschiedlichen Set-ups:

Stimulus für die Erhebungsmethode LangSit: Bilderserie eines Autounfalls

Sprecher:innen

Foto: Yannic Bracke

Aufnahmesituation mit Forschenden (Christian Zimmer, Heike Wiese).

Die Metadaten der Sprecher:innen umfassen

biographische Informationen: Geschlecht, Geburtsjahr, Beruf, für Schüler:innen: Schule, Geburtsort (Land, Ort), Angabe, wo aufgewachsen (Land, Region, Ortsname)
soziolinguistische Informationen: Sprachen der Mutter und des Vaters, Sprachen der Eltern untereinander

Gruppe	Anzahl	Anzahl männlich	Anzahl weiblich	Alter
Kinder (nicht Schüler:innen)	3	3	0	6, 14, 17
Schüler:innen	81	43	38	14-18, Durchschnitt: 16 (7 ohne Altersangabe)
Erwachsene	26	13	13	26-75, Durchschnitt: 48 (1 ohne Altersangabe)
Gesamt	110	59	51	6-75, Durchschnitt: 24

Annotation, Transkription, Anonymisierung/Siglen

Annotationsebenen

Die Daten liegen mit Annotation als Audiodateien und in Form von Transkripten vor. Die Transkripte sind mit sechs Annotationsebenen versehen:

Transkriptionsebene (trans): ursprüngliche Transkriptionsebene (literarische Umschrift)
Tokenisierte Transkriptionsebene (trans_tok): Aufteilung der Transkription in einzelne Tokens
Normalisierte Ebene (norm): Transkription nach standardsprachlicher Orthographie; keine Veränderung nicht-standardsprachlicher Äußerungen (z.B. in Bezug auf Kasus oder Genus)
Wortarten/Part-Of-Speech-Tagging (pos): basierend auf STTS 2.0, ergänzt um drei korpusspezifische Tags (ATM: hörbares Atmen, META: Doppelklammer bei Transkription paraverbaler Äußerungen „((lacht))“, SOART: Kontraktion von son und Flexionsformen)
Lemmaebene (lemma): Wortlemma
Annotation kontaktsprachlicher Tokens (FW): Informationen zu Gebersprache, Umfang der Integration und Existenz eines Lexikoneintrags in der Onlineversion des "Duden"-Wörterbuchs (2020). Diese Annotationsebene ist noch nicht im DGD verfügbar, wird aber in zukünftigen Releases verfügbar gemacht. Die Annotationsrichtlinien für die kontaktsprachlichen Tokens finden Sie hier.

Folgende Abbildung illustriert die Transkriptionsebenen in einem EXMARaLDA-Transkript:

Screenshot eines Transkripts mit allen Transkriptionsebenen.

Transkription

Foto: Heike Wiese

Einer der Aufnahmeorte: Eine Farm.

Die orthographische Transkription erfolgte mit dem Partitur-Editor von EXMARaLDA (Schmidt, 2016), die Annotationsrichtlinien sind eine leichte Modifizierung der cGAT-Konventionen (Schmidt et al. 2015). Die Annotationsrichtlinien mit den Abweichungen von den cGat-Konventionen finden Sie hier. Die Transkription folgt weitgehend der Standardorthographie, erfasst aber gleichzeitig typische Phänomene der gesprochenen Sprache (z.B. Elisionen, Kontraktionen, Wortabbrüche, Gesprächspausen) sowie paraverbale und nonverbale Informationen. Die ersten Versionen der Transkriptionen wurden jeweils von einem weiteren Teammitglied kontrolliert, Abweichungen wurden mit der/dem ursprünglichen Transkribentin/en besprochen und aufgelöst. Eine finale Kontrolle erfolgt durch eine deutschsprachige Namibianerin.

Anonymisierung und Siglen

Anonymisierung von Personennamen, spezifischen Ortsangaben (z.B. Farmen) sowie aller Aussagen, die Rückschlüsse auf die Identität von Personen erlauben
Maskierung in den Audiodateien

Anonymisierung durch vier Arten von Siglen im Korpus, die teilweise metasprachliche Informationen enthalten

Siglen für Sprecher:innen:

Sprecher:in	ID-Nummer	Geschlecht	Altersgruppe
NAM	006	W	1
	001 - 2xx eine Zahl pro Sprecher:in	M männlich W weiblich	1 unter 21 2 21 - 40 3 41 - 60 4 über 60

Siglen für die Forscher:innen (z.B. RES1-RES4)
Siglen für einzelne Tokens, die anonymisiert wurden: Anfangsbuchstabe des anonymisierten Ausdrucks + dreistellige Zahl, z.B. N001
Siglen für anonymisierte Äußerungen, die aus mehreren Tokens bestehen: Phrase „anonymisierte_Äußerung“ + dreistellige Zahl, z.B. anonymisierte_Äußerung001

Projektbeteiligte

Foto: Heike Wiese

Mehrsprachige Werbung für einen Weihnachtsmarkt in Namibia.

PIs: Heike Wiese, Horst J. Simon

Kooperationspartner:innen: Marianne Zappen-Thomson, Thomas Schmidt, Hans Boas

Projektmitarbeiter:innen: Christian Zimmer, Janosch Leugner, Yannic Bracke, Britta Stuhl, Laura Perlitz

Studentische Hilfskräfte: Jones Anam, Christian Anders, Alexandra Fosså, Semra Kizilkaya, Carina Schüffler, Claudia Czarniak, Philipp Klaußner, Jula Kostka, Anika Kroll-Tjingaete, Johanna Pott, Britta Stuhl

Zitierweise

Zimmer, Christian; Wiese, Heike; Simon, Horst J.; Zappen-Thomson, Marianne; Leugner, Janosch; Bracke, Yannic; Stuhl, Britta; Perlitz, Laura, & Schmidt, Thomas: DNam-Korpus zum Deutschen in Namibia.

Literatur

Wiese, Heike; Simon, Horst J.; Zimmer, Christian & Schumann, Kathleen (2017). German in Namibia: A vital speech community and its multilingual dynamics. In Péter Maitz & Craig A. Volker (Hg.), Language Contact in the German Colonies. S.221-245.

Zimmer, Christian; Wiese, Heike; Simon, Horst J.; Zappen-Thomson, Marianne; Leugner, Janosch; Bracke, Yannic; Stuhl, Britta, & Schmidt, Thomas (2020). Das Korpus Deutsch in Namibia (DNam): Eine Ressource für die Kontakt- Variations- und Soziolinguistik. Deutsche Sprache 3: 210-232.

Ergänzungskorpus zum DNam: DNam-Wenker

2013/14 wurden “Wenker”-Daten zum Namibiadeutschen über eine Online-Plattform erhoben.

Die Erhebung wandte sich an Deutschnamibier:innen aller Altersgruppen und diente dazu, breite Daten zu bestimmten Bereichen von Lexikon und Grammatik zu gewinnen, die durch dieses klassische Werkzeug der germanistischen Dialektforschung eine weite Vergleichbarkeit mit anderen, auch älteren Studien zu dialektalen Formen im Deutschen gewährleisten. Um möglichst viele Sprecher:innen zu erreichen, entwickelten wir einen Online-Fragebogen mit den 40 ursprünglichen „Wenker-Sätzen“, ergänzt durch einen einleitenden Text zum Namibia-Deutschen, dem Forschungsprojekt und den „Wenker-Sätzen“ sowie einen Personenfragebogen zu biographischen, sozialen und soziolinguistischen Daten am Ende.

Hier finden Sie den genauen Wortlaut der Aufgabenstellung in der online durchgeführten Umfrage und hier die 40 abgefragten Wenker-Sätze.

Durch umfangreiche Medienarbeit und Dissemination in der deutschsprachigen Gemeinschaft über Radio, Zeitung, Kirchengemeinden und Schulen konnten über 200 Teilnehmer:innen gewonnen werden; damit ist ca. ein Prozent der Sprechergemeinschaft erfasst. Für die engagierte Unterstützung bei der Dissemination von Informationen zur „Wenker“-Umfrage danken wir der Delta-Schule und der Deutschen Höheren Privatschule (DHPS) Windhoek, Wilfried Hähner vom „Hitradio Namibia“ und der „Allgemeinen Zeitung Windhoek“ und dem damaligen Bischof der evangelisch-lutherischen Kirche in Namibia, Bischof Hertel.

Die Ergebnisse der Wenker-Namdeutsch-Umfrage stehen als Excel-Tabelle unter der CC BY 3.0-Lizenz frei zur Verfügung.

Wenker-Namdeutsch by Heike Wiese is licensed under a Creative Commons Attribution 3.0 Germany License.

Dokumentation

Nicht alle Umfragenteilnehmer:innen haben den Fragebogen vollständig ausgefüllt. In den entsprechenden Datensätzen sind die leeren Felder mit „NA“ markiert. Die Angaben der Proband:innen wurden ohne Änderungen übernommen, bis auf drei Bereiche, die aus Datenschutzgründen verändert wurden:

Angaben zum Beruf wurden entfernt
Das Geburtsjahr wurde als Zeitspanne von zehn Jahren angegeben
Bei der Frage nach dem Wohnort im Umfragezeitraum wurde für alle namibischen Städte das Land „Namibia“ angegeben. Alle Datensätze mit einem Wohnort außerhalb von Namibia wurden aus der Tabelle entfernt. Datensätze ohne Angabe zum Wohnort wurden beibehalten.

Mitarbeit / Unterstützende

Heike Wiese, Hans C. Boas, Horst J. Simon, Marianne Zappen-Thomson, Laura Perlitz, Oliver Bunk

Zitierweise

Wiese, Heike (2014): DNam-Wenker. Ein Korpus mit 'Wenker'-Sätzen zum Namibiadeutschen.

Sprach- und literaturwissenschaftliche Fakultät - Deutsch in multilingualen Kontexten

Hauptkorpus: DNam

Förderung

Zugang zum Korpus

Korpusumfang und Teilkorpora

Datenerhebung

Sprecher:innen

Annotation, Transkription, Anonymisierung/Siglen

Annotationsebenen

Transkription

Anonymisierung und Siglen

Projektbeteiligte

Zitierweise

Literatur

Ergänzungskorpus zum DNam: DNam-Wenker

Dokumentation

Mitarbeit / Unterstützende

Zitierweise