Martin Klotz
Brief CV
2024– | Researcher in CRC1412 / INF |
2019–2023 | Researcher in RUEG / Pd & Pc |
2019 | Degree MSc Cognitive Systems (Universität Potsdam) |
2015 |
Degree BA German Linguistics & Computer Science (Humboldt-Universität zu Berlin) |
2011–2019 | Student assistant at the Department of German Studies and Linguistics |
Research Interests
- corpus architectures, historical corpora, parallel corpora, (linguistic) language modelling
- NLP for non-standard varieties
- (semi-)automatic processing and analysis of linguistic corpora and language data
- Research Software Engineering
- Deep Learning, Neural Language Models
Publications
2024
Kateryna Iefremenko, Martin Klotz and Christoph Schroeder (2024). RUEG subcorpus of Kurmanji Kurdish and Turkish data (0.1) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.10810768
2023
Sabine Zerbian, Yulia Zuban and Martin Klotz (2023). Intonational Features of Spontaneous Narrations in Monolingual and Heritage Russian in the U.S.—An Exploration of the RUEG Corpus. Languages, 9(1), 2. https://doi.org/10.3390/languages9010002
Martin Klotz and Thomas Krause (accepted). Eine Ressource durch Abwägung: Wie bestehende generische Softwarelösungen ‚über sich hinauswachsen‘ und ein Parallelkorpus ermöglichen. In: Mittelniederdeutsch an der Schnittstelle zwischen Literaturwissenschaft, Sprachwissenschaft und Digital Humanities. Ed. by M. Coniglio, A. Recker & H. Sahm. Göttinger Universitätsverlag
Thomas Krause and Martin Klotz (2023). Annatto. Version 0.2.0. url: https://github.com/korpling/annatto/.
Lars Erik Zeige, Gohar Schnelle, Martin Klotz, Karin Donhauser, Jost Gippert, Rosemarie Lühr (2023). Deutsch Diachron Digital - Referenzkorpus Altdeutsch (1.2). Humboldt-Universität zu Berlin. Homepage: https://www.deutschdiachrondigital.de/.
2022
Hagen Hirschmann, Anke Lüdeling, Anna Shadrova, Dominique Bobeck, Martin Klotz, Roodabeh Akbari, Sarah Schneider, Sarah and Shujun Wan (2022). FALKO. Eine Familie vielseitig annotierter Lernerkorpora des Deutschen als Fremdsprache. In: KorDaF (Korpora Deutsch als Fremdsprache) (2:2), 139-148.
Conference talk: Martin Klotz, Annika Labrenz, Anke Lüdeling and Heike Wiese: Linguistic diversity across languages and registers: A corpus- linguistic basis for investigating emerging grammars in language-contact situations. In: Methods in Dialectology XVII. Mainz.
2021
43. DGfS-Jahrestagung, Freiburg, Februar 2021 (digitale Konferenz): Workshop Contrastive corpus methodology for language modeling and analysis with Anke Lüdeling and Anna Shadrova.
2019
Conference talk: Anke Lüdeling, Martin Klotz, and Thomas Krause (2019): A structured multi-layer register corpus of heritage languages and majority languages. In: Theme-Session The Dynamics of Heritage Speakers: a Comparative View. International Symposium of Bilingualism: The Next Generation. University of Alberta, Kanada.
Heike Wiese, Artemis Alexiadou, Shanley Allen, Oliver Bunk, Natalia Gagarina, Kateryna Iefremenko, Esther Jahns, Martin Klotz, Thomas Krause, Annika Labrenz, Anke Lüdeling, Maria Martynova, Katrin Neuhaus, Tatiana Pashkova, Vicky Rizou, Tracy Rosemarie, Christoph Schroeder, Luka Szucsich, Wintai Tsehaye, Sabine Zerbian and Yulia Zuban (2019). RUEG Corpus.
2015
Anke Lüdeling, Malte Belz, Hagen Hirschmann, Martin Klotz, Carolin Odebrecht, Laura Perlitz, Marc Reznicek, Simon Sauer, Vivian Voigt, and Amir Zeldes (2015): BeMaTaC, Falko, RIDGES – Linguistische Mehrebenen-Korpora für Nicht-Standard-Varietäten des Deutschen. Digital-Humanities-Tag 2015 – Digitale Ressourcen an der Philosophischen Fakultät II.
Florian Zipser, André Röhrig, Anke Lüdeling, Martin Klotz, Thomas Krause, Stephan Druskat, and Vivian Voigt (2015): SaltNPepper, ANNIS & Atomic: Eine Infrastruktur für Mehrebenenkorpora. Digital-Humanities-Tag 2015 – Digitale Ressourcen an der Philosophischen Fakultät II.
Florian Zipser, Martin Klotz, and André Röhrig (2015): From TEI to linguistic corpora using Pepper. 37. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft.