Faculty of Language, Literature and Humanities - Corpus Linguistics and Morphology

Dr. Thomas Krause

Overview

Researcher

Institut für deutsche Sprache und Linguistik
Sprach- und literaturwissenschaftliche Fakultät
Humboldt-Universität zu Berlin
Unter den Linden 6
D-10099 Berlin

Telephone: +49 (0)30 2093 9720

 

Visiting address: room 3.333 - Dorotheenstraße 24, 10117 Berlin - Mitte

Consultation hours during lecture period summer semester 2025: Tuesday 11:00 to 12:00 (after appointment)

Projects

ANNIS

ANNIS is a search and visualization system for linguistically annotated data.

For more information see: ANNIS.

Hexatomic

An extensible multi-layer annotation software for linguistic corpora: https://hexatomic.github.io/

LAUDATIO

LAUDATIO (Long term Access and Usage of Deeply Annotated Information) is a project for developing a lasting and user oriented storage of scientific data from the historic linguistics.

 

Publications

generated by bibbase.org
  2025 (1)
„Step away from the Computer!“: Über die linguistische Datenkategorisierung als Erkenntnisprozess und daraus folgende Herausforderungen bei der Nachnutzung von Annotationen und Annotationstools. Shadrova, A.; Lüdeling, A.; Klotz, M.; Hartz, R. G.; and Krause, T. Zeitschrift für germanistische Linguistik, 53(1): 166–214. April 2025.
„Step away from the Computer!“: Über die linguistische Datenkategorisierung als Erkenntnisprozess und daraus folgende Herausforderungen bei der Nachnutzung von Annotationen und Annotationstools [link]Paper   doi   link   bibtex   abstract  
  2024 (2)
Eine Ressource durch Abwägung: Wie bestehende generische Softwarelösungen ‚über sich hinauswachsen‘ und ein Parallelkorpus ermöglichen. Klotz, M.; and Krause, T. In Coniglio, M.; Recker, A.; and Sahm, H., editor(s), Mittelniederdeutsch zwischen Korpuslinguistik und Literaturwissenschaft, pages 123–138. Göttingen University Press, Göttingen, 2024.
Eine Ressource durch Abwägung: Wie bestehende generische Softwarelösungen ‚über sich hinauswachsen‘ und ein Parallelkorpus ermöglichen [link]Paper   doi   link   bibtex  
Register: Language Users’ Knowledge of Situational-Functional Variation. Lüdeling, A.; Szucsich, L.; Zeige, L. E.; Adli, A.; Alexiadou, A.; Belz, M.; Bouzouita, M.; Bunk, O.; Dreyer, M.; Egg, M.; Feulner, A. H.; Fleischer, J.; Gagarina, N.; Hirsch, A.; Jannedy, S.; Knoeferle, P.; Krause, T.; Kutscher, S.; Liu, M.; Lütke, B.; Machicao y Priemer, A.; Maquate, K.; Merino Hernández, L.; Meyer, R.; Mooshammer, C.; Müller, S.; Sauerland, U.; Sauermann, A.; Schmitt, V.; Schumacher, N.; Serova, D.; Solt, S.; Vander Klok, J.; Verhoeven, E.; Waltereit, R.; Weirich, M.; and Wiese, H. Register Aspects of Language in Situation, 3(1): 1–53. 2024. Publisher: Sprach- und literaturwissenschaftliche Fakultät
Register: Language Users’ Knowledge of Situational-Functional Variation [link]Paper   doi   link   bibtex   abstract  
  2023 (2)
Hexatomic: An extensible, OS-independent platform for deep multi-layer linguistic annotation of corpora. Druskat, S.; Krause, T.; Lachenmaier, C.; and Bunzeck, B. Journal of Open Source Software, 8(86): 4825. 2023. Publisher: The Open Journal
Hexatomic: An extensible, OS-independent platform for deep multi-layer linguistic annotation of corpora [link]Paper   doi   link   bibtex  
The four elements of achieving research software sustainability for long tail projects. Druskat, S.; and Krause, T. February 2023.
The four elements of achieving research software sustainability for long tail projects [link]Paper   link   bibtex   abstract  
  2022 (3)
graphANNIS 2.2.2. Krause, T. July 2022.
graphANNIS 2.2.2 [link]Paper   doi   link   bibtex  
ANNIS 4.9.5. Krause, T.; Benjamin, W.; Rütte, T.; Glushanok, I.; Klotz, M.; Zhang, S.; Zeldes, A.; Bartels, F.; Druskat, S.; Boyd, A.; Stemle, E.; Lampen, L.; and Petran, F. July 2022.
ANNIS 4.9.5 [link]Paper   doi   link   bibtex  
Register: Language Users’ Knowledge of Situational-Functional Variation. Lüdeling, A.; Alexiadou, A.; Adli, A.; Donhauser, K.; Dreyer, M.; Egg, M.; Feulner, A. H.; Gagarina, N.; Hock, W.; Jannedy, S.; Kammerzell, F.; Knoeferle, P.; Krause, T.; Krifka, M.; Kutscher, S.; Lütke, B.; McFadden, T.; Meyer, R.; Mooshammer, C.; Müller, S.; Maquate, K.; Norde, M.; Sauerland, U.; Solt, S.; Szucsich, L.; Verhoeven, E.; Waltereit, R.; Wolfsgruber, A.; and Zeige, L. E. . July 2022. Accepted: 2022-08-24T08:42:50Z Publisher: Humboldt-Universität zu Berlin
Register: Language Users’ Knowledge of Situational-Functional Variation [link]Paper   doi   link   bibtex   abstract  
  2021 (1)
What is a good corpus?. Lüdeling, A.; Schäfer, R.; Pankratz, E.; Krause, T.; Bildhauer, F.; and Golcher, F. March 2021. A series of three talks given in the colloquium of the CRC (SFB) 1412 Register.
What is a good corpus? [pdf]Paper   link   bibtex  
  2020 (1)
RUEG Corpus. Wiese, H.; Alexiadou, A.; Allen, S.; Bunk, O.; Gagarina, N.; Iefremenko, K.; Jahns, E.; Klotz, M.; Krause, T.; Labrenz, A.; Lüdeling, A.; Martynova, M.; Neuhaus, K.; Pashkova, T.; Rizou, V.; Rosemarie, T.; Schroeder, C.; Szucsich, L.; Tsehaye, W.; Zerbian, S.; and Zuban, Y. April 2020.
RUEG Corpus [link]Paper   link   bibtex  
  2019 (2)
Die Hard 1.1024.0: backward compatibility of a search engine with persistant IDs. Krause, T.; and Druskat, S. June 2019. deRSE19 - Conference for Research Software Engineers in Germany
Die Hard 1.1024.0: backward compatibility of a search engine with persistant IDs [link]Paper   link   bibtex   abstract  
ANNIS: A graph-based query system for deeply annotated text corpora. Krause, T. Ph.D. Thesis, Humboldt-Universität zu Berlin, Mathematisch-Naturwissenschaftliche Fakultät, 2019.
ANNIS: A graph-based query system for deeply annotated text corpora [link]Paper   doi   link   bibtex  
  2018 (1)
Designing a Re-Usable and Embeddable Corpus Search Library. Krause, T.; Leser, U.; Lüdeling, A.; and Druskat, S. In Hanno Biber; Breiteneder, E.; Clematide, S.; and Witt, A., editor(s), Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), Miyazaki, Japan, December 2018. European Language Resources Association (ELRA)
Designing a Re-Usable and Embeddable Corpus Search Library [pdf]Paper   link   bibtex  
  2017 (2)
RIDGES Herbology: designing a diachronic multi-layer corpus. Odebrecht, C.; Belz, M.; Zeldes, A.; Lüdeling, A.; and Krause, T. Language Resources and Evaluation, 51(3): 695–725. September 2017.
doi   link   bibtex   abstract  
Zwei grundlegende Fragen der digitalen Nachhaltigkeit: Wie können wir die heterogenen Forschungsfragen und die Community bei der Verfügbarmachung von Forschungsdaten miteinbeziehen?. Odebrecht, C.; Dreyer, M.; Lüdeling, A.; and Krause, T. In Digitale Nachhaltigkeit. DHd 2017, Bern, February 2017.
Zwei grundlegende Fragen der digitalen Nachhaltigkeit: Wie können wir die heterogenen Forschungsfragen und die Community bei der Verfügbarmachung von Forschungsdaten miteinbeziehen? [pdf]Paper   link   bibtex  
  2016 (6)
ANNIS3: A new architecture for generic corpus query and visualization. Krause, T.; and Zeldes, A. Digital Scholarship in the Humanities, 31(1): 118–139. 2016.
doi   link   bibtex   abstract  
Utilising ANNIS for search and analysis of historical data. Druskat, S.; Krause, T.; and Odebrecht, C. September 2016. Reuse or New Development: sustainability of resources and tools for multi-facetted historical data and languages. Workshop in conjuction with the Conference Forschungsdaten in den Geisteswissenschaften (FORGE 2016) "Jenseits der Daten"
Utilising ANNIS for search and analysis of historical data [link]Paper   link   bibtex  
Berlin United - Nao Team Humboldt: Team Report 2016. Mellmann, H.; Schlotter, B.; Kaden, S.; Strobel, P.; Krause, T.; and Ritter, C. Technical Report Humboldt-Universität zu Berlin, Adaptive Systems Group, 2016.
Berlin United - Nao Team Humboldt: Team Report 2016 [pdf]Paper   link   bibtex  
graphANNIS: A Fast Query Engine for Deeply Annotated Linguistic Corpora. Krause, T.; Leser, U.; and Lüdeling, A. JLCL, 31(1): iii–25. 2016.
graphANNIS: A Fast Query Engine for Deeply Annotated Linguistic Corpora [pdf]Paper   link   bibtex  
corpus-tools.org: An Interoperable Generic Software Tool Set for Multi-layer Linguistic Corpora. Druskat, S.; Gast, V.; Krause, T.; and Zipser, F. In Chair), N. C. (.; Choukri, K.; Declerck, T.; Goggi, S.; Grobelnik, M.; Maegaard, B.; Mariani, J.; Mazo, H.; Moreno, A.; Odijk, J.; and Piperidis, S., editor(s), Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), Portorož, Slovenia, 2016. European Language Resources Association (ELRA)
corpus-tools.org: An Interoperable Generic Software Tool Set for Multi-layer Linguistic Corpora [pdf]Paper   link   bibtex  
A workflow for creating, analysing, and storing multi-layer corpora: Pepper, Atomic, ANNIS and LAUDATIO. Druskat, S.; Krause, T.; Odebrecht, C.; and Zipser, F. In DGfS-CL Poster Session. 38. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), 2016.
doi   link   bibtex  
  2015 (5)
SaltNPepper, ANNIS & Atomic: Eine Infrastruktur für Mehrebenenkorpora. Zipser, F.; Röhrig, A.; Lüdeling, A.; Klotz, M.; Krause, T.; Druskat, S.; and Voigt, V. 2015. Digital Humanities Tag an der Humboldt Universität (DH Tag)
SaltNPepper, ANNIS & Atomic: Eine Infrastruktur für Mehrebenenkorpora [link]Paper   link   bibtex  
Interactive analysis of multi-layer linguistic corpora with ANNIS. Zipser, F.; Krause, T.; and Neumann, A. In DGfS-CL Poster Session. 37. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), April 2015.
Interactive analysis of multi-layer linguistic corpora with ANNIS [link]Paper   doi   link   bibtex  
ANNIS, SaltNPepper & PAULA: A multilayer corpus infrastructure. Zipser, F.; Krause, T.; Lüdeling, A.; Neumann, A.; Stede, M.; and Zeldes, A. In Final Conference of the SFB 632 Information Structure: Advances in Information Structure Research 2003 - 2015, Berlin, 2015.
ANNIS, SaltNPepper & PAULA: A multilayer corpus infrastructure [link]Paper   doi   link   bibtex  
Austausch von historischen Texten verschiedener Sprachen über das LAUDATIO-Repository. Odebrecht, C.; Krause, T.; and Lüdeling, A. In DGfS-CL Poster Session. 37. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), Universität Leipzig, 2015.
link   bibtex  
LAUDATIO. Ein flexibles Repositorium für historische Textdaten. Krause, T.; Lüdeling, A.; Odebrecht, C.; and Zielke, D. In Forschungsdaten in den Geisteswissenschaften (FORGE 2015), Hamburg, 2015. Universität Hamburg
LAUDATIO. Ein flexibles Repositorium für historische Textdaten [pdf]Paper   link   bibtex  
  2014 (4)
LAUDATIO-Repository: Accessing a heterogeneous field of linguistic corpora with the help of an open access repository. Krause, T.; Lüdeling, A.; Odebrecht, C.; Romary, L.; Schirmbacher, P.; and Zielke, D. In Digital Humanities 2014 Conference. Poster Session, 2014.
LAUDATIO-Repository: Accessing a heterogeneous field of linguistic corpora with the help of an open access repository [link]Paper   link   bibtex  
Wissenschaftliche Nutzung der korpuslinguistischen Infrastruktur LAUDATIO. Odebrecht, C.; Zielke, D.; Krause, T.; Weißenfels, B.; Belz, M.; Schernikau, T.; and Voigt, V. In 36. Jahrestagung der DGfS, Poster-Session der Sektion Computerlinguistik, Marburg, 2014.
link   bibtex  
ANNIS3: Towards Generic Corpus Search and Visualization. Krause, T.; Weißenfels, B.; Zeldes, A.; and Zipser, F. In 36. Jahrestagung der DGfS, Poster-Session der Sektion Computerlinguistik, Marburg, 2014.
link   bibtex  
Langfristiger Zugang und wissenschaftliche Nutzung historischer Korpora mit der korpuslinguistischen Infrastruktur LAUDATIO. Krause, T.; Odebrecht, C.; and Zielke, D. In Open-Access-Strategie für Berlin, Berlin, 2014. Freie Universität zu Berlin
Langfristiger Zugang und wissenschaftliche Nutzung historischer Korpora mit der korpuslinguistischen Infrastruktur LAUDATIO [link]Paper   link   bibtex  
  2013 (3)
Unary TEI Elements and the Token Based Corpus. Krause, T.; Odebrecht, C.; Zeldes, A.; and Zipser, F. October 2013. Workshop Perspectives on Querying TEI-annotated data, TEI Conference 2013
Unary TEI Elements and the Token Based Corpus [pdf]Paper   link   bibtex  
Metadata in an Infrastructure for Historical Corpora. Odebrecht, C.; and Krause, T. 2013. Published: SFB 732 Incremental Specification in Context. Kolloquium. Stuttgart
link   bibtex  
Wie kann der Zugriff, die Wiederverwendung und langfristige Speicherung von linguistischen Korpora realisiert werden?. Krause, T.; Odebrecht, C.; and Zielke, D. In 35. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), Universität Potsdam, 2013.
Wie kann der Zugriff, die Wiederverwendung und langfristige Speicherung von linguistischen Korpora realisiert werden? [link]Paper   link   bibtex  
  2012 (1)
Multiple Tokenization in a Diachronic Corpus. Krause, T.; Lüdeling, A.; Odebrecht, C.; and Zeldes, A. In Exploring Ancient Languages through Corpora Conference (EALC), Universitetet i Oslo, 2012.
Multiple Tokenization in a Diachronic Corpus [pdf]Paper   link   bibtex  
  2011 (2)
Topological Fields, Constituents and Coreference: A New Multi-layer Architecture for TüBa-D/Z. Krause, T.; Ritz, J.; Zeldes, A.; and Zipser, F. In Proceedings of the Conference of the German Society for Computational Linguistics and Language Technology (GSCL) 2011, pages 259–262, Hamburg, 2011.
Topological Fields, Constituents and Coreference: A New Multi-layer Architecture for TüBa-D/Z. [pdf]Paper   link   bibtex  
Erfahrungsbasierte Lernmethoden zur visuellen Trajektorienvorhersage humanoider Roboter. Krause, T. Master's thesis, Humboldt-Universität zu Berlin, 2011.
Erfahrungsbasierte Lernmethoden zur visuellen Trajektorienvorhersage humanoider Roboter [pdf]Paper   link   bibtex  
  2010 (3)
NAO-Team Humboldt 2010. Burkhard, H.; Holzhauer, F.; Krause, T.; Mellmann, H.; Ritter, C. N.; Welter, O.; and Xu, Y. Technical Report Humboldt Universität zu Berlin, 2010.
NAO-Team Humboldt 2010 [pdf]Paper   link   bibtex  
"Dass wenn man etwas will, muss man dafür arbeiten"- Zielhypothesen im Lernerkorpus Falko. Reznicek, M.; Krummes, C.; Hirschmann, H.; Lüdeling, A.; Ensslin, A.; Chan, J. W.; Krause, A. Z. T.; and Zipser, F. In 31. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft, Berlin, 2010.
link   bibtex  
NaoTH Software Architecture for an Autonomous Agent. Mellmann, H.; Xu, Y.; Krause, T.; and Holzhauer, F. In Proceedings of the International Workshop on Standards and Common Platforms for Robotics (SCPR 2010), pages 316–327, Darmstadt, November 2010.
NaoTH Software Architecture for an Autonomous Agent [pdf]Paper   link   bibtex   abstract  
  2009 (2)
NAO-Team Humboldt 2009. Burkhard, H.; Holzhauer, F.; Krause, T.; Mellmann, H.; Ritter, C. N.; Welter, O.; and Xu, Y. Technical Report Humboldt Universität zu Berlin, 2009.
NAO-Team Humboldt 2009 [pdf]Paper   link   bibtex  
Search and Visualization of Richly Annotated Corpora with ANNIS2. Chiarcos, C.; Krause, T.; Lüdeling, A.; Ritz, J.; Rosenfeld, V.; Stede, M.; Zeldes, A.; and Zipser, F. In 31. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft, Osnabrück, 2009.
Search and Visualization of Richly Annotated Corpora with ANNIS2 [link]Paper   link   bibtex  
  2005 (1)
GermanTeam 2005. Röfer, T.; Laue, T.; Weber, M.; Burkhard, H.; Jüngel, M.; Göhring, D.; Hoffmann, J.; Altmeyer, B.; Krause, T.; Spranger, M.; Stryk, O. v.; Brunn, R.; Dassler, M.; Kunz, M.; Oberlies, T.; Risler, M.; Schwiegelshohn, U.; Hebbel, M.; Nisticó, W.; Czarnetzki, S.; Kerkhof, T.; Meyer, M.; Rohde, C.; Schmitz, B.; Wachter, M.; Wegner, T.; and Zarges, C. Technical Report 2005.
GermanTeam 2005 [pdf]Paper   link   bibtex  
  undefined (1)
Differenzierung und Standardisierung. Zur Entwicklung von Registern. Uyanık, E.; Müller, S. O.; Lüdeling, A.; and Krause, T. In Pawłowski, G.; Guławska, M.; and Bąk, P., editor(s), Historische Fach- und Wissenschaftstexte kontrastiv. .
link   bibtex