Sprach- und literaturwissenschaftliche Fakultät - Korpuslinguistik und Morphologie

Dr. Thomas Krause

Übersicht

Wissenschaftlicher Mitarbeiter

Institut für deutsche Sprache und Linguistik
Sprach- und literaturwissenschaftliche Fakultät
Humboldt-Universität zu Berlin
Unter den Linden 6
10099 Berlin

Telefon: +49 (0)30 2093 9720


Sitz: Raum 3.333 - Dorotheenstraße 24, 10117 Berlin - Mitte

Sprechzeiten in Vorlesungszeit Sommersemester 2025: Dienstags 11:00 bis 12:00 (bitte mit Anmeldung)

Projekte

ANNIS

ANNIS ist ein Such- und Visualisierungssystem für linguistisch annotierte Daten.
Weitere Informationen unter: ANNIS.

 

Hexatomic

Eine erweiterbares Annotationssoftware für Mehrebenenkorpora: https://hexatomic.github.io/

LAUDATIO

LAUDATIO (Long term Access and Usage of Deeply Annotated Information) ist ein Projekt zur Entwicklung einer nachhaltigen und nutzerorientierten Speicherung von Forschungsdaten für die historische Linguistik.

 

Publikationen und Vorträge

generated by bibbase.org
  2025 (1)
„Step away from the Computer!“: Über die linguistische Datenkategorisierung als Erkenntnisprozess und daraus folgende Herausforderungen bei der Nachnutzung von Annotationen und Annotationstools. Shadrova, A.; Lüdeling, A.; Klotz, M.; Hartz, R. G.; and Krause, T. Zeitschrift für germanistische Linguistik, 53(1): 166–214. April 2025.
„Step away from the Computer!“: Über die linguistische Datenkategorisierung als Erkenntnisprozess und daraus folgende Herausforderungen bei der Nachnutzung von Annotationen und Annotationstools [link]Paper   doi   link   bibtex   abstract  
  2024 (2)
Eine Ressource durch Abwägung: Wie bestehende generische Softwarelösungen ‚über sich hinauswachsen‘ und ein Parallelkorpus ermöglichen. Klotz, M.; and Krause, T. In Coniglio, M.; Recker, A.; and Sahm, H., editor(s), Mittelniederdeutsch zwischen Korpuslinguistik und Literaturwissenschaft, pages 123–138. Göttingen University Press, Göttingen, 2024.
Eine Ressource durch Abwägung: Wie bestehende generische Softwarelösungen ‚über sich hinauswachsen‘ und ein Parallelkorpus ermöglichen [link]Paper   doi   link   bibtex  
Register: Language Users’ Knowledge of Situational-Functional Variation. Lüdeling, A.; Szucsich, L.; Zeige, L. E.; Adli, A.; Alexiadou, A.; Belz, M.; Bouzouita, M.; Bunk, O.; Dreyer, M.; Egg, M.; Feulner, A. H.; Fleischer, J.; Gagarina, N.; Hirsch, A.; Jannedy, S.; Knoeferle, P.; Krause, T.; Kutscher, S.; Liu, M.; Lütke, B.; Machicao y Priemer, A.; Maquate, K.; Merino Hernández, L.; Meyer, R.; Mooshammer, C.; Müller, S.; Sauerland, U.; Sauermann, A.; Schmitt, V.; Schumacher, N.; Serova, D.; Solt, S.; Vander Klok, J.; Verhoeven, E.; Waltereit, R.; Weirich, M.; and Wiese, H. Register Aspects of Language in Situation, 3(1): 1–53. 2024. Publisher: Sprach- und literaturwissenschaftliche Fakultät
Register: Language Users’ Knowledge of Situational-Functional Variation [link]Paper   doi   link   bibtex   abstract  
  2023 (2)
Hexatomic: An extensible, OS-independent platform for deep multi-layer linguistic annotation of corpora. Druskat, S.; Krause, T.; Lachenmaier, C.; and Bunzeck, B. Journal of Open Source Software, 8(86): 4825. 2023. Publisher: The Open Journal
Hexatomic: An extensible, OS-independent platform for deep multi-layer linguistic annotation of corpora [link]Paper   doi   link   bibtex  
The four elements of achieving research software sustainability for long tail projects. Druskat, S.; and Krause, T. February 2023.
The four elements of achieving research software sustainability for long tail projects [link]Paper   link   bibtex   abstract  
  2022 (3)
graphANNIS 2.2.2. Krause, T. July 2022.
graphANNIS 2.2.2 [link]Paper   doi   link   bibtex  
ANNIS 4.9.5. Krause, T.; Benjamin, W.; Rütte, T.; Glushanok, I.; Klotz, M.; Zhang, S.; Zeldes, A.; Bartels, F.; Druskat, S.; Boyd, A.; Stemle, E.; Lampen, L.; and Petran, F. July 2022.
ANNIS 4.9.5 [link]Paper   doi   link   bibtex  
Register: Language Users’ Knowledge of Situational-Functional Variation. Lüdeling, A.; Alexiadou, A.; Adli, A.; Donhauser, K.; Dreyer, M.; Egg, M.; Feulner, A. H.; Gagarina, N.; Hock, W.; Jannedy, S.; Kammerzell, F.; Knoeferle, P.; Krause, T.; Krifka, M.; Kutscher, S.; Lütke, B.; McFadden, T.; Meyer, R.; Mooshammer, C.; Müller, S.; Maquate, K.; Norde, M.; Sauerland, U.; Solt, S.; Szucsich, L.; Verhoeven, E.; Waltereit, R.; Wolfsgruber, A.; and Zeige, L. E. . July 2022. Accepted: 2022-08-24T08:42:50Z Publisher: Humboldt-Universität zu Berlin
Register: Language Users’ Knowledge of Situational-Functional Variation [link]Paper   doi   link   bibtex   abstract  
  2021 (1)
What is a good corpus?. Lüdeling, A.; Schäfer, R.; Pankratz, E.; Krause, T.; Bildhauer, F.; and Golcher, F. March 2021. A series of three talks given in the colloquium of the CRC (SFB) 1412 Register.
What is a good corpus? [pdf]Paper   link   bibtex  
  2020 (1)
RUEG Corpus. Wiese, H.; Alexiadou, A.; Allen, S.; Bunk, O.; Gagarina, N.; Iefremenko, K.; Jahns, E.; Klotz, M.; Krause, T.; Labrenz, A.; Lüdeling, A.; Martynova, M.; Neuhaus, K.; Pashkova, T.; Rizou, V.; Rosemarie, T.; Schroeder, C.; Szucsich, L.; Tsehaye, W.; Zerbian, S.; and Zuban, Y. April 2020.
RUEG Corpus [link]Paper   link   bibtex  
  2019 (2)
Die Hard 1.1024.0: backward compatibility of a search engine with persistant IDs. Krause, T.; and Druskat, S. June 2019. deRSE19 - Conference for Research Software Engineers in Germany
Die Hard 1.1024.0: backward compatibility of a search engine with persistant IDs [link]Paper   link   bibtex   abstract  
ANNIS: A graph-based query system for deeply annotated text corpora. Krause, T. Ph.D. Thesis, Humboldt-Universität zu Berlin, Mathematisch-Naturwissenschaftliche Fakultät, 2019.
ANNIS: A graph-based query system for deeply annotated text corpora [link]Paper   doi   link   bibtex  
  2018 (1)
Designing a Re-Usable and Embeddable Corpus Search Library. Krause, T.; Leser, U.; Lüdeling, A.; and Druskat, S. In Hanno Biber; Breiteneder, E.; Clematide, S.; and Witt, A., editor(s), Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), Miyazaki, Japan, December 2018. European Language Resources Association (ELRA)
Designing a Re-Usable and Embeddable Corpus Search Library [pdf]Paper   link   bibtex  
  2017 (2)
RIDGES Herbology: designing a diachronic multi-layer corpus. Odebrecht, C.; Belz, M.; Zeldes, A.; Lüdeling, A.; and Krause, T. Language Resources and Evaluation, 51(3): 695–725. September 2017.
doi   link   bibtex   abstract  
Zwei grundlegende Fragen der digitalen Nachhaltigkeit: Wie können wir die heterogenen Forschungsfragen und die Community bei der Verfügbarmachung von Forschungsdaten miteinbeziehen?. Odebrecht, C.; Dreyer, M.; Lüdeling, A.; and Krause, T. In Digitale Nachhaltigkeit. DHd 2017, Bern, February 2017.
Zwei grundlegende Fragen der digitalen Nachhaltigkeit: Wie können wir die heterogenen Forschungsfragen und die Community bei der Verfügbarmachung von Forschungsdaten miteinbeziehen? [pdf]Paper   link   bibtex  
  2016 (6)
ANNIS3: A new architecture for generic corpus query and visualization. Krause, T.; and Zeldes, A. Digital Scholarship in the Humanities, 31(1): 118–139. 2016.
doi   link   bibtex   abstract  
Utilising ANNIS for search and analysis of historical data. Druskat, S.; Krause, T.; and Odebrecht, C. September 2016. Reuse or New Development: sustainability of resources and tools for multi-facetted historical data and languages. Workshop in conjuction with the Conference Forschungsdaten in den Geisteswissenschaften (FORGE 2016) "Jenseits der Daten"
Utilising ANNIS for search and analysis of historical data [link]Paper   link   bibtex  
Berlin United - Nao Team Humboldt: Team Report 2016. Mellmann, H.; Schlotter, B.; Kaden, S.; Strobel, P.; Krause, T.; and Ritter, C. Technical Report Humboldt-Universität zu Berlin, Adaptive Systems Group, 2016.
Berlin United - Nao Team Humboldt: Team Report 2016 [pdf]Paper   link   bibtex  
graphANNIS: A Fast Query Engine for Deeply Annotated Linguistic Corpora. Krause, T.; Leser, U.; and Lüdeling, A. JLCL, 31(1): iii–25. 2016.
graphANNIS: A Fast Query Engine for Deeply Annotated Linguistic Corpora [pdf]Paper   link   bibtex  
corpus-tools.org: An Interoperable Generic Software Tool Set for Multi-layer Linguistic Corpora. Druskat, S.; Gast, V.; Krause, T.; and Zipser, F. In Chair), N. C. (.; Choukri, K.; Declerck, T.; Goggi, S.; Grobelnik, M.; Maegaard, B.; Mariani, J.; Mazo, H.; Moreno, A.; Odijk, J.; and Piperidis, S., editor(s), Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), Portorož, Slovenia, 2016. European Language Resources Association (ELRA)
corpus-tools.org: An Interoperable Generic Software Tool Set for Multi-layer Linguistic Corpora [pdf]Paper   link   bibtex  
A workflow for creating, analysing, and storing multi-layer corpora: Pepper, Atomic, ANNIS and LAUDATIO. Druskat, S.; Krause, T.; Odebrecht, C.; and Zipser, F. In DGfS-CL Poster Session. 38. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), 2016.
doi   link   bibtex  
  2015 (5)
SaltNPepper, ANNIS & Atomic: Eine Infrastruktur für Mehrebenenkorpora. Zipser, F.; Röhrig, A.; Lüdeling, A.; Klotz, M.; Krause, T.; Druskat, S.; and Voigt, V. 2015. Digital Humanities Tag an der Humboldt Universität (DH Tag)
SaltNPepper, ANNIS & Atomic: Eine Infrastruktur für Mehrebenenkorpora [link]Paper   link   bibtex  
Interactive analysis of multi-layer linguistic corpora with ANNIS. Zipser, F.; Krause, T.; and Neumann, A. In DGfS-CL Poster Session. 37. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), April 2015.
Interactive analysis of multi-layer linguistic corpora with ANNIS [link]Paper   doi   link   bibtex  
ANNIS, SaltNPepper & PAULA: A multilayer corpus infrastructure. Zipser, F.; Krause, T.; Lüdeling, A.; Neumann, A.; Stede, M.; and Zeldes, A. In Final Conference of the SFB 632 Information Structure: Advances in Information Structure Research 2003 - 2015, Berlin, 2015.
ANNIS, SaltNPepper & PAULA: A multilayer corpus infrastructure [link]Paper   doi   link   bibtex  
Austausch von historischen Texten verschiedener Sprachen über das LAUDATIO-Repository. Odebrecht, C.; Krause, T.; and Lüdeling, A. In DGfS-CL Poster Session. 37. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), Universität Leipzig, 2015.
link   bibtex  
LAUDATIO. Ein flexibles Repositorium für historische Textdaten. Krause, T.; Lüdeling, A.; Odebrecht, C.; and Zielke, D. In Forschungsdaten in den Geisteswissenschaften (FORGE 2015), Hamburg, 2015. Universität Hamburg
LAUDATIO. Ein flexibles Repositorium für historische Textdaten [pdf]Paper   link   bibtex  
  2014 (4)
LAUDATIO-Repository: Accessing a heterogeneous field of linguistic corpora with the help of an open access repository. Krause, T.; Lüdeling, A.; Odebrecht, C.; Romary, L.; Schirmbacher, P.; and Zielke, D. In Digital Humanities 2014 Conference. Poster Session, 2014.
LAUDATIO-Repository: Accessing a heterogeneous field of linguistic corpora with the help of an open access repository [link]Paper   link   bibtex  
Wissenschaftliche Nutzung der korpuslinguistischen Infrastruktur LAUDATIO. Odebrecht, C.; Zielke, D.; Krause, T.; Weißenfels, B.; Belz, M.; Schernikau, T.; and Voigt, V. In 36. Jahrestagung der DGfS, Poster-Session der Sektion Computerlinguistik, Marburg, 2014.
link   bibtex  
ANNIS3: Towards Generic Corpus Search and Visualization. Krause, T.; Weißenfels, B.; Zeldes, A.; and Zipser, F. In 36. Jahrestagung der DGfS, Poster-Session der Sektion Computerlinguistik, Marburg, 2014.
link   bibtex  
Langfristiger Zugang und wissenschaftliche Nutzung historischer Korpora mit der korpuslinguistischen Infrastruktur LAUDATIO. Krause, T.; Odebrecht, C.; and Zielke, D. In Open-Access-Strategie für Berlin, Berlin, 2014. Freie Universität zu Berlin
Langfristiger Zugang und wissenschaftliche Nutzung historischer Korpora mit der korpuslinguistischen Infrastruktur LAUDATIO [link]Paper   link   bibtex  
  2013 (3)
Unary TEI Elements and the Token Based Corpus. Krause, T.; Odebrecht, C.; Zeldes, A.; and Zipser, F. October 2013. Workshop Perspectives on Querying TEI-annotated data, TEI Conference 2013
Unary TEI Elements and the Token Based Corpus [pdf]Paper   link   bibtex  
Metadata in an Infrastructure for Historical Corpora. Odebrecht, C.; and Krause, T. 2013. Published: SFB 732 Incremental Specification in Context. Kolloquium. Stuttgart
link   bibtex  
Wie kann der Zugriff, die Wiederverwendung und langfristige Speicherung von linguistischen Korpora realisiert werden?. Krause, T.; Odebrecht, C.; and Zielke, D. In 35. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), Universität Potsdam, 2013.
Wie kann der Zugriff, die Wiederverwendung und langfristige Speicherung von linguistischen Korpora realisiert werden? [link]Paper   link   bibtex  
  2012 (1)
Multiple Tokenization in a Diachronic Corpus. Krause, T.; Lüdeling, A.; Odebrecht, C.; and Zeldes, A. In Exploring Ancient Languages through Corpora Conference (EALC), Universitetet i Oslo, 2012.
Multiple Tokenization in a Diachronic Corpus [pdf]Paper   link   bibtex  
  2011 (2)
Topological Fields, Constituents and Coreference: A New Multi-layer Architecture for TüBa-D/Z. Krause, T.; Ritz, J.; Zeldes, A.; and Zipser, F. In Proceedings of the Conference of the German Society for Computational Linguistics and Language Technology (GSCL) 2011, pages 259–262, Hamburg, 2011.
Topological Fields, Constituents and Coreference: A New Multi-layer Architecture for TüBa-D/Z. [pdf]Paper   link   bibtex  
Erfahrungsbasierte Lernmethoden zur visuellen Trajektorienvorhersage humanoider Roboter. Krause, T. Master's thesis, Humboldt-Universität zu Berlin, 2011.
Erfahrungsbasierte Lernmethoden zur visuellen Trajektorienvorhersage humanoider Roboter [pdf]Paper   link   bibtex  
  2010 (3)
NAO-Team Humboldt 2010. Burkhard, H.; Holzhauer, F.; Krause, T.; Mellmann, H.; Ritter, C. N.; Welter, O.; and Xu, Y. Technical Report Humboldt Universität zu Berlin, 2010.
NAO-Team Humboldt 2010 [pdf]Paper   link   bibtex  
"Dass wenn man etwas will, muss man dafür arbeiten"- Zielhypothesen im Lernerkorpus Falko. Reznicek, M.; Krummes, C.; Hirschmann, H.; Lüdeling, A.; Ensslin, A.; Chan, J. W.; Krause, A. Z. T.; and Zipser, F. In 31. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft, Berlin, 2010.
link   bibtex  
NaoTH Software Architecture for an Autonomous Agent. Mellmann, H.; Xu, Y.; Krause, T.; and Holzhauer, F. In Proceedings of the International Workshop on Standards and Common Platforms for Robotics (SCPR 2010), pages 316–327, Darmstadt, November 2010.
NaoTH Software Architecture for an Autonomous Agent [pdf]Paper   link   bibtex   abstract  
  2009 (2)
NAO-Team Humboldt 2009. Burkhard, H.; Holzhauer, F.; Krause, T.; Mellmann, H.; Ritter, C. N.; Welter, O.; and Xu, Y. Technical Report Humboldt Universität zu Berlin, 2009.
NAO-Team Humboldt 2009 [pdf]Paper   link   bibtex  
Search and Visualization of Richly Annotated Corpora with ANNIS2. Chiarcos, C.; Krause, T.; Lüdeling, A.; Ritz, J.; Rosenfeld, V.; Stede, M.; Zeldes, A.; and Zipser, F. In 31. Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft, Osnabrück, 2009.
Search and Visualization of Richly Annotated Corpora with ANNIS2 [link]Paper   link   bibtex  
  2005 (1)
GermanTeam 2005. Röfer, T.; Laue, T.; Weber, M.; Burkhard, H.; Jüngel, M.; Göhring, D.; Hoffmann, J.; Altmeyer, B.; Krause, T.; Spranger, M.; Stryk, O. v.; Brunn, R.; Dassler, M.; Kunz, M.; Oberlies, T.; Risler, M.; Schwiegelshohn, U.; Hebbel, M.; Nisticó, W.; Czarnetzki, S.; Kerkhof, T.; Meyer, M.; Rohde, C.; Schmitz, B.; Wachter, M.; Wegner, T.; and Zarges, C. Technical Report 2005.
GermanTeam 2005 [pdf]Paper   link   bibtex  
  undefined (1)
Differenzierung und Standardisierung. Zur Entwicklung von Registern. Uyanık, E.; Müller, S. O.; Lüdeling, A.; and Krause, T. In Pawłowski, G.; Guławska, M.; and Bąk, P., editor(s), Historische Fach- und Wissenschaftstexte kontrastiv. .
link   bibtex