Deutsches Textarchiv

Das Deutsche Textarchiv stellt einen disziplin- und gattungsübergreifenden Grundbestand deutschsprachiger Texte aus dem Zeitraum von ca. 1600 bis 1900 bereit. Das Korpus ist einheitlich im XML/TEI P5-basierten DTA-Basisformat kodiert und mit computerlinguistischen Methoden im Standoff-Verfahren analysiert. Von anderen umfangreichen Textsammlungen im Internet wie Google Books, Wikisource oder dem Projekt Gutenberg-DE unterscheidet sich das DTA durch die sorgfältige Auswahl der Texte und Ausgaben, die sehr hohe Erfassungsgenauigkeit, die strukturelle und linguistische Erschließung der Textdaten sowie die Verlässlichkeit der Metadaten.

Projektmitarbeiter

Prof. Dr. W. Klein, Dr. A. Geyken (Leitung); S. Haaf, B. Jurish, C. Leijser, M. Schulz, C. Thomas, F. Wiegand, K. Zimmer
 

Gefördert durch

Deutsche Forschungsgemeinschaft (DFG)
 

Erfahren Sie mehr unter

http://www.deutschestextarchiv.de

DHd Mailingliste

Registrieren Sie sich für die DHd-Mailingliste (Info). Das Archiv finden Sie hier.