Das Deutsche Textarchiv stellt einen disziplin- und gattungsübergreifenden Grundbestand deutschsprachiger Texte aus dem Zeitraum von ca. 1600 bis 1900 bereit. Das Korpus ist einheitlich im XML/TEI P5-basierten DTA-Basisformat kodiert und mit computerlinguistischen Methoden im Standoff-Verfahren analysiert. Von anderen umfangreichen Textsammlungen im Internet wie Google Books, Wikisource oder dem Projekt Gutenberg-DE unterscheidet sich das DTA durch die sorgfältige Auswahl der Texte und Ausgaben, die sehr hohe Erfassungsgenauigkeit, die strukturelle und linguistische Erschließung der Textdaten sowie die Verlässlichkeit der Metadaten.
Prof. Dr. W. Klein (Leitung), Dr. A. Geyken (stellv. Leitung); M. Boenig, S. Haaf, Dr. B. Jurish, C. Thomas, F. Wiegand, K.-M. Würzner, K. Zimmer; E. Roessink
Deutsche Forschungsgemeinschaft (DFG), Förderung von 2007 bis 2017