Workshop: Aufbau historischer Sprachressourcen: Arbeiten mit den Angeboten des Deutschen Textarchivs

Untertitel: 
7. Juli 2014, 9:00-17:00 Uhr, BBAW, Berlin

Kategorie: 

Am 7. Juli 2014 veranstaltet das Deutsche Textarchiv (DTA) einen Workshop zum Thema "Aufbau historischer Sprachressourcen: Arbeiten mit den Angeboten des Deutschen Textarchivs". Der Workshop wendet sich an Nutzerinnen und Nutzer des DTA ebenso wie an Interessierte, die die Angebote des DTA kennenlernen möchten. Es werden bewährte und zum Teil neu im DTA entwickelte Methoden und Hilfsmittel zum Aufbau und zur Analyse von Korpora vorgestellt und deren Anwendung im Rahmen praktischer Übungen eingeübt.
 
In zwei Themenblöcken werden die Aufbereitung von Ressourcen entsprechend den DTA-Richtlinien einerseits sowie die Arbeit mit den bestehenden DTA-Korpora andererseits näher beleuchtet.
 
Im Rahmen des ersten Themenblocks werden verschiedene Schritte der TEI/P5-kompatiblen Aufbereitung von Ressourcen gezeigt. Grundlage bilden dabei die im DTA-Basisformat (DTABf) zusammengefassten DTA-Richtlinien zur Transkription und zur Annotation historischer Texte. Ausgehend von verschiedenen Szenarien der Textaufbereitung (bestehende Transkriptionen aus unterschiedlichen Formaten; neue Transkriptionsvorhaben) werden Hinweise zur Zuverlässigkeit von Bildvorlagen und Transkription gegeben, Möglichkeiten der halbautomatischen Konvertierung in das DTA-Basisformat vorgeführt und anhand praktischer Übungen vermittelt; die DTABf-kompatible Textaufbereitung mithilfe des DTA-oXygen-Frameworks DTAoX wird erprobt. Darüber hinaus wird gezeigt, wie mithilfe des DTAE-Metadatenformulars ein TEI-Header mit ausführlichen Metadaten zu einem historischen Dokument erstellt werden kann. Schließlich werden Methoden der Kontrolle und Überarbeitung abgeschlossener XML-Textausgaben innerhalb der Qualitätssicherungsplattform DTAQ (Ticket-System, integrierte XML-/Text-Editoren) vorgestellt.
 
Der zweite Themenblock widmet sich den Inhalten der linguistischen Analyse im DTA und den Möglichkeiten der wissenschaftlichen Auswertung der DTA-Korpora. Die Teilnehmer/innen erhalten Einblicke in die Nutzung der im DTA verwendeten Suchmaschine DDC, welche die Auswertung des DTA-Gesamtkorpus sowie ausgewählter Teilkorpora in Hinblick auf bestimmte linguistische oder textstrukturelle Merkmale erlaubt. Über die im DTA verfügbaren Möglichkeiten der Visualisierung linguistischer Phänomene wird schließlich gezeigt, welche zusätzlichen Möglichkeiten die Integration von DTA-Korpustexten in die CLARIN-D-Infrastruktur bietet.

Anmeldung

Eine Anmeldung zur Teilnahme am Workshop wird bis zum 15. Juni 2014 erbeten. Bitte füllen Sie hierfür das Formular zur Anmeldung aus.

Veranstalter

DTA (Deutsches Textarchiv)
E-Mail: dta@bbaw.de
Tel.: +49 (0)30 20370 523
Twitter:  @textarchiv

Veranstaltungsort

Berlin-Brandenburgische Akademie der Wissenschaften
Jägerstr. 22/23, 10117 Berlin
- Einstein-Saal -
 

DHd-Mailingliste

Registrieren Sie sich für die DHd-Mailingliste [Info]. Um frühere Nachrichten an diese Liste zu sehen, besuchen Sie bitte das Archiv der Liste DHd [Link]. (Das aktuelle Archiv ist nur für die Abonnenten der Liste zugänglich.) .