EXMARaLDA

EXMARaLDA steht für "Extensible Markup Language for Discourse Annotation" und ist ein System von Konzepten, Datenformaten und Werkzeugen für die computergestützte Transkription und Annotation gesprochener Sprache, sowie für das Erstellen und Auswerten von Korpora gesprochener Sprache. EXMARaLDA wurde ursprünglich im Teilprojekt "Computergestützte Erfassungs- und Analysemethoden multilingualer Daten" des Sonderforschungsbereichs "Mehrsprachigkeit" (SFB 538) der Universität Hamburg entwickelt. Seit November 2011 wird die Entwicklung im Hamburger Zentrum für Sprachkorpora in Zusammenarbeit mit dem Archiv für Gesprochenes Deutsch am IDS Mannheim weitergeführt. Alle Komponenten des EXMARaLDA-Systems sind frei verfügbar.

Projektinhalt

EXMARaLDA ist ein System zur Erstellung, Verwaltung und Analyse digitaler Korpora gesprochener Sprache. Es wurde ursprünglich zwischen Juli 2000 und Juni 2011 im Rahmen des Sonderforschungsbereichs "Mehrsprachigkeit" (SFB 538) der Universität Hamburg entwickelt. Seit November 2011 wird die Entwicklung im Hamburger Zentrum für Sprachkorpora in Zusammenarbeit mit dem Archiv für Gesprochenes Deutsch am IDS Mannheim weitergeführt.
Aktuell wird EXMARaLDA u.a. zur Korpuserstellung im Bereich der Pragmatik und Konversationsanalyse, in der Dialektologie, in Studien zu Multimodalität und zur Digitalisierung analoger Korpora verwendet. Alle Komponenten des EXMARaLDA-Systems können frei heruntergeladen werden und sind ohne Registrierung zu verwenden. Zu den am häufigsten verwendeten EXMARaLDA-Werkzeugen gehören beispielsweise der Partitur Editor, ein Werkzeug zur Eingabe, Bearbeitung und Ausgabe von EXMARaLDA-Transkriptionen in Partitur-Notation, der Corpus Manager (Coma), ein Werkzeug, um EXMARaLDA-Transkriptionen und die dazugehörigen Aufnahmen mit Metadaten anzureichern und zu Korpora zusammenzufassen, sowie EXAKT (EXMARaLDA Analyse- und Konkordanztool), ein Suchwerkzeug, mit dessen Hilfe sich Korpora nach transkribierten und annotierten Phänomenen durchsuchen lassen.
Eine Hauptmotivation für die Entwicklung von EXMARaLDA lag in der Notwendigkeit, Korpora, die auf proprietären Datenformaten nicht mehr gepflegter Software basieren, nutzbar zu halten. Folglich lag ein Hauptaugenmerk bei der Konzeption von EXMARaLDA auf der Nachhaltigkeit der verarbeiteten Daten. Diese wird durch den Gebrauch offener und standardisierter Datenformate erreicht – in diesem Zusammenhang hat sich XML als universell akzeptierte und quasi konkurrenzlose Lösung etabliert. EXMARaLDA bietet zudem konkrete praktische Unterstützung im Bereich der Interoperationalität in Form von Import- und Exportfitern für andere verbreitete linguistische Werkzeuge und Formate wie z.B. Praat, TEI, ELAN, FOLKER, CHAT, Phon, Transcriber, sowie für gebräuchliche Formate wie RTF, HTML und PDF. Durch die Verwendung von Java zur Implementierung von EXMARaLDA ist es auf allen verbreiteten Betriebssystemen verwendbar (Windows, Macintosh, Linux, Unix).
Neben den traditionellen Darstellungsweisen von Transkriptionen (Partitur, Zeilen, etc.) nutzt EXMARaLDA Hypertext- und Multimediamethoden für die Datenvisualisierung und -verknüpfung. Die Qualität der Wiederverwendbarkeit und Analyse von Korpusdaten wird durch den intendierten, weitreichenden Gebrauch von Metadaten erhöht.
EXMARaLDA unterstützt einen korpus-gestützten, dynamischen Arbeitsablauf, indem es dem Benutzer die Möglichkeit gibt, Suchabfragen bereits während der Transkription zu tätigen, die Genauigkeit existierender Transkriptionen während der Analyse zu überprüfen (z.B. von einem konkreten Abfrageergebnis direkt in das editierbare Transkript zu gelangen) und sie falls nötig zu korrigieren bzw. zu ergänzen.

Projektmitarbeiter

Thomas Schmidt, Kai Wörner, Hanna Hedeland, Daniel Jettka
 

Erfahren Sie mehr unter

 
http://www.exmaralda.org
 

DHd-Mailingliste

Registrieren Sie sich für die DHd-Mailingliste (Info). Das Archiv finden Sie hier.