ELAN

ELAN wird am Max-Planck-Institut für Psycholinguistik im Sprach-Archiv (TLA – The Language Archve) entwickelt. Es wird in der Programmierspache Java geschrieben, die Quellen sind erhältlich für non-kommerzielle Zwecke. Mit ELAN kann ein Benutzer eine unbegrenzte Anzahl von Annotationen zu primären Audio- und Video-Daten erstellen. Eine Annotation kann z.B. ein Satz, Wort oder Morphem sein, oder eine Glosse, ein Kommentar, eine Übersetzung, oder ein Tag oder Beschreibung irgendeines Features das in den Medien beobachtet wurde.

Projektinhalt

Annotationen können mit sogenannten Tiers vielschichtig erstellt werden. Diese Tiers können dabei hierarchisch miteinander verbunden sein. Auf einen seperaten Tier, sind Annotationen zeitlich synchron zu den Medien angeordnet – der Benutzer bestimmt oder verändert Start- und Endpunkt jeder Annotation. Auf abhängigen Tiers, weiter unten in der Hierachie, Annotationen beziehen sich Annotationen auf andere existierende Annotationen, hierbei können sie entweder dieselben Start- und Endzeiten nutzend (eins-zu-eins-Beziehungone), oder den Zeitabschnitt einer Annotation auf einem Tier, der höher in der Hierarchie steht, weiter unterteilen (1:n-Beziehung). Ein Tier kann zum Beispiel Annotationen mit Satz-bezogenen Transkriptionen beinhalten, und abhängige eins-zu-eins-Tiers können Übersetzungen in andere Sprachen beinhalten. Oder eine abhängiger 1:n- Tier beinhaltet eine Annotation für jedes Wort oder jedes Morphem des Tiers auf der höheren Ebene, und ein weiterer beinhaltet gleichzeitig ein Glossierung für jedes Wort oder Morphem. Zahlreiche 1:n-Beziehungen sind möglich, z.B. davon abhängend ob innere Start- und Endzeiten auf den abhängigen Tiers bestimmt werden können. Diese Flexibilität innerhalb der Tier-Relationen erlaubt es, die komplexen ontologischen Verhältnisse von Features zu modellieren, die auf verschiedenen Tiers annotiert werden. Die hierarchischen Konfigurationen können wieder für verschiedene Sprecher verwandt werden und sogar als Vorlage dienen für die Erstellung von neuen Annotations-Dokumenten dienen. Annotationen können durch die Benutzung einer Einzel- oder Multi-Tier-Suche mit regulären Ausdrücken durchsucht werden, innerhalb eines einzelnen Dokuments oder über eine Auswahl vcon Annotations-Dokumenten. Die Annotationen werden immer in seperaten Dateien, unabhängig von den zugehörigen Multimedia-Dateien, erstellt und gespeichert; Letztere bleiben unverändert. Der textuelle Inhalt von Annotationen ist immer in Unicode gehalten und die Annotations-Dateien sind in einem speziellen XML-Format gespeichert, dem “EAF” (ELAN annotation format). Wenn sie in einem Archiv, dass die “Language Archiving Technology “ benutzt, welche auch am TLA (The Language Archive) entwickelt wurde, archiviert sind, können ELAN-Daten zusammen mit den zugehörigen Mediendateien online in einem Web-Browser angezeigt werden.

Förderung

Gefördert wird Elan durch das Max-Planck-Institut für Psycholinguistik und das Sprach-Archiv (TLA – The Language Archve)

Erfahren Sie mehr unter

http://tla.mpi.nl/tools/tla-tools/elan

DHd-Mailingliste

Registrieren Sie sich für die DHd-Mailingliste [Info]. Um frühere Nachrichten an diese Liste zu sehen, besuchen Sie bitte das Archiv der Liste DHd [Link]. (Das aktuelle Archiv ist nur für die Abonnenten der Liste zugänglich.) .

Suchformular

ELAN

Projektinhalt

Förderung

Erfahren Sie mehr unter

DHd-Mailingliste