Im Projekt CLÉA - Collaborative Literature Éxploration and Annotation - entwickeln wir eine webbasierte Arbeitsumgebung, mit der Texte aus dem Google Books Korpus importiert, annotiert und analysiert werden können. CLÉA ist dabei eine partielle Weiterentwicklung unserer Desktop-Software CATMA, mit der semantische Annotationen nach TEI-Standard als non-deterministisches “stand off markup” erstellt werden können.
Die Entwicklung des CLÉA Systems geht einher mit einer Pilotstudie, in der wir ein Google Books Teilkorpus von etwa 15-20 deutschsprachigen literarischen Texten vor 1900 mit narratologischem MarkUp versehen werden. Dieses im sog. ‘crowd sourcing’ Modus kollaborativ erstellte Markup soll dann mit Hilfe von Maschinen-Lern-Algorithmen ausgewertet werden, um so schrittweise zu neuen automatisierten Annotationsverfahren zu gelangen.
CATMA ist ein Projekt der Universität Hamburg unter Mitarbeit von Prof. Dr. Jan Christoph Meister (Projektleiter), Evelyn Gius, M.A. (Projektkoordinatorin), Malte Meister und Marco Petris (Systementwickler) und Lena Schüch.
CLÉA ist eines von insgesamt zwölf europäischen Projekten, die 2010 einen Google Digital Humanties Award erhalten haben.