Projekt DisKo: Aufbau eines Diversitäts-Korpus (DisKo) als Grundlage für die algorithmische Textanalyse
Als Grundlage für die algorithmische Textanalyse bauen wir ein Diversitäts-Korpus auf. Gesucht werden Romane, die im Zeitraum zwischen 1922 und heute entstanden sind und in dem nicht nur Männer-, Frauen- und neutrale Rollen vorkommen, sondern auch Beschreibungen nicht-binärer Charaktere. Das Korpus dient als Trainingsmaterial für einen Classifier zur automatisierten Analyse von Genderrollen in deutschsprachigen literarischen Texten.
DisKo steht für Diversitäts-Korpus und ist ein literaturwissenschaftliches Projekt mit Digital-Humanities-Komponente. Mit Methoden des maschinellen Lernens wollen wir einen Algorithmus trainieren, der nicht nur weibliche, männliche und neutrale Rollen in literarischen Texten erkennt, sondern auch weniger binäre Genderzuschreibungen. Für diesen Trainingsprozess benötigen wir erst einmal ein möglichst diverses Trainingskorpus, das aus Texten besteht, in denen nicht-binäre Genderzuschreibungen vorkommen. Im Rahmen eines Public-Humanities-Konzepts sollen an der Korpusakquise möglichst unterschiedliche Leser:innengruppen beteiligt werden. Denn: Je diverser die Personen, die an der Gestaltung des Korpus beteiligt sind, desto diverser sind am Ende auch die Texte in unserem Trainingskorpus. Diese Vielfalt ist wichtig, um Genderdiversität mit unserem Digital-Humanities-Ansatz sichtbar machen zu können. Zentrale Komponente des Projekts ist eine Umfrage, bei der Sie Ihre Texthinweise einreichen können. Kennen Sie literarische Werke, in denen Figuren nicht stereotyp, sondern divers beschrieben werden? Dann nehmen Sie über den Link an unserer Umfrage teil, tragen Textvorschläge ein und helfen uns dabei, ein Diversitäts-Korpus aufzubauen: https://public.zenkit.com/f/klZHAjPGg/disko?v=xQoeCRIop
Projektstart: April 2022
Projektstatus: laufend
Marie Flüh und Mareike Schumacher
Computational Literary Studies
Deutsche Nationalbibliothek
Marie Flüh und Mareike Schumacher
Universität Hamburg
Technische Universität Darmstadt
Deutsche Nationalbibliothek
Email: marie.flueh@uni-hamburg.de
Email: mareike.schumacher@tu-darmstadt.de
Webseite: https://msternchenw.de/