Der DHd-Verband und seine Abstracts Betrachtungen des Einreichungsprozesses zu den DHd Jahrestagungen

Kategorie: 

Autor*innen aus der Taskforce „DHd Abstracts“

Patrick Helling (ORCID: 0000-0003-4043-165X), Rebekka Borges (ORCID: 0000-0002-4651-5638), Ingo Börner (ORCID: 0000-0001-8294-2541), Anna Busch (ORCID: 0000-0001-5584-4807), Fabian Cremer (ORCID: 0000-0001-8251-9727), Anke Debbeler (ORCID: 0000-0001-5864-8465), Henning Gebhard, Harald Lordick (ORCID: 0000-0002-5070-4263), Timo Steyer (ORCID: 0000-0003-0218-2269)

_______________________

Die Jahreskonferenzen des Verbands Digital Humanities im deutschsprachigen Raum e.V. (DHd) gehören zu den zentralen Veranstaltungen für die deutschsprachige Digital Humanities Community. An den Fachkonferenzen, die jedes Jahr von anderen Digital Humanities Institutionen in Deutschland, Österreich, Luxemburg und der Schweiz organisiert und ausgerichtet werden, nehmen jährlich ca. 500 bis 600 Wissenschaftler*innen teil. Im Durchschnitt werden auf jeder DHd-Jahreskonferenz 130 Beiträge in den Formaten

  • Vortrag (1500-2000 Wörter)
  • Panel (1200-1500 Wörter)
  • Workshop (1200-1500 Wörter)
  • Poster (500-750 Wörter) und
  • Doctoral Consortium (500-750 Wörter)

vorgestellt. Der Einreichungsprozess von Vorschlägen zur Konferenz selbst ist dabei seit der ersten DHd-Jahreskonferenz 2014 in Passau stetig weiterentwickelt worden. Er ist grundsätzlich darauf ausgelegt, dass am Ende des Prozesses eine saubere TEI-XML-Datenbasis generiert wird, die einerseits die automatisierte Erstellung eines Book of Abstracts ermöglicht und andererseits als Untersuchungsgegenstand für die Analyse und Auswertung von DHd-Jahreskonferenzen durch die DH-Community selbst genutzt werden kann. Die Erzeugung der TEI-XML-Daten verursacht bei den Einreichenden jedoch zusätzliche Aufwände. Bisher wird dabei die Zielsetzung einer gemeinsamen Veröffentlichung und maschinenlesbarer Datenbasis bei der Einreichung nicht thematisiert, so dass sich die Abläufe als wenig nutzer*innenfreundlich darstellen.

Mit diesem Blogbeitrag möchten wir als Task Force „DHd Abstracts“ den Einreichungsprozess zu DHd-Jahreskonferenzen dokumentieren und mit einer kritischen Betrachtung nachvollziehbarer, transparenter und einfacher gestalten.

Der Einreichungsprozess zu DHd-Jahreskonferenzen

Der Einreichungsprozess zu DHd-Jahreskonferenzen beginnt i.d.R. ca. zehn Monate vor Konferenzbeginn. Nach der Veröffentlichung des Call for Papers (CfP) kann zunächst ein Beitrag in der ConfTool-Instanz der Jahreskonferenz angelegt werden, die von den jeweiligen lokalen Konferenz-Organisator*innen eingerichtet und bereitgestellt wird. Nach der Auswahl eines Beitragsformats (s.o.) werden hier grundsätzliche Metadaten zum Beitrag selbst abgefragt:

  • Beitragstitel (o)*
  • Namen der Autor*innen (o)*
  • Affiliation der Autor*innen (Schema: Institut, Land) (o)*
  • E-Mail-Adressen der Autor*innen (o)*
  • ORCID der Autor*innen (f)
  • Auswahl der vortragenden Autor*in/nen (o)
  • Zusammenfassung des Beitrags, max. 150 Wörter (o)
  • Themen – Auswahl von passenden Kategorien aus der TaDiRAH-Taxonomie (o)*
  • Stichworte – Vergabe von passenden, durch die Autor*innen frei wählbaren Schlagworten (o)*

(o) = obligatorisch, (f) = fakultativ, * = Metadaten, die in die Dokumentenvorlage (Template) übernommen werden

Für die Erzeugung der TEI-XML-Datenbasis wurde der Webdienst DHConvalidator entwickelt, der Word/OpenOffice-Dateien in valides TEI-XML transformiert und jeweils von der lokalen Konferenzorganisation gehostet werden muss. Sobald ein Beitrag in der ConfTool-Instanz angelegt und gespeichert wurde, kann über den DHConvalidator eine Dokumentvorlage (Template) zum in der ConfTool-Instanz angelegten Beitrag erzeugt werden. Diese Dokumentvorlage (.docx, .odt) enthält die wesentlichen Metadaten (*) des Beitrags, wie sie in der ConfTool-Instanz zuvor eingetragen wurden. Die bei der Einrichtung des Beitrags in der ConfTool-Instanz hinterlegten Metadaten sind zu diesem Zeitpunkt im Einreichungsprozess entsprechend nicht mehr editierbar, da sie in die Dokumentvorlage (Template) übertragen wurden. 

Die erzeugte Dokumentvorlage (Template) muss schließlich heruntergeladen und mit dem Konferenzbeitrag selbst befüllt werden. Dies umfasst neben dem Text auch die Bibliographie, Abbildungen und Fußnoten. Innerhalb der Dokumentvorlage (Template) sind Formatierungsvorgaben angegeben, welche durch die Einreichenden berücksichtigt werden müssen und insbesondere für eine einheitliche Datenbasis sorgen sollen. Die befüllte Dokumentvorlage (Template) wird schließlich wieder im DHConvalidator hochgeladen. Eine Vorschau ermöglicht es den Autor*innen insbesondere die Formatierung des Konferenzbeitrags noch einmal zu überprüfen.

Der prozessierte Konferenzbeitrag wird schließlich heruntergeladen, wobei eine gepackte Archiv-Datei (.dhc) erzeugt wird. Sie enthält den Konferenzbeitrag in der Dokumentvorlage (Template), in einer TEI-XML-Version sowie in einer HTML-Version. Sollten Abbildungen verwendet worden sein, befinden sich diese als separate Dateien in der .dhc-Datei. Die .dhc-Datei muss schließlich wieder in der ConfTool-Instanz unter dem dort eingerichteten Beitrag hochgeladen werden, sodass sie im Review-Prozess von den Gutachter*innen eingesehen werden kann. Wird der Beitragsvorschlag (etwa um auf Empfehlungen der Gutachten einzugehen) durch die Autor*innen angepasst, ist der beschriebene Workflow erneut durchzuführen.

Zur Erstellung eines Book of Abstracts

Die im Einreichungsprozess erzeugten TEI-XML-Dateien dienen als Grundlage für die Erstellung des Book of Abstracts einer DHd-Jahreskonferenz. Das Book of Abstracts bildet als Sammelband die Breite der DH-Forschung im deutschsprachigen Raum ab und wird i.d.R. über das Repositorium Zenodo zur Verfügung gestellt. Zusätzlich werden die Konferenzbeiträge auch als Einzelpublikationen zur individuellen Zitation im PDF- und TEI-XML-Format automatisiert auf Zenodo publiziert. Die Veröffentlichung der gesammelten TEI-XML-Dateien in Github-Repositorien des DHd Verbandes ermöglicht der Community darüber hinaus eine Weiterverarbeitung und Analyse der Konferenzbeiträge und wertet diese als Daten auf.

Die Verarbeitung und Erstellung des Book of Abstracts sowie der Einzelpublikationen werden über XSL-Transformationen realisiert. Sie basieren auf Skripten zur Erstellung des Book of Abstracts zur DH-Konferenz 2013 und ermöglichen individuelle Anpassungen in Layout und Gestaltung. Diese Prozesse erfordern allerdings eine saubere und einheitliche TEI-XML-Datenbasis.

Schwierigkeiten und Verbesserungspotentiale

Der kleinteilige und aufwändige  Einreichungsprozess zu DHd-Jahreskonferenzen erfüllt zwar einerseits diesen Zweck, birgt allerdings potentielle Fehlerquellen für die Erzeugung einer konsistenten Datenbasis, was wiederum einen erheblichen Aufwand durch umfassende Datenbereinigungen durch die lokalen Organisator*innen zur Folge hat. Das führt zu dem Umstand, dass im derzeitigen Ablauf sowohl die Einreichenden als auch die lokalen Organisator*innen mit zeitaufwändiger Zusatzarbeit konfrontiert werden. Die TaskForce “DHd Abstracts” versucht gemeinsam mit dem DHd Data Steward Erleichterungen und Verbesserungen für Einreichende und Organisator*innen, sowohl für den aktuellen Einreichungsprozess zu entwickeln als auch alternative Einreichungs- und Verarbeitungsprozesse zu evaluieren.

Die Plain-Text-Maßnahme

Viele Einreichende nutzen verschiedene Texteditoren und kollaborative Umgebungen, wenn sie alleine oder mit Kolleg*innen einen Beitrag zu einer DHd-Jahreskonferenz verfassen. Hierbei wird i.d.R. durch die Einreichenden selbst, oder durch den jeweils genutzten Editor, der Text gelayoutet. Wenn diese Texte schließlich aus den genutzten Texteditoren in die im DHConvalidator erzeugte Dokumentvorlage (Template) kopiert werden, um den Beitrag schließlich zu prozessieren und einzureichen, werden diese Layoutinformationen häufig mit übernommen. Wenn im Anschluss daran innerhalb der Dokumentvorlage (Template) schließlich die dort angegebenen Layoutvorgaben auf den Text angewendet werden, ist dies zwar in der Dokumentvorlage (Template) entsprechend sichtbar und auch die im DHConvalidator angezeigte Vorschau des Beitrags mag korrekt dargestellt sein. Allerdings ersetzt das in der Dokumentvorlage (Template) angewendete Layout i.d.R. nicht die zuvor übernommenen Layoutinformationen aus den Texteditoren, wodurch in der schlussendlich erzeugten TEI-XML-Datenbasis zwei verschiedene Layoutinformationen übernommen werden, die es dann durch die lokalen Organisator*innen zu bereinigen gilt.

Eine einfache Maßnahme, um diesen Mehraufwand zu minimieren und eine saubere Datenbasis zu erzeugen, wäre es, wenn Einreichende die Layoutinformationen vor dem Kopieren in die Dokumentvorlage (Template) entfernen (Einfügeoptionen im Textverarbeitungsprogramm, Zwischenkopieren in Plain-Text-Editoren oder Schreiben in Plain-Text-Editoren oder der Dokumentvorlage).

Mehr Metadaten, noch mehr Normdaten

Ein weiterer zentraler Aspekt, um die TEI-XML-Datenbasis im Rahmen der DHd– Jahreskonferenzen weiter zu verbessern, ist die stärkere Vereinheitlichung und bessere Integration der Metadaten zu den Konferenzbeiträgen, die durch die Einreichenden im ConfTool eingegeben werden. Seit der DHd-Jahreskonferenz 2022 wird bspw. auch die ORCID der Einreichenden abgefragt, allerdings noch nicht automatisiert in die Dokumentvorlage (Template) übernommen.

Darüber hinaus gibt es keine formalen Vorgaben zur Angabe von Autor*innen-Affiliationen. Einerseits gilt es hier eine Vereinheitlichung des entsprechenden Eingabefeldes im ConfTool, bspw. nach dem Muster “Institution, Land”, einzurichten. Andererseits wurden gleiche Institutionen in den vergangenen Jahren immer wieder in unterschiedlichen Schreibweisen eingetragen (bspw. “Data Center for the Humanities (DCH), Universität zu Köln” und “Data Center for the Humanities, Universität Köln”). Um dieser Tatsache entgegenzuwirken, arbeitet die TaskForce “DHd Abstracts” gemeinsam mit dem DHd Data Steward aktuell daran, aus den gesammelten Affiliationsangaben der vergangenen DHd-Jahreskonferenzen 2014-2022 eine konsolidierte Affiliationsliste zu erstellen, welche als Vorschlagsliste für Affiliationsangaben den Einreichenden in Zukunft zur Orientierung zur Verfügung gestellt werden soll. Auf diese Weise soll zumindest ein erster Schritt in Richtung kontrollierter Affiliationsangaben gemacht werden. Perspektivisch sollte eine solche Liste dann als Dropdown-Menü in ConfTool übernommen werden, wobei hier noch die technische Machbarkeit überprüft werden muss.

Weitere Ziele

Neben einer grundsätzlichen Überarbeitung der Transformationsskripte zur Erstellung des Book of Abstracts bedarf es einer Überprüfung und ggf. Anpassung der Formatierungsvorgaben in der Dokumentvorlage (Template), insbesondere hinsichtlich der Bibliographie und fehlender Formatierungsangaben wie bspw. zu Bildunterschriften. Zusätzlich arbeitet die TaskForce “DHd Abstracts” gemeinsam mit dem DHd Data Steward daran, den Einreichungsprozess zu DHd-Jahreskonferenzen grundsätzlich zu evaluieren. Im Kern geht es dabei sowohl um die individuelle Überprüfung aller Teilschritte des aktuellen Prozesses als auch um die Erprobung neuer technischer und organisatorischer Ansätze zur Verbesserung und Vereinfachung des Einreichungsprozesses, z.B. durch die Nutzung von Software, die direkt TEI-XML erzeugen könnte, wie Fidus Writer; durch die Vorgabe eines XML-Schemas; oder durch Verlagerung der TEI-XML-Erzeugung nach der Begutachtungsphase.

Einladung

Die Ergebnisse des Einreichungsprozesses für Beiträge zu den DHd-Jahreskonferenzen sind beachtenswert: eine umfangreiche Sammlung zitationsfähiger Publikationen und maschinenlesbarer Forschungsdaten, die die Forschungsaktivitäten der DHd-Community widerspiegeln. Der Prozess selbst ist allerdings an entscheidenden Stellen noch verbesserungswürdig. Mit einigen Maßnahmen können die Einreichenden selbst bereits zu einer Verbesserung des Ist-Zustandes beitragen. Gleichzeitig arbeiten die TaskForce “DHd Abstracts” und der DHd Data Steward an der stetigen Verbesserung der Gesamtprozesse. Dabei ist die Evaluation und Professionalisierung sowohl des Einreichungs- als auch des Weiterverarbeitungsprozesses als Community-Aufgabe zu verstehen, zu der alle Kolleg*innen der DHd-Community und darüber hinaus eingeladen sind.

Für eine aktive Mitgestaltung kontaktieren Sie gerne die TaskForce “DHd Abstracts” sowie den DHd Data Steward unter patrick.helling[at]uni-koeln.de.

Weiterführende Literatur

Andorfer, Peter, Fabian Cremer, Timo Steyer: DHd 2019 Book of Abstracts Hackathon, Frankfurt & Mainz 2019. doi:10.5281/zenodo.4622102.

Andorfer, Peter, Anna Busch, Fabian Cremer, Andreas Henrich, Patrick Helling, Harald Lordick, Dennis Mischke, Timo Steyer: Bericht zur vDHd2021-Veranstaltung. Zukunftslabor DHd-Abstracts, DHd-Blog, 08.05.2021. Online: <https://dhd-blog.org/?p=15980>, Stand: 02.05.2022.

Borges, Rebekka, Anke Debbeler, Patrick Helling: „Der DHd Data Steward – Maßnahmen zur Entwicklung einer nachhaltigen Datenstrategie für die Digital Humanities im deutschsprachigen Raum“. DHd 2022 Kulturen des digitalen Gedächtnisses. 8. Tagung des Verbands „Digital Humanities im deutschsprachigen Raum“ (DHd 2022), Potsdam, doi:10.5281/zenodo.6328017.

Burr, Elisabeth, DHd 2016 Modellierung – Vernetzung – Visualisierung. Die Digital Humanities als Fächerübergreifendes Forschungsparadigma, Version 2. überarbeitete und erweiterte Ausgabe (Zenodo, 2017), doi:10.5281/ZENODO.3679331.

Busch, Anna, Fabian Cremer, Harald Lordick, Dennis Mischke, Timo Steyer: Strukturen und Impulse zur Weiterentwicklung der DHd-Abstracts, Potsdam 2022. doi:10.5281/zenodo.6328089.

Cremer, Fabian: Nun sag, wie hältst Du es mit dem Digitalen Publizieren, Digital Humanities?, Digitale Redaktion, 2018. Online: <https://editorial.hypotheses.org/113>, Stand: 06.07.2021.

Gebhard, Henning: Fidus Writer als Alternative zum DH ConValidator? Ein Prototyp, Potsdam 2022. doi:10.5281/zenodo.6327991.

Geierhos, Michaela, „DHd2022: Kulturen des digitalen Gedächtnisses. Konferenzabstracts“, 7. März 2022, doi:10.5281/ZENODO.6304590.

Hannesschläger, Vanessa, Peter Andorfer: Menschen gendern? Einige Gedanken über Datenmodellierung zur Erhebung von Geschlechterverteilung anhand der TEI2016 Abstracts App, Köln 2018. doi:10.5281/zenodo.4622405.

Helling, Patrick, Rebekka Borges, Ingo Börner, Anna Busch, Fabian Cremer, Anke Debbeler, Henning Gebhard, Harald Lordick, Timo Steyer. (2022). Dokumentation des aktuellen Einreichungsprozesses von Konferenzbeiträgen zu DHd-Jahreskonferenzen – Stand November 2022, doi:10.5281/zenodo.7327545 .

Helling, Patrick, Anke Debbeler, Rebekka Borges, „Konferenzbeiträge strategisch publizieren“, o-bib. Das offene Bibliotheksjournal / Herausgeber VDB, 30. August 2022, 1-17 Seiten, doi:10.5282/O-BIB/5835.

Sahle, Patrick, DHd 2019 Digital Humanities: multimedial & multimodal. Konferenzabstracts, Version 1.0.1 (Zenodo, 2019), doi:10.5281/ZENODO.2600812.

Schöch, Christof, DHd 2020 Spielräume: Digital Humanities zwischen Modellierung und Interpretation. Konferenzabstracts (Zenodo, 2020), doi:10.5281/ZENODO.3666690.

Steyer, Timo, Peter Andorfer, Fabian Cremer: Abstract Enhancement. Potentiale der DHd-Konferenzabstracts als Daten/Publikation, Paderborn 2020. doi:10.5281/zenodo.4621706.

Stiegler, Johannes, DHd 2015 – Von Daten zu Erkenntnissen. Digitale Geisteswissenschaften als Mittler zwischen Information und Interpretation, Graz 2015. Online: <https://dhd2015.uni-graz.at/de/nachlese/book-of-abstracts/> (letzter Zugriff: 27. September 2022).

Stolz, Michael, DHd 2017 Digitale Nachhaltigkeit (Zenodo, 2017), doi:10.5281/ZENODO.3684825.

Vogeler, Georg, DHd 2018 Kritik der digitalen Vernunft (Zenodo, 2018), doi:10.5281/ZENODO.3684897.

Skripte

Beispiel für Skripte zur Erstellung des Book of Abstracts zur DHd-Jahreskonferenz 2020, Online: <https://github.com/NinaSeemann/DHd2020-BoA> (letzter Zugriff: 27. September 2022).

Vorverarbeitungsskripte zur Publikation einzelner Konferenzbeiträge: reborg789/zenodup, Online: <https://github.com/reborg789/zenodup> (letzter Zugriff: 27. September 2022).

Vorverarbeitungsskripte zur Publikation einzelner Konferenzbeiträge: PatrickHelling/DHd_BoA_seperated, Online: <https://github.com/PatrickHelling/DHd_BoA-separated> (letzter Zugriff: 09. November 2022).

Skripte für den automatisierten Upload einzelner Konferenzbeiträge auf Zenodo: cceh/zenodup, Online: <https://github.com/cceh/zenodup> (letzter Zugriff: 27. September 2022).

 

DHd-Mailingliste

Registrieren Sie sich für die DHd-Mailingliste [Info]. Um frühere Nachrichten an diese Liste zu sehen, besuchen Sie bitte das Archiv der Liste DHd [Link]. (Das aktuelle Archiv ist nur für die Abonnenten der Liste zugänglich.) .