AG OCR

1. AG-Name

Arbeitsgruppe OCR

2. AG-Arbeitsschwerpunkte

Die Verwendung von digitalen Textdaten ist ein Kernmerkmal der Digitalen Geisteswissenschaften (Digital Humanities, DH). Der große und wachsende Bedarf nach diesen Daten als Forschungsdaten setzt jedoch voraus, dass effiziente Technologien mit einer hohen Erkennungsgenauigkeit sowohl für den Text als auch für die Dokumentstruktur zur Verfügung stehen.

Aus diesem Grund sieht sich die AG OCR als interdisziplinäres und fächerübergreifendes Forum für den Umgang und die Auseinandersetzung mit sowie die Entwicklung von OCR (Optical Character Recognition) als einem Schlüssel für die Umsetzung der Forderungen der DH. Indem die Mitglieder der AG die Vielfalt der Methoden, Technologien und Nutzungsmöglichkeiten des Forschungsbereiches widerspiegeln, soll ein umfassender Kommunikationsraum geschaffen werden, in dem sich Entwickler und Forscher versammeln, die sowohl mit der Optimierung bestehender Software und Technologien wie auch vollkommenen Neuentwicklungen beschäftigt sind, zum anderen Nutzer, die bewährte, einfach zu bedienende aber dennoch mächtige Tools und Technologien für verschiedenste Zwecke einsetzen wollen. Auch Vermittler, deren Ziel es ist, Tools und Technologien Nutzern in Workshops und anderen Lehrveranstaltungen näher zu bringen, nehmen dabei eine wichtige Rolle ein. Auf diese Weise soll ein Netzwerk aus Ansprechpartnern für den direkten Erfahrungsaustausch mit der OCR von Drucken, Handschriften, ganz unterschiedlichen Schrifttypen und Sprachen geschaffen werden. Eigene Forschungsprojekte sollen folgen.

3. AG-Ziele

  • Vernetzung von Nutzer*innen, Vermittler*innen, Entwickler*innen und Forscher*innen durch mindestens jährliche Treffen sowie Workshops und gemeinsame Projekte mit dem Fokus auf freier und quelloffener Software bzw. Publikationen zum Thema.
  • Erarbeitung, Sicherung und Verbreitung von Best Practices zu praktischen Anwendungsfragen der OCR, z. B. Workflow, Formate, Parameter.
  • Technologietransfer aus der Entwicklung in die Praxis.
  • Vermittlung zwischen spezifisch geisteswissenschaftlichen Anforderungen und technischen Möglichkeiten bei der Entwicklung von OCR-Software.
  • Identifikation und kollaborative Bearbeitung offener Forschungsfragen im engen Austausch mit bereits bestehenden AGs der DHd wie z. B. der „AG Zeitungen & Zeitschriften“.

4. AG-URL (extern) und Mailingliste

https://lists.uni-wuerzburg.de/mailman/listinfo/ag-ocr (öffentlich)

5. AG-Kontakt/Convenor

Christian Reul
Zentrum für Philologie und Digitalität „Kallimachos“
Universität Würzburg
Lehrstuhl für Künstliche Intelligenz und Angewandte Informatik
Am Hubland
97074 Würzburg
Tel.: +49 931 / 31 - 80722
E-Mail: christian.reul@uni-wuerzburg.de

DHd-Mailingliste

Registrieren Sie sich für die DHd-Mailingliste [Info]. Um frühere Nachrichten an diese Liste zu sehen, besuchen Sie bitte das Archiv der Liste DHd [Link]. (Das aktuelle Archiv ist nur für die Abonnenten der Liste zugänglich.) .