Lexikon

Digital Humanities

Einleitung

Als Digital Humanities (,,digitale Geisteswissenschaften“) wird seit rund 10–15 Jahren ein Forschungsfeld bezeichnet, das schon seit den 1960er-Jahren unter Bezeichnungen wie ,,Computer and the Humanities“ oder ,,Humanities Computing“ besteht. Sehr allgemein gesprochen kann jede Verwendung des Computers zur Aufbereitung, Analyse und Präsentation von Forschungsdaten in den Geisteswissenschaften zu diesem Feld gezählt werden. Die Geisteswissenschaften, die sich heute auch öfter selbst als Kulturwissenschaften bezeichnen, weisen eine ausgesprochen große Fächervielfalt auf. Zu ihrem Kern gehören die diversen Philologien – oftmals ausdifferenziert in eine Linguistik und eine Literaturwissenschaft, manchmal ergänzt um eine Spezialdisziplin für die Frühzeit der Sprache und Literatur –, z. B. die Germanistik, Anglistik bis hin zur Ägyptologie oder Altorientalistik, sowie die Geschichtswissenschaften, die Kunstgeschichte, die Musikwissenschaft sowie die Philosophie. 

Das kulturelle Erbe als Gegenstand der DH

Einen wesentlichen Schwerpunkt der Arbeit im Bereich der DH bildet die angemessene Digitalisierung und Erschließung von Texten, Bildern, Musiknoten, Tonaufnahmen, 3D-Objekten u. a. m. Zum einen werden gemeinsam mit den Institutionen, die kulturelle Objekte lagern und zugänglich machen, also Bibliotheken, Archiven, Museen usw., Verfahren entwickelt, diese Objekte dem digitalen Medium und seinen Verwendungsmöglichkeiten angemessen zu modellieren. Zum anderen sollen auch komplexe Forschungsperspektiven in diesen Datenmodellen adäquat ausgedrückt werden können. Da die Geisteswissenschaften ihre Quellen zumeist immer wieder verwenden, sollen sie außerdem, etwa in Form von Annotationen, auch nachhaltig und gut dokumentiert gespeichert werden. 

Das lässt sich an einer der wichtigsten Errungenschaften der DH, der Text Encoding Initiative (TEI), verdeutlichen. Die TEI ist zum einen eine umfassende Sammlung von Richtlinien zur Kodierung von digitalen Texten in XML (früher SGML). Zum anderen ist die TEI eine Institution, die durch Mitgliedsbeiträge finanziert den Standard nachhaltig pflegt. Die TEI fördert auch die Weiterentwicklung der Richtlinien, um sie neuen Anforderungen anzupassen, und die Kommunikation mit der Community. Denn nicht zuletzt diese sehr große Gemeinschaft von Anwendern hat die TEI während ihrer nun fast 30-jährigen Entwicklung stets mit innovativen Impulsen versehen und dafür gesorgt, dass den vielfältigen Anforderungen, die die digitalen Bibliotheken, aber auch die spezialisierten Forschungsprojekte stellen, Rechnung getragen werden konnte. Dadurch ist ein robuster de-facto- Standard für die Textauszeichnung von digitalen  Editionen, Textsammlungen und auch Korpora entstanden, der auch durch vielfältige Werkzeuge unterstützt wird.

Es gibt eine ganze Reihe weiterer, vergleichbarer Unternehmungen, die zeigen, welche wichtige Funktion Datenmodellierung als Formalisierung disziplinenspezifischen Wissens in den DH hat: z. B. die Entwicklung des ,,CIDOC Conceptual Reference Model“ als Ontologie für den Museumsbereich, die ,,Music Encoding Initiative“, die Musiknoten nachhaltig so kodiert, dass sie durchsucht, layoutet und auch akustisch wiedergegeben werden können, die ,,Functional Requirements of Bibliographic Records“, die Konzepte der historischen geographischen Informationssysteme und viele andere mehr.

Methoden und Arbeitsfelder der DH

Die Vielfalt von Methoden in den DH ist durch die Vielzahl der einschlägigen Medien – Text, Bild, Ton, Film, virtuelle Welten usw. – und durch die Vielzahl der Fächer bedingt, die jeweils fachspezifische Perspektiven auf mediale Objekte entwickelt haben. Im Bereich der Textwissenschaften gibt es etwa, anknüpfend an die disziplinären Traditionen, etablierte und ausdifferenzierte Verfahren, z. B. wie eine digitale Edition (Literaturwissenschaft) oder ein Korpus (Linguistik) zu gestalten ist. Beide digitalen Objekte haben die Aufgabe, Texte zu repräsentieren, aber aufgrund der unterschiedlichen Fachperspektiven wird das Objekt Text ganz unterschiedlich modelliert. Die Literaturwissenschaften haben heute eine Auffassung vom Text, aufgrund derer sein (ursprünglich) materiales Gegebensein relevant ist, also betrachten sie z. B. im Fall eines modernen Dichtermanuskripts die Schrift als Spur eines kreativen Vorgangs, der als Prozess von Interesse ist, sodass alle Löschungen, Ersetzungen, Umstellungen gewissenhaft notiert und miteinander in Beziehung gesetzt werden. In digitalen Editionen findet man daher nicht selten aufwendige Text-Bild-Verlinkungen, die Manuskripte und deren Umschrift zusammenführen, sowie komplexe Variantenverzeichnisse und -visualisierungen, die übrigens trotz aller Fortschritte bislang nur halb-automatisch erzeugt werden können. Die Linguistik dagegen dokumentiert zumeist stattgefundene Kommunikation, z. B. Texte, wie sie publiziert worden sind, und annotiert verschiedene linguistische Ebenen des Textes wie Lemma, Partof- Speech, morphologische Informationen usw. Aufgrund dieser unterschiedlichen Erkenntnisinteressen werden auch andere Methoden zur Analyse und Visualisierung verwendet.

Zur disziplinären Vielfalt kommt ein weiterer Faktor: Im gleichen Fach können die Geschichtlichkeit des Objekts und die disziplinäre Geschichte seiner Beschreibung und Analyse zu ganz unterschiedlichen digitalen Modellen und Methoden führen. Diese zweischichtige Geschichtlichkeit, auf der Ebene des Objekts und auf der Ebene der disziplinären Beschreibung, führt neben der Vielfalt der geisteswissenschaftlichen Forschungsparadigmen zu einer kaum überschaubaren Fülle an Methoden – und zeigt sich auch als kaum zu überschätzender Widerstand gegen schnelle Vereinheitlichungen von außen, z. B. seitens der Informatik.

Diese Vielfalt macht es auch nicht ganz einfach, einen methodischen Kanon der DH zu identifizieren, und selbst eine sehr allgemeine Charakterisierung wie die Folgende kann nur einseitig und verkürzend sein. Zwei Schwerpunkte lassen sich ausmachen: Die Repräsentation und die Analyse kultureller Artefakte.

  1. Das starke Gewicht, das die Repräsentation und adäquate Modellierung kultureller Artefakte hat, wurde oben schon angesprochen. Gerade weil sich hier Formalisierungswissen und geisteswissenschaftliche Kompetenz ergänzen müssen und sie weder von einem Informatiker noch von einem traditionellen Geisteswissenschaftler geleistet werden können, gilt dies vielen in den DH als eine das Fach charakterisierende Kompetenz. Einen wichtigen Aspekt dabei bildet die Visualisierung der Daten, womit heute nicht nur die Vermittlung bereits vorhandenen Wissens, sondern zunehmend eine visuelle Analyse der Daten erreicht werden soll.
  2. Die Analyse der kulturellen Artefakte mit digitalen Methoden bildet den zweiten Schwerpunkt. Hierzu zählen die unterschiedlichen Formen des Information Retrieval in den verschiedenen Medien, z. B. die Suche nach komplexen Mustern in Texten oder nach bestimmten Notenfolgen in entsprechend kodiertem Material. Hinzu kommen heute die vielfältigen Verfahren der Datenanalyse, im Fall von Texten etwa das Textmining aufgrund von regelbasierten und ML-Verfahren, angereichert durch eine Vorverarbeitung der Daten mit Natural Language Processing. Daneben finden sich auch spezielle Analysetechniken, z. B. die automatische Analyse des Metrums von Versen, die stark von den sprachspezifischen Gegebenheiten abhängig ist, oder stilometrische Verfahren, die häufig für die Autorschaftsattribution eingesetzt werden. Die Stilometrie mit ihrer langen Forschungsgeschichte hat auch eine ganze Reihe von spektakulären Erfolgen zu verzeichnen, z. B. die erfolgreiche Identifikation von J. K. Rowling als Autorin der unter dem Pseudonym Galbraith publizierten Romane [1].

Die Analyse digitaler Artefakte geschieht dabei auf allen möglichen Ebenen: Das beginnt mit der physikalischen Ebene des Artefakts, geht über die Identifikation und Analyse einzelner Elemente, etwa Zeichen, und reicht bis hin zur Erschließung einfacher oder komplexer, z. B. symbolischer, Bedeutungen. So werden etwa in der Manuskriptanalyse Verfahren wie die Hyperspektralanalyse eingesetzt, um verblichene Textspuren wieder lesbar zu machen. Zeichen werden (halb-) automatisch segmentiert und automatisch oder manuell mit anderen verglichen, um ihre Bedeutung oder den Schreiber oder die Schreibschule zu identifizieren. Die semantische Erschließung der Artefakte geschieht im Fall von Texten etwa aufgrund von ,,Topic Models“ oder anderen Verfahren der distributionellen Semantik und kann auch bei Heranziehung von großen Textsammlungen, Wörterbüchern und Enzyklopädien bislang nur in einfachen Fällen überzeugende Ergebnisse erbringen.

Die unterschiedliche Verfügbarkeit digitaler Verfahren für verschiedene Medien und Fragestellungen hat dazu geführt, dass die Fächer diese sehr unterschiedlich schnell adaptiert haben. Die Linguistiken etwa, die viele ihrer Fragen aufgrund der Analyse von Sprachoberflächenphänomenen beantworten können, haben lange Zeit eine Führungsrolle in den DH gespielt; inzwischen haben sich die digitalen Varianten in Form der Korpus und der Computerlinguistik als weitgehend eigenständige Forschungsfelder etabliert. Die Archäologie dagegen hat sich aufgrund ihrer Nähe zu den Naturwissenschaften in vielen Punkten ganz eigenständig entwickelt und nur einen geringen Austauschmit den anderen DH-Disziplinen gepflegt. Diese Asymmetrien in der Entwicklung zeigen sich auch in der Forschungsförderung: CLARIN, das europäische Projekt zum Aufbau linguistischer Forschungsinfrastrukturen, hat ungefähr den gleichen Umfang wie DARIAH, das Vergleichbares für alle anderen Geisteswissenschaften leistet.

Verhältnis von DH und Informatik

Auch wenn die DH an der Schnittstelle zwischen Geisteswissenschaften und Informatik angesiedelt sind, so handelt es sich ihrem Selbstverständnis nach doch um eine eigenständige Disziplin, vergleichbar vielleicht mit der Bioinformatik. Dabei beanspruchen die DH nicht, ebenfalls kompetente Systemarchitekten oder Erfinder von effizienten Algorithmen auszubilden. Auch wenn es vorkommt, dass in den DH eigene Algorithmen entwickelt werden, so geschieht dies zumeist, um ein Defizit im Bereich der Datenanalyse auszugleichen, während Aspekte wie Effizienz und Robustheit zumeist hintanstehen. Vielmehr verstehen sich viele Vertreter der DH als Vermittler zwischen den beiden Bereichen, den Geisteswissenschaften und der Informatik; sie sprechen die Sprache beider Bereiche und können die Probleme so formulieren, dass es leichter fällt, festzustellen, ob Lösungen existieren und welche Ansätze chancenreich sind. Viele Projekte in den letzten Jahrzehnten, in denen Informatiker Geisteswissenschaftlerinnen und Geisteswissenschaftler wie andere ,,Kunden“ auch mit Lösungen versorgt haben, zeigten, dass dies ein für beide Seiten sehr vorbereitungs- und arbeitsintensives Unterfangen ist, das leicht scheitern kann. Eben da können Spezialisten für diese Vermittlung ansetzen.

Tatsächlich wird auch in den DH selbst diskutiert, wie das Verhältnis zur Informatik ist oder sein sollte. Häufig ist ein ganz pragmatischer Anlass der Auslöser für diese Diskussion: Die Gestaltung eines DH-Curriculums. Wie viel Informatikanteile und welche sollen in das DH-Studium aufgenommen werden? Dabei zeigt sich eine große Vielfalt. Vier Positionen, die auch für unterschiedliche Modelle der DH stehen, lassen sich prototypisch unterscheiden:

  1. Die DH werden in erster Linie als geisteswissenschaftliche Disziplin verstanden; vor allem die Reflexionskompetenz in Bezug auf digitale Medien steht im Vordergrund. Diese Variante findet sich eher im angelsächsischen Raum (als eine unter anderen).
  2. Die Erzeugung und Modellierung kultureller Artefakte steht im Mittelpunkt, also etwa das Erstellen von digitalen Editionen. Hierbei liegt ein Schwerpunkt auf der Vermittlung und Einübung der entsprechenden Standards, z. B. XML und TEI sowie grundlegender Programmierkenntnisse.
  3. Die DHwerden als disziplinäre Datenanalytik verstanden, also als Schnittstelle zwischen Geisteswissenschaften, Informatik und Statistik. Das umfasst zum einen die Inhalte, die unter 2) genannt werden, dazu kommen aber die anderen einschlägigen Kompetenzen zur Datenanalyse: Statistik, Maschinelles Lernen usw.
  4. Die DH werden als Fachinformatik verstanden, die im Prinzip viele Elemente der Informatik umfassen sollte, vielleicht mit Ausnahme der theoretischen Informatik etc.

Nicht zuletzt sollte erwähnt werden, dass die DH sich von Anfang an für Fragen interessiert und Lösungen entwickelt haben, die lange Zeit nicht im Fokus der Informatik standen. So ist etwa die Kodierung von halbstrukturierten Daten mittels SGML und dann XML nicht unwesentlich durch Vertreter der DH vorangetrieben worden, und es ist ein bezeichnendes Detail, dass Michael Sperberg-McQueen langjähriger Editor der TEI war und zugleich einer der Editoren der ersten XML-Spezifikation ist.

Digital Humanities als eigenständige Disziplin

Die Frage nach der Definition von DH hat in den DH eine lange Geschichte, und die Frage wird auch durch die Vielfalt der Gegenstände und Methoden virulent bleiben. Zugleich kann man ganz nüchtern feststellen, dass die DH heute bereits eine eigenständige Disziplin sind. Wissenschaftssoziologisch wird ein Fach bekanntlich nicht nur durch seinen Gegenstand und seine Methoden etabliert, sondern auch durch seine Institutionen, also Fachverbände, durch spezialisierte Zeitschriften, durch Lehrstühle, Studiengänge usw. Betrachtet man diese Faktoren, so zeigt sich, dass die DH tatsächlich schon seit Jahren eine Fachwissenschaft sind – nur sind sie erst jetzt bekannt geworden.

Die meisten Forscherinnen und Forscher im Feld der Digital Humanities sind Mitglieder in der Alliance of Digital Humanities Organizations (gegründet 2005) oder einer der zugehörigen Verbände, z. B. der European Association for Digital Humanities (1973, früher ALLC). Es gibt eine ganze Reihe von einschlägigen Zeitschriften, etwa die renommierte Digital Scholarship in the Humanities (seit 1986). Wichtiger Knotenpunkt der Fachkommunikation ist auch die Diskussionsliste HUMANIST, die seit den 1980er-Jahren vonWillard McCarty moderiert wird. In Deutschland allein gibt es außerdem inzwischen mehrere einschlägige Lehrstühle und Studiengänge, u. a. in Darmstadt, Köln, Passau und Würzburg. Es existieren Einführungen in das Fach, z. B. A Companion to Digital Humanities [2], und auch spezialisierte Buchreihen (z. B. bei Ashgate).

Die Zukunft der DH

Die Verwendung digitaler Objekte und digitaler Methoden wird auch in den Geisteswissenschaften zunehmend selbstverständlich, wozu in den letzten Jahren die großen einschlägigen Infrastrukturprojekte nicht wenig beigetragen haben, in Deutschland z. B. Clarin-De, Dariah-De, Textgrid usw. Wenn bald alle Geisteswissenschaften digitale Objekte und Methoden verwenden, so nehmen einige an, wird das Fach ,,digitale Geisteswissenschaften“ überflüssig werden. Das ist recht unwahrscheinlich, und die bisherigen Tendenzen weisen in eine andere Richtung. In dem Maße, wie die Verwendung digitaler Methoden Alltag wird, ist diese allein keine Grundlage mehr für die DH. Wer z. B. mit der Anwendung eines etablierten stilometrischen Verfahrens einen anonymen Text erfolgreich einem Autor zuordnen kann, hat eine Erkenntnis gewonnen, aber interessant ist diese vor allem für diejenigen, die sich für den Autor und den Text interessieren und nicht für die DH. Diese wird sich in Zukunft wohl stärker darauf konzentrieren, für geisteswissenschaftliche Fragestellungen und Anforderungen brauchbare Datenmodelle und Algorithmen zu identifizieren und diese systematisch auszutesten und zu verbessern. So wird es also, auch wenn alle Geisteswissenschaften digital werden, die DH als spezialisierte Disziplin geben, die Verfahren prüft, adaptiert oder (weiter-) entwickelt; dabei ist zu erwarten, dass zugleich deutlich eigenständige Unterdisziplinen wie die digitale Geschichte, digitale Literaturanalyse, Computational Narratology u. a. m. entstehen.

Literatur

1. Juola P (2013) Rowling and ,,Galbraith“: an authorial analysis. Language Log 16.
Juli 2013. languagelog.ldc.upenn.edu/nll/
2. Schreibman S, Siemens R, Unsworth J (eds) (2004) A Companion to Digital Humanities.
Malden, Blackwell (völlig überarbeitete und erweiterte Neuauflage 2016
unter dem Titel ,,A New Companion to Digital Humanities“)

Weiterführende Literatur

Zumeist online unter: adho.org/publications
GoldMK, Klein LF (eds) (2012)Debates in theDigital
Humanities.University of Minnesota Press, Minneapolis
Thaller M (2012) Controversies around the Digital
Humanities.Hist Soc Res 37(3):7–229

Autor und Copyright

Fotis Janndis
Institut für Deutsche Philologie, Philosophische Fakultät I,
Universität Würzburg, Würzburg
E-Mail 

© Springer-Verlag Berlin Heidelberg 2016