Digital Humanities (6/6)

Wie die Nomaden in Athen entdeckt wurden

Von Charlotte Schubert
 - 22:57

Optimistische Selbstgewissheit und skeptische Zurückhaltung – zwischen diesen Gegensätzen bewegen sich viele Geisteswissenschaftler, wenn es um die Haltung zu den Digital Humanities geht. Im Bereich der Textwissenschaften hat Franco Moretti mit dem Gegensatzpaar von Distant reading und Close reading umrissen, wie man aus der schieren Menge von Daten durch algorithmenbasierte Auswertung mit den Methoden etwa des Textmining, des Clustering oder des Topic Modeling neue Zusammenhänge aus sehr großen Text- und Datenmengen erkennen kann. Dabei drängt sich aber die Frage auf: Wie genau verhält sich dieser Ansatz zum Close reading, wie es sich in der traditionellen, historisch-philologischen Textanalyse etabliert hat?

Für die textorientiert arbeitenden Altertumswissenschaften ist diese Frage aufgrund ihrer besonders komplexen Überlieferungssituation höchst relevant. Einerseits hat man in den Altertumswissenschaften bereits in den achtziger Jahren des vergangenen Jahrhunderts mit der Digitalisierung von Textkorpora begonnen, so dass heute die erhaltene Literatur der Antike in einer Vollständigkeit digitalisiert vorliegt, die ihresgleichen sucht. Andererseits weist die Überlieferungsgeschichte der Texte selbst viele Zwischenstufen auf und ist geprägt von sehr unterschiedlichen Editionspraktiken. Dass gerade diese komplexe Struktur ein weites Feld von Anwendungsmöglichkeiten für die Methoden des Information Retrieval bietet, soll hier an einem Beispiel illustriert werden.

Ein einziges Mal in der gesamten griechischen Literatur

Im Rahmen verschiedener Projekte aus der BMBF- und DFG-Förderung haben wir an der Universität Leipzig in der Zusammenarbeit von Altertumswissenschaftlern und Informatikern Methoden aus dem Textmining zur Anwendung für unsere digitale Textanalyse adaptiert. Ein methodisch besonders interessanter Weg hat sich aus der Kookkurrenzsuche ergeben. Kookkurrenzen, ganz allgemein: das gemeinsame Auftreten etwa zweier Wörter innerhalb eines Satzes oder Abschnittes, können auch semantische Zusammenhänge anzeigen. Interessant sind jene Kookkurrenzen, die weder offensichtlich und geläufig sind noch durch herkömmliche Suchstrategien erkannt werden können, wie sie sich aus der Verwendung von Lexika, Nachschlagewerken, Konkordanzen, Indizes, Suchprogrammen mit einfacher oder Boolescher Wortsuche entwickelt haben.

Kookkurrenzen, die im gesamten Textkorpus der antiken griechischen Literatur lediglich ein- bis dreimal auftreten, sind, wenn sie nicht gerade in den Werken der sehr bekannten, das heißt vielgelesenen Autoren enthalten sind, nur durch den Zufall zu finden. Das Phänomen des „glücklichen Zufalls“, das heißt in diesem Fall einer wissenschaftlichen Entdeckung, die unbeabsichtigt gelingt, weil ursprünglich etwas ganz anderes gesucht wurde, ist wissenschaftshistorisch von Robert Merton als „serendipity“ wiederentdeckt worden. Darunter ist die Entdeckung eines meist nicht beabsichtigten Ergebnisses zu verstehen. Demgegenüber basiert das geläufige Verständnis etwa der explorativ vorgehenden Suche auf einer analytisch definierten Suchstrategie.

Darin kommt nun auch ein grundlegender Unterschied im Anspruch der Aussagefähigkeit einer Suchmethode zum Ausdruck: Zwar wird seit Jahren, im Grunde seit Jahrzehnten, gerade in den Naturwissenschaften breit diskutiert, was „serendipity“ als „glücklicher Zufallsfund“ eigentlich bedeutet: Die Entdeckung des Penicillins durch Alexander Fleming ist der vielleicht berühmteste Fall einer solchen Entdeckung. Doch dass „serendipity“ nicht unbedingt etwas vollständig Zufälliges sein muss, ist auch längst gesehen worden: Selbst der glückliche Zufallsfund wird nur erkannt, wenn genügend fachliches Wissen vorliegt.

Gerade die Kookkurrenzsuche kann, wie unsere Arbeit im Projekt eAQUA für mehrere Fälle gezeigt hat, auf solche unbeabsichtigten, da nicht intendierten beziehungsweise nicht zielgerichtet gesuchten „Zufallsfunde“ führen. Einer dieser Funde war die Kookkurrenz von Nomaden und Athen. Diese Kookkurrenz verweist auf zwei überhaupt nicht miteinander in inhaltlicher Verbindung stehende Dinge, die in einem Kontext stehen – Nomaden und die Geschichte der Stadt Athen. Die Erwähnung beider zusammen findet sich ein einziges Mal in der gesamten griechischen Literatur der Antike und ist später lediglich zweimal von anderen Autoren zitiert worden. Aufgrund dieses seltenen Vorkommens und des auf den ersten Blick so unwahrscheinlichen inhaltlichen Kontextes – denn was haben Nomaden in Athen zu suchen, in einer Stadt, die sich als hochkultureller Mittelpunkt der griechischen Welt sah? – ist der Zusammenhang aus dem Originalzitat in den Editionen als vermeintlich falsch „gelöscht“ worden.

Interessante Kandidaten für das Auffinden neuer Zusammenhänge

Die Durchsicht der gefundenen Kookkurrenzen führt auf einen unerwarteten Zusammenhang. Der Kontext, auf den die einzelnen Textbelege aus dem Suchergebnis in ihrem Zusammenhang führen, zeigt, dass hier eine inhaltlich plausible Argumentation vorliegt. So wurde deutlich, dass die Nomaden in Athen bei einer ganzen Gruppe von antiken Historikern, den sogenannten Atthidographen (Historikern, die Werke speziell zur Geschichte Athens geschrieben haben), in ein ganz anderes Geschichtsbild als das bisher angenommene gehörten. Bei den meist als unterkomplex eingeschätzten Atthidographen ließ sich so ein evolutionäres Geschichtsbild rekonstruieren, das von der nomadischen Ur-Existenz der Athener über ihr Sesshaftwerden bis zu der von ihnen erstmalig begründeten Polis verlief.

Die Suche nach den seltenen Kookkurrenzen hat sich mittlerweile bewährt und gezeigt, dass die „seltenen Ereignisse“ die interessanteren Kandidaten für das Auffinden neuer Zusammenhänge sind als die statistisch häufigeren. Denn versierte Wissenschaftler kennen ihre Quellentexte in der Regel recht gut, werden also von den aufgrund der statistischen Häufigkeit angezeigten Zusammenhängen kaum überrascht sein.

Für den Einsatz der Kookkurrenzsuche lässt sich aus diesem Befund das methodische Prinzip ableiten, dass man nach den seltenen Kookkurrenzen suchen sollte, um genau solche ungewöhnlichen, bisher von der Forschung nicht gesehenen oder für abwegig gehaltenen Zusammenhänge aufzudecken, die jedoch nur im Kontext einer umfassenden Textanalyse deutlich werden. Daran zeigt sich, dass das Erkenntnispotential, das sich aus der Zusammenarbeit mit der Informatik ergibt, für die Altertumswissenschaften gewinnbringend ist, also kein Anlass zur skeptischen Zurückhaltung besteht.

Quelle: F.A.Z.
  Zur Startseite
Ähnliche ThemenAthenBundesforschungsministeriumUniversität Leipzig