<iframe src="https://www.googletagmanager.com/ns.html?id=GTM-WBPR4W&gtm_auth=3wMU78FaVR9TNKtaXLbV8Q&gtm_preview=env-23&gtm_cookies_win=x" height="0" width="0" style="display:none;visibility:hidden"></iframe>
Indogermanistik

Wie erforscht man Ursprünge?

Von Wolfgang Krischke
 - 22:02

Fast die Hälfte der Menschheit spricht eine der 220 indogermanischen Sprachen als Muttersprache. Über den Wortschatz und die Grammatik des Urindogermanischen, aus der diese Sprachfamilie hervorgegangen ist, weiß man inzwischen recht viel. Doch wo wurde es gesprochen? Und wann begann diese Ursprache sich auszubreiten und in unterschiedliche Sprachen aufzugliedern?

Linguistische, archäologische und genetische Befunde haben sich in den vergangenen Jahrzehnten zu zwei konkurrierenden Theorien verdichtet: Die Steppen-Hypothese besagt, dass das Indogermanische von Viehnomaden gesprochen wurde, die in den Steppen nördlich des Schwarzen und des Kaspischen Meeres lebten. Von hier aus drangen vor rund sechstausend Jahren Gruppen in mehreren Schüben zunächst in die westlicheren Regionen Europas und später in Richtung Asien vor, dominierten die dort lebenden Völker und verbreiteten so ihre Sprache. Ein ganz anderes Bild zeichnet die Anatolien-Hypothese: Ihr zufolge waren die Indogermanen Bauern, beheimatet in der heutigen Türkei, die ihre Sprache zusammen mit der Landwirtschaft nach Europa brachten. In diesem Szenario begann die Wanderungsbewegung drei Jahrtausende früher, und die sprachliche Ausbreitung ging langsamer vor sich.

Im Jahr 2012 schien der langwierige Forscherstreit endlich entschieden. Ein Aufsatz in der Zeitschrift „Science“ verkündete den Sieg der Anatolien-Hypothese. Durchgeführt hatte die Studie ein Team aus Informatikern und Biologen um den neuseeländischen Evolutionsforscher Russell Gray. Die Wissenschaftler hatten Daten von 103 alten und aktuellen indogermanischen Sprachen durch ein Computerprogramm laufen lassen, das ursprünglich für die Rekonstruktion von Virenstammbäumen bestimmt war. Die Untersuchung von Sprachfamilien mit Methoden der biologischen Statistik ist seit längerem ein florierendes Forschungsfeld, in dem Gray zu den führenden Experten gehört. Nach der „Science“-Veröffentlichung verkündeten Medien rund um die Welt, das Indogermanen-Rätsel sei nun gelöst. Viele Fachleute sahen das allerdings ganz anders: Die vermeintliche Lösung bildete den Auftakt zu einer Kontroverse, die bis heute anhält.

Lücken des Big-Data-Ansatzes

Dabei ist die Engführung von Biologie und Linguistik an sich nicht neu. Stammbäume verwendeten Indogermanisten sogar schon vor Darwin. Ähnlich wie die natürlichen Arten werden Sprachen nach Verwandtschaften sortiert und mächtigen Stammbäumen zugeordnet, in denen die heutigen Sprachen als die jüngsten Zweige in verästelten Kronen erscheinen. Seit den neunziger Jahren arbeiten Forscher an statistikbasierten Computerprogrammen, die endlich den linguistisch, geographisch und chronologisch „richtigen“ Stammbaum auswerfen sollen. Das hatten Gray und seine Kollegen nun scheinbar geschafft – den linguistischen Bioinformatikern schien gelungen, woran Generationen von Sprachforschern und Historikern sich die Zähne ausgebissen hatten. Zwei Jahre später wurde Russell Gray Direktor der Abteilung für Sprach- und Kulturevolution im neugegründeten Max-Planck-Institut für Menschheitsgeschichte in Jena, wo seitdem auch mehrere seiner Teamkollegen forschen.

Bei Sprachhistorikern traditioneller Prägung stieß die „Science“-Veröffentlichung auf heftige Ablehnung. Zu sehr weicht der computergenerierte Baum von dem ab, was die indogermanistische Forschung mit guten Gründen für gesichert hält. Bei mehreren Sprachen kollidierten die Verwandtschaftsbestimmungen und Datierungen mit den bekannten Fakten. Am drastischsten war das bei der Sprache der Roma, dem Romani, der Fall. Dessen Herausbildung erschien im digitalen Stammbaum um 2500 Jahre zu früh. Auch die Annahmen über das Tempo der Sprachentwicklungen und der Migrationsbewegungen, die in das Modell eingeflossen waren, stießen auf Kritik. Der Stammbaum, so hat sich gezeigt, wurzelt weniger in Anatolien als im lockeren Boden problematischer Methoden und Vorannahmen.

Vor diesem Hintergrund verschlug das sportlich-forsche Vorpreschen der linguistischen Bioinformatiker vielen Indogermanisten in Deutschland die Sprache. Aus den Vereinigten Staaten kam indessen eine Breitseite: In ihrem Buch „The Indo-European Controversy“ sowie in Blogs und auf Youtube werfen die Sprachwissenschaftlerin Asya Pereltsvaig und der Geograph Martin F. Lewis den Vertretern der linguistischen Bioinformatik gravierende Fehler, sprachhistorische Unkenntnis und Ignoranz gegenüber den Methoden und Leistungen der Indogermanistik vor. Pereltsvaig und Lewis verstünden die verwendeten Methoden nicht, kontern die Verteidiger. Doch den entscheidenden Kritikpunkten haben sie bislang wenig entgegengesetzt.

Für viele Indogermanisten bildet der „Science“-Aufsatz nur den bisherigen Höhepunkt in einer Entwicklung, die sie schon lange mit Unbehagen erfüllt. In Deutschland hat die Indogermanistik in den vergangenen zwei Jahrzehnten fast die Hälfte ihrer Lehrstühle und Standorte verloren. Vom Glanz, der diese Disziplin einst umgab, ist wenig geblieben. Ihre philologische Liebe zum Detail wirkt angestaubt in einer Zeit, in der Big Data und hochtechnisierte Labors die Vorstellung davon, was „echte“ Wissenschaft ist, prägen. Diesem Zeitgeist entspricht die computerlinguistische Stammbaumforschung viel besser. Ihr naturwissenschaftlicher Exaktheitsanspruch verschafft ihr Prestige, mediale Aufmerksamkeit und Fördermittel. Doch die fachliche Konkurrenz dreht sich nicht nur um Geld und Ansehen, sondern um Kernfragen sprachwissenschaftlicher Methodik.

Die Datengrundlage der computergenerierten Stammbäume bilden Wortvergleiche zwischen den verschiedenen Sprachen: Wenn sich zeigt, dass zwei Sprachen viele Wörter haben, die jeweils auf einen gemeinsamen Vorfahren zurückgehen – „Kognaten“ genannt –, gelten sie als eng verwandt. Umgekehrt gilt: Je weniger solcher Kognaten die verglichenen Sprachen aufweisen, desto weiter liegen sie im Stammbaum auseinander, und desto mehr Zeit ist vergangen, seit sich ihr gemeinsamer Ast gabelte. Das Verfahren klingt einfach, doch es erfordert komplizierte Vorbereitungen.

Verzerrte Analysen

Zunächst einmal muss man Wortpaare finden, die sich sinnvoll darauf hin überprüfen lassen, ob sie Kognaten sind. Diese Auswahl kann schwierig sein: Mit welchem englischen Wort soll man zum Beispiel den deutschen Hund abgleichen? Nimmt man dog, ergeben sich keine Kognaten, wohl aber mit hound. Je mehr solcher Unsicherheiten in die Berechnungen einfließen, desto fragwürdiger wird das Ergebnis. Es waren unter anderem solche Verzerrungen im Wortschatz, die zur falschen Datierung und Einteilung des Romani im Stammbaum der „Science“-Publikation führten.

In manchen Forschungsprojekten erfolgt die Kognatenerkennung automatisch. Diese Programme gleichen streng schematisch alle Vergleichswörter Laut für Laut miteinander ab und errechnen daraus den Grad der Verwandtschaft. Entsprechend hoch ist oft die Fehlerrate. Andere Teams kontrollieren ihre Wortlisten vorher von Hand. Aber auch dabei schleichen sich Fehler ein. Vermeiden ließen sie sich nur durch ein großes Team linguistischer Experten. „Vielen dieser Computerprojekte fehlen solide Sprachdaten. Wenn aber der Input schon nichts taugt, kann man die Ergebnisse auch vergessen“, sagt Sabine Ziegler von der Universität Jena. Die Vorsitzende der Indogermanischen Gesellschaft kritisiert zudem, dass die linguistischen Bioinformatiker sich auf den Wortschatz beschränken und auf grammatische und lautliche Analysen verzichten. Gerade durch die Entdeckung von gesetzmäßig verlaufenden Lautverschiebungen haben Sprachhistoriker viele Verwandtschaftsverhältnisse aufgespürt. Doch hier zeigen sich die Grenzen maschineller Analysen.

Wunsch nach einer Synthese

Die Kritik aus dem Lager der „klassischen“ Sprachhistoriker wird von den linguistischen Bioinformatikern mittlerweile durchaus ernst genommen. Jedenfalls in Jena, wo es inzwischen einen regen Austausch zwischen dem Max-Planck-Institut für Menschheitsgeschichte und dem universitären Seminar für Indogermanistik gibt. Im Max-Planck-Institut selbst forschen mittlerweile sprachhistorisch ausgebildete Linguisten, zumeist in der Abteilung für Sprach- und Kulturevolution.

„Wir brauchen eine Synthese mit den klassischen Linguisten“, sagt Johann-Mattis List, gelernter Indogermanist und seit dem vergangenen Jahr am Institut für Menschheitsgeschichte. Bei allem Verständnis für die Kritik an den computergestützten Analysen betont er doch deren großes Potential. Der Rechner kann nicht nur riesige Datenmengen schnell verarbeiten – sein Mangel an Intuition, gepaart mit strikter Logik, hat auch eine heilsame Wirkung. Er decke Mängel in den Daten auf und zwinge dazu, methodische Vorannahmen offenzulegen, meint List.

„Dabei wird deutlich, dass sich viele Probleme, mit denen die automatische Analyse zu kämpfen hat, auch für die klassische Linguistik stellen.“ Inwieweit sich beispielsweise von Lautverschiebungen auf sprachliche Verwandtschaften schließen lasse, sei keineswegs immer so klar, wie die Indogermanisten behaupteten. Die linguistische Bioinformatik sieht List nicht als Totengräber, sondern als Blutspender traditioneller Sprachgeschichte: „Die klassische Indogermanistik war im Niedergang, die Computerlinguistik hat sie gerettet.“ In der Tat haben Russell Gray und seine Kollegen indogermanistischen und anderen sprachhistorischen Themen Eingang in internationale Top-Journale und damit öffentliche Aufmerksamkeit verschafft. Von den so gewonnenen Fördertöpfen profitiert mittlerweile auch die Indogermanistik – allerdings eher als Juniorpartnerin denn als Leitdisziplin.

Quelle: F.A.Z.
  Zur Startseite
Ähnliche ThemenMax-Planck-InstitutEuropaJena