Anzeige

„Wayback Machine“

Netz-Gedächtnis der Menschheit lagert in einer Kirche

Von Adrian Lobe
 - 21:58
Wer das Internet archivieren will, braucht hohe Rechenleistung und viel Speicherplatz. Bild: obs, F.A.Z.

Das Gedächtnis des Internets hat einen Ort: In einer unscheinbaren Nebenstraße in San Francisco, zwischen Zypressen und Einfamilienhäusern, steht ein weißgetünchter Monumentalbau im neoklassischen Stil, mit Säulen und Bögen. Hier, in einer ehemaligen Kirche, residiert das Internet Archive. Das Gros der Besucher steuert nicht die physische Adresse in der Funston Avenue an, sondern die Internetadresse www.archive.org. Die Non-Profit-Organisation wurde 1996 von dem Informatiker Brewster Kahle gegründet und versteht sich als digitale Bibliothek. „Universaler Zugang zum Wissen“ lautet ihr Leitsatz. Die „Wayback Machine“ ist das Herzstück dieses Projekts, ein Roboter, der unermüdlich das Netz nach Seiten durchpflügt. 435 Milliarden Websites wurden über die Jahre gespeichert. Und täglich werden es mehr. Jeder kann per Mausklick eine neue Quelle hinzufügen. So wie Staatsarchive alte Bücher sammeln, kollektioniert das Internet Archive alte Websites.

Anzeige

Die Website hat mit Screenshots die Homepages archiviert, zum Teil auch weiterführende Links. Man staunt, wenn man einen Blick in die digitalen Archive wirft. Alte Homepages mit Familienfotos tauchen auf, Nachrichtenseiten im Old-School-1.0-Format. Von „Spiegel Online“ ist die Startseite vom 13. September 2001 überliefert, zwei Tage nach dem Terroranschlag, mit dem Aufmacher: „Lebte einer der Terrorpiloten in Hamburg?“ Es ist eine Zeitreise zurück in die Geschichte des Internets. Die inzwischen eingestellte „Financial Times Deutschland“ berichtete am 28. Mai 2002 in ihrer Online-Ausgabe: „Nato und Russland beenden Kalten Krieg.“ Zeitgeschichte, festgehalten in einem Screenshot. Am 13. August 2008 erstrahlt die Homepage der Dresdner Bank in grünem Glanz. Heute ist die Homepage tot, die Dresdner Bank wurde an die Commerzbank verkauft. Internet Archive ist das Google historischer Homepages, und es ist verblüffend, wenn Suchergebnisse auftauchen, die man heute gar nicht mehr findet.

Kurze Ewigkeit

Die durchschnittliche Halbwertszeit einer Website beträgt rund hundert Tage. Das ist ein zwiespältiger Befund, schließlich meinen wir, das Netz vergesse nie. Was einmal im Netz landet, hat Bestand, ist eingemeißelt für die Ewigkeit – denkt man. In Wirklichkeit werden haufenweise Seiten gelöscht. 2006 sagte der jetzige britische Premier David Cameron in einer Rede, Google demokratisiere die Welt, „weil es den Menschen Informationen zugänglicher macht“. Sieben Jahre später nahmen die Torys zehn Jahre Redematerial von ihrer Website, inklusive der genannten. Was interessiert schon das Geschwätz von gestern? Das Portal BuzzFeed löschte mehr als 4000 Artikel seiner Redakteure, angeblich, weil sie mit der Zeit immer lächerlicher und dümmlicher wirkten. Social-Media-Posts, öffentliche Einträge – im Internet ist manches doch vergänglich. Wenn man eine Seite aufruft, die nicht mehr existiert, meldet der Browser lapidar: „Diese Seite konnte nicht gefunden werden. Page not found.“ Nicht finden heißt: nicht existieren. Oberflächlich besehen. Denn irgendwo in den Tiefen lagern die Informationen noch, auf Servern oder in alten Ordnern. Man kann sie nur nicht einsehen. Die sichtbare Seite wurde überschrieben, wie bei einem Taschenrechner. Überschreiben bedeutet: alte Daten durch das Speichern neuer zu zerstören.

Dabei müssen Seiten nicht einmal gezielt gelöscht werden. Als MySpace, GeoCities und Friendster rekonfiguriert beziehungsweise verkauft wurden, verschwanden Millionen Accounts. Karteileichen, versunken im digitalen Nichts. Laut einer Studie der Harvard Law School von 2014 sind mehr als siebzig Prozent der URLs in der „Harvard Law Review“ und anderen Journalen sowie fünfzig Prozent der URLs der Supreme-Court-Opinions nicht mehr mit dem originären Link verknüpft – und somit nicht mehr einsehbar. Damit geht auch wertvolles Wissen verloren. Gegen diesen Trend stemmt sich das Internet Archive. Wie wichtig diese Aufgabe sein kann, zeigt ein Vorfall aus dem vergangenen Sommer.

Anzeige

Weg in die Vergangenheit

Nachdem eine Maschine der Malaysian Airlines am 17. Juli 2014 über der Ukraine abgeschossen wurde, postete der Separatistenführer Igor Girkin, auch bekannt als Strelkow, auf der russischen Social-Media- Plattform VKontakte folgenden Eintrag: „Wir haben gerade ein Flugzeug heruntergeholt, eine Antonow 26.“ Der Post war mit einem Video versehen, das erkennbar die Bilder eines Flugzeugwracks zeigt – es scheint die Boeing 777 der Malaysian Airlines zu sein. Zwei Wochen vor dem Abschuss hatte Anatol Shmelev, Kurator der russischen und eurasischen Kollektion an der Hoover Institution in Stanford, eine Reihe von Websites übermittelt, die als Teil des Konflikts in der Ukraine archiviert werden sollten. Strelkows Profilseite war auch darunter. In einer E-Mail an das Internet Archive schrieb der Archivar Shmelev: „Strelkow ist ein Kommandeur in Slawjansk und eine der wichtigsten Figuren in dem Konflikt.“ Seine Seite „verdient es, zweimal täglich registriert zu werden“. Am 17. Juli um 15.22 Uhr Londoner Zeit machte Shmelev einen Screenshot von Strelkows Profil auf VKontakte. Es dauerte keine zwei Stunden, da griff ein Redakteur des „Christian Science Monitor“ diesen Screenshot auf und verbreitete ihn im Netz. Doch in der Zwischenzeit hatte Strelkow, unter Druck stehend, den Eintrag gelöscht. Er scheint unwiederbringlich verloren. Der einzige Beweis liegt in der Wayback Machine. Das Internet Archive ist ein reichhaltiger Fundus nicht nur für Forscher, sondern auch für Kriminalisten.

Mit der Wayback Machine geht es durch den digitalen Wust. Es ist ein ähnlicher Ansatz wie bei einer Suchmaschine. Der Computer klickt Seiten an und speichert sie. Das Projekt will den Beweis antreten, dass man ein digitales Archiv erschaffen kann. Brewster Kahle, der Gründer des Internet Archive, teilt per E-Mail mit: „Wir wissen nicht, was wichtig sein wird und was nicht, also versuchen wir, so viel zu bekommen wie möglich.“ Das Datenvolumen im Internet wächst rasant. Der globale IP-Traffic wird nach Schätzungen von Cisco 2018 1,6 Zetabyte betragen. Das entspricht 395 Milliarden DVDs. Alle drei Minuten wird die Menge aller bislang aufgenommenen Filme durch die Internetleitungen gejagt. Mit dieser digitalen Expansion kann das Archiv kaum mithalten. „Wir sammeln eine Milliarde Seiten pro Woche, aber wir kommen schon jetzt nicht mehr mit allem hinterher, was etwa auf Youtube gepostet wird“, konstatiert Kahle.

Eine Kathedrale der Informationstechnologie

Das Internet Archive verfügt über mehrere Rechenzentren (unter anderem ein Backup-Rechenzentrum in Richmond), die insgesamt fünfzig Petabyte gespeichert haben. In einer Dokumentation ist zu sehen, wie Brewster Kahle eine Besuchergruppe durch das Heiligtum seiner Organisation führt. In der Andachtshalle der alten Christian Science Church blinken und surren Server. Das Internet Archive ist eine Kathedrale der Informationstechnologie. Verglichen mit Google und Facebook, die riesige Rechenzentren in der Größe von Flugzeughangars betreiben, nimmt sich die Speicherkapazität gering aus. Gegen die Tech-Giganten kommt das Internetarchiv nicht an. Die gemeinnützige Organisation finanziert sich über Spenden und hat ein jährliches Budget von zehn Millionen Dollar. Ein Witz, verglichen mit den Milliardenumsätzen von Google & Co. Die Library of Congress in Washington, wo Twitter seine Tweets verwahrt, hat neun Milliarden Seiten archiviert. Die British Library kommt auf sechs Milliarden Seiten.

Die Frage ist: Warum muss eine Non-Profit-Organisation Archive pflegen? Wir beklagen uns über die Übermacht von Google, zementieren diese aber mit jeder Suchanfrage. Sollte es nicht eine gesellschaftliche Aufgabe sein, die Geschichte des Internets festzuhalten? „Wir haben alle eine Rolle zu spielen“, sagt Kahle. „Leider ist es schwierig, digitale Archive aufrechtzuerhalten. Haben Sie etwa noch Ihre alten Mails von vor zehn Jahren?“ Nun hat man auch früher nicht alle Briefe zur Seite gelegt und abgeheftet. Die entscheidende Frage ist doch, ob wir alles archivieren müssen.

Das Recht auf Vergessen beschneidet das Recht auf Information

Der Europäische Gerichtshof hat im vergangenen Jahr ein „Recht auf Vergessenwerden“ etabliert. Google wird seither mit Löschanträgen überhäuft. Aktivisten wie Viktor Mayer-Schönberger fordern schon seit langem, elektronisch gespeicherte Informationen mit einem Verfallsdatum auszustatten. Das Internet Archive entfernt Einträge, die der Nutzer nicht mehr länger archiviert sehen möchte. Das Problem ist, dass das Recht auf Vergessen das Recht auf Information beschneidet. Kahle verficht ein uneingeschränktes Informationsrecht. Er sieht das Internet als riesige Bibliothek, die in den Besitz der Allgemeinheit überführt werden muss. „Millionen Menschen haben Zeit und Mühen hineingesteckt, um das zu teilen, was wir als World Wide Web kennen. Wir wollen eine Bibliothek für diese neue Publikations-Plattform schaffen.“ Es geht nicht zuletzt um die Frage, wer die Geschichte schreibt. Die Non-Profit-Organisation will das Feld der Deutungshoheit nicht Google überlassen.

Das Internet Archive kämpft gegen das Vergessen an und schafft gleichsam eine neue Erinnerungskultur. Das, was die Wayback Machine zutage fördert, ist nicht durch Google-Algorithmen vorgefiltert und im Ergebnis nicht verzerrt. Es bildet das Netz in seiner Wirklichkeit ab. Unverfälscht und offen. Doch angesichts der exponentiell wachsenden Datenmenge droht dem Internet Archive früher oder später die digitale Amnesie.

Quelle: F.A.Z.
  Zur Startseite
Ähnliche ThemenDavid CameronSan FranciscoCommerzbankDresdner BankHarvardKircheMalaysia AirlinesNatoSpiegel OnlineEinfamilienhausUSA-Reisen

Anzeige