Das Internet Archive in San Francisco will unser kollektives Gedächtnis sein. Acht Säulen schmücken die Front des Hauptsitzes im Stadtteil Richmond, strahlend weiß und kantig überragt es die aus Holz gebauten Häuser in der sonst unscheinbaren Wohnstraße. 1923 wurde das Gebäude als Kirche errichtet. Das Archive übernahm es 2009 – nicht zuletzt, weil es dem eigenen Logo, einem antiken Säulentempel, so ähnlich sah. Wo früher Gottesdienste abgehalten wurden, gibt es heute Vorträge über künstliche Intelligenz und ähnliche Themen. Wo einst Heiligtümer ihren Platz fanden und Choräle gesungen wurden, surren nun Server. Als eine universelle Bibliothek im Zeitalter der Cloud sieht sich das Internet Archive, und deshalb soll hier so viel wie nur möglich für die Nachwelt digitalisiert, gespeichert und abrufbereit gehalten werden. Gegründet wurde es 1996 vom Programmierer und Unternehmer Brewster Kahle, der damals gleichzeitig seine Internet-Analyse-Firma Alexa startete und sie 1999 für rund 250 Millionen US-Dollar an Amazon verkaufen konnte.
16 Millionen Texte, 1,6 Millionen Stunden Fernsehen, 4,2 Millionen Videos, 4,1 Millionen Audiodateien und 180.000 Livekonzerte von 7.000 Bands
Die Statistiken des Internet Archive lesen sich gewaltig: 35 Petabyte Daten sind bisher gespeichert. In dieser unvorstellbaren Menge von 35 Billiarden Byte finden sich zum Beispiel 327 Milliarden Websites, die man in der „Wayback Machine“ ansehen kann. Sie reichen bis ins Jahr 1996 zurück.
Alexis Rossi, Director of Media and Access, ist seit dem Start dieser Internet-Zeitmaschine dabei. „Anfangs gingen wir davon aus, dass sich schon bald andere Organisationen um Dinge wie Bücher, Musik oder TV kümmern würden“, erklärt sie. „Aber die Jahre vergingen, und nichts tat sich.“ Also nahm das Archive auch dies selbst in die Hand.
Deshalb geht es schon lange nicht mehr nur ums Internet, sondern um alles, was man auch in einer klassischen Bibliothek finden würde. Nur ist diese digitale Version eben um einiges umfassender, als es das Vorbild aus Stein und Beton jemals sein könnte: Rund 16 Millionen Texte, 1,6 Millionen Stunden Fernsehen, 4,2 Millionen Videos, 4,1 Millionen Audiodateien und 180.000 Livekonzerte von 7.000 Bands sind hier zu finden. Die Liste ließe sich fortsetzen.
Darunter findet sich ein Special rund um die Terroranschläge vom 11. September 2001 in den USA mit der damaligen Live-Berichterstattung verschiedener Fernsehkanäle. Außerdem kann man in 40 Jahre alten Computermagazinen stöbern und Radiosendungen hören aus einer Zeit, als es noch kein Fernsehen gab. Auch Musikaufnahmen finden sich hier, die sonst nur auf Schellackplatten erhalten sind. Und seit 18 Jahren gehören nun eben auch Aufzeichnungen vom Livefernsehen zum Angebot des Internet Archive.
All das soll einen „universellen Zugang zu allem Wissen“ ermöglichen und ist als Werkzeug für Forschung und Recherche gedacht
Eine noch vergleichsweise neue und zugleich sehr erfolgreiche Kategorie ist Software. Freiwillige haben hier Wege gefunden, alte Hardware zu emulieren. Schließlich sind auch Spielekonsolen und PCs ein Teil unserer Kultur.
Die Inhalte des Internet Archive kommen dabei aus drei Quellen. Erstens nehmen es die 150 Mitarbeiterinnen und Mitarbeiter bisweilen selbst in die Hand, sie einzuspeisen. So werden derzeit rund 1.000 Bücher pro Tag eingescannt. Zweitens bekommt das Archive als gemeinnützige Organisation gelegentlich auch etwas geschenkt, wie etwa das Prelinger Archive, in dem sich gut 6.900 Filme aus Werbung und Lehre sowie zahlreiche Amateuraufnahmen finden. Drittens können die Nutzer selbst Inhalte hochladen und in „Kollektionen“ sortieren.
All das soll einen „universellen Zugang zu allem Wissen“ ermöglichen und ist als Werkzeug für Forschung und Recherche gedacht. So jedenfalls lautet die offizielle Mission des Internet Archive. Das Geld dafür kommt überwiegend aus Dienstleistungen. Man kann das Archive beispielsweise auch damit beauftragen, Bücher zu digitalisieren oder Internetseiten zu archivieren. Der Rest kommt über Fördermittel, Stiftungen und Spenden herein. Etwa 15 Millionen Dollar beträgt das jährliche Budget.
Eine der Herausforderungen des Internet Archive ist es, dass Menschen sich nicht immer gern erinnern und manches am liebsten vergessen wollen – manchmal auch die Geschichte ihres eigenen Landes und wie sich dessen Kultur in den letzten Jahrzehnten verändert hat. „Wir haben einige ernsthaft anstößige Inhalte in unserem Archiv“, sagt Alexis Rossi. Was vor 50 Jahren noch als alltäglich galt, werde heute als rassistisch und sexistisch angesehen. Selbst zunächst harmlos scheinende Inhalte wie Cartoons oder TV-Werbespots können in diese Kategorie fallen. Propagandafilme und Hetzschriften gehören sowieso dazu.
Will man das wirklich noch sehen?
Aber was wird nun gelöscht, und was darf bleiben? Eine offizielle, öffentlich einsehbare Leitlinie gibt es dazu nicht. „Unsere Tendenz ist es, Inhalte verfügbar zu lassen“, erklärt Alexis Rossi und ergänzt: „Wir sind kein Unterhaltungsangebot. Was bei YouTube erlaubt ist und was bei uns erlaubt ist, wird sich schon deshalb unterscheiden.“
Das gilt etwa für Gewaltdarstellungen in der Berichterstattung aus dem Zweiten Weltkrieg. „Auch Kriegsbilder sollten für Menschen in 50 Jahren und 100 Jahren noch zur Verfügung stehen“, sagt sie. Das Archive würde keine „Wochenschau“ aus jener Zeit entfernen, nur weil darin Kriegsgräuel plastisch zu sehen sind.
Trotzdem ist nicht alles für jeden erreichbar, denn auch das Internet Archive muss sich an Gesetze halten und will selbst Verantwortung zeigen. Manche Inhalte lassen sich deshalb nicht auf anderen Websites einbetten. Sie sind überhaupt nur abrufbar, wenn man als Nutzer angemeldet ist.
Andere Inhalte wiederum werden für Menschen aus bestimmten Regionen der Welt geblockt, weil sie dort illegal sind. „Lieber blocken wir zum Beispiel ein einzelnes Buch, als dass das gesamte Archive in diesem Land nicht erreichbar ist“, sagt Alexis Rossi. Es zahle sich am Ende aus, hier flexibel zu sein.
Ein größeres Hindernis bei der Arbeit des Internet Archive ist das Urheberrecht. Das wurde seit seiner Einführung immer wieder ausgeweitet. Wem aber sei damit geholfen, wenn dadurch ein wissenschaftliches Lehrbuch von 1980 nicht zur Verfügung steht, fragt Alexis Rossi. „Wir brauchen das Copyright, damit Urheber mit ihren Werken Geld verdienen können. Aber wenn es endlos ausgedehnt wird, beschränkt es das, was andere mit diesen Werken tun können.“
Wer sich aus dem Speicher gelöscht sehen will, kann das mitteilen – und wird auch ernst genommen
Anfangs war auch die „Wayback Machine“ dadurch bedroht. Schließlich legte das Internet Archive mit diesem Angebot zahlreiche Kopien urhebergeschützter Werke an. Inzwischen aber werde der Wert erkannt, sagt Alexis Rossi.
Bei alldem möchte das Archive aber Menschen nicht in Schwierigkeiten bringen. Wer sich aus dem Speicher gelöscht sehen will, kann das mitteilen. „Wir nehmen das sehr ernst. Wir wollen sowohl respektvoll mit den Menschen sein als auch unsere Mission einer Bibliothek der modernen Welt erfüllen.“ Das sei natürlich bisweilen ein Drahtseilakt. Und durch strengere Datenschutz-Vorschriften wie die Datenschutzgrundverordnung (DSGVO) könnte das zukünftig noch etwas komplizierter werden.
Dabei legt sich das Archive durch seine konsequente Arbeit nicht zuletzt mit den Großen und Mächtigen an. „Die derzeitige US-Regierung wollte am liebsten Dinge aus dem Netz verschwinden lassen, aber wir haben es gespeichert. Alles davon“, sagt Alexis Rossi mit einer gewissen Genugtuung in der Stimme.
Unbequeme Themen wie den Klimawandel kann man dann zwar beispielsweise von den offiziellen Websites verbannen. Aber wie sich die Politik hier mit dem Regierungswechsel geändert hat, lässt sich weiterhin unter archive.org nachsehen.
Titelbild: LIANNE MILTON/NYT/Redux/laif