Zahlen, bitte: 446 Milliarden Dokumente in der Wayback Machine

Die Wayback Machine ist mit 446 Milliarden Webseiten Teil des Internet Archive und selbiges der Erinnerungsort der digitalen Revolution schlechthin.

In Pocket speichern vorlesen Druckansicht 6 Kommentare lesen
Zahlen, bitte: 446 Milliarden Dokumente in der Wayback Machine
Lesezeit: 4 Min.
Von
  • Detlef Borchers
Inhaltsverzeichnis

Wie Daniel Bell in seinem Werk über "Die nachindustrielle Gesellschaft" ausführte, sind Informationen und Wissen, ihre Pflege und freie Nutzung in großen Datenbanken der eigentliche Motor der dritten industriellen Revolution. Es geht also um eine ziemlich immaterielle Sache, die von keinem Ort besser abgebildet werden könnte als dem Internet Archive in San Francisco.

Zahlen, bitte!

In dieser Rubrik stellen wir immer dienstags verblüffende, beeindruckende, informative und witzige Zahlen aus den Bereichen IT, Wissenschaft, Kunst, Wirtschaft, Politik und natürlich der Mathematik vor.

Hier befindet sich nicht nur die Wayback Machine, mit der das frühe Internet besucht werden kann. Das an einen griechischen Tempel angelehnte, 1923 für die "Christliche Wissenschaft" gebaute Gebäude wurde 2009 von Brewster Kahle und dem Internet Archive gekauft, weil es wie das Logo des Internet Archive aussieht, das bereits 1996 entworfen wurde. Mehr Meta geht nicht. Als Erinnerungsstätte für den 2013 verstorbenen Internet-Aktivisten Aaron Swartz erfüllt es zudem eine religiöse Funktion. Swartz nahm sich 2013 das Leben, nachdem er wegen des illegalen Downloads einer Wissensdatenbank angeklagt wurde.

Wenn Information und Kommunikation das Zeug haben, eine Gesellschaft zu revolutionieren, dann muss es Wege und Mittel geben, den Wert von Informationen zu bestimmen, die den "Mehr-Wert" der Wissensgesellschaft ausmachen. Mit dieser Frage beschäftigte sich der Soziologe Daniel Bell 1973 in seinem Buch über die nachindustrielle Gesellschaft. Bell setzte sich ausführlich mit dem österreichisch-amerikanischen Ökonomen Fritz Machlup auseinander, der erstmals Wissen als ökonomische Ressource definierte.

Einen Schritt weiter als Machlup ging Marc Porat, der in seiner 1976 erschienen Dissertation "The Information Economy" acht Kategorien von Wissen unterschied und ihren Wert zu berechnen versuchte. Kategorie Eins war die Produktion von Wissen, Kategorie Acht umfasste die Schulgebäude und Universitäten, in denen gelehrt wurde, wie man mit dem Wissen arbeitet und neues Wissen anhäuft. Für das Jahr 1967 rechnete Porat vor, dass die USA bereits 174,6 Milliarden Dollar oder 21,9 Prozent des Bruttosozialproduktes mit Wissen erwirtschaftete. Für 1980 sagte Porat voraus, dass die Wissensproduktion der dominierende Wirtschaftsfaktor sein werde, weit vor dem Bau von Autos und Flugzeugen.

Und bereits sein Lehrer Daniel Bell wies auf das Problem hin, dass im Zuge der anstehenden Revolution das Urheberrecht gründlich reformiert werden müsse. Einen großen Schritt in diese Richtung ging Brewster Kahle, ein Informatiker, der nach seinem Studium bei Thinking Machines arbeitete. Dort entwickelte er basierend auf dem Konzept vernetzter Rechner an den Universitäten das System der Wide Area Information Server (WAIS), die jeweils eine oder mehrere Datenbanken zu einem Wissensgebiet unterhalten und durchsucht werden konnten.

WAIS wurde 1991 zunächst für die Supercomputer von Thinking Machines entwickelt, war aber bald für eine Reihe von Unix-Systemen verfügbar. Such-Clients für WAIS gab es für Windows, MacOS und DOS. Kahle gründete mit WAIS eine eigene Firma, verkaufte aber bald das System an den Online-Dienst America Online (AOL), weil er Software für das von Tim Berners-Lee erdachte World Wide Web entwickeln wollte.

Mit seinem Ranking-Dienst Alexa landete Kahle einen weiteren kommerziellen Erfolg, während er zugleich die Wayback Machine entwickelte. Inspiriert wurde Kahle 1996 bei einem Besuch der damals wichtigsten Suchmaschine Altavista, als ihm klar wurde, wie häufig sich Web-Auftritte ändern. Mit der Wayback Machine nahm er 1996 den Kampf gegen das Vergessen im Internet auf.

Heute ist die Wayback Machine mit 446 Milliarden Webseiten Teil des Internet Archive und selbiges der Erinnerungsort der dritten industriellen Revolution, die längst nicht abgeschlossen ist. Was alles im Archiv ist, reicht für viele Zahlenspiele: 200.000 Software-Programme halten die Erinnerungen an frühe Rechner oder das seltsame MS-DOS hoch, mit dem Microsofts Aufstieg begann. Eine eindrucksvolle Dokumentensammlung zeigt den 11. September 2001 als Tag, an dem Google von der Suchmaschine zum Nachrichtenkanal transformierte. Zuletzt wurden 20.000 VHS-Kassetten aus der Zeit vor der großen Verschmelzung aller Medien digitalisiert.

Aktuell laufen 15 archivarische Projekte, die sich auch mit anderen Artefakten beschäftigen, etwa das Hooniverse, das sich mit der untergehenden Automobilindustrie beschäftigt. Derzeit ist das Internet Archive in den Nachrichten, nachdem es in Zeiten der Coronakrise seine Open Library unbegrenzt öffnete. Nach einer Klage von US-Verlagen wird die Notfall-Bibliothek am heutigen Dienstag geschlossen. Doch die dritte industrielle Revolution läuft unverdrossen weiter.

(axk)