Surfen auf vergangenen Websites

Wem das aktuelle Angebot im Internet nicht ausreicht, der kann in den 10 Milliarden Seiten des Internet-Archivs eine Reise in die Vergangenheit antreten.

In Pocket speichern vorlesen Druckansicht 117 Kommentare lesen
Lesezeit: 3 Min.
Von
  • Andreas Grote

Auf einer jetzt für die Öffentlichkeit freigeschalteten Website des Internet Archive kann jeder kostenlos auf die dort seit 1996 gespeicherten 10 Milliarden Internet-Seiten zugreifen. Um in die Vergangenheit zu surfen, ist hierzu in der WaybackMachine lediglich die gewünschte URL einzugeben und ein Zeitpunkt auszuwählen, für den die Website zur Verfügung steht.

"Wir hatten das Internet-Archiv 1996 gegründet, da wir starke Zweifel daran hatten, dass diese historisch wichtigen Dokumente dieses neuen Mediums für die Öffentlichkeit erhalten bleiben würden", erklärt der Gründer und Direktor des Non-profit-Unternehmens, Brewster Kahle. Tatsächlich seien die meisten Web-Seiten von 1996 schon heute nicht mehr im Internet vorhanden. Mit Hilfe der WaybackMachine lassen sich nicht mehr existierende Homepages wieder rekonstruieren, sofern sie damals archiviert wurden. Allerdings fehlen einige Websites, von denen die automatische Archivierungssoftware keine Kenntnis hatte, deren Zugang mit einem Passwort geschützt oder aus anderen Gründen nicht zugänglich war. "Heute besitzt das Internet-Archiv 10 Milliarden Websites in seinem Archiv, die sonst verloren gegangen wären, und gibt so einen Einblick über die Ursprünge und Entwicklung des Internet sowie ein Spiegelbild unserer Gesellschaft als Ganzes am Ende eines Jahrtausends".

Die Archivare vom Internet-Archiv archivieren das gesamte Internet alle zwei Monate. So ist zwar nicht das gezielte Suchen nach einem bestimmten Datum möglich, aber der Anwender kann im günstigsten Fall verfolgen, wie sich eine Website im 60-Tage-Rhythmus verändert hat. Seit 1996 wurden so 100 Terabytes an Daten gespeichert, monatlich kommen 12 Terabytes hinzu. Das macht das Internet-Archiv zur größten existierenden Datenbank der Welt. Gespeichert sind die Daten auf Dutzenden von modifizierten Servern von Hewlett-Packard und uslab.com, die unter den Betriebssystemen FreeBSD und Linux laufen. Jeder Computer besitzt einen Arbeitsspeicher von 512 MByte und verwaltet mehr als 300 Gigabytes an Daten auf den angeschlossenen IDE-Festplatten.

Ursprünglich war die WaybackMachine als Recherche-Hilfsmittel für Wissenschaftler, Historiker und Studenten, aber auch für Web-Designer, Richter und Journalisten entworfen worden. "Auch interessierte Menschen, die einfach nur nachsehen wollen, wie historische Ereignisse im Internet zu ihrer Zeit behandelt wurden, werden hier fündig", verweist Kahle auf Sondersammlungen wie 500 Millionen Websites zu den Terroranschlägen in den USA am 11. September, 200 Millionen Websites zur US-Wahl 2000, 360 Filme mit historischem Material von 1903 bis 1973 und 5.000 historische Dokumentationen.

Heute nutzen neben der umfangreichen Library of Congress auch AT&T Research, Compaq, Xerox PARK und IBM zusammen mit vielen Forschergruppen weltweit das Internet-Archiv für ihre Arbeit und um ihre Daten für später zu sichern. Doch auch jeder private Anwender kann seine eigenen Internet-Seiten im Internet-Archiv archivieren lassen, sofern sie dort noch nicht vorhanden sind. Durch den Aufruf der Website "Archive Your Site" wird die eigene Homepage zu einem historischen Dokument. (Andreas Grote) / (mw)