Genaue Datierung alter Websites

Im Internet haben nicht alle Angebote zweifelsfrei identifizierbare Zeitstempel. IT-Forscher haben deshalb einen Algorithmus entwickelt, mit dem der Entstehungszeitraum einer Website leichter ermittelt werden kann.

In Pocket speichern vorlesen Druckansicht 16 Kommentare lesen
Lesezeit: 2 Min.

Wer jemals versucht hat, das genaue Alter einer einzelnen Seite im Web zu ermitteln, kennt das Problem: Nicht jedes Online-Angebot verfügt über eine eindeutige Zeitmarkierung, insbesondere bei privaten Sites und Firmenpräsentationen fehlt diese gerne. Die IT-Forscher Hany SalahEldeen und Michael Nelson von der Old Dominion University in Norfolk, Virginia, haben deshalb nun eine neue Altersbestimmungsmethode entwickelt, die Abhilfe schaffen könnte, berichtet Technology Review in seiner Online-Ausgabe. Ihre Web-Anwendung namens Carbon Date ermittelt das Erstellungsdatum einer Seite, in dem sie nach ihren ersten Online-Erwähnungen sucht. Dabei werden verschiedene Faktoren betrachtet, um ein möglichst genaues Ergebnis zu erhalten.

So werden Internet-Angebote häufig gleich auf mehrere Arten erfasst, sobald sie erstellt werden. Beispielsweise lässt sich beim URL-Shortener-Dienst Bit.ly nachsehen, wann jemand die fragliche Internet-Adresse erstmals zur Weiterleitung über soziale Netzwerke verkürzt hat oder bei Topsy prüfen, wann jemand erstmals die URL auf Twitter erwähnte. Mit Memento lässt sich wiederum abfragen, wann eine URL erstmals in einem Web-Archiv landete. Google erlaubt es ebenfalls mit etwas Arbeit, das Datum zu ermitteln, wann eine Seite erstmals in den Index aufgenommen wurde. Zudem zeigt der sogenannte Last-Modified-Header im Web-Protokoll HTTP die Zeit, wann eine Seite letztmalig verändert wurde.

Allerdings lässt sich nur dann ein verlässliches Erstellungsdatum finden, wenn man mehrere dieser Dienste kombiniert. Genau das tut Carbon Date und automatisiert den Prozess. SalahEldeen und Nelson sagen, dass ihr Werkzeug bereits weitgehend zuverlässig arbeitet, auch wenn sie noch am Anfang stehen. So haben sie ein Paket mit 1200 Web-Seiten getestet, bei denen das Entstehungsdatum bereits bekannt war.

Mehr zum Thema in Technology Review online:

(bsc)