Altersbestimmung fürs Web

Im Internet haben nicht alle Angebote zweifelsfrei identifizierbare Zeitstempel. IT-Forscher haben deshalb nun eine neue Methode entwickelt, mit der der Entstehungszeitraum einer Website ermittelt werden kann.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 2 Min.
Von
  • TR Online

Im Internet haben nicht alle Angebote zweifelsfrei identifizierbare Zeitstempel. IT-Forscher haben deshalb nun eine neue Methode entwickelt, mit der der Entstehungszeitraum einer Website ermittelt werden kann.

Wer jemals versucht hat, das genaue Alter einer einzelnen Seite im Web zu ermitteln, kennt das Problem: Nicht jedes Online-Angebot verfügt über eine eindeutige Zeitmarkierung, insbesondere bei privaten Sites und Firmenpräsentationen fehlt diese gerne.

Die IT-Forscher Hany SalahEldeen und Michael Nelson von der Old Dominion University in Norfolk, Virginia, haben deshalb nun eine neue Altersbestimmungsmethode entwickelt, die Abhilfe schaffen könnte. Ihre Web-Anwendung namens Carbon Date ermittelt das Erstelldatum einer Seite, in dem sie nach ihren ersten Online-Erwähnungen sucht. Dabei werden verschiedene Faktoren betrachtet, um ein möglichst genaues Ergebnis zu erhalten.

So werden Internet-Angebote häufig gleich auf mehrere Arten erfasst, sobald sie erstellt werden. Beispielsweise lässt sich beim URL-Shortener-Dienst Bit.ly nachsehen, wann jemand die fragliche Internet-Adresse erstmals zur Weiterleitung über soziale Netzwerke verkürzt hat oder bei Topsy prüfen, wann jemand erstmals die URL auf Twitter erwähnte. Mit Memento lässt sich wiederum abfragen, wann eine URL erstmals in einem Web-Archiv landete. Google erlaubt es ebenfalls mit etwas Arbeit, das Datum zu ermitteln, wann eine Seite erstmals in den Index aufgenommen wurde. Zudem zeigt der sogenannte Last-Modified-Header im Web-Protokoll HTTP die Zeit, wann eine Seite letztmalig verändert wurde.

Allerdings lässt sich nur dann ein verlässliches Erstelldatum finden, wenn man mehrere dieser Dienste kombiniert. Genau das tut Carbon Date und automatisiert den Prozess. SalahEldeen und Nelson sagen, dass ihr Werkzeug bereits weitgehend zuverlässig arbeitet, auch wenn sie noch am Anfang stehen. So testeten sie ein Paket mit 1200 Web-Seiten, bei denen das Entstehungsdatum bereits bekannt war. Von 75,90 Prozent der getesteten Ressourcen war ein Alterswert ermittelbar, bei 32,78 Prozent landete das Team jeweils einen Volltreffer. Bestehende Abweichungen sollen mit einer Verbesserung des derzeit verwendeten Algorithmus erzielt werden. Dann könnten auch Journalisten und Historiker den Dienst zuverlässig nutzen. ()