Noch viel größer
Wenn man wissen will, wie groß das Internet ist, wird es interessant und kompliziert.
- Peter Glaser
Die Frage kam an einem glutheißen Sommernachmittag. Wie groß ist das Internet?, wollte mein Freund p. wissen. Gute Frage. Ich dachte, ich hätte sie ihm schon mit einem Hinweis beantwortet. Wir hatten uns gelegentlich über die US-Firma Wal-Mart unterhalten, die nach eigenen Angaben über 460 Terabyte an Kundendaten verfügt – Experten zufolge mehr als das Doppelte der Datenmenge des gesamten Internet. Das Internet sollte demzufolge also etwas weniger als 230 Terabyte an Daten umfassen.
Zur Veranschaulichung kann man die beliebte A4-”Schreibmaschinenseite” nehmen. Sie faßt 4 Kilobyte. Ein Terabyte entspricht 250 Millionen Schreibmaschinenseiten - einem Papierstapel von 25 Kilometern Höhe. 230 Terabyte ergeben einen Stapel von 5.750 Kilometer Höhe, das entspricht (in der Horizontalen) exakt der Entfernung zwischen New York und Paris - Charles Lindbergh hat sie im Jahr 1927 in 33 Stunden als erster im Alleinflug bewältigt.
Freund p., der einen Server mit dem schönen Namen “Verein zur Förderung des öffentlichen bewegten und unbewegten Datenverkehrs e.V.", kurz FoeBuD, mitbetreibt, wies mich darauf hin, dass schon der FoeBuD ein Terabyte an Kapazität im Keller stehen habe - vier 250-Gigabyte-Festplatten, die heute nicht viel mehr als 500 Euro kosten. Da man davon ausgehen muß, dass das Internet aus mehr als 230 größeren Servern besteht, stand die Frage erneut im Raum: Wie groß also ist das Internet?
Der Suchmaschinenspezialist John Batelle schätzt zurückhaltend, dass eine durchschnittliche Website aus 1000 Web-Seiten a 100 Kilobyte besteht, was 100 Megabyte für eine Website als Richtmaß ergäbe. Dem britischen Internet-Dienstleister Netcraft zufolge sind derzeit weltweit 122.000.635 Websites am Netz, macht insgesamt 12.200.063.500 Megabyte oder 11.634,8 Terabyte (oder 11,6 Petabyte).
Googles Suchroboter durchforsten das Netz ständig auf der Suche nach Webseiten, im Juni 2005 waren es 8.058.044.651 Seiten. Geht man auch hier von 100 Kilobyte pro Seite aus, ergibt das zusammen ungefähr 750 Terabyte - nicht einmal ein Zehntel der Schätzung Batelles. Heute gibt Google übrigens zur Größe seines Indexes nur noch an, er sei “dreimal größer als der jeder anderen Suchmaschine”.
Manche erinnert der Versuch, die Größe des Internet zu ermitteln, an die mittelalterlichen Scholastiker, die sich jahrelang darum stritten, wie viele Engel wohl auf einer Nadelspitze tanzen können. Im August 2005 war die eher akademische Frage nach der Größe des Web zu einer Waffe im Konkurrenzkampf der Suchmaschinen geworden. Yahoo meldete eine Indexgröße von 19,2 Milliarden Webseiten - mehr als doppelt so viele wie der Konkurrenz-Index von Google mit damals 8,1 Milliarden Seiten. Das scheinbare Auftrumpfen machte vor allem den Unterschied zwischen Daten und Informationen deutlich. Bloße Daten, auch wenn es viele sind, nützen niemandem etwas - und ein Gutteil der Yahoo-Milliardenkonvolute bestand aus Datenwüsten. Erst wenn Daten sich zu Information formieren, sind sie für Menschen interessant.
Ich fragte p., ob er schätzen wolle, wie schwer eine Kugel Eis ist. Er winkte ab. Wir bestellten zwei unhinterfragte Tüten Eis. Als ich nach Haus kam und mich am kühlsilbernen Licht des Bildschirms etwas zu erfrischen suchte, sah ich, dass sie bei Yahoo nachgekartet hatten. Nun geht es nicht mehr um schiere Daten-Himalayas. Mit unbekümmerter Offenheit breitet man nun im Marketingbereich des Portals aus, was unter “Behavioral Targeting” zu verstehen sei, nämlich aus immensen Mengen an Nutzerdaten jene Verhaltensmuster herausdestillieren zu können, die auf Kaufwilligkeit hinweisen. “An einem Tag”, heißt es da, “generiert Yahoo! Weltweit mehr Nutzerdaten als Walmart in einem ganzen Jahr: 16 Terabyte.” (wst)