Jagd auf die "Kopfjäger" im Internet

Abb. 1. Die sogenannte "LUMAscape", eine Darstellung des wirren Ökosystems von Werbeagenturen, Maklern und Informationsanbietern im Internet.

Transparenz und Schutz der Privatsphäre im Internet

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Vor kurzem fand an der Universität Princeton die Web Privacy and Transparency Conference statt - eine Tagung über den Schutz der Privatsphäre. Diskutiert wurden die immer ausgefeilteren Methoden, die von Drittanbietern für das Verfolgen und die Modellierung der Interessen und Vorlieben von Internetbenutzern entwickelt werden, sowie mögliche Abwehrmechanismen.

Arvind Narayanan, Informatik-Professor am Center for Information Technology Policy der Universität Princeton, hat sich im Rahmen seines Transparenzprojekts für das Internet den Schutz der Privatsphäre der Benutzer auf die Fahne geschrieben. Er jagt die Jäger, d.h. die Dutzenden von Firmen, die heute Benutzeridentifizierungsdienste betreiben: Bevor eine Anzeige im Webbrowser des Nutzers erscheint, geben solche Anbieter die Identität bzw. die wahrscheinlichen Präferenzen des Benutzers gegen Entgelt preis, so dass die Werbung personalisiert werden kann.

Das ist so wie bei Amazon: Hat man bereits einige Bücher gekauft, schlägt Amazon selbst neue Einkäufe vor, die zu den vorherigen Büchern thematisch oder stilistisch passen. In dem Fall ist nichts zu beanstanden. Allerdings verfolgen die Drittanbieter von Identitätsdaten die Benutzer über unterschiedliche Webseiten sowie über alle Grenzen hinweg, und verknüpfen das Verhalten des Benutzers in Amazon mit dem Verhalten z.B. bei Ebay, Facebook und Twitter. Das Ergebnis ist eine komplette Röntgenaufnahme des Benutzers, womit er oder sie angreifbarer für maßgeschneiderte Werbung wird. Die Internetbenutzer werden von solchen "Kopfjägern" in Schubladen gesteckt, manchmal in die korrekte - aber oft auch in die falsche. Man weiß nicht, was irritierender ist.

Bei der von ihm organisierten "Web Privacy and Transparency Conference" am 24. Oktober hat Narayan Abb. 1 gezeigt, eine bekannte Darstellung der vielen Firmen bzw. Makler, die zwischen Informationen in Webbrowsern und den Konsumenten der Information sitzen. Wenn man heute z.B. eine Seite der New York Times lädt, hängen sich sofort verschiedene Werbefirmen an, die Anzeigen im Sichtfeld des Kunden platzieren. Während bei einem Magazin die Werbung eine mögliche, gut bekannte Leserschaft anspricht, z.B. Bieranzeigen bei Sportseiten, benutzen heutige Informationsanbieter eine "algorithmische Modellierung" des Kunden in Echtzeit. Viele der Unternehmen in Abb. 1 schauen den Benutzern über die Schulter (mit legalen, aber auch mit illegalen Mitteln), korrelieren das Verhalten von Millionen von Personen und verkaufen ihre Erkenntnisse an die Werbefirmen.

Während Cookies (alle Arten davon, sogar gelöschte und rekonstruierte Cookies) die traditionelle Art der Benutzerverfolgung darstellen und viele Firmen sich auf das Lesen der Cookies von anderen Anbietern spezialisiert haben, gibt es heute effektivere Methoden einen Benutzer unter Millionen eindeutig zu identifizieren. Dazu zählt das sogenannte Browser Fingerprinting, eine Technik über die bereits bei heise.de berichtet worden ist.

Wenn eine Webseite geladen wird, kann die Konfiguration des Browsers gelesen werden, darunter die Anzahl und Art der Plug-Ins, die Fonts, die der Browser zur Verfügung stellt, und sogar die Größe des Bildschirms. Wie das Projekt Panopticlick der Electronic Frontier Foundation belegt hat, kann über solche einfachen Tests ein Computer wiedererkannt werden. Es ist dann möglich, einen Kunden über viele besuchte Seiten zu verfolgen. Die Tracking-Firma braucht nur für ausreichend viele Webseiten zu arbeiten und kann die damit gewonnenen Daten verknüpfen und auswerten.

Für meinen Laptop stellte Panopticlick fest: "Der Fingerabdruck ihres Browsers scheint eindeutig bei den 4,643,941, die wir bis jetzt getestet haben... Wir schätzen dass ihr Browser-Fingerabdruck 22.15 Bits an Identifizierungsinformation trägt." Natürlich kann man sich davor schützen, aber dafür muss man sich sehr gut mit den Browsereinstellungen auskennen - was natürlich die meisten Benutzer nicht tun.

Ein noch tückischerer Angriff erfolgt über die Darstellung von unsichtbaren Texten. Ein Text mit allen Buchstaben des Alphabets wird in einem (für den Nutzer nicht sichtbaren) Canvas-Element dargestellt und die entsprechenden Pixel werden wieder analysiert. Es stellt sich heraus, dass sich für jeden Benutzer (durch die unterschiedlichen Computer, Betriebssysteme, Grafikarten und Bildschirme) leichte Unterschiede in der Pixeldarstellung ergeben. Diese Unterschiede erlauben dann über das sogenannte Canvas Fingerprinting die Identifizierung des Benutzers über verschiedene Webseiten hinweg.1 Bereits Anfang des Jahres benutzten 5% der am meisten benutzen Webseiten ein solches Benutzeridentifizierungsverfahren. Besorgniserregend ist, dass sobald ein neuer Angriff erdacht worden ist, dieser sich sehr schnell über die Werbemakler verbreitet.