Der Datenkrake

GMail, Blogger.com, Writely, Google Desktop, Earth, Search Toolbar, Finance und so weiter - Google beschenkt die Surferschaft mit kostenlosen Diensten und Anwendungen. Die revanchiert sich, indem sie dem Konzern einen tiefen Einblick in ihre Privatsphäre erlaubt.

In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen
Lesezeit: 17 Min.
Von
Inhaltsverzeichnis

Im Februar präsentierte Google Version 3 seiner PC-Desktop-Suchmaschine. Das Programm indexiert - wie seine Vorgänger - E-Mails, Outlook-Adressbücher und -Termine, Word-, Excel-, PowerPoint-, PDF-Dateien sowie Dokumente eines guten Dutzends weiterer Formate und erschließt sie mit einer Volltextsuchmaschine, kurzum: Eine nützliche Hilfe für die tägliche Arbeit am PC.

Neu war die Option, nicht nur den lokalen Rechner, sondern auch die Indices anderer PCs zu durchforsten. Dazu benötigt der Nutzer einen Google-Account. Alle Rechner, auf denen Google Desktop unter diesem Account läuft, können auf Indices der jeweils anderen Rechner zugreifen. Neben Zusammenfassungen hält Google, wie bei der Web-Suche, auch einen Cache mit zwischengespeicherten Versionen der Dokumente bereit. Mit anderen Worten: Google lagert den Inhalt jeder Datei, derer es mit der Desktop-Suchmaschine habhaft werden kann, auf seinen Servern.

Google Desktop ist nur eines von vielen Angeboten, die dem Suchmaschinen-Betreiber einen tiefen Blick in die Daten seiner Nutzer ermöglichen. Die Google Toolbar ist eine Werkzeugleiste für den Internet Explorer und Firefox. Ihre „erweiterten Funktionen“ übertragen die Adressen aller besuchten Sites zu Google, ihre Rechtschreibkorrektur sendet die in Web-Formulare eingegebenen Texte an einen Google-Server.

Unter www.google.com/xhtml betreibt Google eine Suchmaschine für Handys. Sie listet die Ergebnisse nicht nur auf; Google unterhält auch einen Proxy-Server, der Webseiten für kleine Displays aufbereitet. Klickt der Benutzer auf einen Treffer, ruft er die Seite ab, passt sie fürs Handy an und liefert sie anschließend aus. Wer mobil mit Google sucht, surft anschließend also über den Proxy - Google kennt jedes übertragene Bit. Das Gleiche gilt auch für Surfer, die den Web Accelerator verwenden, eine Erweiterung für den Internet Explorer und Firefox, die das Surfen im Web beschleunigen soll.

Ein Surfer, der konsequent auf die Nutzung von Google-Diensten setzt, hinterlässt digitale Spuren, nach denen sich zum Beispiel Werber die Finger lecken: Die Suchabfragen in der Volltextsuchmaschine und in Froogle sowie die Klicks auf Treffer und kontextbezogene Anzeigen offenbaren, für welche Produkte sich Nutzer interessieren, welche Käufe in nächster Zeit anstehen und viel mehr.

Die Recherchen bei Google News und die im Newsreader abonnierten Feeds zeigen, welche Themen den Nutzer bewegen. In seinem Blog bei der Google-Tochter Blogger.com veröffentlicht er sogar die eigene Meinung. Bei Google Finance informiert er sich über die Aktien in seinem Depot. Mit dem Homepage-Generator Google Page Creator stellt er Fotos von sich und seiner Familie online. Die Daten, die die Log-Analyse-Software Google Analytics sammelt, liefern Informationen über die Besucher seiner Seiten. Die Recherchen bei Google Maps und Google Earth lassen Rückschlüsse darauf zu, wo er wohnt und wo er Urlaub macht.

Bei der kürzlich von Google erworbenen Online-Textverarbeitung Writely lagert der Homo Googleiensis seine Texte, bei Gmail seine E-Mail- und Chat-Konversationen, mit dem Calendar verwaltet er seine Termine und Aufgaben. Stimmen die Gerüchte, kann er bald bei einem Dienst namens GDrive Dateien aller Art ablegen. Im Kleinanzeigenmarkt Google Base kauft und verkauft er seinen Hausrat. Dabei wird er, so die Auguren, die Rechnungen schon bald mit einem Google-eigenen Bezahldienst begleichen können.

Beim Social-Network-Dienst Orkut findet er neue Freunde. Dazu hinterlegt er ein detailliertes Profil, von der Hautfarbe über den Humor bis hin zur „sexuellen Neigung“. So hinterlässt das ganze Leben eine digitale Signatur bei Google.

Wann immer die Sprache auf die Themen „Benutzerdaten und Privatsphäre“ kommt, verweist Google stereotyp auf das Firmenmantra „Don’t be evil“. Aber Google ist kein gemeinnütziger Verein, sondern ein nach Profit strebendes, börsennotiertes und somit seinen Aktionären verpflichtetes Unternehmen. Die Benutzerdaten sind so etwas wie eine stille Kapitalreserve für schlechtere Zeiten, die Google eines Tages in klingende Münze verwandeln könnte. Wollte Google seine Benutzer ausspähen - die Technik dazu wäre schon vorhanden; Google müsste wohl nur wenige Veränderungen an seiner Infrastruktur vornehmen.

Protokollierte Google die Links mit, die der Benutzer auf den Ergebnisseiten der Suchmaschine anklickt, könnte das Unternehmen wertvolle Rückschlüsse daraus ziehen, welche Treffer der Anwender als nützlich ansieht. In den Suchergebnissen müsste Google dazu spezielle, präparierte Verweise auf den eigenen Server hinterlegen, statt die Treffersites direkt zu verlinken. Ein Klick auf einen Link führt den Benutzer so auf einen Google-Server, der registriert, welcher Verweis angeklickt wurde. Von dort leitet ihn Google dann sofort weiter. Der Benutzer merkt von der Umleitung nichts.

Google setzt diese Technik schon heute bei den AdWords-Anzeigen ein. Auch bei den eigenen Suchergebnissen zeichnet Google von Zeit zu Zeit Klicks auf, um nach eigenen Angaben die Qualität der Ergebnisse zu kontrollieren. Google Mail protokolliert laut den Datenschutz-FAQs diverse angezeigte oder angeklickte Daten mit, einschließlich Elementen der Benutzeroberfläche, Anzeigen und Links.

Auch die in den verschiedenen Diensten anfallenden Daten zu speichern, zu verknüpfen und auszuwerten, wäre keine große Herausforderung für Google. Die persönliche Suche speichert zum Beispiel schon heute die komplette Suchhistorie des Benutzers. In Google Mail kann der Anwender seine E-Mails und Chat-Konversationen lagern lassen. Und dass Google im Prinzip sogar wesentlich größere Datenmengen pro Benutzer verwalten kann, beweist das Unternehmen mit der Speicherung der Indices von Google Desktop auf seinen Servern.

Das wichtigste Verknüpfungselement, mit dem sich die Informationen verschiedener Dienste zu einem Profil zusammenfügen lassen, ist der Google Account. Für Google Mail, Orkut, Google Alerts, Google Sitemap, Blogger, Google News Alerts, den Google Reader, Google Calendar, die personalisierte Suche und die Shopping List bei Froogle gilt: Kein Zutritt ohne ein Google-Passwort. Google baut die Anzahl der Dienste, die einen Account erfordern, offenbar laufend aus.

Seine Expertise im Data Mining demonstriert Google mit der Technik, die Webseiten und E-Mails nach Themen durchforstet. Google setzt sie im Rahmen des AdSense-Werbeprogramms auf Partnersites und in Google Mail ein, um zu den Inhalten der Websites oder E-Mails passende Reklame einzubetten. Die entsprechende auf E-Mail bezogene Technik, die so genannte „Content Extraction“, hat sich Google durch Patente sichern lassen [1].

Content Extraction läuft völlig automatisch durch Computerprogramme, kein Google-Mitarbeiter bekommt den Inhalt der E-Mails zu Gesicht, versucht Google Kritiker zu beruhigen. Dennoch kritisieren Verbraucherschutzorganisationen wie das Electronic Privacy Information Centre ihren Einsatz [2]. Eines ihrer Argumente: Nur die Benutzer von Google Mail werden über die Verwendung von Content Extraction informiert. Dies gilt für Surfer, die Nachrichten an Google-Mail-Nutzer senden, jedoch nicht: Sie wissen nicht, dass ihre E-Mails durchforstet werden.

Google hat zwar immer wieder beteuert, keine Profile seiner Nutzer anzulegen. Dennoch beschreibt das „Content Extraction“-Patent nichts anderes („Information about a recipient based on a profile or information about the sender“). Ein konkretes Beispiel im Patent handelt von einem Weinfreund, aus dessen Korrespondenz sich schließen lässt, dass deren Empfänger sich ebenfalls für Wein interessiert.

Spinnt man den Gedanken eines Google weiter, das möglichst viele Daten sammelt, und nimmt an, der Suchmaschinenriese würde nicht nur seine Nutzer, sondern alle Surfer ausspionieren wollen, so ergäbe sich eine fast Orwell’sche Vision der totalen Überwachung. Das Erschreckende daran ist, dass auch hierfür viele technische Voraussetzungen bereits existieren.

Google muss gar nicht explizit in Erscheinung treten, um mit im Spiel zu sein. Das Unternehmen stellt Webmastern zum Beispiel kostenlos den Dienst Google Analytics bereit, mit dem sich Benutzerströme analysieren und Marketingkampagnen steuern lassen. Dazu baut der Webmaster ein paar Zeilen JavaScript in seine Seiten ein.

Google Analytics loggt neben den besuchten Seiten auch die Besuchszeitpunkte und die verweisenden Quellen. Daneben kennt der Dienst Details zu den Systemkonfigurationen, den Providern und die IP-Adressen der Surfer [3]. Unter Juristen herrscht weitgehende Einigkeit darüber, dass IP-Adressen personenbezogene Daten sind.

Nach deutschem Recht ist die Speicherung der Daten daher nur nach Zustimmung der Nutzer rechtens. Der Besucher einer Site, die mit Google Analytics überwacht wird, merkt davon aber in der Regel nichts. Google empfiehlt Webmastern, in den Datenschutzerklärungen auf die Verwendung von Google Analytics hinzuweisen. Aber welcher Surfer liest schon das Kleingedruckte?

Die Anzahl der Sites, die Google Analytics einsetzen, und die damit anfallenden Benutzerdaten dürften aber nur einen kleinen Bruchteil der Informationen ausmachen, die Google mit anderen Kooperationen umwälzt: Diverse Websites betten die Google-Suche oder andere Dienste über Programmierschnittstellen ein. Der Web-2.0-Hype lässt fast täglich neue Dienste entstehen, die Google-Inhalte integrieren. Besonders beliebt ist dabei Google Maps. Der vermutlich verbreitetste Google-Dienst ist AdSense, der zum Inhalt der Partnersites passende Werbung einblendet.

Theoretisch könnte Google bei allen diesen Partnerdiensten - zumindest ohne großen Aufwand - ähnlich viele Daten erheben wie mit Analytics. Aber das ist nur ein Gedankenspiel - oder? Eine weitere erschreckende Erkenntnis: Wenn Google längst im großen Stile Benutzerprofile speicherte und auswertete - Otto Normalsurfer hätte keine Chance, es herauszufinden.

Google veröffentlicht detaillierte Datenschutzrichtlinien [4]. Dort erklärt das Unternehmen sehr ausführlich, welche Daten es erhebt, wofür es sie verwendet und unter welchen Bedingungen es sie weitergibt. Auf den ersten Blick sind die Datenschutzbestimmungen übersichtlich und verständlich. So erfüllt Google zum Beispiel die so genannten Safe-Harbor-Bedingungen, eine Selbstverpflichtung, die amerikanische Unternehmen auf europäische Datenschutzstandards festlegt.

Allerdings bleiben bei einem genaueren Blick in die Datenschutzbedingungen einige Fragen offen. Unter „Personenbezogene Daten und sonstige Daten, die wir sammeln“ findet sich zum Beispiel der Passus „Wir können die über Sie erhobenen personenbezogenen Daten mit Daten von anderen Google-Diensten oder anderen Unternehmen kombinieren, um das Angebot für unsere Nutzer zu verbessern, z.B. durch individuell auf Sie zugeschnittene Inhalte.“ Als Beispiel nannte Peter Fleischer, Privacy Counsel Europe bei Google, das Sucharchiv, das Daten aus allen Suchdiensten (Text, Bilder et cetera) vereint. Eine vollständige Übersicht über Kombinationen von Daten konnte er uns nicht geben.

Man muss nicht das Bild eines zum Bad Guy gewandelten Google an die Wand malen, um über die Verwendung der dort anfallenden Daten besorgt zu sein. Die Auseinandersetzung zwischen Google und dem Verteidigungsministerium hat gezeigt, dass staatliche Stellen ein starkes Interesse am Zugriff auf die Benutzerdaten von Google und Co. entwickeln.

Im Januar 2006 verlangte das amerikanische Justizministerium von Google und anderen Suchmaschinen die Herausgabe von 5000 zufällig ausgewählten Suchabfragen. Das Justizministerium benötigte die Daten unter anderem, um Internet-Filter für Minderjährige zu testen. Google wehrte sich dagegen. Im Rechtsstreit mit dem Department of Justice hat sich der Suchmaschinenbetreiber durchgesetzt - er musste keine Benutzerdaten herausrücken.

Wenn es um die Terrorabwehr im Rahmen des Patriot Act geht, haben die Behörden dagegen fast unbeschränkten Zugriff auf Benutzerdaten [5]. Sie können mit einer Anordnung Firmen dazu zwingen, Daten über beliebige Nutzer auszuhändigen. Diese Anordnung ist geheim, das heißt, die Unternehmen dürfen die Öffentlichkeit und die Betroffenen nicht über die Herausgabe informieren. Die Anordnung unterliegt außerdem keiner richterlichen Überprüfung.

Ein weiteres Gefährdungsszenario sind Cracks. Über Google sind bisher so gut wie keine Sicherheitsprobleme publik geworden, durch die Eindringlinge an Benutzerdaten gelangt sind. Für das soziale Netzwerk Orkut mit seiner Sammlung an besonders sensiblen Daten ist allerdings kurz nach dem Start eine solche Lücke bekannt geworden, mit der Angreifer die Einstellungen von Orkut-Nutzern ändern konnten.

Dass derzeit keine Sicherheitsprobleme bei Google bekannt sind, bedeutet nicht, dass es keine gibt. Ein besonders lohnenswertes Ziel sind die Google-Server mit ihren ungeheuren Datenvolumina für Angreifer allemal.

Der News-Dienst Cnet testete Mitte 2005 die Möglichkeiten der Recherche mit Google, indem er mit Hilfe der Suchmaschine Informationen über den Google-Chef Eric Schmidt sammelte [6]. So fanden sich in einem Artikel Details zu Schmidts Aktiengeschäften, etwa die Information, dass Schmidt Unternehmensanteile im Wert von 1,5 Milliarden Dollar besaß und dass er kürzlich Google-Aktien im Wert von 90 Millionen Dollar verkauft hatte. Der Leser erfuhr, dass Schmidts Ehefrau einen Tanz mit dem ehemaligen Präsidentschaftskandidaten Al Gore gewagt hatte und dass Schmidt begeisterter Amateurpilot ist.

Eric Schmidt war über die Demonstration der Leistungsfähigkeit seiner Suchmaschine überhaupt nicht amüsiert. Er belegte Cnet mit einer einjährigen Nachrichtensperre. Diese Episode beleuchtet eine weitere Facette der Datenschutzproblematik bei Google und Co. Suchmaschinen sind mittlerweile so leistungsfähig, dass sie dem gewieften Benutzer auch einfach so, ohne selbst gezielt Benutzerdaten zu aggregieren und auszuwerten, zu ungewollten Einblicken ins Privatleben anderer verhelfen können.

Daran „schuld“ ist die mittlerweile im Internet verfügbare Datenfülle. Die Informationen, die die Suchdienste automatisch im Web zusammensammeln und durchsuchbar machen, genügt in vielen Fällen, um ein detailliertes Bild einzelner Personen zu zeichnen. Sehr schmerzlich mussten das zum Beispiel die zwei BND-Agenten erfahren, die für den Nachrichtendienst im Irak arbeiteten. Jedermann zugängliche Informationen auf ihren Homepages führten dazu, dass ihre vom Arbeitgeber geheim gehaltenen Namen in der Öffentlichkeit bekannt wurden.

In Zeiten, in denen Personalchefs nach den Namen von Bewerbern googlen, können alte Forenbeiträge, peinliche Partyfotos oder üble Nachrede Dritter zum Karrierekiller werden. Für sein Usenet-Archiv hat Google eine Möglichkeit geschaffen, nicht mehr erwünschte Beiträge löschen zu lassen. Auch Seiten auf der eigenen Homepage lassen sich wieder aus dem Index entfernen.

Problematischer sind Dateien auf fremden Servern, auf die man keinen Zugriff hat - hier können unerwünschte Informationen zur Zeitbombe werden. Otto Normalverbraucher lebt in der Gefahr, die Kontrolle über die digitale Seite seiner Identität zu verlieren.

„Das Ziel von Google besteht darin, die Informationen der Welt zu organisieren und allgemein nutzbar und zugänglich zu machen“, lautet das Motto des Suchmaschinenriesen. Es ist ein offenes Geheimnis, dass Google und Co. daran arbeiten, neue Datenquellen anzuzapfen und in die Ergebnisse einzubauen. Laut Eric Schmidt soll Google weiter ausgebaut werden, um „mehr über Sie zu wissen“.

Es geht hier nicht darum, Verschwörungstheorien anzuheizen. Viele Überlegungen in diesem Artikel sind hypothetischer Natur. Es liegt uns kein Hinweis darauf vor, dass Google seine Datenschutzrichtlinien verletzt, etwa indem es Benutzerprofile an andere Unternehmen verkauft.

Für die Erhebung vieler der Daten gibt es gute Gründe. So ist es zum Beispiel für einige der Funktionen der Google Toolbar eine technische Voraussetzung, dass Google die Adressen der besuchten Sites erhält. Dass Google einen Proxy für Handy-Surfer betreibt, ist ein guter Service, der viele Sites für Handys überhaupt erst darstellbar macht. Und ein soziales Netzwerk funktioniert nun einmal umso besser, je mehr die Teilnehmer von sich preisgeben. Der Benutzer hat bei vielen Angeboten die Wahl, wie viele Daten er Google überlässt. So stellt Google zum Beispiel auch eine abgespeckte Version der Toolbar bereit, ohne URL-Übertragung und Page Rank.

Außer Google gibt es eine Reihe weiterer Unternehmen, die im großen Stil Benutzerdaten sammeln. Allen voran betreibt Konkurrent Yahoo ein ähnlich breites Portfolio an Diensten, angefangen vom Portal mit seinem News-, E-Mail und Personalisierungsangeboten bis zu der zugekauften Bookmark-Verwaltung del.icio.us und dem Bilderalbum Flickr.

Dennoch, oder gerade deshalb, sollten Surfer genau überlegen, welche Informationen sie online offenbaren. Es wird ihnen heutzutage so einfach wie nie gemacht, im Netz der Netze Privates preiszugeben - nicht nur bei Google. Ein wenig im Blog aus dem heimischen Nähkästchen plaudern - macht doch nichts, es wissen doch nur ein paar Eingeweihte, wer der Autor ist. Und was macht es schon, dass Google jede Datei indexiert? Das ist doch ein praktischer Service. Oder?

In Zeiten, in denen Mannis und Biggis in den täglichen TV-Talkshows Intimstes ausplappern, mag es altmodisch erscheinen, im Internet auf den Schutz der Privatsphäre zu achten. Doch die Talkshows versenden sich, das heißt, auch der peinlichste Auftritt ist eines Tages aus dem kollektiven Gedächtnis verschwunden. Netzinhalte können auch in vielen Jahren noch auffindbar sein. Dann gilt: Google verjährt nicht.

[1] Google-Patent Nr. 20040059712, „Serving advertisements using information associated with e-mail“

[2] Gmail Privacy Page bei Epic.org

[3] Joerg Heidrich, Ausgeplaudert und ausgewertet, Datenschutzrecht, c't 7/06, S. 192

[4] Googles Datenschutzrichtlinien

[5] Das virtuelle Datenschutzbüro über National Security Letter

[6] Cnet-Artikel über Eric Schmidt

"Info-Krake Google"
Weitere Artikel zum Thema "Info-Krake Google" finden Sie in der c't 10/2006:
Der unheimliche Erfolg S. 162
Datenschutzprobleme S. 168
Gegenwind aus Europa S. 172
Alternative Service-Anbieter S. 176

(jo)