zurück zum Artikel

Big Data is watching you

Christian Buck

Unternehmen und Sozialforscher analysieren unsere Datenspuren in Mobilfunknetzen und im Internet. Ihre Algorithmen enthüllen persönliche Vorlieben, machen soziale Beziehungen sichtbar – und verraten am Ende ziemlich viel über uns selbst.

Unternehmen und Sozialforscher analysieren unsere Datenspuren in Mobilfunknetzen und im Internet. Ihre Algorithmen enthüllen persönliche Vorlieben, machen soziale Beziehungen sichtbar – und verraten am Ende ziemlich viel über uns selbst.

David Petersen weiß ziemlich genau, wo sich seine amerikanischen Mitbürger gerade aufhalten und welche persönlichen Vorlieben sie haben – zumindest jene 90 Millionen, deren Smartphones die Server von Sense Networks regelmäßig mit Informationen über ihren Aufenthaltsort versorgen. Das von ihm geleitete Unternehmen mit Sitz in New York hat sich darauf spezialisiert, aus den Bewegungsmustern von Menschen Schlüsse auf deren Vorlieben und Lebensgewohnheiten zu ziehen. Solche Erkenntnisse bringen die Werbebranche ihrem großen Traum wieder ein Stück näher: Potenziellen Käufern die richtige Werbung zum richtigen Zeitpunkt auf dem Handy zu servieren und damit einen todsicheren Kaufanreiz zu schaffen.

Sense Networks nutzt dafür die Fähigkeit moderner Smartphones, mithilfe ihrer GPS-Empfänger jederzeit die Position des Nutzers auf wenige Meter genau bestimmen zu können. Werbefinanzierte Apps auf dem Mobiltelefon senden diese Ortsinformationen immer dann an die Server des Unternehmens, wenn sie von dort neue Werbebanner abrufen – zusammen mit einer Gerätekennung wie Apples IDFA (Identifier for Advertisers), mit deren Hilfe sich jedes Gerät eindeutig wiedererkennen lässt.

Mit anderen Worten: Sense Networks weiß nicht nur, wo sich ein Handy im Moment aufhält, sondern kann über einen längeren Zeitraum auch Verhaltensmuster seines Besitzers erkennen. Das Programm registriert, wer regelmäßig beim Handelsriesen Wal-Mart einkauft. Oder es speichert, wann der Besitzer eines Smartphones in einem Stadion sitzt, und verknüpft die Information mit einem Event, das dort stattfindet. Läuft gerade ein Lady-Gaga-Konzert, dürfte es sich um einen Fan der Sängerin handeln. Und wer ständig Inlandsflüge bucht, ist sehr wahrscheinlich ein Geschäftsreisender.

"Wir haben heute Tausende solcher Merkmale, mit denen wir Smartphone-Nutzer charakterisieren können", erklärt Petersen. Mit der Zeit entsteht über den Besitzer des Mobiltelefons ein immer detaillierteres Bild – und das ist Gold wert: Unternehmen können jetzt gezielte Kampagnen fahren, die sich an spezifizierte Zielgruppen richten – etwa an Menschen, die Hamburger lieben und gerade neben einer McDonald's-Filiale stehen. Mehr noch: Die Algorithmen von Sense Networks erkennen sogar persönliche Zeitmuster potenzieller Kunden. Wer statt samstags lieber schon am Freitag einkauft, kann pünktlich vor seiner Shopping-Tour mit Handy-Werbung beglückt werden.

Mit welcher Genauigkeit sein Unternehmen die Smartphone-Nutzer in Kategorien wie "Luxus-Shopper" oder "Auto-Narr" einteilen kann, will Petersen nicht verraten. Stattdessen verweist er auf das allgemein akzeptierte Erfolgsmaß der Online-Werbebranche: die Click-Through-Rate (CTR), die angibt, wie viel Prozent der Nutzer tatsächlich auf ein Banner klicken, um mehr über das beworbene Produkt zu erfahren. "Dank unserer Nutzerprofile ist sie viermal höher als bisher und liegt zwischen zwei und vier Prozent", rechnet er vor. Dafür bezahlen ihm Kunden wie die Sandwich-Restaurants Quiznos und die Bäckerei-Kette Swiss Bakers viel Geld. Das 2006 gegründete Unternehmen mit 20 Mitarbeitern erreichte letztes Jahr die Gewinnschwelle. Die Identität der Smartphone-Nutzer könne er jedoch nicht herausfinden, beteuert Petersen: Die einlaufenden Ortsinformationen – immerhin rund zehn Milliarden im Monat – würde Sense Networks nur verwenden, um die Profile zu verbessern, und sie danach löschen.

Für seine Analysen nutzt die Firma keine eigenen Server, sondern die Cloud-Infrastruktur von Amazon. "Wir sind ein waschechtes Big-Data-Unternehmen", sagt Petersen. "Wir arbeiten mit Linux-Computern und dem in diesem Bereich weit verbreiten Software-Programmiergerüst Hadoop für verteiltes Rechnen und verteilte Datenspeicherung." Die firmeneigenen Algorithmen filtern zunächst Fehler in den Ortsinformationen heraus, bevor andere Programme das Verhalten der Nutzer analysieren und künftige Aktionen vorhersagen. All das geschieht in Echtzeit, sobald neue Daten eintreffen.

Entstanden ist das Unternehmen aus dem Projekt "Reality Mining" am MIT in Cambridge, Massachusetts. Dort statteten die Informatiker Alex Pentland und Nathan Eagle ab 2004 die Mobiltelefone von Studenten mit einer Software aus, die Informationen über ihren Standort und die von ihnen geführten Telefonate aufzeichnete. Schon nach einigen Monaten konnten die beiden Wissenschaftler aus den Geo-Daten auf Gewohnheiten ihrer Probanden schließen. Die Gesprächsdaten lieferten ein detailliertes Bild der sozialen Netzwerke innerhalb der Gruppe – ganz ohne die in der Sozialforschung sonst üblichen Fragebögen. Allein aufgrund der Mobilfunkdaten analysierten die Forscher die Beziehungen zwischen 100 MIT-Studenten und -Professoren und konnten präzise vorhersagen, wo sich die Mitglieder einer Gruppe an einem beliebigen Wochentag treffen würden.

"Computational Social Science" nennt sich dieser relativ neue Ansatz in der Sozialforschung, aus Datenspuren in Mobilfunknetzwerken oder dem Internet Erkenntnisse über soziale Gruppen zu gewinnen. Mittlerweile hat er eine wissenschaftliche Revolution ausgelöst: "Früher waren wir auf Laborexperimente oder Umfragen angewiesen, an denen sich maximal einige Tausend Menschen beteiligt haben", sagt der Sozialforscher Michael Macy von der Cornell University in Ithaca. "Heute können wir das Verhalten von vielen Millionen Menschen untersuchen."

Der Unterschied ist gewaltig: Die Auswirkungen von Freundschaften auf das Verhalten etwa ließ man in bisherigen Studien außen vor – die Teilnehmer sollten sogar ganz bewusst unabhängige Individuen sein. Doch eine solche "atomistische Betrachtungsweise" hält Macy für schlicht unrealistisch: "Wie Menschen sich verhalten, wird nicht nur vom Alter, der Zugehörigkeit zu einer ethnischen Gruppe oder der Religion bestimmt, sondern von ihrer gesamten Umgebung. Dank der Mobilfunkdaten können wir jetzt realistische Netzwerke zwischen Menschen untersuchen." Darum vergleicht er die neuen Möglichkeiten in der Sozialforschung mit den Umbrüchen in anderen Wissenschaften – etwa den Fortschritten, die Teilchenbeschleuniger in der Physik ermöglichten, oder den Perspektiven, die Gensequenzierung den Lebenswissenschaften eröffnet.

"Bei uns ging es zum Beispiel um die Frage, ob ein Zusammenhang besteht zwischen der Vielfalt an persönlichen Beziehungen von Menschen und dem Wohlstand in einer Region", erläutert Macy. Genau das behauptet eine Theorie aus der Sozialforschung: Wer sich nur innerhalb einer engen, fest zusammengewachsenen sozialen Gruppe bewegt, hat weniger Aufstiegschancen als jemand, der auch viele lose Kontakte zu Menschen in anderen Gruppen hat. "Es konnte aber nie ein quantitativer Zusammenhang nachgewiesen werden." Im Rahmen einer 2010 veröffentlichten Studie werteten er und andere Beteiligte deshalb die anonymisierten Gesprächsdaten von 65 Millionen britischen Telefonkunden aus, um so das soziale Netzwerk einer ganzen Gesellschaft zu analysieren.

Die Daten umfassten mehr als 90 Prozent der Mobiltelefone und fast alle Festnetzanschlüsse des Landes. "Wir wollten einfach feststellen, wer mit wem befreundet ist." Im Anschluss kombinierten Macy und seine Kollegen die ermittelten Netzwerke mit Daten über die regionale Verteilung des Einkommens in Großbritannien. Diese stammten aus einer Volkszählung. Das Ergebnis zeigte, so fasst Macy zusammen, "dass vielfältige Netzwerke zumindest ein starker Hinweis für Wohlstand in einer Gemeinschaft zu sein scheinen". Die Erkenntnis ist nicht nur von akademischem Interesse. Politiker könnten beispielsweise den Strukturwandel von Regionen unterstützen, indem sie gezielt die Vernetzung der Bevölkerung fördern.

Gesundheitsexperten träumen ebenfalls davon, solche Verbindungsdaten zum Wohle der Menschen zu nutzen: Wenn sich zum Beispiel ungewöhnlich viele Handy-Nutzer während der Arbeitszeit zu Hause aufhalten, könnte das auf eine ansteckende Krankheit in der betreffenden Region hindeuten. Mit solchen Informationen ließe sich etwa die Ausbreitung einer Grippe-Epidemie beobachten und ihr Ausgangspunkt zurückverfolgen.

Ähnliche Prognosen erarbeitet auch Google, indem das Unternehmen den geografischen Ursprung von Suchanfragen nach Grippesymptomen oder -medikamenten ermittelt und ihre zeitliche Verteilung beobachtet. Christian Bauckhage, Professor am Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme in Sankt Augustin, nutzt die weltweit führende Suchmaschine hingegen, um mehr über die Meinungen und Vorlieben von Menschen zu erfahren: "Google Trends" verrät ihm eine Menge über die Stimmung im Netz – das Tool zeigt an, wie oft im Lauf der Zeit nach einem Begriff gesucht wird. Und weil 27 Prozent aller Internetnutzer Webseiten über Google ansteuern, statt die Adresse direkt in den Browser einzutippen, lässt sich daraus auf die Zugriffszahlen der betreffenden Angebote schließen.

"Die Zahlen von Google Trends sagen uns zum Beispiel, wie lange ein soziales Netzwerk noch populär sein wird", erklärt Bauckhage. "Die Popularität verläuft fast immer nach einem festen zeitlichen Muster: Anbieter wie Myspace und studiVZ gewinnen an Zuspruch, erreichen ein Maximum und verlieren dann wieder an Bedeutung." Die Teilnahme an sozialen Netzwerken sei so etwas wie ein Hype – je mehr Leute dann dem Trend folgen, desto uninteressanter werde der auch wieder, vermutet der Wissenschaftler.

Indem er die Mathematik hinter der Popularität sozialer Netzwerke entschlüsselt, kann er aus aktuellen Daten Prognosen ableiten. "Bis 2018 könnten die Zugriffe bei Facebook zum Beispiel wieder auf die Hälfte des Maximums sinken", vermutet er. Aber nicht alle Internet-Erfolgsgeschichten enden zwangsläufig mit dem Tod des Helden. Amazon hat sich bisher in Bauckhages Untersuchungen als die große Ausnahme erwiesen: Das Unternehmen folgt der scheinbar unbestechlichen Formel für den Auf- und Abstieg von Webangeboten nicht und zieht von Jahr zu Jahr mehr Nutzer an. Ob der jüngste Leiharbeiter-Skandal daran etwas ändert, bleibt abzuwarten.

Auch Twitter und Blogs stehen längst im Dienst der Sozialforschung. Einer, der diese Mitteilungen von Menschen aus aller Welt durchstöbert, ist Ed MacKerrow, der Präsident der 2009 gegründeten "Computational Social Science Society of the Americas" (CSSSA) sowie Mitarbeiter des Think Tanks "New Mexico Consortium". Ihn interessiert, wie sich Nachrichten von Erdbeben oder Diskussionen über politische Themen in Raum und Zeit ausbreiten. "Erstellt der Nutzer seinen Tweet mit dem Smartphone, verwenden wir etwa die Geo-Daten, die Twitter gemeinsam mit einem Beitrag veröffentlicht", erklärt der Physiker. "Außerdem zählen wir die Häufigkeit von Schlüsselwörtern, um den zeitlichen Verlauf des Interesses an einem bestimmten Thema zu messen." Wie Sense Networks kann auch er Menschen anhand ihrer Datenspuren bei Twitter in Cluster einteilen – etwa in Befürworter und Gegner einer strengeren Waffenkontrolle. Wie stark bestimmte Schlüsselwörter zunehmen, zeigt ihm, ob die beiden Gruppen unterschiedlich schnell auf neue Ereignisse reagieren. "Weil die Aktivisten genau abschätzen können, wann ihr Gegner den nächsten Schritt macht, können sie ihre politischen Kampagnen effektiver planen", so MacKerrow.

Lässt sich aus den Beiträgen in Twitter auch vorhersagen, ob eine Demonstration gewalttätig verlaufen wird? "An solchen Fragen arbeiten viele Leute, indem sie die Tweets nach bekannten Schimpfwörtern durchforsten", sagt MacKerrow. "Wir haben selbst Daten aus der Vergangenheit analysiert und nach Indikatoren gesucht – aber bis jetzt hatten wir kein Glück."

Angesichts der immer umfassenderen Analyse unserer Datenspuren ist das eine geradezu beruhigende Erkenntnis: Noch können die Sozialforscher mit ihren Computern und Algorithmen offenbar doch nicht alles über uns herausfinden. (bsc [1])


URL dieses Artikels:
https://www.heise.de/-1895835

Links in diesem Artikel:
[1] mailto:bsc@heise.de