Big Data is watching you

Inhaltsverzeichnis

Der Unterschied ist gewaltig: Die Auswirkungen von Freundschaften auf das Verhalten etwa ließ man in bisherigen Studien außen vor – die Teilnehmer sollten sogar ganz bewusst unabhängige Individuen sein. Doch eine solche "atomistische Betrachtungsweise" hält Macy für schlicht unrealistisch: "Wie Menschen sich verhalten, wird nicht nur vom Alter, der Zugehörigkeit zu einer ethnischen Gruppe oder der Religion bestimmt, sondern von ihrer gesamten Umgebung. Dank der Mobilfunkdaten können wir jetzt realistische Netzwerke zwischen Menschen untersuchen." Darum vergleicht er die neuen Möglichkeiten in der Sozialforschung mit den Umbrüchen in anderen Wissenschaften – etwa den Fortschritten, die Teilchenbeschleuniger in der Physik ermöglichten, oder den Perspektiven, die Gensequenzierung den Lebenswissenschaften eröffnet.

"Bei uns ging es zum Beispiel um die Frage, ob ein Zusammenhang besteht zwischen der Vielfalt an persönlichen Beziehungen von Menschen und dem Wohlstand in einer Region", erläutert Macy. Genau das behauptet eine Theorie aus der Sozialforschung: Wer sich nur innerhalb einer engen, fest zusammengewachsenen sozialen Gruppe bewegt, hat weniger Aufstiegschancen als jemand, der auch viele lose Kontakte zu Menschen in anderen Gruppen hat. "Es konnte aber nie ein quantitativer Zusammenhang nachgewiesen werden." Im Rahmen einer 2010 veröffentlichten Studie werteten er und andere Beteiligte deshalb die anonymisierten Gesprächsdaten von 65 Millionen britischen Telefonkunden aus, um so das soziale Netzwerk einer ganzen Gesellschaft zu analysieren.

Die Daten umfassten mehr als 90 Prozent der Mobiltelefone und fast alle Festnetzanschlüsse des Landes. "Wir wollten einfach feststellen, wer mit wem befreundet ist." Im Anschluss kombinierten Macy und seine Kollegen die ermittelten Netzwerke mit Daten über die regionale Verteilung des Einkommens in Großbritannien. Diese stammten aus einer Volkszählung. Das Ergebnis zeigte, so fasst Macy zusammen, "dass vielfältige Netzwerke zumindest ein starker Hinweis für Wohlstand in einer Gemeinschaft zu sein scheinen". Die Erkenntnis ist nicht nur von akademischem Interesse. Politiker könnten beispielsweise den Strukturwandel von Regionen unterstützen, indem sie gezielt die Vernetzung der Bevölkerung fördern.

Gesundheitsexperten träumen ebenfalls davon, solche Verbindungsdaten zum Wohle der Menschen zu nutzen: Wenn sich zum Beispiel ungewöhnlich viele Handy-Nutzer während der Arbeitszeit zu Hause aufhalten, könnte das auf eine ansteckende Krankheit in der betreffenden Region hindeuten. Mit solchen Informationen ließe sich etwa die Ausbreitung einer Grippe-Epidemie beobachten und ihr Ausgangspunkt zurückverfolgen.

Ähnliche Prognosen erarbeitet auch Google, indem das Unternehmen den geografischen Ursprung von Suchanfragen nach Grippesymptomen oder -medikamenten ermittelt und ihre zeitliche Verteilung beobachtet. Christian Bauckhage, Professor am Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme in Sankt Augustin, nutzt die weltweit führende Suchmaschine hingegen, um mehr über die Meinungen und Vorlieben von Menschen zu erfahren: "Google Trends" verrät ihm eine Menge über die Stimmung im Netz – das Tool zeigt an, wie oft im Lauf der Zeit nach einem Begriff gesucht wird. Und weil 27 Prozent aller Internetnutzer Webseiten über Google ansteuern, statt die Adresse direkt in den Browser einzutippen, lässt sich daraus auf die Zugriffszahlen der betreffenden Angebote schließen.

"Die Zahlen von Google Trends sagen uns zum Beispiel, wie lange ein soziales Netzwerk noch populär sein wird", erklärt Bauckhage. "Die Popularität verläuft fast immer nach einem festen zeitlichen Muster: Anbieter wie Myspace und studiVZ gewinnen an Zuspruch, erreichen ein Maximum und verlieren dann wieder an Bedeutung." Die Teilnahme an sozialen Netzwerken sei so etwas wie ein Hype – je mehr Leute dann dem Trend folgen, desto uninteressanter werde der auch wieder, vermutet der Wissenschaftler.

Indem er die Mathematik hinter der Popularität sozialer Netzwerke entschlüsselt, kann er aus aktuellen Daten Prognosen ableiten. "Bis 2018 könnten die Zugriffe bei Facebook zum Beispiel wieder auf die Hälfte des Maximums sinken", vermutet er. Aber nicht alle Internet-Erfolgsgeschichten enden zwangsläufig mit dem Tod des Helden. Amazon hat sich bisher in Bauckhages Untersuchungen als die große Ausnahme erwiesen: Das Unternehmen folgt der scheinbar unbestechlichen Formel für den Auf- und Abstieg von Webangeboten nicht und zieht von Jahr zu Jahr mehr Nutzer an. Ob der jüngste Leiharbeiter-Skandal daran etwas ändert, bleibt abzuwarten.

Auch Twitter und Blogs stehen längst im Dienst der Sozialforschung. Einer, der diese Mitteilungen von Menschen aus aller Welt durchstöbert, ist Ed MacKerrow, der Präsident der 2009 gegründeten "Computational Social Science Society of the Americas" (CSSSA) sowie Mitarbeiter des Think Tanks "New Mexico Consortium". Ihn interessiert, wie sich Nachrichten von Erdbeben oder Diskussionen über politische Themen in Raum und Zeit ausbreiten. "Erstellt der Nutzer seinen Tweet mit dem Smartphone, verwenden wir etwa die Geo-Daten, die Twitter gemeinsam mit einem Beitrag veröffentlicht", erklärt der Physiker. "Außerdem zählen wir die Häufigkeit von Schlüsselwörtern, um den zeitlichen Verlauf des Interesses an einem bestimmten Thema zu messen." Wie Sense Networks kann auch er Menschen anhand ihrer Datenspuren bei Twitter in Cluster einteilen – etwa in Befürworter und Gegner einer strengeren Waffenkontrolle. Wie stark bestimmte Schlüsselwörter zunehmen, zeigt ihm, ob die beiden Gruppen unterschiedlich schnell auf neue Ereignisse reagieren. "Weil die Aktivisten genau abschätzen können, wann ihr Gegner den nächsten Schritt macht, können sie ihre politischen Kampagnen effektiver planen", so MacKerrow.

Lässt sich aus den Beiträgen in Twitter auch vorhersagen, ob eine Demonstration gewalttätig verlaufen wird? "An solchen Fragen arbeiten viele Leute, indem sie die Tweets nach bekannten Schimpfwörtern durchforsten", sagt MacKerrow. "Wir haben selbst Daten aus der Vergangenheit analysiert und nach Indikatoren gesucht – aber bis jetzt hatten wir kein Glück."

Angesichts der immer umfassenderen Analyse unserer Datenspuren ist das eine geradezu beruhigende Erkenntnis: Noch können die Sozialforscher mit ihren Computern und Algorithmen offenbar doch nicht alles über uns herausfinden. (bsc)