Missing Link: Street View verrät Wahlverhalten oder Datenschutz mit KI aushebeln

Forschern ist es gelungen, mithilfe von Deep Learning aus öffentlich verfügbaren Google-Straßenaufnahmen auf soziale, wirtschaftliche und politische Muster in Stadtvierteln zu schließen. Wie bei ähnlichen KI-Verfahren gibt es Datenschutzbedenken.

170

07.01.2018, 09:00 Uhr

Lesezeit: 19 Min.

Von

Stefan Krempl

Wenn einem beim Durchfahren einer Stadt in den USA mehr viertürige Stufenhecklimousinen als Pickup-Trucks begegnen, ist die Wahrscheinlichkeit mit 88 Prozent recht groß, dass dort bei der nächsten Präsidentschaftswahl ein Kandidat der Demokraten das Rennen macht. Lässt sich das gegenteilige Phänomen beobachten, dürfte sich die Kommune eher für einen Republikaner aussprechen – bei einer Treffsicherheit von 82 Prozent.

Was ein US-Forscherteam jüngst herausgefunden und in einem Beitrag in den Proceedings of the National Academy of Sciences veröffentlicht hat, hört sich zunächst nicht nach höherer Mathematik an. Marktforscher und Politikanalysten könnten durch eigene Recherchen und Umfragen zu ähnlichen Ergebnissen kommen. Überraschender und vermutlich deutlich folgenschwerer ist die Art und Weise, wie die Wissenschaftler unter Einsatz von Methoden Künstlicher Intelligenz (KI) zu den Resultaten gekommen sind.

Über die klassische Demoskopie hinaus

Die Gruppe, die Timnit Gebru als Doktorandin an der Stanford-Universität geleitet hat, analysierte für das Vorhaben mit maschineller Hilfe rund 50 Millionen öffentlich verfügbare Bilder und Standortdaten von Google Street View. Erstmals schafften es die Wissenschaftler dabei über Deep-Learning-Methoden, aus dem Straßenansichtsdienst weitere Daten abzuleiten, diese zu sortieren, nach Zusammenhängen zu durchschürfen sowie soziale, wirtschaftliche und politische Muster wie Einkommen, Einkaufsvorlieben oder Interessen für einzelne Parteien in Stadtvierteln der gesamten USA auszumachen.

Der Ansatz könne helfen, schreiben die Forscher, klassische Formen der Demoskopie und die Volkszählung zu ergänzen und zu unterfüttern. Automatische Systeme dürften ihnen zufolge imstande sein, demografische Informationen künftig effizienter als "arbeitsintensive Ansätze" in hoher "Auflösung" und "fast in Echtzeit" zu messen.

Für den Informatiker Erez Lieberman Aiden, der ein genomisches Forschungszentrum an der Baylor School of Medicine leitet und das von Stanford aus orchestrierte Team beraten hat, geht das Projekt weit darüber hinaus: "Auf einmal können wir Bilder genauso analysieren wie bislang Text", erklärte er der New York Times. Computer dürften nun auch in diesem Bereich ihre Fähigkeiten ausspielen, "ohne eine Hand auf den Rücken gebunden zu haben".

Ähnlich wie bei Menschen gibt es bei der KI über die Untersuchung von Text, Sprache und Beobachtungen unterschiedliche Wege, um sich die Außenwelt zu erschließen. Die ersten beiden Kategorien waren bei rechnergestützten Verständnisversuchen bisher trotz aller semantischer Mehrdeutigkeiten prinzipiell einfacher zu handhaben, da sie zunächst auf begrenzten Zeichenabfolgen wie dem Alphabet aufbauen. Aber auch die Bilderkennung hat in den vergangenen Jahren Fortschritte gemacht, auch weil Konzerne viel Geld in dieses Gebiet gesteckt und etwa Methoden zur Gesichtserkennung verbessert haben.

Auto verrät Besitzer

Das auf Google Street View aufsetzende Projekt weist in diese Richtung. Wichtigster Hinweis ist dabei das liebste Kind der US-Amerikaner und ein Symbol der westlichen Kultur: das Auto. Ein solches findet sich den Forscher zufolge in 90 Prozent der US-Haushalte und die Wahl des motorisierten Fahrzeugs werde beeinflusst durch zahlreiche demografische Faktoren einschließlich der Bedürfnisse, der persönlichen Vorlieben und der ökonomischen Gesamtsituation der Halter.

Um diese Variablen für den Computer zu erschließen, entwickelten die Wissenschaftler ein Erkennungssystem, das vor allem auf dem Deep-Learning-Modell der "Convolutional Neural Networks" (CNN) aufbaut. Darunter versteht man ein künstliches neuronales Netz, das konzeptionell biologische Prozesse für das maschinelle Lernen nachzuahmen versucht, und laut den Autoren den bislang für die Objektklassifizierung erfolgreichsten einschlägigen Algorithmus nutzt. Mit dem System sei es möglich gewesen, nicht nur insgesamt 22 Millionen Autos in den komplexen Straßenszenen aus Street View auszumachen, sondern auch eine weite Reihe ihrer Charakteristiken festzustellen. Dazu gehörten etwa der Fabrikant, das Modell und das Baujahr.

Die CNN-Variante ist laut den Insidern mittlerweile fähig, Autos jeweils binnen 0,2 Sekunden in eine von 2657 Kategorien einzuordnen. Die Treffsicherheit, ein normales zwei- oder viertüriges Fahrzeug zu erkennen, liege bei 95 Prozent anhand der Testdaten. Vans und Minibusse könne das System mit einer Trefferquote von 83 beziehungsweise 91 Prozent unterscheiden, Geländefahrzeuge sowie SUVs zu 86 und Pritschenwagen zu 82 Prozent. Die Klassifizierung der 50 Millionen Aufnahmen dauerte so zwei Wochen. Ein menschlicher Experte hätte dafür über 15 Jahre gebraucht, da ein einzelner entsprechender Vorgang bei ihm rund zehn Sekunden dauert.

Training bleibt nötig

Vorher war es nötig, den CNN-Algorithmus entsprechend zu trainieren. Das habe die eigentliche Herkulesaufgabe dargestellt, erzählte die derzeit bei Microsoft Research tätige Gebru der New York Times. Viele KI-Projekte scheiterten genau an diesen Grundlagen in der physikalischen Welt. Maschinenlernen funktioniert in der Regel so, dass eine große Datenmenge in spezielle Kategorien eingeteilt wird, wobei einzelnen Werten unterschiedliche Zusatzinformationen angefügt werden. Eine von Hand gepflegte Datenbank musste auch in diesem Fall her, um der KI-Software zunächst zu helfen, die Bilder und die darauf ersichtlichen Objekte zu identifizieren und zu unterscheiden.

Die Forscher heuerten dafür mehrere hundert Leute an, die aus einem Testset von einer Million Aufnahmen die darin sichtbaren Autos herauspickten und klassifizierten. Darunter waren Liebhaber, die der Maschine etwa beibrachten, die subtilen Unterschiede an den Rückleuchten eines Honda Accord der Baujahre 2007 und 2008 wahrzunehmen.

Nachdem das System eingearbeitet war, konnte es unter anderem das durchschnittliche verfügbare Haushaltsgeld, die hauptsächliche ethnische Herkunft, die Ausbildung und die Wahlmuster auf der Ebene einzelner Viertel mit recht hoher Wahrscheinlichkeit bestimmen. Unter den weiteren Korrelationen war, dass Burlington in Vermont die Stadt mit den Autos mit dem wenigsten Benzinverbrauch war; Casper in Wyoming im Mittleren Westen hatte dagegen fahrzeugtechnisch die schlechteste Kohlendioxidbilanz pro Kopf. Generell schätzte der Algorithmus die Oststaaten und den Westen der USA als ökologisch "grüner" ein als die Regionen im Binnenland.

Einblicke in die USA

Chicago ist laut der Analyse die Stadt mit den höchsten Unterschieden bei den Einkünften mit großen Clustern teurer und billiger Autos in einzelnen Vierteln. Jacksonville in Florida ist in dieser Hinsicht die homogenste Gemeinde mit einem recht hohen Ausgabeniveau. New York hat das System als die Stadt mit den teuersten Autos identifiziert, in El Paso hat es die meisten Hummer entdeckt, in San Francisco den höchsten Anteil ausländischer Modelle.

Als die zwei Marken, die am stärksten auf asiatisch geprägte Viertel hinweisen, haben die Forscher mithilfe der Maschine Hondas und Toyotas ausgemacht. Autos von Chrysler, Buick und Oldsmobile verwiesen auf Gegenden mit vielen Afroamerikanern. Wo vor allem Pickups, Volkswagen und Aston Martins parkten, galt dies als Anzeichen für einen überwiegend von Weißen bewohnten Kiez.

Selbst das Alter von Kindern in einer Gegend konnten die Wissenschaftler nach eigenen Angaben mit einer noch "moderat akkuraten" relativen Häufigkeit von knapp über 50 Prozent einschätzen. Nicht ableiten ließ sich mit der Methode aber etwa der Anteil von Landwirten, die in einer bestimmten Region wohnen. Traktoren fanden sich auf den Straßenansichten offenbar selten. Generell sind viele der Verknüpfungen ähnlich wie bei anderen KI-Projekten mit Vorsicht zu genießen, schon allein da die Fehlerwahrscheinlichkeiten dabei meist noch hoch sind.

Gebru und ihre Kollegen sind sich ihrem Artikel nach bewusst, dass ihr Verfahren nicht nur Marktforschern und Politikern das Leben erleichtern könne, sondern auch "wichtige ethische Bedenken" hervorrufen werde. Es sei klar, dass öffentliche Daten nicht verwendet werden sollten, um die "angemessenen Erwartungen an die Privatheit individueller Bürger" zu unterlaufen. Der Datenschutz werde daher bei der Weiterentwicklung des Ansatzes etwa für Voraussagen bis zur Ebene einzelner Individuen eine wichtige Stellschraube bilden. Material dafür dürfte es genug geben, sobald mehr hochautomatisierte Autos mit ihren Kameras und Sensoren durch die Straßen fahren. Hierzulande hatte Street View schon vor dem Start des Dienstes 2010 Datenschützer auf den Plan gerufen.