Die soziale Röntgenbrille

MIT-Wissenschaftlerin Rosalind Picard will mit Hilfe der digitalen Gesichtserkennung auf die Stimmung anderer Menschen schließen und so Kommunikationsvorgänge erleichtern.

In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Lesezeit: 4 Min.

MIT-Wissenschaftlerin Rosalind Picard will mit Hilfe der digitalen Gesichtserkennung auf die Stimmung anderer Menschen schließen und so Kommunikationsvorgänge erleichtern.

Forscher am Media Lab des Massachusetts Institute of Technology (MIT) haben eine Brille entwickelt, die mit einer eingebauten Kamera den Gesichtsausdruck des Gegenübers erfassen kann und über eine auf einem Kleincomputer laufende Software mittels Bildanalyse auf die Stimmung des Kommunikationspartners schließt. "Soziale Röntgenbrille" nennt Rosalind Picard, Direktorin der "Affective Computing Research Group" und Leiterin des Forschungsprojektes, das System.

Insgesamt 24 Punkte im Gesichts werden dazu ständig beobachtet. "Wir können Aufmerksamkeit ebenso erkennen wie Widerspruch oder Konfusion", erläutert Rana el Kaliouby, die die Technik zusammen mit Picard entwickelt hat. Unter Idealbedingungen arbeite das System besser als ein Mensch: So sollen Missverständnisse ausgeschlossen werden. "Wir achten nicht immer auf subtile Gesten." Ursprünglich wurde die Technik für Autisten entwickelt, die Probleme haben, die Mimik anderer Menschen richtig zu interpretieren – mit Picards Entwicklung sollte es ihnen möglich werden, besser auf ihre Umwelt zu reagieren.

Über ein einfaches Signalsystem kann der Träger der Brille erkennen, wie sich sein Gegenüber gerade fühlt – eine rote LED steht für Desinteresse, eine grüne für volle Aufmerksamkeit. Gelb wird das Licht, wenn sich andeutet, dass jemand langsam das Interesse verlieren könnte – beispielsweise durch ein Augrenrollen. Daneben kann der Computer per Sprachausgabe in einen an der Brille angeschlossenen Knopfhörer auch noch weitere Details durchgeben, die er mittels Gesichtserkennung ermittelt hat.

Seine Datenbasis bezieht das System aus einer Datenbank, die zuvor mit der Technik des maschinellen Lernens befüllt wurde. Dabei wird dem Computer zunächst beigebracht, welcher Gesichtsausdruck für welche Emotion steht. Dies geschieht mit zahlreichen unterschiedlichen Testpersonen, bis es zu einer stabilen Erkennungsleistung kommt.

Allerdings müsse das System unterschiedlichen Kulturkreisen gegebenenfalls angepasst werden, sagt el Kaliouby: "Zwar sind die Gesichtsausdrücke weltweit recht einheitlich, manche subtile Geste steht in einem anderen Land aber für etwas anderes." Das lasse sich aber problemlos mit einer genügend großen Datenbank regeln, die Trainingsphase müsse dann eben einmal durchgeführt werden.

Neben der Ursprungsanwendung für autistische Personen haben Picard und el Kaliouby mittlerweile diverse neue Ideen für eine Nutzung ihrer Technik entwickelt. So könne man sich beispielsweise vorstellen, das Publikum bei einer Präsidentschaftsdebatte zu analysieren, um ein genaues Ergebnis zu erhalten, wer wirklich der wahre Sieger eines solchen Rededuells ist. Denn: Umfrageergebnisse nach der Veranstaltung stehen oft weniger für die Realität als der Gesichtsausdruck während einer Antwort des Kandidaten, den Menschen recht schwer verstecken können.

Die MIT-Forscher glauben außerdem, dass sie in Zukunft noch genauere Erkennungsalgorithmen entwerfen können. Dazu müsse aber zunächst die Bildauflösung der Kameras erhöht werden, weil dies noch deutlich mehr Datenpunkte als die jetzt verwendeten 24 ergebe, sagt el Kaliouby.

Eine weitere Anwendung ergibt sich im Bereich des interkulturellen Dialoges: Statt nur einem Übersetzungsprogramm zu lauschen, das in Zukunft per Spracherkennung gefüttert werden könnte, würde die Brille parallel auch die Stimmung des Gegenübers erfassen. So ließe sich etwa genau feststellen, ob eine eingeschlagene Strategie in Vertragsverhandlungen mit China oder anderen dem Westen kulturell unterschiedlichen Regionen die richtige ist.

El Kaliouby hat mit Picard mittlerweile das Spin-off Affectiva gegründet, dass die Technik vermarkten soll – unter anderem mit einem der genannten Projekte, aber auch an Marketingfirmen, die erforschen wollen, wie neue Werbung wirklich bei Kunden ankommt.

Außerdem arbeitet das MIT-Team an einer Miniaturisierung seiner Erfindung: Statt auf einem Laptop soll die Gesichtserkennung dann eines Tages mit einem Smartphone erfolgen. Auch die Brille ist nicht in Stein gemeißelt: Grundsätzlich könnte die Technik auch schlicht über die Kamera des Mobilfunkgeräts funktionieren, die dann nur auf die Person gehalten wird, mit der man gerade diskutiert. Aus Höflichkeitsgründen sollte man dann aber sagen, was man vorhat. (bsc)