Gesichtserkennung: Clever oder unheimlich?

Neue Fotoanwendungen von Apple und Google enthalten revolutionäre Technologien, die manchem Nutzer nicht ganz geheuer sein dürften. Ein Selbstversuch.

In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen
Lesezeit: 10 Min.
Von
  • Beth Rosenberg
  • Simson Garfinkel

Auf unseren Festplatten befinden sich mehr als 25.000 Digitalfotos – die meisten davon zeigen Menschen. Bislang lag der einzige Weg, in diesem Pixelwirrwarr ein gewünschtes Gesicht aufzufinden, in der manuellen Suche: Nach Datum, EXIM-Metainformationen, von Hand gesetzten Schlüsselbegriffen oder durch den schlichten Einsatz des eigenen Gedächtnisses. Das ändert sich nun: Kollege Computer hilft ab sofort bei der Suche. Smarte Gesichtserkennungsalgorithmen, die die IT-Riesen Apple und Google kürzlich vorgestellt und inzwischen in die jüngsten Versionen ihrer Foto-Management-Programme integriert haben, machen es möglich.

Fortschritte im Bereich der Gesichtserkennung wurden in den letzten Jahren besonders von Wissenschaftlern gemacht, die sich mit Anti-Terror-Technologien auseinandersetzten. Die Idee: Computer sollen automatisch Attentäter aussieben, wenn sie sich beispielsweise durch Sicherheitskontrollen auf dem Flughafen bewegen. So richtig scheint das allerdings noch nicht zu funktionieren. Bei einem Test im amerikanischen Tampa wurden Airport-Angestellte, die sich zuvor freiwillig registriert hatten, nur in 53 Prozent aller Fälle korrekt identifiziert. Bürgerrechtsgruppen brachten zudem die Gefahr von Fehltreffern in die Diskussion: Unschuldige Menschen, die plötzlich als Terroristen dastünden und vielleicht aufgrund ihres Aussehens sogar festgenommen werden könnten. Kein Wunder also, dass die Technik in der Öffentlichkeit kaum mehr debattiert wird.

Die Entwicklung ist trotzdem nicht beendet. Viele Länder, darunter auch die Vereinigten Staaten, arbeiten weiter an der Technik. So wurden dort etwa die Vorgaben für Passfotos überholt, um sie für Gesichtserkennungsprogramme leichter nutzbar zu machen. Das National Institute of Standards and Technology, wo man seit 1994 an Gesichtserkennungssoftware forscht, führte 2002 und 2006 große Tests durch. Oregon und andere US-Bundesstaaten begannen, die Gesichtserkennung zum Aussieben von Personen zu nutzen, die versuchen, unter falschem Namen einen Führerschein zu beantragen. All das führte dazu, dass die Technik in den letzten Jahren ständig besser wurde – viel besser.

Damit ein Gesichtserkennungssystem funktioniert, muss ein Rechner zunächst lernen, Gesichter und andere Objekte zu unterscheiden. Technisch ist das einfacher umzusetzen als die tatsächliche Identifizierung einzelner Personen. Perfektioniert wurde der Ansatz schon kurz nach den Anschlägen des 11. September 2001. Das Ergebnis: Systeme zur Ermittlung von Gesichtern werden inzwischen in handelsübliche Digitalkameras und Camcorder eingebaut. Diese Algorithmen suchen nach Augen, Nasen und runden Bereichen eines Bildes. Dann wird ein Kasten definiert, auf den sich das Autofokussystem konzentrieren kann. Ergebnis: Das Bild wird stets auf Gesichter scharf gestellt, Omas Augen sind nie mehr verschwommen.

Gesichtserkennung beginnt also damit, Gesichter überhaupt erst einmal aus dem Hintergrund heraus zu ermitteln. Dann wird das Gesicht so gedreht, dass die Augen auf einer Ebene sind und das Bild auf eine Standardgröße gebracht. Als nächstes übernimmt einer von drei technischen Ansätzen. Jeder von ihnen basiert auf seinen eigenen patentierten Ideen und steckt dementsprechend in verschiedenen Soft- und Hardware-Angeboten unterschiedlicher Hersteller. Bei einem Ansatz wird das Gesicht in ein mathematisches Muster zerlegt, das dann gespeichert und durchsucht werden kann, ein zweiter nutzt das gesamte Gesicht als Mustervorlage und sucht dann nach Übereinstimmungen. Variante Nummer drei versucht wiederum, aus dem Gesicht ein 3D-Modell zu machen, um dann nach geometrischen Übereinstimmungen zu suchen. Nach unseren Erfahrungen mit der Software scheint Apple auf bestimmte Merkmale im Gesicht zu setzen, während Google einen Bildabgleich vorzunehmen scheint. Klar ist das allerdings nicht, denn keine der Firmen legt offen, welche Algorithmen tatsächlich verwendet werden.

Wir testeten die Gesichtserkennungsfähigkeiten von Apples iPhoto '09 an zwei verschiedenen Datenbanken mit 17.000 und 10.000 Aufnahmen, die sich auf unseren eigenen Festplatten befanden. Googles Picasa funktioniert nur mit Aufnahmen, die zuvor ins Web hochgeladen wurden, hier konnten wir das Feature an 500 Bildern überprüfen. Das Ergebnis: Beide Systeme funktionieren erstaunlich gut, sind fast schon gruselig.

iPhoto '09 ist der freundlichere von beiden Kandidaten. Beim ersten Programmstart sucht die Software nach allen Gesichtern in der Fotobibliothek – auf einem Zweikern-iMac-Rechner dauerte das aufgrund unserer Bildmenge rund vier Stunden. Als nächstes klickt man auf das Bild einer Person, die man kennt, selektiert den Bereich "Namen" und füllt diesen dann aus. iPhoto durchsucht dann die gesamte Bildbliothek nach anderen Aufnahmen der gleichen Person. (Die Erkennung scheint dabei anhand der Eigenheiten des Gesichts zu erfolgen, abgegrenzt jeweils durch einen Kasten, der sich zwischen rechter und linker Schläfe, Augenbrauen und Kinn erstreckt.)

Insgesamt macht iPhoto dabei einen erstaunlich guten Job. Dennoch gibt es auch Fehltreffer. Der nächste Schritt ist also, dem Programm mitzuteilen, wo es richtig lag und wo nicht. Diese Informationen werden dann verwendet, um das mathematische Modell zu ergänzen. Anschließend wird die Bibliothek erneut durchforstet, um die nun neu erkannten Personen zu suchen. Ist das nicht erfolgreich, kann man iPhoto auch einen anderen Startpunkt mitteilen. Außerdem ist es möglich, ein Foto anzuklicken und iPhoto zu bitten, die Person auf dem Bild zu ermitteln – wenn das Ergebnis korrekt ist und bestätigt wird, verbessert das die interne Datenbank noch weiter.

Besonders erstaunlich waren die Leistungen iPhotos beim Auffinden von Bildern der Kinder. Erstaunlicherweise war sogar die Unterscheidung unserer eineiigen Zwillinge möglich. (Der Trick dabei scheint zu sein, dass eines der Kinder ein etwas dünneres und längeres Gesicht hat.) Enttäuschend war allerdings, dass Aufnahmen eines Zwillings wesentlich häufiger aufgefunden wurden als die des anderen, obwohl jeweils genauso viele Schnappschüsse beider vorhanden waren – häufig auf dem gleichen Bild. Eine nähere Untersuchung ergab, dass ein Zwilling stets direkt in die Kamera schaute, während der andere stets leicht wegschaute. iPhotos Gesichtserkennung funktioniert also nicht, wenn nur ein Auge sichtbar ist. Sind die Gesichter bemalt (bei unseren Halloween-Bildern, beispielsweise), versagt iPhoto meistens – nur wenn die Farbe in einem Bereich aufgetragen wurde, der außerhalb des Erkennungskastens liegt, war dem nicht so.

Man kann so manches in die Software hineinlesen. So ergab die Suche nach mir, Beth, zahlreiche Bilder von Simsons Ex-Freundinnen. Man könnte daraus schließen, dass die Software weiß, welchen Geschmack Simson hat, doch die Wahrscheinlichkeit ist größer, dass es ein statistisches Problem war: In der zufällig gewählten Bildbibliothek von Simson steckten eben viele Aufnahmen seiner Verflossenen.

iPhoto war außerdem erstaunlich erfolgreich bei der Erkennung von Katzen – besonders jenen mit Fell in Weiß und Orange. Bei Gefleckten sah es anders aus – offenbar sind die Gesichtseigenschaften hier schwerer zu erkennen, wenn die Augen die Farbe der Wangen haben. Verblüffend gut war iPhoto auch im Umgang mit dem Auffinden und Erkennen von Gesichtern, die im Schatten lagen oder wenig Kontrast hatten. Der Grund: iPhoto dreht zuvor den Kontrast auf, um zwischen Gesicht und Hintergrund besser unterscheiden zu können.

Nach der Installation von iPhoto '09 verbrachte die Familie Stunden vor dem Rechner, suchte nach Bildern der Kinder und brachte dem iMac bei, wer wie aussieht. Dabei tauchten zahlreiche alte Fotos auf, die wir bereits vergessen hatten. Wir lachten über die Fehltreffer. Wir versuchten, den Algorithmus zu verstehen. Schnell war klar: Apple hat selten eine unterhaltsamere Software geschaffen.

Googles Picasa ist da schon wesentlich unheimlicher: Statt mit Bildern von Personen zu beginnen, die man kennt und dann nach ähnlichen Treffern zu suchen, nimmt sich die Software jedes hochgeladene Bild vor, analysiert es nach Gesichtern und gruppiert diese dann in Gruppen. Anschließend geht man diese durch und teilt Google mit, wer welche Person ist – inklusive vollem Namen, Internet-Pseudonym und E-Mail-Adresse.

Besonders gut funktioniert dieses Clustering allerdings nicht. Es legt oft verschiedene Menschen in der gleichen Gruppe ab oder schafft mehrere Gruppen ein und derselben Person. Im Gegensatz zu iPhoto, das problemlos Bilder unserer 12jährigen Tochter mit ihren Kleinkindaufnahmen abgleichen konnte, machte Google zwei unterschiedliche Personen daraus. Die Schnittstelle von Picasa ist allerdings sehr leicht zu durchschauen, das "Matching" macht erstaunlich viel Freude und man hat im Nu alle seine Fotos mit Namen und E-Mail-Adresse der darin zu sehenden Personen markiert.

Die Verwendung des Klarnamens macht Picasa allerdings ein wenig unheimlich. Schließlich befinden sich die Bilder nicht auf dem eigenen Rechner, sondern auf Googles Server-System. Da E-Mail-Adressen eindeutig sind, könnte der Konzern aus den von seinen Nutzern markierten Fotos eine globale Datenbank basteln, die sowohl E-Mail als auch Bild enthält. Das würde noch nicht einmal Googles aktuellen Datenschutzbedingungen widersprechen, solange diese Informationen nur dazu benutzt werden, den Dienst "besser" zu machen und die Datenbank nicht vollständig öffentlich verfügbar gemacht wird.

Wirklich merkwürdig ist außerdem, dass Google nicht nur möchte, dass man seine Freunde markiert, sondern auch die Gesichter derjenigen, die im Hintergrund stehen oder zufällig auf einem Bild auftauchen. Selbst Gesichter auf Postern werden erkannt. Das passt sicherlich zu Googles Mission, alle Informationen der Welt zu organisieren zu wollen und sie überall verfügbar zu machen. Doch will man das wirklich von einer Website, auf der das private Fotoalbum liegt?

Die Nutzung von iPhoto war dagegen ein reines Vergnügen. Es war spannend und befriedigend, so viele Bilder unserer Kinder, unserer Familie und unserer Freunde zu entdecken – und auch die von uns selbst. Picasa wirkte dagegen ganz anders. Wir hatten ein wenig das Gefühl, als würden wir im Auswertungsbüro des Geheimdienstes eines totalitären Staates werkeln.

Wir glauben, dass solche Gesichtserkennungssysteme für Endkunden die Debatte über biometrische Systeme und Videoüberwachung künftig auf den Kopf stellen könnte. Nach dem 11. September verstand zunächst niemand, wie die Technologie funktionierte, was sie konnte und was nicht. Doch noch in diesem Jahr werden Millionen von Menschen allein in Amerika die Chance haben, einige der am besten arbeitenden Gesichtserkennungssysteme der Welt auf ihren Rechnern zu haben. Zunächst wird sie dabei nur der Reiz des Neuen interessieren. Ist der verflogen, dürfte es spannend werden: Bei der politischen Debatte, ob diese durchaus streitbare Technik im öffentlichen Raum reguliert werden muss. (bsc)