Microsoft schaltet Datenbank für Gesichtserkennungs-Training ab

Laut einem Bericht hat Microsoft eine Datenbank für KI-Training abgeschaltet. Sie wurde auch von chinesischen Firmen genutzt, die in die Kritik geraten waren.

In Pocket speichern vorlesen Druckansicht 17 Kommentare lesen
Gesichtserkennung: Microsoft schaltet Datenbank für KI-Training ab

Eigentlich sollte die Datenbank nur Promis enthalten, an deren Gesichtern KI-Systeme trainieren können. Dabei blieb es aber wohl nicht.

(Bild: Microsoft)

Lesezeit: 3 Min.

Microsoft hat ohne Ankündigung eine Datenbank mit Millionen Gesichtsfotos offline genommen, die hauptsächlich KI-Gesichtserkennungssystemen zu Trainingszwecken diente. Die Datenbank mit der Bezeichnung "MS Celeb" soll etwa 10 Millionen Bilder von ca. 100.000 Personen enthalten haben, berichtet die Financial Times (FT).

Wie das Magazin schreibt, hat der Redmonder Konzern seine 2016 freigegebene Datenbank offenbar nach einem anderen Bericht der FT vom April abgeschaltet. Dieser Bericht beleuchtete die teils fragwürdige Nutzung von "Celeb" unter anderem durch chinesische Unternehmen wie Sensetime und Megvii sowie durch das US-Militär. Die beiden chinesischen Firmen sollen Ausrüster für Behörden in der chinesischen Provinz Xinjiang sein, in der Gesichtserkennung zur Unterdrückung ethnischer Minderheiten eingesetzt wird.

Microsofts "Celeb"-Datenbank soll sich aus Ergebnissen von Suchmaschinen sowie aus Video-Standbildern zusammensetzen, die unter Creative-Common-Lizenz stehen – das Einverständnis der abgebildeten Personen sei dafür nicht eingeholt worden. Auch Unternehmen wie IBM, Hitachi, Panasonic, Alibaba und Nvidia hätten "Celeb" genutzt, was aus Zitatangaben in Forschungsarbeiten zur Künstlichen Intelligenz hervorgehe. Microsoft teilte zur Begründung seiner Entscheidung mit, dass die Datenbank für akademische Zwecke gedacht gewesen sei. Das Projekt sei von einem Mitarbeiter betreut worden, der inzwischen nicht mehr bei Microsoft arbeite, daher habe man die Datenbank abgeschaltet.

Außerdem sollen laut dem FT-Bericht zwei weitere Datenbanken mit vergleichbarer Zielsetzung inzwischen nicht mehr öffentlich zugänglich sein: "DukeMTMC" mit Überwachungsdaten, die Forscher der Duke University zusammengestellt haben, sowie "Brainwash" von der Stanford University. "Brainwash" soll Bilddaten eines Video-Livestreams aus einem Café in San Francisco analysiert haben. Die Stanford University habe der FT auf Anfrage mitgeteilt, man habe die Datensätze entfernt, weil ein Autor der Studie, für die sie genutzt wurden, darum gebeten habe.

Die Beschaffenheit der drei Datenbanken hatte der Forscher Adam Harvey in seinem Projekt "Megapixels" aufgedeckt. Die zunehmende automatisierte Nutzung von Gesichtserkennung wird seit Längerem wegen der unabsehbaren Folgen und der möglichen Einschränkung von Grundrechten kritisiert. Microsoft habe seine Datenbank zwar "Celeb" genannt in Anspielung darauf, dass öffentliche Bilder von Prominenten Verwendung finden würden, sagte Harvey. Er fand jedoch heraus, dass in "Celeb" auch Personen vorkämen, die online nicht präsent seien und keine digitale Identität besäßen. Die Financial Times habe einige Personen aus der Datenbank darauf angesprochen – diesen sei nicht bewusst gewesen, dass sie in "Celeb" aufgenommen wurden. (tiw)