FragwĂĽrdig: Googles PaliGemma 2 kann Emotionen erkennen

Googles frei verfĂĽgbares KI-Modell PaliGemma 2 kann Emotionen in Bildern erkennen. Das ist in der EU eigentlich verboten.

In Pocket speichern vorlesen Druckansicht 10 Kommentare lesen
Emotionserkennung

Gute Laune, schlechte Laune – KI kann das erkennen.

(Bild: Gino Crescoli, gemeinfrei)

Lesezeit: 3 Min.

Emotions- und Gesichtserkennung sind heikle Gebiete. Unter anderem ist beides in der EU laut AI Act verboten – wenn auch mit einigen Ausnahmen. Nun ist Googles neues und frei zugängliches Vision-Language-Model PaliGemma 2 in der Lage, genau diese Fähigkeit der Emotionserkennung zu lernen. Zum einen kann das Modell grundlegend Emotionen erkennen, zudem ist es mittels Finetuning offenbar ein Leichtes, diese Fähigkeit auszubauen. Dabei werden der KI Bilder samt dazugehörigen Informationen zu den Emotionen zur Verfügung gestellt. Freilich dürfte das auch mit freien KI-Modellen anderer Anbieter möglich sein.

PaliGemma ist in der Version 2 gerade erst vorgestellt worden. Damit lassen sich Text als auch Bilder verarbeiten, man kann also etwa Fragen zu einem Bild stellen. Laut Googles Blogbeitrag könne das KI-Modell "detailreiche und kontextuell relevante Informationen" aus einem Bild herauslesen und gehe dabei über die "reine Objekterkennung" hinaus. PaliGemma 2 kann "Handlungen, Emotionen und das Narrativ einer Szene beschreiben".

Da PaliGemma 2 ein offenes Modell ist, also frei zugänglich, sind Experten ob des so leichten Zugangs zur Emotionserkennung besorgt. In der europäischen KI-Verordnung ist der Einsatz in großen Teilen verboten. Etwa dürfen weder Arbeitgeber noch Schulen oder Privatpersonen sie nutzen, anders ist es bei Grenzschutzbehörden und auch bei Flugzeugpiloten darf ein System überwachen, ob die Piloten müde sind oder fit.

Dabei ist Gesichts- und Emotionserkennung nicht unbedingt so einfach, wie man zunächst denken mag. Während ein Lächeln leicht zu erkennen ist, ist auch der Kontext des Lächelns wichtig, um es richtig zu deuten. Das führt zu vielen Fehlern. Gesichtserkennungs-Software steht zudem im Verdacht, einen besonders starken Bias zu haben. Unter anderem werden dabei fälschlicherweise dunkelhäutigen Menschen eher negative Eigenschaften und Emotionen zugeschrieben.

Neben der visuellen Emotionserkennung ist es ebenfalls schon lange möglich, Emotionen aus der Stimme herauszuhören – mittels Künstlicher Intelligenz. Die Stimme kann sehr viel Aufschluss über Emotionen und sogar Krankheiten geben. Auch diese Systeme sind nicht ohne Weiteres erlaubt. Sie finden etwa Einsatz in Callcentern, es muss darüber allerdings informiert werden. Laut AI Act unterstehen sie bestimmten Transparenz- und Dokumentationspflichten.

Fraglich ist, inwieweit die Fähigkeit zur Emotionserkennung in einem Modell wie PaliGemma 2 zu einer strengeren Überprüfung und Kategorisierung nach der Verordnung führt. Bisher unterliegen Vision-Language-Modelle als General Purpose AI einer relativ lockeren Sonderregelung, in der allerdings festgeschrieben ist, dass es eine Neu-Eingruppierung bei auffallenden Risiken geben kann.

(emw)