ERNIE-ViLG: KI-Bildgenerator aus China kann Anime und wird zensiert

Mit ERNIE-ViLG gibt es nun auch einen KI-Bildgenerator, der Chinesisch versteht. Bei politisch heiklen Begriffen verweigert er aber einfach die Arbeit.

In Pocket speichern vorlesen Druckansicht 43 Kommentare lesen

Die unterschiedlichen Ergebnisse für "democracy in germany" und "democracy in china"

(Bild: Screenshot)

Lesezeit: 3 Min.

Ein neuer KI-Bildgenerator des chinesischen Internetkonzerns Baidu soll kulturelle Eigenheiten des Reichs der Mitte besser einfangen, als die westlichen Vorbilder – umfasst aber offenbar von der Politik vorgegebene Filter. Wie das US-Wissenschaftsmagazin Technology Review zusammenfasst, weigert sich eine Demo des Programms etwa, Bilder zu dem Stichwort "Tian’anmen-Platz" zu produzieren. Statt eines generierten Bildes kommt lediglich der Hinweis, dass die Aufforderung den "relevanten Regeln" widerspreche oder auch nur "ERROR". Während andere KI-Generatoren bestimmte Aufforderungen ebenfalls nicht umsetzen, das aber zumeist auf Basis moralischer Abwägungen, geht es hier wohl um neuerliche Folgen der staatlichen chinesischen Zensur.

Wie Technology Review jetzt ausführt, ist die Demo von ERNIE-ViLG seit Ende August online verfügbar. Der größte Unterschied zu bereits existierenden Generatoren wie Midjourney, Dall-E 2 und Stable Diffusion, ist, dass die Konkurrenz aus China auch Anweisungen ("Prompts") in Chinesisch akzeptiert. Englischsprachige Vorgaben werden zuerst ins Chinesische übersetzt. Vor allem bei chinesischsprachigen Eingaben sollte die Gefahr von Missverständnissen geringer ausfallen, etwa wenn es um kulturspezifische Themen geht. Ersten Analysen zufolge fallen die Ergebnisse für historische Figuren und Prominente aus China sowie chinesisches Essen wohl zufriedenstellender aus. Auch generierte Anime-Kunst gefällt demnach deutlich besser.

Welche Vorgaben die KI-Technik nicht akzeptiert, müssen Nutzer und Nutzerinnen in mühevoller Handarbeit selbst herausfinden. Nicht generiert würden etwa Aufforderungen, in den die Namen wichtiger chinesischer Politiker wie Xi Jinping oder Worte wie "Revolution" vorkommen. Auch zu "Wände erklimmen" liefert die KI keine Bilder, in China wird damit umgangssprachlich die Nutzung eines VPN-Dienstes umschrieben. Bei Worten wie "Demokratie" ist es wohl etwas komplizierter, allein werden sie akzeptiert, in längeren Phrasen teilweise nicht. "Demokratie in Deutschland" hat ERNIE-ViLG bei Versuchen von heise online regelmäßig bebildert, "Demokratie in China" dagegen nicht, außer ein "anime style" wurde angehängt.

Ob die Liste mit zensierten Begriffen staatlich vorgegeben wurde, oder die Verantwortlichen für die KI von sich aus tätig wurden, ist nicht bekannt. Zwar gibt es bei den anderen KI-Bildgeneratoren auch Filter mit nicht unterstützten Wörtern oder Themenfeldern, dabei geht es aber etwa allgemein um Gewaltdarstellungen und pornografische Inhalte, auf die sich wohl eher gesellschaftlich geeinigt wurde. Außerdem lassen sich die Regeln einsehen. Das Vorgehen bei ERNIE-ViLG wirkt dagegen noch vergleichsweise grob und unfertig. Vorstellbar ist, dass sich die gigantische Zensurmaschinerie Chinas an die neue Technik anpasst und unerwünschte Begriffe künftig nicht mehr blockiert werden, sondern stattdessen geändert wird, was daraus generiert wird.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes Video (Kaltura Inc.) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Kaltura Inc.) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

(mho)