Wie sich Künstler gegen die Nutzung ihrer Bilder als KI-Vorlagen wehren
Die Bilder des Digitalkünstlers Greg Rutkowski dienen KI-Bildgeneratoren als beliebte Vorlage. Doch glücklich ist er darüber nicht.
- Melissa Heikkilä
Sie haben diese coolen KI-generierten Bilder im Internet gesehen? Die Wahrscheinlichkeit ist groß, dass sie auf den Werken von Greg Rutkowski basieren. Rutkowski ist ein polnischer Digitalkünstler, der klassische Malstile verwendet, um verträumte Fantasielandschaften zu schaffen. Er hat Illustrationen für Spiele wie Sonys Horizon Forbidden West, Ubisofts Anno, Dungeons & Dragons und Magic: The Gathering angefertigt. Nun ist Rutkowski plötzlich auch in der neuen Welt der Text-zu-Bild-KI-Generierung ein Hit geworden.
Sein unverwechselbarer Stil ist jetzt einer der am häufigsten verwendeten Eingabevorschläge in dem neuen Open-Source-KI-Generator Stable Diffusion, der Ende August veröffentlicht wurde. Zusammen mit anderen beliebten KI-Modellen zur Bilderzeugung ermöglicht das Werkzeug jedem User, beeindruckende Bilder auf der Grundlage von Textvorgaben zu erstellen.
KI-Vorlage wider Willen
Gibt man zum Beispiel ein: "Zauberer mit Schwert und einer glühenden Kugel aus magischem Feuer kämpft gegen einen wilden Drachen Greg Rutkowski", wird das System etwas produzieren, das nicht weit von Werken im Stil Rutkowskis entfernt ist.
Diese Open-Source-Programme werden mithilfe von aus dem Internet geklaubten Bildern erstellt, oft ohne Erlaubnis und ohne angemessene Nennung der Künstler. Daher werfen sie heikle Fragen zu Ethik und Urheberrecht auf. Jetzt haben Künstler wie Rutkowski genug davon.
Laut der Webseite Lexica, die über zehn Millionen von Stable Diffusion generierte Bilder und Prompts, also Vorlagen für die KI, verfolgt, wurde Rutkowskis Name rund 93.000 Mal als Prompt verwendet. Einige der berühmtesten Künstler der Welt, wie Michelangelo, Pablo Picasso und Leonardo da Vinci, wurden jeweils nur etwa 2.000 Mal oder weniger aufgerufen. Rutkowskis Name taucht auch tausende Male als Eingabevorschlag auf dem Discord-Server eines anderen Text-zu-Bild-Generators, Midjourney, auf.
Rutkowski war zunächst überrascht, dachte aber, dass dies eine gute Möglichkeit sei, neue Zielgruppen zu erreichen. Dann versuchte er, nach seinem Namen zu suchen, um zu sehen, ob ein Werk, an dem er gearbeitet hatte, veröffentlicht worden war. Die Online-Suche ergab Arbeiten, die mit seinem Namen versehen waren, aber nicht von ihm stammten.
"Es ist erst einen Monat her. Wie wird es in einem Jahr aussehen? Wahrscheinlich werde ich meine Werke nicht mehr finden können, weil [das Internet] mit KI-Kunst überflutet sein wird", sagt Rutkowski. "Das ist besorgniserregend."
Auslese von bestimmten Bildern als Prompts
Das Unternehmen Stability.AI, das Stable Diffusion entwickelt hat, hat das Modell mit dem von der deutschen gemeinnützigen Organisation LAION zusammengestellten LAION-5B-Datensatz trainiert. LAION grenzte den Datensatz ein, indem es mit einem Wasserzeichen versehene Bilder herausfilterte, ebenso wie nicht ästhetisch Bilder wie Logos, sagt der Technologe und Autor Andy Baio. Er hat 12 Millionen der 600 Millionen Stable-Diffusion-Bilder, die zum Trainieren des Modells verwendet wurden, heruntergeladen und analysiert. Dabei stellte er fest, dass ein großer Teil davon von Drittanbieter-Websites wie Pinterest und Kunsthandelsseiten wie Fine Art America stammt.
Viele von Rutkowskis Kunstwerken wurden von ArtStation entnommen, einer Webseite, auf der viele Künstler ihre Online-Portfolios hochladen. Seine Popularität als KI-Souffleur ist auf mehrere Gründe zurückzuführen. Erstens sieht sein fantastischer und ätherischer Stil sehr cool aus. Außerdem ist er sehr produktiv, und viele seiner Illustrationen sind online in ausreichender Qualität verfügbar, so dass es viele Beispiele gibt, aus denen man wählen kann. Ein früher Text-zu-Bild-Generator namens Disco Diffusion schlug "Rutkowski" von selbst als Beispiel für eine Eingabeaufforderung vor.
Was das Einsammeln von Rutkowskis Bildern aus dem Internet zusätzlich erleichtert, ist der englischsprachige Alt-Text, den er seinen online gestellten Arbeiten hinzufügt. Diese Bildbeschreibungen sind eigentlich für Menschen mit Sehbehinderungen gedacht, die eine Bildschirmlesesoftware verwenden, aber sie helfen auch Suchmaschinen, die Bilder einzustufen. Sie lassen des Weiteren das KI-Modell wissen, welche Bilder für Prompts wichtig sind.