KI-Bildgeneratoren: Was sie können und wie man sie einsetzt

Seite 4: Inhalte-Filter

Inhaltsverzeichnis

Problematisch können auch erzeugte Bilder sein, die nicht jugendfrei sind oder anderweitigen Schaden anrichten könnten. Die Betreiber der Dienste versuchen, das durch restriktive Nutzungsbedingungen zu unterbinden. Der Dall-E-Entwickler OpenAI zum Beispiel verbietet es ausdrücklich, solche Bilder zu erstellen.

Zu den verbotenen Inhalten zählen Gewalt, "Belästigung", Sexualität und Nacktheit. Tabu sind aber "große Verschwörungen oder Ereignisse im Zusammenhang mit wichtigen laufenden geopolitischen Ereignissen", Inhalte, "die zur Beeinflussung des politischen Prozesses oder zum Wahlkampf verwendet werden können" sowie "Bilder von Personen des öffentlichen Lebens". Nutzer sind auch zur Transparenz angehalten. Sie dürfen nicht verschleiern, dass die erzeugten Bilder von einer KI stammen.

Letztlich ist es Glückssache, was eine KI auswirft. Man produziert auch viel Ausschuss. Dieser deformierte Roboter entstand beim Versuch, eine Illustration zu erzeugen.

Offensichtlich nutzt OpenAI auch Wortfilter, um seine Regeln durchzusetzen. So weigerte sich Dall-E bei unseren Versuchen, ein Bild mit dem Prompt "elon musk flying on a blue bird digital art" zu erzeugen.

Momentan entsteht ein großer Hype um die KI-Bildgeneratoren. Der Stockfoto-Anbieter Shutterstock etwa will künftig direkt auf seinem Portal mit Dall-E von OpenAI Bilder generieren – ebenso wie Microsoft mit seiner Suchmaschine Bing.

Derweil werden die KI-Dienste schnell weiterentwickelt und etwa um die Funktionen Inpainting und Outpainting ergänzt. Inpainting erlaubt es dem Nutzer, Bildbereiche zu löschen, in die die KI mithilfe des Prompts neue Inhalte hineinerfindet. Beim Outpainting wiederum kann eine KI ein Originalbild über den Rand hinaus erweitern. Dabei übernimmt sie wahlweise den Stil des Originals oder variiert ihn.

Die künstlichen Künstler haben ganz offensichtlich das Potenzial, so manchen grafischen Gestaltungsprozess zu verändern. Vielleicht ist Ihnen ja schon das eine oder andere von einer KI gestaltete Bildelement untergekommen – zum Beispiel in der c’t: Das folgende Bild ist ein Aufmacherbild, das eine KI fabriziert hat.

Midjourney: "C3PO the robot god of music production wielding the magic".

Als im August 2022 ein von Midjourney generiertes Bild einen Kunstwettbewerb gewann, wurde auf Twitter und in einschlägigen Blogs schon diskutiert, ob die KI-Bildgeneratoren den "Tod der Kunst" einläuten. Aber das scheint überzogen zu sein. Zwar finden viele Menschen zumindest einige KI-Bilder schön, der größte Teil ist aber auf eine unangenehme Art seltsam oder schlichtweg sinnloser Ausschuss. Vor allem aber ist es mit Prompt Engineering alleine nicht möglich, den Prozess so zu kontrollieren, dass das Ergebnis exakt den Erwartungen entspricht.

Genau aus diesem Grund haben wir gar nicht erst versucht, die Aufmacherbilder für die Artikel dieses Schwerpunkts von einer KI malen zu lassen, sondern einen Grafiker beauftragt. Die vier Bilder sollten wiedererkennbare Elemente haben, die eine grafische Verbindung zwischen den Artikeln knüpfen. So etwas kann man bei KI-Generatoren nicht bestellen.

Dass die KI-Bilder schwer zu beeinflussen sind, wird sich auch mit den nächsten Generationen der Generatoren nicht ändern. Die Auflösungen werden sicherlich steigen, die Bezüge in den Bildern werden logischer werden, die Werke werden immer weniger wie Wimmelbilder aussehen. Aber es wird schwierig bleiben, bestimmte Ausgabe zu erzeugen, bei denen Komposition, Inhalte und Stil den eigenen Vorstellungen entsprechen.

Wer sich mehr Kontrolle erhofft, muss auf verbessertes Inpainting hoffen, das sicherlich in Zukunft eine größere Rolle in Bildbearbeitungsprogrammen spielen wird. Photoshop hat jetzt schon eine Funktion für KI-Inpainting. Die kann man aber bisher noch nicht mit einer Texteingabe steuern.

Für die Zukunft ist also zu erwarten, dass Bildgeneratoren Teil des Werkzeugkastens von Illustratoren und Künstlern werden, diese aber nicht ersetzen. Kreative werden die Grafik-KIs als Inspirationsquelle nutzen oder als Lieferanten von Rohmaterial – wie bei folgendem Aufmacher.

Für dieses Aufmacherbild wurden mehrere Bilder mit StableDiffusion generiert, in Photoshop zusammengesetzt und nachbearbeitet.

Dafür hat eine Kollegin mehrere Bilder mit Stable Diffusion generiert, zu einer Komposition zusammengestellt, in Photoshop einige Fehler retuschiert, das Mikro ausgebessert, die Augen verändert und die Farben mittels Filter aufgefrischt.