c't 17/2023
S. 144
Praxis
Bild-KI Midjourney 5
Bild: KI Midjourney | Bearbeitung Kai-Uwe Lipphardt

Wie gemalt

Künstlerische Stile mit der Bild-KI Midjourney simulieren

Die fünfte Generation der generativen künstlichen Intelligenz von Midjourney zeichnet beeindruckende Bilder. Allerdings hängt das Ergebnis maßgeblich von der Texteingabe, dem Prompt, ab. Dafür muss man nicht nur eine Sprache sprechen, die die KI versteht, sondern auch den künstlerischen Stil und die Epoche möglichst genau benennen.

Von André Kramer

Kaum ein halbes Jahr nach Veröffentlichung kann die generative KI von Midjourney schon nahezu fotorealistische Bilder erzeugen, die nur ein geschultes Auge noch als künstliche Erzeugnisse entlarvt. Midjourney V5 wurde mit etwa fünf Milliarden Datensätzen trainiert und gilt damit als aktuell umfangreichster, frei verfügbarer Bildgenerator. Die Kinderkrankheiten früherer Versionen wie unnatürlich wirkende Hände und Gesichter hat er hinter sich gelassen – Grund genug, sich genauer anzusehen, wie man ihm bestmögliche Resultate entlockt.

Die Midjourney-KI birgt eine Unmenge kulturelles Wissen, das weit über fotorealistische Darstellung hinausgeht. Sie ist in der Lage, eine Vielfalt künstlerischer Stile abzubilden, die ihresgleichen sucht. Um den Schatz zu heben und in beeindruckende Grafiken umzuwandeln, genügt es nicht, sprachliche Bilder wie „ein Segelschiff vor einer Palmeninsel im Sonnenuntergang“ einzugeben. Mindestens ebenso wichtig sind stilistische Angaben. Einige der Beispiele in diesem Artikel stammen von dem Werbefilmer Kai-Uwe Lipphardt, der für c’t Grafikstile der Sechziger bis Achtziger Jahre des vorigen Jahrhunderts mit Midjourney simulierte. Weitere Experimente von c’t zeigen unter anderem: Midjourney versteht selbst Emojis und erzeugt aus nur zwei Symbolen perfekt wirkende Grafiken.

Kommentieren