Update für Bildgenerator: Midjourney 5.2 vergrößert die Leinwand
Es ist, als würde man einen Schritt zurücktreten: Der neue Midjourney-Parameter „zoom out“ vergrößert die Leinwand. Version 5.2 soll dazu mehr Details bringen.
Bei generativer KI zeigen auch kleine Schritte große Wirkung. Das Update 5.2 für den KI-Bildgenerator Midjourney bringt ein neues Werkzeug, mit dem man aus Bildern herauszoomen kann. Außerdem ändert sich die standardmäßige Bildästhetik.
Leinwand vergrößern
Einen neuen Befehl führt Midjourney 5.2 nicht ein. Am Anfang steht nach wie vor der Prompt über den Befehl /imagine. Midjourney präsentiert im Anschluss vier Varianten und darunter einen Satz Befehle: U1 bis U4 stellen jeweils eine Variante in höherer Auflösung bereit ("Upscaling"). V1 bis V4 erzeugen weitere Varianten.
Nach dem Upscaling erscheinen neue Menüpunkte unter dem Bild. Zum einen kann man das Bild variieren lassen. Über den Befehl „Zoom out“ lässt sich außerdem die Leinwand vergrößern. Dafür stehen zwei Schaltflächen mit den Werten 1.5 und 2 zur Verfügung. Der Parameter --zoom akzeptiert über die Kommandozeile Werte zwischen 1 und 2.
Im Resultat präsentiert Midjourney jeweils vier neue Varianten gewissermaßen aus größerem Betrachtungsabstand: Das vorige Motiv erscheint kleiner in der Bildmitte, an den Rändern erzeugt die KI mehr Details. Den Prozess kann man so oft wiederholen, wie man möchte.
Adobes aktuelle Betaversion von Photoshop enthält ein vergleichbares Werkzeug. Über „generatives Füllen“ kann die Bildbearbeitung den KI-Bildgenerator Adobe Firefly nutzen, um ebenfalls die Leinwand eines geladenen Bildes zu vergrößern. Im Unterschied zu Photoshop bearbeitet Midjourney nur selbst generierte KI-Bilder.
Midjourneys neuer Stil
Abgesehen davon ändert sich bei Midjourney mit Version 5.2 auch der Stil. Das aktuelle Modell verspricht laut Hersteller schärfere, detailreichere Bilder mit besseren Farben und Kontrasten.
Außerdem soll der Bildgenerator sensibler auf die Parameter --style und --stylize reagieren. Über „--style raw“ erzeugt Midjourney fotografisch anmutende Bilder. Weitere Varianten heißen „--style cute“, „--style scenic”, “--style original” und “--style expressive”.
Der Parameter --stylize oder --s beeinflusst, wie künstlerisch Midjourney Farben, Formen und Komposition gestaltet. Der Standardwert ist 100. Mit dem Wert Null bleibt Midjourney trocken und humorlos beim Prompt. Beim maximalen Wert 1000 löst sich der Bot vom Prompt und produziert künstlerische Ergebnisse.
Die Midjourney-Version 5.2 ist ab sofort bei dem KI-Bildgenerator voreingestellt. Über den Parameter --version oder --v kann man jedoch weiterhin ältere Versionen nutzen. Der Parameter akzeptiert derzeit die Werte 1, 2, 3, 4, 5, 5.1 und 5.2 (zu allen Midjourney-Befehlen und weiteren Prompt-Tipps siehe Praxisartikel in c’t 17/2023).
Preise und Verfügbarkeit
Midjourney 5.2 ist ab sofort verfügbar. Ein Abo kostet monatlich 11,90 US-Dollar und berechtigt zu 3,3 Stunden schneller GPU-Berechnung. Für 35,70 US-Dollar gibts 15 Stunden pro Monat. Sind sie aufgebraucht, kann man weitere für 4 US-Dollar pro Stunde hinzukaufen oder muss Geduld aufbringen. (akr)