c't 11/2024
S. 124
Praxis
Bild-KIs: Detailreiche Bilder

Bildentwicklung

Mit Stable Diffusion große, detailreiche Bilder erzeugen

Um mit der Bilder-KI Stable Diffusion große Bilder zu erzeugen, benötigen Sie nicht nur viel Grafikkartenspeicher. Modelle mit einer höherer Trainingsauflösung ermöglichen höhere Auflösungen. Alternativ können Sie mit Outpainting kleine Bilder vergrößern und per Inpainting zusätzliche Details ergänzen.

Von Mirko Dölle

Schon wenige Worte genügen in Stable Diffusion, um beeindruckend detailreiche Bilder zu erzeugen. Doch die Auflösung des Standardmodells ist begrenzt, die Version 1.5 wurde mit Bildern im Format von lediglich 512 × 512 Pixeln trainiert. Zwar können Sie auch größere Bilder erzeugen lassen, doch mit zunehmender Auflösung neigt das Standardmodell dazu, den zusätzlichen Platz mit sich wiederholenden Motiven, zusätzlichen Körperteilen oder mehrfach ineinander verschachtelten Figuren zu füllen. Mit speziellen, bereits trainierten Modellen, den sogenannten Checkpoint-Modellen, und Zusatzfunktionen des Stable Diffusion Web UI können Sie trotzdem bildschirmfüllende Grafiken in hoher Detailtiefe erzeugen.

Die Auflösung der Trainingsdaten ist ausschlaggebend dafür, bis zu welcher Bildgröße Sie ein Checkpoint-Modell sinnvoll nutzen können. Beim Standardmodell Version 1.5 von StabilityAI zum Beispiel hatten die Trainingsbilder nur 512 × 512 Pixel, die besten Ergebnisse erhalten Sie deshalb bei dieser Auflösung. Je weiter Sie über die Trainingsauflösung hinausgehen, desto mehr Unfug stellt Stable Diffusion an. Dennoch können Sie Glück mit dem Initialisierungswert der Zufallsgeneratoren (Seed) haben und bei vielen Durchläufen mit dem gleichen Prompt auf ein ansehnliches Ergebnis ohne größere Fehler stoßen – es wird nur unwahrscheinlicher.

Kommentieren