KI-Bildgenerator: Wie man Stable Diffusion XL feintunen kann

Stable Diffusion XL gilt als bestes Open-Source-Text2Image-Modell. Innerhalb des Hugging-Face-Diffuser-Frameworks kann man das Modell mit Python feintunen.

Artikel verschenken

07.11.2023, 14:00 Uhr

Lesezeit: 14 Min.

iX Magazin

Von

Ramon Wartala

KI-Bildgenerator: Wie man Stable Diffusion XL feintunen kann
- Datenbasis
Feintuning mit DreamBooth LoRA
Malen im Web
Fazit

Bildgeneratoren, die Bilder aus Prompts erzeugen können – daher Text2Image-Modelle genannt – erfreuen sich nicht nur in den sozialen Medien großer Beliebtheit. Das eigene Konterfei in eine Barbie oder einen Ken zu verwandeln ist dank Diensten wie Bairbie.me oder Replicate längst für Centbeträge möglich. Im professionellen Umfeld hingegen geht es mittlerweile primär um die Kontrolle über die Bildausgabe der neuen Bilderzeugungstechnik. Denn in Anwendungsfeldern wie dem Marketing möchte man schließlich nicht irgendein Produktbild zeigen, das dem eigenen bloß ähnelt, sondern eines, das genau so aussieht wie das beworbene Produkt. Um das zu erreichen, kann man sich zurzeit noch nicht allein auf vortrainierte kommerzielle Modelle verlassen, so gut sie auch sein mögen. Man muss selbst Hand anlegen und das Modell feinjustieren – wofür sich Stability AIs Text2Image-Modell Stable Diffusion XL (SDXL) hervorragend eignet.

Seit Ende Juli 2023 ist Stable Diffusion XL 1.0 verfügbar. Im Gegensatz zu älteren Versionen besteht das Modell aus 3,5 Milliarden Parametern und kann Bilder bis zu einer Größe von 1024 × 1024 Pixeln erzeugen. Entwickler Stability AI hat das Modell auf GitHub als Open Source veröffentlicht, was dazu führte, dass die eigene Community in kurzer Zeit zahlreiche Blogartikel und YouTube-Videos zu SDXL veröffentlichte. Auch auf Portalen wie Civitai und Replicate entstanden viele Erweiterungen, die auf Basis verschiedener Motive und Stilrichtungen trainiert wurden.

Ramon Wartala ist Director Data Science bei Accenture Song in Hamburg. Als Berater entwirft und implementiert er mit seinem Team Datenarchitekturen für Machine-Learning-Lösungen seiner Kunden.

Im Folgenden soll gezeigt werden, wie sich SDXL mithilfe der Hugging-Face-Diffuser-Frameworks in Python feintunen und ausführen lässt. Dabei nutzt man das DreamBooth-Verfahren zum Training von Low-Rank-Adaptionen, kurz LoRAs.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Im Test: Reiseobjektive von Canon, Fujifilm, Nikon und Sony

Viele Fotografen müssen sich beim Gepäck einschränken. Wir geben einen Überblick, welche Objektive die Hersteller für eine Vielzahl an Motiven bereithalten.

Laden und Batterie: Warum Elektroautos billiger werden und weiter fahren

NMC- und LFP-Zellen werden vorerst dominant bleiben. Hier gibt es nur Feintuning. Das heißt aber nicht, dass nichts passiert: Anodenmaterialien verändern sich.

Linux-Workstation mit 96-Kern-ARM-Prozessor im Test

MIFcom integriert in seiner Workstation eine ARM-basierte Server-CPU von Ampere. Wir testen unter Ubuntu-Linux, für welche Aufgaben der Rechner geeignet ist.

Action-Akrobatik: So zockt sich "Assassin’s Creed Mirage" auf iPhone und iPad

Ubisofts "Assassin’s Creed Mirage" schickt Spieler in ein historisches und halsbrecherisches Abenteuer.

15 Monitore von 90 bis 220 Euro im Test

Ein neuer Monitor muss her, doch das Budget ist klein? Kein Problem! Wer die eigenen Anforderungen gut absteckt, muss keine faulen Kompromisse eingehen.

Monitor-Kaufberatung

Besseres Heimnetz dank alter Fritzbox: Router als Repeater recyceln (mit Video)

Wir zeigen, wie Sie einen noch halbwegs aktuellen AVM-Router als Repeater im heimischen Netzwerk und als DECT-Station weiter nutzen.

Fritzbox 7690 mit WiFi 7

nach oben

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}