c't 9/2023
S. 58
Titel
Stable Diffusion auf iPhone, iPad und Mac

KI veräppelt

Stable Diffusion auf Mac, iPhone und iPad nutzen

Die App „Draw Things“ berechnet KI-Bilder auf Apples Macs und Mobilgeräten. Damit entstehen skurrile Illustrationen und Bildkompositionen. Wir zeigen, was aktuell alles möglich ist.

Von Immo Junghärtchen

Mit „Draw Things: AI Generation“ kommt Stable Diffusion auf Ihr iPhone, iPad und auf Macs mit Apples M-Prozessoren. Die kostenlose App erzeugt auch unterwegs stimmungsvolle, skurrile und mit etwas Übung realistische Illustrationen. Dafür verwendet sie die gleichen Stability-AI-Modelle und bietet fast den gleichen Leistungsumfang wie ein auf einem Windows- oder Linux-Rechner installiertes Stable Diffusion WebUI im Browser – sie kann auch Bildelemente hinzuberechnen (Inpainting) und neuerdings dank der Erweiterung ControlNet Skizzen als Vorlage nutzen.

Die App selbst ist nicht sonderlich groß. Beim ersten Start sollte man allerdings eine schnelle Internetverbindung haben, denn die App lädt unter anderem das Standard-KI-Modell v1.5 von Hugging Face herunter. Insgesamt werden so knapp 2 GByte Speicher belegt.

Mit der App erkunden Sie spielerisch, wie eine künstliche Intelligenz Bilder berechnet. Zunächst geben Sie ein paar Begriffe auf Englisch in das hell unterlegte Textfeld im Fensterkopf ein und tippen auf „Generate“. Nach wenigen Sekunden bis Minuten – je nach Gerät – weicht das Schachbrettmuster der ersten KI-Grafik in der Auflösung 512 × 512 Pixel.

Draw Things bringt die Bilder-KI auf iPad, iPhone und Macs. Die Bedienoberfläche auf iPad und Mac lehnt sich weitgehend an das von Windows und Linux bekannte Stable Diffusion WebUI an.
Draw Things bringt die Bilder-KI auf iPad, iPhone und Macs. Die Bedienoberfläche auf iPad und Mac lehnt sich weitgehend an das von Windows und Linux bekannte Stable Diffusion WebUI an.

Entspricht das Ergebnis nicht den eigenen Vorstellungen, und das passiert recht oft, lohnt ein zweiter Anlauf: Ein Tipp oder Klick auf die rot unterlegte Zahl ganz oben erzeugt einen neuen zufälligen Startpunkt (Seed). Das Ergebnis sieht meist ganz anders aus. Der Regler „Batch Size“ automatisiert das: Ziehen Sie ihn nach rechts, um denselben Prompt bis zu viermal hintereinander mit unterschiedlichen Ausgangs-Seeds auszuprobieren.

Zugespitzt

Wollen Sie bestimmte Elemente in Ihrer Grafik vermeiden, etwa Autos aus einer Straßenszene verbannen, nutzen Sie den Negativ-Prompt: Ein zweites, dunkel hinterlegtes Textfeld nimmt Begriffe auf, die auf das Bild nicht zutreffen sollen. Am iPhone wischen Sie dafür einmal von rechts nach links über das helle Texteingabefeld.

Das Regler-Symbol oben rechts öffnet am iPhone den Einstellungsdialog, um den Algorithmus zu tunen – auf iPad und Mac sieht man ihn dauerhaft links von der Bildvorschau. Verschiedene Regler und Auswahlfelder stehen bereit, nebst englischer Erklärungen. Wirkt das Bild schon ganz gut, aber in Details noch etwas unfertig, schieben Sie den Steps-Regler vom voreingestellten 20 auf einen höheren Wert, etwa 30 oder 40. Die KI rechnet dann entsprechend länger, korrigiert aber häufig Fehler in Bildern.

Wer mit diesen Mitteln keine brauchbaren Bilder bekommt, kann mit dem Schieberegler „Text Guidance“ experimentieren. Je weiter Sie den Regler nach links ziehen, desto mehr Freiheiten erlaubt sich die KI bei der Textinterpretation. Ebenso einfach wechseln Sie auf einen anderen Sampler. „Euler Ancestral“ beispielsweise erzeugt detailreichere, manchmal surreale Bilder, braucht aber fünfzig oder mehr Einzelschritte für ein überzeugendes Resultat.

Draw Things legt automatisch eine Historie an. Per Schieberegler unter dem Vorschaubild des iPhones wechselt man zu früheren Varianten, um sie als Ausgangspunkt für einen neuen Anlauf zu wählen. Auf iPad und Mac erscheint die Chronik rechts neben der Motivvorschau.

Im Voreinstellungsdialog kann man auch einen Zielordner bestimmen. Jede erfolgreich generierte Grafik landet dann dort. Besonders hilfreich: Der Dateiname besteht aus Prompt und Seed, um die Grafik auf leistungsfähigerer Hardware noch einmal neu zu berechnen. Dabei können Sie noch einen Upscaler dahinterschalten, um die eher niedlichen erlaubten Auflösungen nachträglich aufs bis zu Sechzehnfache aufzublasen.

Andere Ausgangsbasis

Draw Things kann mit mehreren KI-Modellen arbeiten, einige lassen sich im Drop-Down-Menü „Model“ mit nur einem Klick herunterladen und hinzufügen. Neben verschiedenen Versionsnummern des Stability-Standard-Modells stehen auf bestimmte Stilrichtungen trainierte Modelle zur Auswahl: „Papercut“ zum Beispiel erzeugt Grafiken, die wie aus Scherenschnitten zusammengesetzt erscheinen, das Modell „Ghibli“ setzt Prompts im Heidi-Zeichentrick-Stil um und „Inkpunk“ erzeugt Bilder, die aus einem Spiel der Borderlands-Reihe stammen könnten.

Neben den standardmäßig angebotenen Modellen können Sie auch eigene hinzufügen, etwa von DreamBooth erzeugte persönliche Modelle. Dafür laden Sie die Pickle- oder SafeTensors-Datei aufs iOS-Gerät und bewegen sie in der Dateien-App in den Ordner „auf meinem iPhone/Draw Things/Downloads“. Öffnen Sie dann in der App den Models-Dialog, importieren Sie es über „Customize …“ – danach steht es in der Liste der Modelle bereit.

Besonders praktisch ist die Inpainting-Funktion: Will man an einem Bild nur ein kleines Detail ändern, etwa eine Hand mit überzähligen Fingern oder ein schielendes Auge, löscht man dieses Detail mit dem Radiergummi-Werkzeug, um dann nur diesen Bereich neu berechnen und mit etwas Glück den Fehler beheben zu lassen. Von manchen KI-Modellen stehen speziell dafür trainierte Inpainting-Modelle zum Download bereit.

So bekommen Sie übrigens auch schnell Details in einem Foto heraus- oder hineinretuschiert: Über den Kamera-Button laden Sie ein Bild, radieren ein Bildteil aus, beschreiben, was Sie sich vorstellen, im Prompt-Feld, und das Inpainting-Modell füllt die Lücke.

Mit der Inpainting-Funktion erfindet Draw Things zusätzliche Bildelemente und übermalt überflüssige.
Mit der Inpainting-Funktion erfindet Draw Things zusätzliche Bildelemente und übermalt überflüssige.

Wie läufts?

Wie schnell ein Bild fertig berechnet wird, entscheiden Prozessor und RAM des Geräts. Eine Grafik mit den Standardeinstellungen und einer Größe von 512 × 512 Pixeln zu berechnen, dauert auf einem iPhone 12 Pro Max mit A14-Bionic-Chip 67 Sekunden. Auf einem iPad Pro 2017 mit A12X-Prozessor waren es 112 Sekunden. Überfordert man das Gerät, etwa durch zu hohe Auflösungen oder exzessive Berechnungsschritte, stürzt die App gelegentlich auch ab. Wechselt man am iPad in den Prozessoreinstellungen auf CoreML-Berechnung, erzeugt ein aktuelles iPad Pro mit M2-SoC dasselbe Bild in nur 17 Sekunden. Dabei braucht das Gerät ordentlich Energie und reduziert bei jeder Bilderzeugung die Akkukapazität um einige Prozent.

Die Prozessoreinstellungen erlauben höhere Geschwindigkeiten auf aktuellen iPhones und iPads.
Die Prozessoreinstellungen erlauben höhere Geschwindigkeiten auf aktuellen iPhones und iPads.

Die Bilder, die Draw Things berechnet, sind nicht sehr hoch aufgelöst, mehr als 1200 × 600 Pixel unterstützt die App nicht. Doch für eine schnelle Grafik fürs Web oder die spaßige Retusche zwischendurch liefert Draw Things auf der iOS-Plattform genügend Leistung. Vor allen Dingen erlaubt die App, sich spielerisch an die Bilder-KI Stable Diffusion heranzutasten. (imj@ct.de)

Die Erweiterung ControlNet erlaubt es, Skizzen etwa aus der Notizen-App als Vorlagen für die Bilderzeugung zu nutzen.
Die Erweiterung ControlNet erlaubt es, Skizzen etwa aus der Notizen-App als Vorlagen für die Bilderzeugung zu nutzen.

Kommentieren