KI-Bild-Generatoren: Standalone-App für Macs mit ARM-Prozessoren

DiffusionBee erzeugt auf Klick künstliche Bilderwelten und nutzt dazu das Projekt Stable Diffusion.

In Pocket speichern vorlesen Druckansicht 13 Kommentare lesen

Ein Beispiel eines an einem M1-Mac generierten Bildes.

Update
Lesezeit: 3 Min.

KI-basierte Bild-Generatoren sind faszinierend: Aus einem simplen "Prompt", der das Darzustellende in Worte fasst, stellen sie künstliche Fotos und sogar Malereien her. Mittlerweile gibt es eine ganze Reihe unterschiedlicher Algorithmen, die das können. Die Technik ist teilweise so gut, dass sie Kunstpreise gewinnt. Allerdings ist der Zugriff derzeit noch begrenzt. Manche Systeme gibt es nur für Entwickler, die meisten müssen jedoch per Website verwendet werden. Mac-Besitzer können nun einen der Bild-Generatoren, Stable Diffusion (SD), direkt auf ihrem Rechner ausprobieren – und das ohne Ausflug ins Terminal zur Installation, sondern als in sich geschlossene App.

Das Programm nutzt die Tatsache, dass SD als Open-Source-Projekt vorliegt und ist kostenlos erhältlich.Die App hört auf den Namen DiffusionBee. Entwickler Divam Gupta, der im Hauptberuf bei Meta arbeitet, hatte schon zuvor das One-Click-ML-Werkzeug Liner.ai publiziert. DiffusionBee läuft nur auf ARM-Macs und ist laut Gupta für M1- und M2-Maschinen optimiert. Die Installation nach dem Download ist dennkar einfach: Wenn das Programm gestartet wird, werden zunächst zwei vorkonfigurierte Modelle heruntergeladen. Diese nehmen einige Gigabytes auf der SSD in Anspruch, man sollte also etwas Platz gelassen haben.

Danach startet die App nach einer kurzen Initialisierung sofort. Die Nutzung erfolgt über die Eingabe eines Prompts in ein Textfeld. Das sollte in englischer Sprache erfolgen und kann auch durchaus "Verrücktes" sein, etwa unser obiger Hund in Form einer Giraffe. Die Beschreibung darf auch detailliert ausfallen, beispielsweise kann man den Hintergrund beschreiben oder auch das Genre des Bildes ("Comic", "photorealistic", "oil painting"). Anschließend läuft der Erstellungsprozess, der zwischen 30 Sekunden und rund einer Minute dauern kann; es sind auch Feineinstellungen möglich, die den Prozess gegebenenfalls beschleunigen oder verlangsamen.

Die maximale Bildauflösung liegt bei 768 mal 768 Bildpunkten und ist damit geringer als etwa beim beliebten Midjourney, das via Discord zur Verfügung steht. Für Experimente sollte man es zudem am besten bei den voreingestellten 512 mal 512 Bildpunkten belassen, da diese die Erstellungszeit noch im Rahmen halten. Erhöhbar sind weiterhin die Generierungsschritte (Steps) sowie die sogenannte Guidance Scale. Beides hat Auswirkungen auf das Endprodukt, verlängert aber die Generierung eines Bildes.

DiffusionBee verschlingt zudem sehr viel RAM – ein grundlegendes Merkmal von KI-Generatoren. Minimal sollte man 16 GByte im Mac haben, mehr Hauptspeicher ist aber durchaus angeraten. Entwickler Gupta empfiehlt, andere Anwendungen während des Erstellungsprozesses zu schließen, was DiffusionBee beschleunigen kann, weil dann mehr RAM zur Verfügung steht.

[Update 15.09.22 19:55 Uhr:] Mit CHARL-E steht ein weiterer SD-basierter Bild-Generator für den Mac zur Verfügung. Die App bietet mehr Einstellungsmöglichkeiten als DiffusionBee, wird dadurch aber auch etwas komplexer. Auch hier ist das gesamte notwendige Softwarepaket in eine App gepackt worden.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

(bsc)