Bilder erstellen mit KI: Bild-Generatoren im Vergleich
7 Tools für die KI-gestützte Bilderzeugung
| 💡 Das Wichtigste in Kürze |
|
Der Geist der Künstlichen Intelligenz ist aus der Flasche, und wie es sich für einen echten Dschinn gehört, erfüllt er Wünsche. Im Fall von Bild-KIs reicht es aus, einfach per Text-Prompt zu beschreiben, was für ein Bild man sich wünscht – und wie durch Zauberhand wird es in kürzester Zeit generiert. Damit sind KI-Systeme eine schnelle und kostengünstige Alternative zu Fotografen oder Stockfoto-Diensten, etwa bei Cliparts für Anzeigen oder private Einladungskarten.
Hinter allen KI-Systemen stecken sogenannte Large-Language-Models (LLM): Ausgeklügelte Algorithmen analysieren die Texteingabe und greifen anschließend auf enorme Trainings-Datenbanken zurück, um aus Vorhandenem etwas Neues zu erstellen. Das benötigt erheblichen Rechenaufwand, und der kostet die Betreiber Geld in Form von Serverfarmen. Derartige Tools sind deshalb in der Regel kostenpflichtig. Kostenlose KI-Bildgeneratoren limitieren die Nutzung stark oder sind primär als Testversionen für kostenpflichtige Angebote gedacht.
Noch sind die Bild-KI-Systeme allerdings fehlbar: Zwar werden sie mit jedem Update besser, doch mangelt es der KI schlicht an Verständnis dessen, was sie da eigentlich macht. Dadurch entstehen nicht selten bizarre Fehler, die besonders bei Bildern mit Händen oder Schrift auftreten.
Auch können Beschränkungen durch das Marken- oder Persönlichkeitsrecht verhindern, dass ein Bild wie gewünscht erstellt wird. Dann ist den Anbietern mitunter schlicht verboten, bestimmte Personen oder Produkte abzubilden.
Bild-Generierung mit KI: 7 Möglichkeiten im Vergleich
Aller Einschränkungen zum Trotz sind Bild-KIs praktische Werkzeuge, um tolle Fotos, Grafiken und Bilder für jeden Zweck zu erstellen. Wir stellen im Folgenden sieben empfehlenswerte KI-Bildgeneratoren vor und nennen deren Stärken sowie Schwächen.
| Anbieter in diesem Beitrag |
|
Pixlr: Preiswerter und einsteigerfreundlicher KI-Bildgenerator
Der Bildgenerator Pixlr bietet Vorlagen für verschiedene Grafikstile, von Anime über Foto bis Pixelkunst. Zudem gibt es Auswahlfelder für Farb- und Beleuchtungsstile sowie die Bildkomposition und -format. Insgesamt ist das Tool auch für Einsteiger sehr gut beherrschbar.
(Bild: Screenshot)
Die Bilderstellung ist schon im Gratis-Tarif ausgesprochen schnell, die Treffsicherheit lässt allerdings stellenweise zu wünschen übrig: Während Grafiken meist unproblematisch sind, tut sich der Generator bei Fotos schwerer. Umso praktischer ist daher die Remix-Funktion, die auf Basis eines bereits generierten oder hochgeladenen Bildes ein neues Werk erstellen kann. Hilfreich ist auch die Option „negativer Prompt“, die dabei hilft, Bildelemente direkt bei der Generierung zu vermeiden, etwa wenn ein Strandmotiv erstellt werden soll, aber keine Palmen im Bild erscheinen sollen.
Im Gratis-Tarif nach Anmeldung gibt es 50 Credits, die für zwölf Generierungen ausreichen (vier Credits für je vier Bilder). Guthaben in Form von 200 Credits kann jederzeit für 2,99 € nachgekauft werden. Alternativ gibt es preiswerte Abo-Modelle mit 80 bis 1000 monatlichen Credits, die häufig rabattiert angeboten werden.
|
Vorteile
|
Nachteile
|
Fazit: Pixlr ist eine gute Wahl für KI-Einsteiger, die ohne tiefe Beschäftigung mit der Materie schöne Ergebnisse erzielen wollen. Der Dienst hilft Anwendern, wo er kann, und besitzt ein preiswertes und flexibles Tarifsystem.
➤ Pixlr7 Tage gratis testen
ChatGPT 4o: Hervorragende Bildgenerierung zum Premium-Preis
Mit dem aktuellen Modell 4o kann ChatGPT nun auch Bilder erstellen – und greift dabei nicht mehr auf das veraltete Dall-E3-Modell zurück, sondern auf eine eigene Lösung. Durch diese Verknüpfung zwischen Text- und Bild-KI ist ChatGPT sehr fortschrittlich und in der Lage, auch komplexe Inhalte wie Comicstrips mit verschiedenen Panels und Sprechblasen, Fotos mit Textinhalten oder textlastige Schaubilder zu erstellen. Probleme, die viele KIs bei der Text-Generierung und der Konsistenz der generierten Inhalte haben, treten dadurch nur noch vereinzelt auf.
(Bild: Screenshot)
Voraussetzung für die erfolgreiche Erstellung dieser komplexen Inhalte ist allerdings, dass der Anwender sich ein wenig mit Prompt-Design auskennt: Wer der KI einfach nur einen Halbsatz zuspielt, wird nicht die gewünschten Ergebnisse erhalten. Zum Glück beherrscht ChatGPT Kontext, wodurch bereits generierte Bilder schrittweise per Prompt verbessert werden können.
Allerdings hat das Ganze seinen Preis: Wer die Bild-Generierung im Gratis-Modus testet, hat nur sehr wenige Bilder zur Verfügung, denn OpenAI limitiert das monatliche Kontingent, deshalb ist bei ChatGPT das Plus-Abo für rund 23 € pro Monat eigentlich Pflicht.
|
Vorteile
|
Nachteile
|
Fazit: Wer jederzeit die neueste und beste KI zur Hand haben will, kommt am recht teuren ChatGPT kaum vorbei. Die neue Bild-Generierung liefert hervorragende Ergebnisse.
➤ ChatGPT-4oZum Anbieter
Adobe Firefly: Lebensechte Bilder durch Stockfotos
Adobes Bildgenerator-KI Firefly* ist eine recht ausgeklügelte KI, die viele verschiedene Bildstile unterstützt. Der große Vorteil des Dienstes ist, dass Adobe die eigenen Stock-Foto-Bestände aus Adobe Stock zum Training verwenden kann: Dadurch sind vorrangig „Standardmotive“ aus der Stock-Fotografie in kürzester Zeit erstellt. Möglich wird das durch die sparsame Generierung: Zunächst werden Bilder nur mit 512 x 512 Pixeln ausgegeben, besondere Ergebnisse können aber hochskaliert werden. Zudem gibt es die Möglichkeit, Text und Bild zu ergänzen und sogar Videos aus den Fotos generieren zu lassen.
Auf den ersten Blick sehen die Ergebnisse meist brillant und lebensecht aus, auf den zweiten Blick springen jedoch Bildfehler und Generierungs-Artefakte ins Auge: Diese können aber mit dem Generativ Füllen-Tool (oder Photoshop) korrigiert werden. Das Tool kommt je nach Motiv aber schnell ins Straucheln und „zermatscht“ das Motiv.
(Bild: Screenshot)
Schön an Adobe Firefly ist die hohe Geschwindigkeit: Ein Satz mit vier Bildern wird binnen weniger Sekunden erstellt. Ebenfalls gut gelöst ist die Werkzeugleiste, mit der Anwender sehr präzise festlegen können, welchen Stil, Tonalität, Lichtverhältnisse und Effekte im Bild zu sehen sein sollen. Sogar der Kamerawinkel kann auf diese Weise angegeben werden. Das funktioniert natürlich alles auch direkt per Prompt, durch die Schalter sorgen die Nutzer aber dafür, dass konsistente Ergebnisse ausgegeben werden.
|
Vorteile
|
Nachteile
|
Fazit: Adobe Firefly* ist eine leistungsstarke Bild-KI. Durch den Rückgriff auf die Stockfoto-Bibliothek liefert der Dienst lebensechte Ergebnisse, die aber Artefakte aufweisen können.
➤ Adobe Firefly*Zum Anbieter
Dall-E3: Der flotte Klassiker
Als vor einigen Jahren die KI-Revolution durch OpenAI begann, war Dall-E einer der ersten öffentlich verfügbaren KI-Bildgeneratoren überhaupt. Schnell folgte Version 2, Ende 2023 dann Dall-E3, das leistungsfähig genug war, um Fake-Fotos zu erstellen. Das Modell Dall-E3 ist seither in ChatGPT-4 (dem Vorgänger von "-4o“) enthalten. Microsoft integrierte das Tool eilends im Bing Image Creator, auch andere preiswerte oder kostenlose KI-Dienste greifen auf Dall-E2 oder Dall-E3 zurück.
(Bild: Screenshot)
In der schnelllebigen KI-Welt ist Dall-E3 mit über 1,5 Jahren seit Erscheinen zwar schon recht alt – die Ergebnisse können sich aber nach wie vor sehen lassen. Typische KI-Bildfehler, wie sie noch in Dall-E2 und anderen zeitgenössischen Generatoren häufig auftraten, sind hier kaum noch zu finden, allerdings tut sich der Generator mit Fotorealismus schwer.
Dafür hat Dall-E3 den großen Vorteil, dass es deutlich schneller als der omnimodale, direkt in ChatGPT integrierte Bildgenerator seit ChatGPT 4o ist: Wer Dall-E3 nutzen will, benötigt daher auch einen Plus-Account bei OpenAI oder muss zu einem Drittanbieter wie Microsoft greifen.
|
Vorteile
|
Nachteile
|
Fazit: Dall-E3 ist zwar „veraltet“, aber dennoch ein sehr leistungsstarker Bildgenerator. Er arbeitet deutlich schneller in ChatGPT als sein tief in GPT-4o integrierter Nachfolger.
➤ Dall-EZum Anbieter
Midjourney: Tipp für künstlerische Grafiken
Midjourney ist der große Mitbewerber zu Dall-E3 und lieferte bereits früh eindrucksvolle Ergebnisse. Vor allem im künstlerischen Bereich hat die KI viele Freunde. Der Vorteil ist die hohe Qualität und Geschwindigkeit des Modells, zudem setzt Midjourney schon seit Beginn stark auf den Community-Gedanken: Anfangs war der Dienst nur via Discord erreichbar, inzwischen gibt es wenigstens eine eigene Website. Durch die aktive Teilnahme und Bewertung der Benutzer ist es Midjourney möglich, besonders zuverlässige Bildgenerationen anzubieten.
(Bild: Screenshot)
Midjourney ist hauptsächlich durch seine Fähigkeit, atmosphärisch dichte Bilder zu erstellen, bekannt geworden. Das Modell – aktuell v7 – ist in der Lage, Bilder zu modellieren, die gleichzeitig realistisch und künstlerisch aussehen. Generierte Bilder erinnern in ihrer Farbenpracht, Detailtiefe und Atmosphäre oft ein wenig an den Stil der Luc-Besson-Filme „Das 5. Element“ und „Valerian“, ohne diesen Stil tatsächlich zu kopieren. Neben fotorealistischen Bildern beherrscht Midjourney aber natürlich auch alle anderen gängigen Stile, doch die Leistung bei „Fotografien“ ist besonders eindrucksvoll.
Schön ist, dass neben dem eigentlichen Bildgenerator auch ein Editor für die KI-Bilder an Bord ist. Zudem laufen auf der Website Feed mit den neuesten Generierungen der Community, in denen sich Nutzer Inspiration und Hilfe holen können. Tägliche „Themen“ vertiefen bestimmte Motive, wodurch es Spaß macht, Midjourney auch dann zu benutzen, wenn man gerade kein Bild erstellen möchte.
|
Vorteile
|
Nachteile
|
Fazit: Midjourney ist die erste Wahl, wenn es darum geht, künstlerische Bilder mit eigenem Stil per KI zu generieren. Auch Grafikdesigner können die KI für ihre Arbeit nutzen.
➤ MidjourneyZum Anbieter
Gemini / Imagen: Kostenloser KI-Bildgenerator mit Gedächtnisschwäche
Obwohl Google federführend bei vielen Anwendungen im Netz ist, hat sich der Alphabet-Konzern erst recht spät dem KI-Thema gewidmet. Erste Versionen des Gemini-Bildgenerators Imagen waren derart zensiert und politisch korrekt, dass Gemini zu einem eigenen Meme wurde.
Doch Google hat nachgebessert und liefert inzwischen gute Ergebnisse bei der Bild-Generierung. Wie bei den meisten großen Bild-KIs verhindern Marken- und Persönlichkeitsrechte so manch korrekte Generierung, zudem kommt es bei Gemini gelegentlich noch deutlich zu Artefakten. Prompts werden nicht immer korrekt umgesetzt oder missverstanden.
(Bild: Screenshot)
Obwohl die Google-KI funktional durchaus mit ChatGPT vergleichbar ist, ist die Kontext-Funktion eingeschränkt. Bittet man Gemini etwa, einem Bild noch ein Detail beizufügen – etwa Peperoni auf dem Bild einer Pizza – generiert das System das Bild komplett neu. Das Ergebnis ist ein gänzlich anderes Motiv, bei dem das Gewünschte sogar fehlen kann. Hier muss Google an der Kontext-Fähigkeit schrauben.
Dafür hat Gemini den Vorteil, dass das Basis-System unbeschränkt und kostenlos nutzbar ist. Wer mehr möchte, muss auf Gemini Advanced umschwenken.
|
Vorteile
|
Nachteile
|
Fazit: Gemini mit Imagen ist ein gutes Tool, um kostenlos KI zu testen. Die Ergebnisse sind gut, Googles KI schwächelt jedoch bei Folge-Prompts.
➤ Imagen | GeminiZum Anbieter
Leonardo: Benutzerfreundliche Midjourney-Alternative
Wie schon Midjourney bedient auch Leonardo.ai primär Nutzer, die Bilder und Grafiken in einem besonders kunstvollen Stil erstellen möchten. Dabei sticht der Dienst durch seine enorme Nutzerfreundlichkeit hervor: Neben der eigentlichen Bild-Generierung gibt es eine Reihe von Möglichkeiten, einmal erstellte Bilder zu ergänzen, zu verändern oder zu manipulieren.
(Bild: Screenshot)
Technisch basiert Leonardo auf dem Open-Source-System von Stable Diffusion. Dieses wurde vom australischen Anbieter verbessert und mit eigenen Trainingsdaten unterlegt, wodurch die Ergebnisse tatsächlich deutlich besser sind als beim Original. Allerdings weist Leonardo deutliche Schwierigkeiten bei fotorealistischen Motiven auf: So wirkt etwa menschliche Haut sehr verwaschen, wie man es auf einem modernen Ölgemälde erwarten würde. Deutlich besser gibt sich das Tool bei Bildern, die keinen Realismus beinhalten, etwa Grafiken oder Comic-Stile.
Ein besonderes Feature ist die Realtime-Canvas: Hier können Nutzer mit der Maus etwas zeichnen, die KI setzt es direkt in ein mehr oder weniger brauchbares Bild um. Praktisch ist zudem die Inpaint-Funktion, mit deren Hilfe Bild-Details aktiv überarbeitet werden können. Es gibt außerdem einen Upscaler zur Vergrößerung von Bildern und sogar eine Video-Funktion. Insgesamt gibt sich Leonardo.ai dadurch als sehr praktisches Allround-Tool für die Generierung künstlerischer Grafiken in KI.
|
Vorteile
|
Nachteile
|
Fazit: Leonardo.ai ist eine gute Alternative zu Pixlr oder Midjourney. Vor allem bei Grafiken und Zeichnungen ist das Tool extrem stark.
➤ Leonardo.aiZum Anbieter
Fazit
Unser Bildgenerator-Test zeigt: Vor allem bei der Leistung für bestimmte Motivtypen unterscheiden sich die Bild-KIs teilweise deutlich. Während etwa ChatGPT-4o und Adobe Firefly* sich bei fotorealistischen Bildern hervorheben, sind Pixlr, das von Leonardo.ai eingesetzte Stable Diffusion, Midjourney oder Dall-E3 vorwiegend bei Grafiken stark. Viele praktische Tools zur Verfeinerung der Bilder finden sich bei Pixlr, Firefly und Leonardo. Google Imagen ist zwar kostenlos und schafft Fotorealismus, tut sich aber beim Kontext sehr schwer. Dall-E3 bildet technisch gesehen derzeit das Schlusslicht, was auch daran liegt, dass OpenAI das Modell nicht mehr wirklich pflegt.
Preislich liegen alle Modelle auf einem ähnlichen Niveau: Gemini ist in der Basisversion kostenlos. Pixlr ist sehr günstig (2,99 € / 200 Credits), Midjourney verhältnismäßig teuer (10 US-$ plus Mehrwertsteuer für 200 Credits / Monat), volle Leistung gibt es erst ab dem Pro-Plan für 60 US-$ / Monat. Alle anderen Dienste liegen dazwischen. ChatGPT Plus (20 US-$ + MwSt.) bietet sich als guter Allrounder für Nutzer an, die hauptsächlich eine Text-KI benötigen und nur gelegentlich Bilder generieren.
* Mit einem Stern markierte Links sind Affiliate-Links, für die wir unter Umständen eine Provision erhalten. Der Kaufpreis erhöht sich dadurch nicht!
Redaktion & Aktualisierung: heise Download-Team
Kommentare
{{line}}