KI-Update Deep-Dive: KI-Bildgeneratoren machen rapide Fortschritte

KI-Bildgeneratoren haben in den letzten Monaten enorme Entwicklungssprünge gemacht. Woran es weiterhin hakt besprechen wir in der neuen Podcast-Folge.

In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 2 Min.

Die Welt der KI-gestützten Bildgeneratoren entwickelt sich in atemberaubendem Tempo weiter. Noch vor zwei Jahren völlig unbekannt, gehören Namen wie Midjourney, Stable Diffusion und DALL-E heute bereits zum Mainstream. "Es gibt wahnsinnig viele Anbieter, aber am Ende steckt überall eine ähnliche Technologie dahinter", erklärt André Kramer, Experte für Fotografie und Bildbearbeitung bei c't. Er hat sieben Bildgeneratoren für das Magazin getestet.

In den letzten Monaten haben die Tools enorme Fortschritte gemacht, was Bildqualität und Umsetzung kreativer Ideen angeht. "Mittlerweile kann man auch unüblichere Motive generieren, zum Beispiel einen kranken Roboter, der von einem Arzt gepflegt wird", so Kramer. Dennoch offenbaren sich bei genauem Hinsehen immer noch typische Schwächen: "Zu viele Finger an einer Hand, krumme Linien, wo eigentlich Ecken sein sollten, und Probleme mit Schriftzügen."

Bei der Nutzerfreundlichkeit gibt es ebenfalls große Unterschiede. Während Midjourney primär über textbasierte Prompts gesteuert wird, bieten andere Anbieter wie Adobe Firefly oder Dream Studio mit dem dahinter liegenden Open-Source-Modell Stable Diffusion deutlich komfortablere Oberflächen. "Da kann man dann Seitenverhältnisse, Stile und andere Parameter einfach anklicken, was gerade Einsteigern entgegenkommt", meint der c't-Redakteur. "Wenn man einen eher nüchternen Stil bevorzugt, dann würde ich es vielleicht mal mit DALL-E oder Microsofts Copilot versuchen." Letzterer ist auch in Microsofts Bing integriert und kann dort kostenlos ausprobiert werden.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Ein zentrales Problem bleibt vorerst die rechtliche Grauzone der Trainingsdaten. "Es ist alles noch wilder Westen. Da laufen etliche Gerichtsverfahren, aber Präzedenzfälle gibt es noch nicht", warnt Kramer. Große Player wie Adobe Firefly und der iStock KI-Generator von Getty Images, die auf eigenes Bildmaterial zurückgreifen, sind hier klar im Vorteil und bieten auch Haftungsbeschränkungen für kommerzielle Kunden.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Insgesamt sieht der Experte die Entwicklung positiv, mahnt aber auch zur Vorsicht: "Man darf nicht vergessen, dass die Bildgeneratoren nur reproduzieren können, was sie aus Unmengen von Trainingsdaten gelernt haben. Echte Kreativität und Einzigartigkeit kommen nach wie vor vom Menschen." Dennoch ist Kramer überzeugt: "KI-generierte Bilder und Videos werden schon bald ein fester Bestandteil sowohl im privaten als auch im professionellen Bereich sein."

(igr)