Wie KI-Bild- und Textgeneratoren die Kreativ-Branche umkrempeln

2022 haben Bild- und Textgeneratoren das Internet erobert. Das ist der Beginn einer KI-Revolution, die mehr als hübsche Bilder generiert.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Für diesen Text schuf der Digitalkünstler Erik Carter mit DALL-E 2 Bilder im Stil von Science-Fiction-Filmen der 1970er-Jahre. Dies ist "ein Künstler, der Kunst mit Hilfe eines KI-Tools erzeugt, im Setting des Films Alien"., Dall-e 2 / MIT Technology Review

Für diesen Text schuf der Digitalkünstler Erik Carter mit DALL-E 2 Bilder im Stil von Science-Fiction-Filmen der 1970er-Jahre. Dies ist "ein Künstler, der Kunst mit Hilfe eines KI-Tools erzeugt, im Setting des Films Alien".

(Bild: Dall-e 2 / MIT Technology Review)

Lesezeit: 14 Min.
Von
  • Will Douglas Heaven
Inhaltsverzeichnis

Ende 2021 spielte ein kleines Team von Forschern in den Büros von OpenAI in San Francisco mit einer Idee herum. Sie hatten eine neue Version eines Text-Bild-Modells entwickelt. DALL-E ist eine KI, die kurze schriftliche Beschreibungen in Bilder umwandelt: einen von Van Gogh gemalten Fuchs vielleicht oder einen Corgi aus Pizza. Jetzt mussten sie nur noch herausfinden, was sie damit anfangen könnten.

Mehr zu ChatGPT und KI-Textgeneratoren

Als sie an dem Modell tüftelten, wurde allen Beteiligten schnell klar, dass dies etwas Besonderes war. Aber niemand konnte vorhersehen, wie viel Aufsehen dieses Produkt erregen würde. "Dies ist die erste KI-Technologie, bei der normale Menschen Feuer und Flamme sind", sagt Sam Altman, Mitbegründer und CEO von OpenAI.

Dall-E 2 wurde im April 2022 veröffentlicht. Im Mai kündigte Google zwei eigene Text-zu-Bild-Modelle an (ohne sie jedoch zu veröffentlichen): Imagen und Parti. Dann kam Midjourney, ein Text-zu-Bild-Modell für Künstler. Und im August machte das britische Start-up Stability AI das Open-Source-Modell Stable Diffusion kostenlos der Öffentlichkeit zugänglich.