Wie KI-Bild- und Textgeneratoren die Kreativ-Branche umkrempeln

2022 haben Bild- und Textgeneratoren das Internet erobert. Das ist der Beginn einer KI-Revolution, die mehr als hübsche Bilder generiert.

Artikel verschenken

3

Für diesen Text schuf der Digitalkünstler Erik Carter mit DALL-E 2 Bilder im Stil von Science-Fiction-Filmen der 1970er-Jahre. Dies ist "ein Künstler, der Kunst mit Hilfe eines KI-Tools erzeugt, im Setting des Films Alien".

(Bild: Dall-e 2 / MIT Technology Review)

02.03.2023, 08:15 Uhr

Lesezeit: 14 Min.

MIT Technology Review

Von

Will Douglas Heaven

Wie KI-Bild- und Textgeneratoren die Kreativ-Branche umkrempeln
Eine magische Revolution
Das Innere der Blackbox
Begrenzte Kreativität
Hilfreiche Assistenten

Ende 2021 spielte ein kleines Team von Forschern in den Büros von OpenAI in San Francisco mit einer Idee herum. Sie hatten eine neue Version eines Text-Bild-Modells entwickelt. DALL-E ist eine KI, die kurze schriftliche Beschreibungen in Bilder umwandelt: einen von Van Gogh gemalten Fuchs vielleicht oder einen Corgi aus Pizza. Jetzt mussten sie nur noch herausfinden, was sie damit anfangen könnten.

Als sie an dem Modell tüftelten, wurde allen Beteiligten schnell klar, dass dies etwas Besonderes war. Aber niemand konnte vorhersehen, wie viel Aufsehen dieses Produkt erregen würde. "Dies ist die erste KI-Technologie, bei der normale Menschen Feuer und Flamme sind", sagt Sam Altman, Mitbegründer und CEO von OpenAI.

Dall-E 2 wurde im April 2022 veröffentlicht. Im Mai kündigte Google zwei eigene Text-zu-Bild-Modelle an (ohne sie jedoch zu veröffentlichen): Imagen und Parti. Dann kam Midjourney, ein Text-zu-Bild-Modell für Künstler. Und im August machte das britische Start-up Stability AI das Open-Source-Modell Stable Diffusion kostenlos der Öffentlichkeit zugänglich.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

, Copyxspace, stock.adobe.com / heise medien

USB-C: Warum Sie eigentlich immer das falsche Kabel anschließen

Das richtige Kabel für USB-C-Verbindungen zu finden, ist ein Glücksspiel: Das eine lädt zu langsam, beim anderen kriechen die Daten im Schneckentempo. Was tun?

Arbeitsagentur: Wenn die Anmeldung zur Arbeitslosigkeit am System scheitert

Wer Mitmenschen beim digitalen Behördengang unterstützen will, wird von arbeitsagentur.de in den Wahnsinn getrieben. Ein Leidensbericht.

Tschüss, Big Tech: Gmail-Postfach exportieren und E-Mails löschen

Sie haben Ihren E-Mail-Anbieter gewechselt? Dann müssen Sie jetzt noch Ihren Datenschatz aus dem alten Postfach heben. Wir erklären, wie das geht.

Sony FE 100 mm F2.8 Makro GM OSS im Test: Highend-Optik für extreme Nahaufnahmen

Das neue Sony Makro überzeugt mit enormer Vergrößerung, schnellem Autofokus und starker Schärfe. Wir zeigen, wie gut es im Labor abschneidet.

Eine Radarkontrolle fürs Büro selber bauen

Dein Büroflur wird zur Tempo-10-Zone. Diese Radarfalle verhindert heimliche Bürostuhlrennen oder hektische Druckersprints auf dem Gang

KI-Grafik: Real gewordener OpenClaw-Bot arbeitet mit Schraubenschlüssel in der Hand am System.

OpenClaw im Selbstversuch: Erste Schritte mit dem Super-KI-Agenten

OpenClaw macht aus LLMs eigenständige Helfer: Sie senden Mails, schreiben Skripte und erledigen komplexe Aufgaben. Wir haben das in sicherer Umgebung probiert.