Bilder mit KI erstellen: DALL-E startet kostenpflichtige Betaphase

Eine Millionen Interessierte will OpenAI für die Beta des KI-Systems einladen, das Bilder auf der Basis von Textbeschreibungen generiert.

In Pocket speichern vorlesen Druckansicht 22 Kommentare lesen

Zwei Ergebnisse zu "A bowl of soup as a planet in the universe as digital art"

(Bild: OpenAI)

Lesezeit: 3 Min.
Von
  • Rainald Menge-Sonnentag

OpenAI hat offiziell die Betaphase für DALL-E eröffnet. Das KI-System erstellt Bilder anhand von Beschreibungen und kann vorhandene Bilder auf der Basis von Texteingaben verändern. Der Projektname ist ein Kofferwort aus dem Nachnamen des spanischen Künstlers Salvador Dali und dem Titel des Pixar-Films "WALL-E".

Zum Start der Beta hat OpenAI angekündigt, eine Millionen Interessierte von der Warteliste in den kommenden Wochen in das Programm einzuladen. Bisher hatte nur eine begrenzte Zahl von Usern Zugriff.

Mit der weiteren Öffnung des Systems endet auch die vollständig kostenlose Probephase. In der Beta erhalten User im ersten Monat 50 und in den Folgemonaten jeweils kostenfrei 15 Credits. Mit einem Credit erhalten sie vier Bilder anhand einer Texteingabe. Alternativ können sie hochgeladene oder von DALL-E erstellte Bilder mit Textbeschreibungen verändern oder Variationen des ursprünglichen Bilds generieren. Dabei erhalten sie jeweils drei Resultate für ein Credit.

Das Bild entstand mit dem Befehl "Faust as Super Mario and Mephistopheles as Wario, photorealistic".

(Bild: Vladimir Alexeev)

Wer weitere Inhalte generieren oder verändern möchte, kann 115 Credits für 15 US-Dollar kaufen. Parallel zum kostenpflichtigen Angebot gibt OpenAI die bisher untersagte kommerzielle Nutzung frei. User dürfen die von DALL-E erstellten Bilder unter anderem für Illustrationen, Newsletter oder Spielecharakter verwenden. Das gilt auch rückwirkend für die während der Previewphase erstellten Werke.

OpenAI weist in dem Blogbeitrag zum Betastart erneut auf die Vorsichtsmaßnahmen und Regeln für den Einsatz von DALL-E hin. Das Hochladen realistischer Portraits oder der Versuch, bekannte Persönlichkeiten nachzustellen, ist ebenso untersagt wie die Darstellung von Gewalt, politischen oder sexuellen Inhalten. Auf technischer Seite soll ein Filter das Hochladen entsprechender Inhalte blockieren. Erst vor Kurzem hatte das Unternehmen zudem das System angepasst, um mehr Diversität beim Generieren von Personenbildern zu erreichen.

DALL-E ist ein KI-System, das Bilder anhand von Beschreibungen erstellt. Die erste Version hatte OpenAI im Januar 2021 veröffentlicht. Sie setzte auf das ebenfalls von OpenAI stammende Sprachmodell GPT-3. Während Letzteres aus einer großen Sammlung von Texten sein Basiswissen bezieht, hat OpenAI DALL-E und dessen Nachfolger mit zahlreichen Bildern und zugehörigen Beschreibungen trainiert. Das System nutzt die Grundlage, um beispielsweise einen Astronauten auf einem Pferd im Andy-Warhol-Stil zu generieren.

Der im April 2022 veröffentlichte Nachfolger DALL-E 2 kombiniert zwei Techniken, die OpenAI seit der Veröffentlichung der ersten Variante entwickelt hat: CLIP (Contrastive Language-Image Pre-training), ein künstliches neuronales Netz, das visuelle Konzepte in Kategorien umsetzt, und GLIDE (Guided Language to Image Diffusion for Generation and Editing), ein textgeführtes Diffusionsmodell, das laut einem Paper DALL-E vor allem in den Bereichen Fotorealismus und passende Beschreibung übertroffen hat.

Das System kann Variationen von Kunstwerken und anderen Bildern erstellen.

(Bild: OpenAI)

Anders als der Vorgänger kann DALL-E 2 Bilder nachträglich verändern und Inhalte kontextbezogen hinzufügen. Darüber hinaus kann das System vorhandene Bilder umgestalten. Die Projektseite zeigt Variationen bekannter Kunstwerke wie "Das Mädchen mit dem Perlenohrring" von Jan Vermeer van Delft oder "Der Kuss" von Gustav Klimt.

Weitere Details lassen sich dem OpenAI-Blog entnehmen. Interessierte können sich auf die Warteliste eintragen. Auch wenn der jüngste Blogbeitrag von DALL-E spricht, handelt es sich technisch um den Nachfolger DALL-E 2.

(rme)