KI-Bildgenerator DALL·E ab sofort ohne Warteliste verfügbar

Zwar befindet sich das KI-System weiterhin in der Betaphase, aber OpenAI nimmt nun alle Interessierten direkt auf.

In Pocket speichern vorlesen Druckansicht 14 Kommentare lesen

(Bild: OpenAI)

Lesezeit: 2 Min.
Von
  • Rainald Menge-Sonnentag

OpenAI öffnet DALL·E für alle Interessierten, ohne wie bisher eine Warteliste zu führen. Das KI-System erstellt Bilder anhand von Beschreibungen und kann vorhandene Bilder auf der Basis von Texteingaben verändern. Laut OpenAI sind die Sicherheitsmaßnahmen gegen Missbrauch nun ausgereift genug, um das System der breiten Öffentlichkeit zur Verfügung zu stellen.

DALL·E befindet sich allerdings nach wie vor in der kostenpflichtigen Betaphase, die OpenAI im Juli begonnen hat. Derzeit verwenden laut OpenAI über 1,5 Millionen Nutzerinnen und Nutzer das System und erstellen täglich gut zwei Millionen Bilder.

Seit dem Start der Beta hat OpenAI das System im September um Outpainting erweitert: DALL·E erweitert ein Originalbild über den Rand hinaus und kann dafür wahlweise den Stil des Originals übernehmen oder ihn variieren.

Original: Mädchen mit dem Perlenohrring von Johannes Vermeer, Outpainting von August Kamp

(Bild: August Kamp)

Generative Modelle wie DALL·E oder auch der Textegenerator GPT-3 bergen Risiken. Sie können verbreitete Vorurteile übernehmen, und User können versuchen, sie gezielt zu manipulieren oder für Inhalte einzusetzen, die beispielsweise gewaltverherrlichend sind. OpenAI setzt auf zahlreiche Vorsichtsmaßnahmen und hat unter anderem den Trainingssatz gefiltert, damit er keine Vorlagen für Gewalt, hassgetriebene oder sexuelle Inhalte bietet.

Außerdem verbietet die Content Policy des Unternehmens das Generieren von entsprechenden Inhalten. Auf technischer Seite soll ein Filter für Texteingaben und hochgeladene Bilder einen Missbrauch des Systems abwehren. Schließlich setzt OpenAI Techniken ein, um das Erstellen fotorealistischer Inhalte anhand echter Personen zu verhindern. Zusätzlich hat OpenAI im Juli technische Maßnahmen integriert, die mehr Diversität schaffen sollen.

Die Anweisung "a portrait of a heroic firefighter" zeigt seit den Anpassungen für mehr Diversität nicht mehr nur weiße Männer.

Laut dem OpenAI-Blog hat das Unternehmen die Sicherheitssysteme seit dem Start der Betaphase weiter angepasst. Daher könne es jetzt DALL·E für die breite Öffentlichkeit bereitstellen.

DALL·E (2) und ähnliche Systeme

DALL·E ist ein KI-System, das Bilder anhand von Beschreibungen erstellt. Die erste Version hatte OpenAI im Januar 2021 veröffentlicht. Sie setzte auf das ebenfalls von OpenAI stammende Sprachmodell GPT-3. Während Letzteres aus einer großen Sammlung von Texten sein Basiswissen bezieht, hat OpenAI DALL·E und dessen Nachfolger mit zahlreichen Bildern und zugehörigen Beschreibungen trainiert. Der Projektname ist ein Kofferwort aus dem Nachnamen des spanischen Künstlers Salvador Dali und dem Titel des Pixar-Films "WALL-E".

Der im April 2022 veröffentlichte Nachfolger DALL·E 2 kombiniert zwei Techniken, die OpenAI seit der Veröffentlichung der ersten Variante entwickelt hat: CLIP (Contrastive Language-Image Pre-training), ein künstliches neuronales Netz, das visuelle Konzepte in Kategorien umsetzt, und GLIDE (Guided Language to Image Diffusion for Generation and Editing), ein textgeführtes Diffusionsmodell, das laut einem Paper DALL·E vor allem in den Bereichen Fotorealismus und passende Beschreibung übertroffen hat. Auch wenn DALL·E 2 den Vorgänger ersetzt hat, spricht OpenAI inzwischen nur noch von DALL·E.

Auch wenn OpenAI das Thema KI-Bildgenerierung angestoßen hat, sind einige andere Systemen am Start. Ein ernsthafter Herausforderer ist im August mit Stable Diffusion erschienen. Das Modell steht anders als DALL·E vollständig als Open Source bereit, und die Ausgaben stehen der Allgemeinheit frei zur Verfügung.

Das heute als Craiyon geführte System ist ebenfalls Open Source und startete ursprünglich mit einer unverhohlenen Anspielung auf das Vorbild als dall·e mini. Google ist bereits im Mai auf den Zug der Bildgeneratoren aufgesprungen und hat die öffentliche Demo des KI-Systems Imagen gestartet. Seid Juli befindet sich zudem der proprietäre Text-zu-Bild-Generator von MidJourney in der Testphase.

Weitere Details zum Ende der Warteliste für DALL·E lassen sich dem Open-AI-Blog entnehmen. Interessierte können sich auf der Anmeldeseite registrieren. Seit dem Start der öffentlichen Beta im Juli ist das System nicht mehr vollständig gratis. Dafür gehören die Rechte an den generierten Bildern nicht mehr OpenAI. Nutzerinnen und Nutzer erhalten monatlich 15 kostenlose Credits und können für 15 US-Dallar 115 Credits hinzukaufen. Jeder Vorgang wie Bildgenerierung, Inpainting oder Outpainting kostet einen Credit und erstellt vier Bilder.

(rme)