Black Forest Labs: Bildbearbeitung über KI-Prompt

Die künstliche Intelligenz "Flux.1 Kontext" vom Freiburger KI-Startup Black Forest Labs analysiert den Bildinhalt, um ihn per Prompteingabe zu bearbeiten.

vorlesen Druckansicht 2 Kommentare lesen

Die künstliche Intelligenz „Flux.1 Kontext" analysiert den Bildinhalt und setzt Motive nach Prompteingabe in neuen Kontext.

Lesezeit: 2 Min.
Inhaltsverzeichnis
close notice

This article is also available in English. It was translated with technical assistance and editorially reviewed before publication.

Unter generativer künstlicher Intelligenz versteht man landläufig Bildgeneratoren, die nach Texteingabe einen Astronauten auf einem Einhorn zeigen oder hochgeladene Fotos in gezeichnete Illustrationen wandeln. Die neue Modellfamilie Flux.1 des KI-Startups Black Forest Labs aus Freiburg im Breisgau will darüber hinausgehen. Sie soll Bilder über Textanweisungen bearbeiten können. Firmengründer Robin Rombach, Andreas Blattmann und Axel Sauer konnten für ihre KI neben einem Studium in Heidelberg und München auch Erfahrungen beim Londoner Unternehmen Stability.AI sammeln.

Videos by heise

Laut Unternehmenswebseite identifiziert und erhält Flux.1 Kontext die Charaktere im Bild und kann so Figuren oder Objekte in einen anderen Kontext setzen, beispielsweise um den CEO am Rednerpult in einem neuen Bild als Skateboarder auf der Rampe zu inszenieren. Im einfachsten Fall fügt die KI Objekte hinzu, beispielsweise ein VR-Headset, oder entfernt Objekte wie einen Hut oder eine Brille.

Einige Funktionen sind schon aus anderen KI-Modellen wie Adobe Firefly bekannt: Flux.1 kann hochgeladene Bilder als Stilreferenz nutzen, um beispielsweise aus der Kohlezeichnung eines Apfels das Bild eines völlig anderen Motivs im selben Stil zu erstellen.

Mit Flux.1 Kontext soll man dabei iterativ arbeiten können, also in einem begonnenen Projekt weitere Anweisungen hinzufügen, um auf einem vorherigen Ergebnis aufzubauen.

Flux.1 Kontext retuschierte glaubhaft die Wollmütze und wandelte, wie im Prompt gewünscht, den verschneiten Heisecampus in eine frühlingshafte Landschaft.

Black Forest Labs stellt drei Varianten seiner Flux.1-Familie vor. Das Premium-Modell Flux.1 Kontext [max] bietet die maximal mögliche Leistung bei hoher Geschwindigkeit. Es soll Prompts besser verstehen als vorherige Modelle und Typografie generieren können.

Beim Modell Flux.1 Kontext [pro] liegt der Fokus auf schneller Verarbeitung. Es bietet sich für die Ideenfindung oder iterative Bearbeitung mit vielen Arbeitsschritten an. Außerdem soll es sich für die lokale Bildbearbeitung eignen. Für Forschungszwecke will der Hersteller künftig zusätzlich das Modell Flux.1 Kontext [dev] anbieten.

Das Waldfoto (unten links) diente hier als Referenzfoto. Den Bären und den missglückten "Honigtopf" ergänzte die KI von Black Forest Labs.

Flux.1 Kontext lässt sich im „Playground“ ausprobieren. Nutzer erhalten 200 Credits, die für etwa 12 Bildgenerierungen ausreichen. Die englischsprachige Oberfläche bietet die Bearbeitungsoptionen Generate, Edit, Fill und Expand.

Preise gibt das Unternehmen detailliert für die gesamte Modellfamilie und für die Bearbeitung einzelner Bilder an. Es richtet sich an Großkunden und Entwickler. Beispielsweise kooperiert die Deutsche Telekom mit Black Forest Labs.

(akr)