Google Whisk: Bilder nutzen als Prompt

In den Bildgenerator Google Whisk kann man Bilder als Prompt eingeben, statt Worte zu nutzen. Ein spielerischer KI-Schneebesen.

In Pocket speichern vorlesen Druckansicht 6 Kommentare lesen
Aus drei Bildern wird mit Whisk eins.

Aus drei Bildern wird mit Whisk eins.

(Bild: Google Blogbeitrag)

Lesezeit: 2 Min.

Whisk ist ein neuer Bildgenerator von Google. Er erstellt Bilder, indem man andere Bilder als Prompt eingibt. Worte finden dabei zumindest in einem ersten Schritt keinen Platz. Allerdings ist Whisk zunächst ausschließlich in den USA verfügbar. Da es ein experimenteller Bildgenerator ist, kann man ihn auch in den USA ausschließlich über die Google Labs erreichen, das ist Googles Testumgebung.

Der Begriff Whisk bedeutet auf Deutsch Schneebesen. Der Bildgenerator soll also Bilder verrühren und vielleicht sogar schaumig schlagen? Schaut man sich die Beispielbilder von Google auf der Webseite von Whisk an, erinnern die eher an Spielereien. Alles ist Comic-haft. Es sind keine fotorealistischen Bilder dabei. Google schreibt auch, es sei ein Experiment, "mit dem Sie in einem schnellen und unterhaltsamen, kreativen Prozess Bilder als Aufforderung verwenden können." Und: "Prompt less, Play more", also "weniger Prompten, mehr Spielen".

Dabei gibt es nicht ein Bild als Prompt, sondern mehrere Bilder, die man fĂĽr die unterschiedlichen Bereiche als Vorlage nutzen kann. Ein Bild soll das Subjekt enthalten, ein weiteres steht fĂĽr die Szenerie und ein drittes Bild ist fĂĽr den Stil verantwortlich. Im Blogbeitrag heiĂźt es: "Dann kannst du sie neu kombinieren, um etwas Einzigartiges zu schaffen, von einem digitalen PlĂĽschtier bis hin zu einer Emaille-Anstecknadel oder einem Aufkleber."

Whisk basiert auf Googles KI-Modell Gemini und dem Bildgenerator Imagen 3. Zunächst beschreibt Gemini die geprompteten Bilder im Hintergrund, die Texte fließen dann zu Imagen 3 und werden dort verarbeitet. Die zugrundeliegenden Prompts, also das, was Gemini beschreibt, lässt sich einsehen und editieren. Google sagt, es gehe weniger um pixel-perfekte Bilder, sondern darum, schnell Ideen auf den Weg zu bringen.

(emw)