Google Whisk: Bilder nutzen als Prompt
In den Bildgenerator Google Whisk kann man Bilder als Prompt eingeben, statt Worte zu nutzen. Ein spielerischer KI-Schneebesen.

Aus drei Bildern wird mit Whisk eins.
(Bild: Google Blogbeitrag)
Whisk ist ein neuer Bildgenerator von Google. Er erstellt Bilder, indem man andere Bilder als Prompt eingibt. Worte finden dabei zumindest in einem ersten Schritt keinen Platz. Allerdings ist Whisk zunächst ausschließlich in den USA verfügbar. Da es ein experimenteller Bildgenerator ist, kann man ihn auch in den USA ausschließlich über die Google Labs erreichen, das ist Googles Testumgebung.
Der Begriff Whisk bedeutet auf Deutsch Schneebesen. Der Bildgenerator soll also Bilder verrühren und vielleicht sogar schaumig schlagen? Schaut man sich die Beispielbilder von Google auf der Webseite von Whisk an, erinnern die eher an Spielereien. Alles ist Comic-haft. Es sind keine fotorealistischen Bilder dabei. Google schreibt auch, es sei ein Experiment, "mit dem Sie in einem schnellen und unterhaltsamen, kreativen Prozess Bilder als Aufforderung verwenden können." Und: "Prompt less, Play more", also "weniger Prompten, mehr Spielen".
Gemini und Imagen arbeiten zusammen
Dabei gibt es nicht ein Bild als Prompt, sondern mehrere Bilder, die man fĂĽr die unterschiedlichen Bereiche als Vorlage nutzen kann. Ein Bild soll das Subjekt enthalten, ein weiteres steht fĂĽr die Szenerie und ein drittes Bild ist fĂĽr den Stil verantwortlich. Im Blogbeitrag heiĂźt es: "Dann kannst du sie neu kombinieren, um etwas Einzigartiges zu schaffen, von einem digitalen PlĂĽschtier bis hin zu einer Emaille-Anstecknadel oder einem Aufkleber."
Whisk basiert auf Googles KI-Modell Gemini und dem Bildgenerator Imagen 3. Zunächst beschreibt Gemini die geprompteten Bilder im Hintergrund, die Texte fließen dann zu Imagen 3 und werden dort verarbeitet. Die zugrundeliegenden Prompts, also das, was Gemini beschreibt, lässt sich einsehen und editieren. Google sagt, es gehe weniger um pixel-perfekte Bilder, sondern darum, schnell Ideen auf den Weg zu bringen.
Lesen Sie auch
Selbstporträt per KI – So versetzen Sie sich in fantastische Welten
KI-Update kompakt: OpenAIs EU-Blueprint, Brighter AI, Klimaschutz, GPT-4o
KI-Bilder erstellen – so geht's
Bildgenerierung mit ChatGPT 4o in der Praxis: So erzeugen Sie mehr als nur Memes
Bildgenerator von GPT-4o: Was vermutlich technisch hinter dem Durchbruch steckt
(emw)