"Nano Banana": Google erweitert seine Bildberarbeitungsfunktion in Gemini

Google Gemini 2.5 Flash Image verbessert KI-Bildbearbeitung mit konsistenten Personendarstellungen und weiteren Optionen.

vorlesen Druckansicht 4 Kommentare lesen
Frau mit Locken und Golden Retriever

Gemini 2.5 Flash Image hat in diesem Fall die einzelnen Bilder einer Frau und eines Hundes miteinander kombiniert und auch den Hintergrund ausgetauscht. Prompt: "Create an image where the woman in the photo is cuddling the dog on a basketball court."

(Bild: Google)

Lesezeit: 2 Min.
close notice

This article is also available in English. It was translated with technical assistance and editorially reviewed before publication.

Nachdem vor einigen Tagen ein mysteriöser KI-Bildgenerator namens "Nano Banana" viral ging und Spekulationen aufkamen, Google könnte dahinterstecken, hat das Unternehmen nun die Gerüchte bestätigt. Google stattet seine KI-Anwendung Gemini mit einem neuen, leistungsfähigeren Bildbearbeitungsmodell seiner Forschungstochter DeepMind aus, das den offiziellen Namen Gemini 2.5 Flash Image trägt. Es soll vor allem die Konsistenz bei der Veränderung von Personen und Tieren in Fotos verbessern und bietet weitere kreative Bildbearbeitungsmöglichkeiten.

Ein bekanntes Problem bei der KI-gestützten Bildbearbeitung von Personen ist, dass kleine, aber wichtige Merkmale oft verloren gehen. Das Ergebnis wirkt dann zwar ähnlich, aber nicht authentisch. Das neue Modell soll genau hier ansetzen und sicherstellen, dass Freunde, Familie oder das eigene Haustier auch nach einer Bearbeitung – etwa mit einer Bienenkorbfrisur aus den 60er-Jahren oder einem Tutu für den Chihuahua – noch eindeutig wiedererkennbar bleiben.

Über die verbesserte Konsistenz hinaus führt Google mehrere neue Funktionen ein, zum Beispiel die Möglichkeit, Fotos zu kombinieren: Nutzer können nun mehrere Bilder hochladen und miteinander verschmelzen. Als Beispiel nennt Google ein Porträt, das eine Person und ihren Hund gemeinsam auf einem Basketballplatz zeigt, obwohl die Originalfotos getrennt aufgenommen wurden.

Beispiele fĂĽr KI-Bildbearbeitung mit Gemini 2.5 Flash Image (10 Bilder)

Charakterkonsistenz: Stelle die Frau in eine Stierkampfarena ... (Bild:

Google

)

Bilder lassen sich in mehreren aufeinanderfolgenden Schritten verändern. So kann ein leerer Raum zunächst mit Wandfarbe versehen, dann um ein Bücherregal und schließlich um weitere Möbelstücke ergänzt werden. Gemini behält dabei den Kontext des Bildes bei und verändert nur die gewünschten Bereiche.

Zudem soll es möglich sein, den Stil oder die Textur eines Bildobjekts auf ein anderes Bild zu übertragen. So lässt sich etwa die Textur von Blütenblättern auf ein Paar Gummistiefel anwenden oder ein Kleid mit dem Muster von Schmetterlingsflügeln gestalten.

Laut Google handelt es sich bei dem neuen Modell um das derzeit bestbewertete Bildbearbeitungsmodell im "Large Model Arena"-Benchmark. Die aktualisierte Funktion wird ab heute weltweit fĂĽr alle Nutzer der Gemini-App ausgerollt, sowohl in der kostenlosen als auch in der kostenpflichtigen Variante. Alle in der App erstellten oder bearbeiteten Bilder werden zur Kennzeichnung mit einem sichtbaren Wasserzeichen sowie dem unsichtbaren digitalen Wasserzeichen SynthID versehen.

(mack)