Project Genie: Google öffnet experimentelles KI-Weltmodell für Anwender
Google Genie 3 generiert aus Textprompts und Bildern interaktive 3D-Umgebungen. Mit Project Genie können US-Nutzer das Weltmodell nun selbst ausprobieren.
Von der Texteingabe zur spielbaren Simulation: Eine durch Project Genie erschaffene Umgebung inklusive Steuerungselemente.
(Bild: Google)
Nach der Vorstellung von Google Genie 3 im August und einer geschlossenen Testphase mit ausgewählten Nutzern startet mit Project Genie erstmals ein öffentlicher Prototyp. Die Nutzung ist aktuell auf die USA beschränkt und setzt ein aktives Abo für Google AI Ultra voraus.
Google Genie 3 geht deutlich über reine Videogeneratoren wie Sora und Veo hinaus und erzeugt frei begehbare 3D-Umgebungen, die über mehrere Minuten hinweg konsistent bleiben. Auch einfache Interaktionen sind möglich, inklusive realistisch simulierter Physik.
Videos by heise
Der öffentliche Prototyp Project Genie kreist um drei Funktionen: Zuerst erstellen Nutzer durch Textvorgaben sowie generierte oder hochgeladene Bilder eine 3D-Umgebung, wobei sich die Welt durch eine Vorschau anpassen und verfeinern lässt. Dabei lassen sich der Charakter, die Perspektive und Fortbewegungsarten wie Gehen, Fliegen oder Fahren individuell festlegen. Die eigentliche Welterkundung findet in einer frei navigierbaren Umgebung statt, die Project Genie basierend auf den Aktionen des Nutzers in Echtzeit generiert. Zu guter Letzt ist es auch möglich, Welten anderer Nutzer zu erkunden und diese über eine Remix-Funktion zu verändern oder zu erweitern.
Einsatz im KI-Training, in Videospielen und im Metaverse
Laut Google gibt es aktuell noch technische Einschränkungen. Die Umgebungen wirken oder verhalten sich nicht immer echt oder setzen komplexe Prompts nicht exakt um. Zudem reagieren Charaktere teilweise verzögert auf Eingaben oder lassen sich schwerer steuern, während die Dauer der Simulationen aktuell auf 60 Sekunden begrenzt ist. In Zukunft soll das System jedoch weiter verbessert und ausgebaut werden. Geplant ist etwa eine Funktion, die es Nutzern erlaubt, die Umgebung in Echtzeit mit Texteingaben zu verändern.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Zu den naheliegenden Anwendungsszenarien von Google Genie 3 gehört das Prototyping für Videospiele. Großes Potenzial zeigt die Technologie auch im Kontext des Metaverse: KI-Weltmodelle wie dieses könnten künftig zu einer Holodeck-Maschine heranreifen, die es ermöglicht, auf Knopfdruck beliebige Welten zu kreieren und gemeinsam zu erkunden.
Google DeepMind und führende KI-Wissenschaftler wie Yann LeCun und Fei-Fei Li sehen in KI-Weltmodellen einen wichtigen Baustein für eine generelle künstliche Intelligenz. Anstatt nur mit starren Daten zu arbeiten, könnten KI-Agenten anhand dieser realistischen Umgebungen Erfahrungen mit physikalischen Interaktionen gewinnen. Das Ziel ist eine KI, die Ursache-Wirkung-Prinzipien der echten Welt versteht, indem sie in der Simulation verschiedene Handlungsoptionen und deren physische Konsequenzen erprobt.
Project Genie ist ab sofort für Google-AI-Ultra-Abonnenten in den USA verfügbar und wird in Zukunft auf zusätzliche Länder ausgeweitet.
(tobe)