xAI bindet neuen Bildgenerator Aurora in Grok ein
Bisher lief Elon Musks xAI-Bildgenerator in Grok über das Modell Flux.1 aus Deutschland. Nun zieht mit Aurora ein eigenes Modell ein.
Grok steht als Polarlicht in den Himmel geschrieben.
(Bild: Grok Blogbeitrag)
Groks Fähigkeit, Bilder zu generieren, basiert künftig auf Aurora, einem neuen und eigenständigen Bildgenerator. Zuvor war das Modell Flux von Black Forest Labs für die Bildgenerierung in dem Chatbot zuständig. Wie es um die Partnerschaft mit dem deutschen Unternehmen nun steht, ist unbekannt. Aurora scheint ähnlich wenig Leitplanken mitbekommen zu haben wie der gesamte Chatbot Grok.
Videos by heise
Elon Musk hat Grok von seiner im Sommer 2023 gegründeten Firma xAI entwickeln lassen. Es handelt sich um einen KI-Chatbot, der für zahlende Nutzerinnen und Nutzer von X verfügbar ist. Grok zeichnet sich dadurch aus, weniger Regeln und Grenzen bei der Generierung von Texten und Bildern zu kennen, als andere KI-Dienste. Musk meint, das seien "humorvolle Interaktionen", wenn der Bildgenerator dem Pokémon Pikachu eine Maschinenpistole in die Hand gibt.
Grok liefert fotorealistische Bilder und hat multimodale Fähigkeiten
An dieser Einstellung scheint sich nichts geändert zu haben. Dafür hat sich der Anbieter beziehungsweise das KI-Modell geändert, das die Wünsche umsetzt. xAI spricht von einem Update für Grok, es ziehe ein "autoregressives Mixture of Experts Netzwerk" ein. Aurora sei mit Milliarden von Bildern aus dem Internet trainiert worden, sodass es ein "tiefes Verständnis von der Welt" mitbringe. Ein Mixture-of-Experts-Model besteht aus mehreren spezialisierten Modellen, die jeweils als Experten fungieren und von denen immer nur die benötigten Experten auf eine Anfrage reagieren. Das soll die Leistung verbessern, bei gleichbleibendem Rechenaufwand. Autoregressiv meint, dass das Modell Token vorhersagt und damit anders arbeitet, als frühere Diffusionsmodelle, die mittels eines Rauschens Bilder entstehen lassen.
Dank Aurora soll Grok fotorealistische Bilder erzeugen können und sehr genau in der Umsetzung der Prompts sein. Außerdem arbeitet das Model multimodal, man kann also beispielsweise auch eigene Bilder eingeben und editieren. Erste Tester haben mit Aurora bereits Bilder von Menschen wie Musk selbst oder Sam Altman, CEO von OpenAI, generieren lassen und veröffentlicht, die sehr realistisch aussehen.
Der bisherige Bildgenerator in Grok wurde von Black Forest Labs entwickelt. Deren Gründer waren zuvor bei Stability AI, die mit Stable Diffusion einen Diffusions-basierten Bildgenerator anbieten. Flux.1 von den Schwarzwäldern entspricht laut eigenen Aussagen einer hybriden Architektur aus multimodalen und parallelen Diffusion-Transformer-Blöcken und soll in gängigen Benchmarks Modelle wie Midjourney v6.0, Dall-E 3 und SD3-Ultra bereits übertroffen haben. Entsprechend stellt sich die Frage, ob Aurora nun noch besser ist oder warum xAI den Anbieter-Wechsel vollzogen hat.
(emw)