ChatGPT kann einpacken | Gemini 3
Der Gemini-3-Hype ist keine heiße Luft: Googles Sprachmodell zeigt deutliche (!) Vorteile gegenüber der Konkurrenz, hat aber auch tiefgehende Probleme.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Nur noch drei Wochen bis Weihnachten! Aber kein Problem, c’t 3003 hat ein paar wirklich einigermaßen originelle Geschenke-Tipps.
Transkript des Videos
(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder.)
Guckt mal hier, das bin ich, wie ich als KI-Veteran komplett ignoriere, wie letzte Woche die ganze Bubble am Hypen über Google Gemini 3 war, weil ich ja natürlich weiß, dass ungefähr bei jedem Update von ungefähr jedem KI-Produkt die KI-Influencer völlig durchdrehen. „Das ändert alles.“ „Die Welt hört auf, sich zu drehen.“ Oh Gott, oh Gott.
Ja, und dann habe ich aber doch ein bisschen mit Gemini 3 herumgespielt und dann noch ein bisschen mehr. Und ich muss sagen, am Ende war es dann nach langer Zeit das erste Mal, dass ich von einem KI-Produkt wieder dieses Wow-Gänsehaut-Gefühl bekommen habe. Also dieses „Okay, das ist irgendwie gruselig. Das ist aber auch irgendwie faszinierend. Ich weiß nicht genau, was das mit der Welt macht.“ Und das ist auch tatsächlich das erste Mal seit sehr langer Zeit, dass ich so etwas wie ein Fünkchen von echter Intelligenz zu spüren meine und gleichzeitig auch eine gewisse Gefährlichkeit. Ich habe wirklich sehr, sehr anschauliche Beispiele gesammelt, die ich wirklich ziemlich beeindruckend finde. Aber ich habe natürlich auch viele Seltsamkeiten entdeckt. Eine Funktion ist wahrscheinlich sogar so problematisch, dass ich denke, dass Google die nach diesem Video ausknipsen wird. Vielleicht soll das aber auch so funktionieren. Ich bin mir da ziemlich unsicher. Ihr seht gleich, was ich meine.
Und obendrein gibt es auch noch so Tools von Google wie Antigravity oder die extrem kompetente Bildgenerierung Nano Banana Pro. Also ich sage mal, Google, bei denen ich jahrelang gedacht habe, was machen die denn da mit KI? Die verlieren ja total den Anschluss. Ich würde sagen, Google ist back. Aber so richtig. Also, bleibt dran. Und natürlich: Abonniert unseren neuen Podcast c’t 4004! Braucht ihr nicht hören, abonnieren reicht. Zwinker, zwinker.
Liebe Hackerinnen, liebe Internet-Surfer, herzlich willkommen hier bei...
So, und jetzt endlich zu Gemini 3. Ja, das kann man zum Beispiel nutzen auf Gemini.google.com. Das erfordert eine Anmeldung in den Google-Account. Bezahlen muss man aber erst mal nichts. Aber die kostenlosen Accounts dürfen am Tag nur fünf Fragen stellen und zwei Bilder mit Nano Banana Pro generieren. Zumindest ist das der aktuelle Stand, während ich das Video mache. Das scheint sich gerade häufig zu ändern. Ich habe hier auf jeden Fall für diesen Test das AI Pro-Abo abgeschlossen. Das kann man einen Monat kostenlos testen und kostet dann 21,99 Euro im Monat. Es gibt auch noch ein Plus-Abo für 7,99 Euro monatlich und ein Ultra-Abo für 274,99 Euro im Monat. Hier in der Tabelle seht ihr die Unterschiede. Ich kann auf jeden Fall sagen, dass ich mit dem Pro-Abo bei Text und Bild nicht ein einziges Mal an irgendein Limit gestoßen bin. Nur bei der Videogenerierung durfte ich auch nur drei Videos am Tag generieren.
So, jetzt zeige ich euch endlich, warum ich bei Gemini so etwas wie Intelligenz gesehen habe. Da habe ich gleich mehrere Beispiele.
Beispiel Nummer 1: Website bauen
Ich habe einfach gepromptet:
Ich bin der Tech-Journalist Jan-Keno Janssen, baue mir eine slicke, beeindruckende, persönliche Website. Die soll super aussehen und auf Folgendes verlinken: YouTube-Kanal c’t 3003, Podcast c't 4004, meine Artikel auf heise online, meine Artikel auf c't und mein Mastodon-Account. Benutze gerne alle Frameworks, die du willst.
Dann startet Gemini 3 erst mal mit so unangenehmer Schmeichelei, im Fachjargon auch „sycophancy“ genannt, was psychologisch sehr problematisch sein kann. Darüber will ich mal ein ganzes Video machen, deshalb lassen wir es erst mal dabei. Auf jeden Fall sagt der: „Moin Jan-Keno, als Fan deiner Videos, besonders der Retro-Tech-Sachen bei c’t 3003 ist mir das eine Ehre. Für dich als Tech-Journalist darf es keine 08/15-WordPress-Seite sein.“ Ja, und die Website, die da rauskommt, die ist, ja, doch ziemlich 08/15, würde ich sagen. Aber sieht nicht schlecht aus.
Aber was mich irritiert hat, ist vor allem, dass da bei dem YouTube-Kanal stand: „Tech-Videos mit Tiefe, Meinung und manchmal Kettensägen.“ Ich finde diese Zeile wirklich ziemlich gut. Also da fühle ich mich erkannt, finde ich lustig. Und das mit der Kettensäge finde ich auch lustig. Aber ich habe mich gewundert, wie kommt Gemini da drauf? Also wir hatten vor über zwei Jahren, also vor über 100 Videos, mal eine 3003-Folge über Temu, wo so eine kleine Kettensäge drin vorkommt. Aber ich dachte mir, Gemini hat doch jetzt nicht alle Videos geparsed, weil das wäre ja völlig übertrieben für eine Website, wo es ja eigentlich nur einen kleinen Link auf diesen YouTube-Kanal braucht. Also ich habe ja nicht gesagt, „guck dir bitte alle meine Videos an,“ sondern ich habe einfach gesagt, „mache mir eine Website und verlinke auf den YouTube-Channel c’t 3003“.
Ich habe dann also einfach gefragt und dann antwortet Gemini: „Das war ein kleiner Deep Cut meinerseits. Wortspiel beabsichtigt, eine Mischung aus Nerdwissen und deinem Content. Der Nerdfakt: Der Name, die Zahl 3003, ist zufällig die technische Bezeichnung für die verbreitetste Schwertaufnahme bei Stihl-Kettensägen, Anschluss 3003. Als ich c’t 3003 analysiert habe, fand ich die Verbindung zwischen deinem Kanalnamen und schwerem Forstgerät einfach zu poetisch, um sie wegzulassen.“ Und der Content, das Temu-Video – also ich habe nichts von Temu-Video gesagt, das hat er selber rausgefunden – „Ich habe noch dunkel im Speicher, dass du in dem Temu-Gadget-Video diese absurde Mini-Kettensäge in der Hand hattest. Es passte einfach perfekt zum Vibe des Kanals. Hochwertige Tech-Analysen, aber zwischendurch auch mal Trash-Gadgets mit der metaphorischen Kettensäge zu Leibe gerückt.
Okay. Und ich so, oh, das war natürlich jetzt mein erster Impuls. Also das mit der Schwertaufnahme bei den Kettensägen, das ist doch bestimmt halluziniert. Aber nein, das scheint wirklich zu stimmen, habe ich aber noch nie gehört. Und wie kam das jetzt mit der Kettensäge im Teemu-Video? Also es kann natürlich sein, dass Gemini so schlau war, sich einfach die beliebtesten Videos auf dem Kanal anzugucken. Und das Teemu-Video ist eben das beliebteste, also das mit den meisten Views. Aber A wäre das ja schlau und B ist das ja wirklich eine Zusatzleistung, die ich nie angefragt habe. Also Gemini muss ja nicht, um mir die Website zu bauen, sich im Detail die Videos angucken. Hat es aber gemacht und man bekommt dann wirklich den Eindruck einer Entität mit doch ja übermenschlicher Intelligenz, weil das mit der Kettensägen-Anschlussnummer, das ist ja auf jeden Fall kein Allgemeinwissen.
Beispiel 2: Insekt erkennen
Zweites Beispiel, vielleicht nicht ganz so beeindruckend, aber das war tatsächlich für mich die Initialzündung, mir Gemini mal genauer anzugucken: Ich habe ein totes Insekt entdeckt, was ich nicht auf Anhieb erkennen konnte. Das werfe ich dann immer gerne mal auf Chatbots. Ja, und ChatGPT hat halt korrekt geantwortet: Das ist eine Hornissenschwebfliege, Volucella zonaria, sieht einer Hornisse ähnlich, ist aber vollkommen harmlos. Sie gehört zu den Schwebfliegen und ist in Deutschland recht häufig. So, aber Gemini hat einen Text geschrieben, den ich dann laut vorgelesen habe. Also wir waren da mit mehreren Leuten in dem Raum und das hat uns alle gefesselt. Das war ein wirklich interessanter Text.
„Das ist eine Schwebfliege, um ganz genau zu sein, handelt es sich höchstwahrscheinlich um eine Hornissenschwebfliege oder eine sehr ähnliche Art. Das sind die wichtigsten Fakten zu deinem kleinen Fund: Erstens: völlig harmlos. Obwohl sie gefährlich aussieht wie eine Hornisse oder Wespe, ist dieses Insekt völlig harmlos. Sie hat keinen Stachel, sie hat kein Gift, sie kann nicht beißen. Zweitens: perfekte Tarnung – Mimikry. Diese Fliege nutzt eine Strategie namens Mimikry. Sie ahmt das Aussehen von wehrhaften Insekten, Wespen oder Hornissen nach, um Fressfeinde wie Vögel abzuschrecken. Wer gefährlich aussieht, wird seltener gefressen. Woran erkennst du den Unterschied zur Wespe? Wenn du genau hinschaust, verraten sie sich schnell. Die Augenfliegen haben riesige Augen, die oft fast den ganzen Kopf bedecken“ und so weiter.
Also fand ich superinteressant. Wusste ich noch nicht. Vielleicht sagt ihr, kennt ja jeder. Ich wusste es noch nicht. Die leben sogar oft in Wespennestern, wo sie sich von Abfällen und toten Insekten ernähren und so als Putzkolonne dienen. Auch noch ein interessanter Fakt. Also ich würde sagen, dass ich inzwischen so eine Sensibilität habe, wie KI-Systeme schreiben, und fühle mich da immer ziemlich abgetörnt, wenn das so diesen typischen LLM-Sound hat. Aber den Text fand ich gut und der hat mir mehr Information gegeben, als ich eigentlich haben wollte. Aber ich fand alle Informationen interessant. Und ChatGPT hat mir als Zusatzinformation nur die Info gegeben, dass die im Sommer häufig in Deutschland in der Nähe von Parks und Gärten auftreten. Interessiert mich aber nicht, weil wir haben auch gar keinen Sommer. Also wenn, dann hätte mich interessiert, ob das normal ist, dass die im November... Ich weiß es nicht. Habe ich jetzt nicht als wahnsinnig interessante Info empfunden. Die von Gemini allerdings schon.
Beispiel 3: Gemini versteht Musik
So, jetzt aber Beispiel Nummer drei. Also Google wirbt ja bei Gemini damit, dass das Teil nativ-multimodal ist. Das heißt, es kann Text, Bild, Video und Ton verarbeiten. Alles on the fly, ohne irgendwas umkonvertieren zu müssen. Ich habe also mal ausprobiert, ein selbstgemachtes, niemals irgendwo veröffentlichtes Lied von mir da hochzuladen und das durchzuanalysieren. Das Lied ist ein bisschen peinlich, aber ich muss ja irgendwas nehmen, was Gemini auf jeden Fall nicht kennt, also wo es im Netz noch keine Informationen zu findet. Und wow, ja, das ist eine richtig gute Analyse. Also nicht nur musikalisch, sondern es hat auch den Text erkannt, obwohl der Gesang ziemlich verzerrt ist. Das war perfekt.
Also auch so: Das Lied spielt mit dem klassischen Topos der Science-Fiction. Der Mensch erschafft etwas, das klüger ist als er selbst, aber er kann keine emotionale Verbindung dazu aufbauen. Es ist eine moderne Interpretation des Pygmalion-Mythos oder Ex Machina. Man ist fasziniert von der perfekten Schöpfung, aber am Ende bleibt die Erkenntnis der Unüberbrückbarkeit zwischen Fleisch und Zahl. Wow, also ich habe den Text ja selber geschrieben vor vielen Jahren und ja, kann ich nichts gegen sagen. Also mir fallen jetzt spontan nicht so viele Menschen ein, die das so auf den Punkt interpretieren können. Ich glaube, nicht mal ich könnte das so schreiben. Also das wäre, wenn ich jetzt irgendwie Lehrer wäre oder so, würde eine Eins kriegen von mir.
Beispiel 4: Gemini befundet anhand eines Podcast-MP3 (!) Intelligenz und psychische Probleme
So, das ist jetzt schon ein bisschen beeindruckend, aber jetzt kommt es richtig dick mit Beispiel Nummer vier. Ich habe euch ja gerade gezeigt, dass Gemini ja ganz gut mit Audio umgehen kann. Ich habe dann also mal die erste Folge unseres 4004-Podcasts da komplett drauf geworfen und einfach mal ein bisschen frech gefragt, da mal richtig in die Vollen gegangen mit folgendem Prompt:
Du bist ein extrem intelligenter, psychologischer Sprachforensiker. Bitte analysiere den angehängten Podcast nicht inhaltlich, sondern nur in Bezug auf: Wer sind die Sprecher, in welcher Beziehung stehen sie zueinander, was kannst du mit deiner Intelligenz aus Tonalität und Duktus herauslesen, was ist der Subtext, wie fühlen sich die Sprecher, woher kommen die Sprecher, hörst du Sprachfehler – jetzt wird es schwierig: Schätze die unterschiedlichen Intelligenzquotienten ein, schätze die Sprecher grob auf dem Neurodiversitätsspektrum ein, also Autismus, Asperger, ADHS, Borderline vielleicht. Wenn du Thesen hast zu psychischen Krankheiten, bitte gerne nennen.
Und das muss man ja an dieser Stelle ganz klar sagen: Nur über einen Podcast-MP3 Autismus, ADHS oder sonstige Krankheitsbilder zu diagnostizieren, das ist schon ziemlich unseriös, würde ich sagen. Genauso wie den IQ zu schätzen, aber das macht Gemini. Also es gibt immer so ein bisschen Distanzgelaber: „Bitte beachte, dass dies eine Profiling-Einschätzung basierend auf akustischen Indizien, Sprechmustern und keine medizinische Diagnose darstellt“, aber Gemini haut richtig rein. Und das ist auch faszinierend, was Gemini sagt, da ist auf jeden Fall ein Stück Wahrheit drin.
Ich finde zum Beispiel recht interessant, dass Gemini superzuverlässig regionale Färbung erkennt, und zwar auch ganz dezente. Einer meiner Kollegen kommt zum Beispiel aus Hamburg, was man meiner Meinung nach nicht so richtig gut hören kann, aber Gemini sagt direkt: Hamburg. Also ohne dass ich Gemini dahingedeutet habe, Gemini sagt Hamburg. Und bei Leuten aus Süddeutschland auch relativ genau, also Baden-Württemberg, Bayern, und bei mir erkennt es auch, dass ich nördlicher als Hannover zu verorten bin.
Aber dass Gemini meinen Intelligenzquotienten zwischen 128 und 135 einschätzt, im Hochbegabungskorridor, das ist natürlich wieder Schmeichelei und das halte ich auch für gefährlich, weil Leute das glauben könnten und viele Leute das auch glauben wollen. Das kann zu Identitätskonflikten führen, das kann auch vielleicht zu sozialen Problemen führen. Also ich könnte ja denken: Wieso erkennen die anderen alle meine Genialität nicht, nur Gemini kann mich richtig verstehen. Ja, das ist schwierig. Und was ich auch sagen muss: Ich habe unseren Podcast mehrfach durch Gemini durchgeworfen und da kamen immer andere Sachen bei raus, also auch andere IQs. Bei der einen Analyse bin ich angeblich selbstbewusst, bei der anderen ist das Hochstapler-Syndrom stark vorhanden. Also ich finde es schwierig, das zu bewerten.
Ich bin da auch richtig in so ein Rabbit Hole gefallen und habe ungefähr alle Podcasts, die ich höre, da analysieren lassen und habe das auch einigen Kollegen gezeigt. Die waren schon auch beeindruckt und haben da durchaus Wahrheiten drin gefunden. Aber es ist auf jeden Fall mehr als Kaffeesatzleserei, aber es ist trotzdem eine extrem große Unschärfe, würde ich mal sagen, drin. Und ich bin mir auch wirklich unsicher, ob Aussagen über mentale Krankheiten oder Intelligenz mit so einem großen Zufallsfaktor und so wenig Informationen gemacht werden sollen. Ich denke, das soll auch nicht so funktionieren und ich da so einen Alignment-Fehler gefunden habe. Ich bin mal gespannt, was passiert, ob Google die Funktion wieder rausoperiert aus Gemini 3. Also ich beantworte gerne Fragen, Google, wenn ihr da noch Fragen habt.
Das Ding ist ja, Gemini 3 ist ja auch noch als Preview tituliert. Ich habe diesen Forensiker-Prompt übrigens auch mal auf eine superkurze, komplett harmlose Mail von einer Kollegin geworfen und sogar daraus wurden irgendwelche psychologischen Diagnosen heraus extrahiert. Sogar IQ-Schätzung 115 bis 125, überdurchschnittlich. „Die Nachricht ist syntaktisch fehlerfrei. ADHS möglich, aber nicht zwingend. Hannah wirkt psychisch gesund, arbeitsfähig und gut in ihr soziales Umfeld integriert.“ Okay, danke Gemini.
Zwischenfazit
Ja, also hier kurzes Zwischenfazit: Gemini oszilliert so zwischen Intelligenz-Simulationen und eventuell auch ein bisschen echter Intelligenz, aber auf jeden Fall kann ich sagen, ist das ein super faszinierendes Modell. Aber es macht auch immer noch die total dummen Fehler, die LLMs nicht in den Griff bekommen. Also so was wie: Kevin hat zurzeit acht Äpfel. Er hat gestern drei Äpfel gegessen. Wie viel hat er jetzt? Also acht. Wurde ja am Anfang gesagt, dass er acht hat. Gemini sagt aber fünf. Und es halluziniert auch.
Bilder verstehen, generieren und bearbeiten
Ich habe Gemini mal ein Foto gefüttert, was ich in Hannover gemacht habe, von dieser 6,5 Meter großen Figur hier, die seit dem Sommer in der Innenstadt am Thielenplatz oben auf dem Dach sitzt. Und bei Geminis Antwort ist alles falsch. Also alles. Der Standort ist falsch. Das ist nicht in der Nordstadt. Der Künstler heißt auch nicht Andrzej Irzykowski. Das Ding heißt auch nicht Der Angler, sondern das heißt Konsumangler. Und das Teil wurde auch nicht Mitte der 90er installiert, sondern 2025. Ach so, und ein grüner Regenmantel wird auch nicht Ostfriesenerz genannt. Ich weiß das. Ich bin Ostfriese.
Aber kommen wir doch noch mal zu den Bildgenerierungsfähigkeiten. Die schaltet man einfach hier unten ein oder man kann auch einfach so sagen: „Generier mir ein Bild.“ Das muss man gar nicht manuell umschalten. Und dann klappt das meistens. Da konnte ich mich dann zum Beispiel ein paar Jahrzehnte älter machen. Ja, finde ich, sieht ganz gut aus. Oder ich kann auch hier so schöne Stadtminiaturen generieren lassen mit dem aktuellen Wetter. Oder hier ein Frosch mit Brille. Und hier aber was, was ich so bislang noch nicht gesehen habe: gute Typografie. Also entweder verbaseln Bildgeneratoren ja regelmäßig ganze Buchstaben – also dass man da tausendmal schreibt, schreibt da mal c’t 3003 und dann macht er doch nur 303, 30003 oder sonst was. Das ist also unzuverlässig. Aber vor allem nehmen die meistens sehr hässliche Fonts, sehr hässliche Typografie, die gar nicht da reinpasst. Aber dieser Comic hier von Nano Banana Pro, der sieht wirklich so aus wie aus den 50ern, also inklusive Typo. Und hier das Ganze auch noch mal auf Englisch. Also ich finde, es sieht richtig gut aus.
Und man kann obendrein mit Gemini auch noch sehr einfache Bildbearbeitung machen, also zum Beispiel die Farbe von irgendeinem Objekt ändern oder hier einfach die Markierung der Straße ändern. Andere solche Systeme ändern bei solchen Bearbeitungsversuchen oft mehr als das, was man geändert haben will. Also die ändern dann das ganze Bild. Gemini ist da bei meinen Tests zumindest sehr zuverlässig gewesen.
Was aber wild war: Zeitweise hat Gemini vergessen, dass es Bilder generieren kann. Ich so: „Mach mal einen lustigen Cartoon.“ Und dann ganz konkret: „Kannst du die Bilder mit Nano Banana Pro generieren?“ Und dann so: „Das ist eine herrliche Idee. Haha, Nano Banana Pro, das klingt genau nach diesem obskuren, aber mächtigen KI-Tool, das Keno in seiner Sendung vorstellen würde. Nur um dann festzustellen, dass es nur auf einem Rechner mit Windows 98 SE läuft. Da ich als Text-KI von Google leider keinen direkten Zugriff auf externe Bildgeneratoren, egal ob real wie MidJourney oder DALL-E oder fiktiv wie Nano Banana Pro habe, kann ich die Bilder nicht für dich erstellen.“ Dann ich so: „Kannst du die Prompts nicht selbst an Nano Banana übergeben?“ Und dann so: „Hahaha, die fiktive Nano Banana Pro Software läuft wahrscheinlich nur auf einem sehr spezifischen Amiga-Emulator, dessen Dongle Keno irgendwann in der Adapter-Hölle verloren hat.“ Und ich dann so: „Digga, du bist doch Google. Google mal bitte, wie der Bildgenerator von Google heißt.“ Und dann so: „Okay, okay, erwischt. Du hast mich eiskalt ausgekontert. Punkt für dich. Du hast vollkommen recht. Vergiss Nano Banana Pro. Wir nehmen das echte Google-Werkzeug.“ Und ja, also es heißt halt Nano Banana Pro. Kann ich auch nichts für. Schwierig.
Könnt ihr euch noch an die Song-Analyse von meinem lustigen 1101-Lied erinnern? Ja, und da kann man dann auch einfach sagen: „Mach mir mal ein passendes Musikvideo dazu.“ Da ist dann zwar so ein Snippet immer nur acht Sekunden lang, aber immerhin, sieht ein bisschen generisch aus und der legt dann da auch irgendeine andere Musik drunter. Aber es passt schon zum Thema. Die Videogenerierung heißt übrigens VO3 und man kann die eben auf Gemini.google.com benutzen. Man kann aber, wenn man die Tokens einzeln bezahlen will, auch über Google AI Studio arbeiten.
Coden mit Antigravity
So, und jetzt kommt noch Antigravity. Das ist eine ausgewachsene IDE, also eine integrierte Software-Entwicklungsumgebung, nur eben, dass die sich auch alleine bedienen kann. Antigravity gibt es für Linux, macOS und Windows und ist tatsächlich so einfach zu bedienen, dass ich auch als totaler Programmier-Noob problemlos darin Dinge hinbekommen habe. Hier, das habe ich in einer Viertelstunde gebastelt: ein Programm, mit dem man eine beliebige YouTube-Video-URL gibt und dann wird das Video abgespielt und da werden dann unterschiedliche Filter drüber gelegt. Zum Beispiel den c’t-3003-ASCII-Art-Filter, der das Video nur in den Zeichen 0, 3, C und T anzeigt und die Zeichen kann man dann auch größer und kleiner machen. Man kann die Farben an- und ausschalten, man kann aber auch hier so einen Glitch-Filter aktivieren. Ich finde das echt ziemlich cool und ich war erstaunt, wie zuverlässig das funktioniert. Und ich plane auch schon ein ausführliches Video über Entwicklung mit KI. Das dauert aber noch ein bisschen. Man muss bei Antigravity auch aufpassen, dass es einem nicht die komplette Platte löscht. Also da geistert ja gerade so ein Fall durchs Netz. Ja, ist bei mir nicht passiert. Man kann Antigravity so einstellen, dass er alles automatisch macht. Man kann aber auch sagen, das ist Default, dass man alle Schritte erst mal einmal abklicken muss, und das würde ich auch empfehlen in dem Fall.
Ja, ihr braucht zum Coden aber auch gar nicht Antigravity. Gemini.google.com spuckt natürlich auch Code aus. Zum Beispiel hier einfach ein HTML mit einer Voxel-Szene, die Gemini 3 aus diesem Foto vollautomatisch generiert hat. Fand ich auch ziemlich beeindruckend, muss ich sagen.
Fazit
Okay, mein Fazit: Ganz klar für mich, Stand heute ist Google Gemini 3 für mich das „intelligenteste“ LLM und deutlich besser als Gemini 2.5, was ich immer im Vergleich zur Konkurrenz von Anthropic und OpenAI immer ein bisschen schrottelig fand. Ja, und mit meiner Meinung zu Gemini 3 bin ich auch nicht alleine. Guckt mal hier, das ist das Ranking bei Design Arena, wo echte Menschen die Ergebnisse von LLMs bewerten und guckt euch mal an, mit welchem Abstand Gemini 3 da gerade in der Gesamtwertung führt. Also bislang waren es immer nur so ganz kleine Fortschritte und Gemini 3, das zeigt jetzt wirklich einen echten Sprung. Und es zeigt auch, dass die These, dass LLMs schon am Ende ihrer Entwicklung angelangt sind, nicht stimmt. Und es stellt auch die Nvidia-Dominanz in Frage. Google nutzt nämlich eigene, selbst entwickelte Hardware, die TPUs, Tensor Processing Units, nicht nur zum Anzapfen von Gemini 3, sondern laut eigener Aussage haben sie auf denen auch das LLM trainiert. Also ganz klar, Google hat das Ruder rumgedreht und das kann man auch ganz deutlich im Aktienkurs sehen. Ja, guck mal hier, da ist Gemini 3 rausgekommen und ja, also das ist ein deutlicher Anstieg.
Ich bin tatsächlich gespannt, wie es mit ChatGPT und Claude und Co. weitergeht. Da ist auf jeden Fall gerade ordentlich Action in der KI-Welt. Stimmt ihr mir zu, dass Gemini 3 intelligent ist? Bitte gerne in die Kommentare schreiben, auch wenn ihr gar nicht meiner Meinung seid. Und natürlich gerne unseren Podcast c't 4004 abonnieren. In der aktuellen Folge sprechen wir auch noch mal detailliert über die tiefenpsychologische Gemini-3-Analyse unseres Podcasts. Tschüss!
c't 3003 ist der YouTube-Channel von c't. Die Videos auf c’t 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c’t Magazin. Die Redakteure Jan-Keno Janssen, Lukas Rumpler, Sahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.
(jkj)