Grok: Elon Musks KI kann jetzt Bilder und Witze verstehen
Grok, der KI-Chatbot in X, kann Witze erklären, sagt Elon Musk. Das KI-Modell hat Bildanalyse-Fähigkeiten bekommen.
Der KI-Chatbot von xAI kann nun auch Bilder verstehen und analysieren. Grok, so nennt sich auch das zugrundeliegende KI-Modell, steht zahlenden Abonnenten von X zur Verfügung. Dort lassen sich nun Bilder hochladen, die von der KI erklärt werden können. Laut X- und xAI-Chef Elon Musk geht das sogar mit Witzen, die etwa in Comicform oder andere Bilder dargestellt werden – inklusive Text.
Humor ist Musk bekanntlich sehr wichtig, auch wenn es um KI geht. Grok hat kaum Leitplanken mitgegeben bekommen, das heißt, mit dem Chatbot und integriertem Bildgenerator lassen sich fast alle erdenklichen Texte und Bilder erstellen. Andere Anbieter lassen etwa fotorealistische Bilder nicht zu oder verweigern neben Gewalt und sexuellen Darstellungen auch Bilder, die etwa Politiker in Situationen zeigen, die Einfluss auf Wahlentscheidungen haben könnten. Musk meint, man müsse auch solche Bilder erlauben und sie mit Humor nehmen.
Musk und seine Witze
Das Beispiel, das Musk bei X postet, zeigt denn auch einen Witz, in dem es um tote Wissenschaftler geht. Die Erklärung des Chatbots, warum der Comicstrip witzig ist, hat er gleich mit verlinkt. Musk sagt allerdings auch, die Funktion sei noch im Anfangsstadium, werde sich aber rasch verbessern.
Erst im August hatte xAI Grok-2 veröffentlicht und damit den integrierten Bildgenerator, der auf dem Modell Flux.1 vom KI-Anbieter Black Forest Labs basiert. Damit einher ging auch die Ankündigung, Grok werde bald multimodal, könne also gleichermaßen Text wie Bilder und gegebenenfalls Audio verarbeiten.
Bei X hat sogleich jemand kritisiert, Grok könne trotzdem noch immer nicht alle Dateiformate verarbeiten, etwa PDFs. Musk antwortete, dass sich dies bald ändern werde. "Wir schaffen in Monaten, wofür andere Jahre gebraucht haben", schreibt er in seiner bekannt bescheidenen Art. Unklar ist dabei, welche Jahre er meint, denn auch die anderen großen KI-Anbieter haben innerhalb weniger Monate ihre Modelle deutlich um Funktionen und Multimodalität erweitert. OpenAI spricht inzwischen sogar von einem Omnimodell, das sie mit GPT-4o auf den Markt gebracht haben.
(emw)