KI-Update kompakt: OpenAI, Babbel-KI, Windows Terminal Chat, MetaDreamer

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 6 Min.
Inhaltsverzeichnis

Dieser Tage wird die KI-Szene vor allem von den Vorgängen rund um OpenAI und Microsoft beeindruckt. Es gibt aber auch noch anderes Berichtenswertes, zum Beispiel eine KI-gestützte 3D-Modellierung aus Textbeschreibungen

In einem offenen Brief an den OpenAI-Vorstand, der auf sozialen Medien zirkuliert, fordert fast die gesamte Belegschaft des KI-Unternehmens den Rücktritt des Vorstands. Andernfalls drohen massenhafte Kündigungen. Der Grund für die Revolte ist der Rauswurf von Sam Altman, dem ehemaligen CEO von OpenAI, der überraschend gemeinsam mit Mitgründer Greg Brockman bei Microsoft anheuerte. Ilya Sutskever, Vorstandsmitglied und ebenfalls Mitgründer von OpenAI, entschuldigte sich zwischenzeitlich für seine Rolle bei Altmans Kündigung und unterzeichnete ebenfalls den offenen Brief, der die Rückkehr von Altman und Brockman verlangt.

Altman äußerte sich versöhnlich und betonte die gute Zusammenarbeit des Teams. Der neue Interims-CEO von OpenAI, Emmett Shear, kündigte auf X/Twitter an, einen unabhängigen Ermittler einzusetzen, der die Vorgänge rund um Altmans Kündigung untersucht. Shear beabsichtigt zudem, das Management- und Führungsteam umzubauen und betont, dass die Priorität weiterhin auf der Kundenzufriedenheit liege. Er räumt ein, dass der Prozess und die Kommunikation bezüglich Altmans Entlassung schlecht gehandhabt wurden und viel Vertrauen gekostet haben.

Laut einer Quelle, die mit dem Investigativmagazin The Information gesprochen haben soll, hat der Verwaltungsrat von OpenAI nach der Entlassung von Sam Altman mit Dario Amodei, dem CEO von Anthropic, über eine mögliche Fusion der beiden KI-Unternehmen diskutiert. Ziel war es, Amodei als neuen CEO von OpenAI zu gewinnen. Amodei lehnte jedoch ab.

Nach der Absage wandte sich der Vorstand an andere Führungskräfte, darunter Nat Friedman, CEO von GitHub, und Alex Wang, CEO von Scale AI, um den Posten des Interim-CEO zu besetzen. Schließlich wurde der ehemalige Twitch-CEO Emmett Shear für die Position ausgewählt. Dass OpenAI bei Anthropic, einem KI-Start-up und mehr oder weniger unfreiwilligen Spin-off von OpenAI, nach einer Fusion suchte, veranschaulicht das massive Chaos bei OpenAI ziemlich gut.

Die Sprachlernplattform Babbel hat zwei KI-basierte Funktionen in seine App integriert, um Nutzern beim Erlernen von Fremdsprachen zu helfen. Das Feature "Alltagskonversationen" ermöglicht es, alltägliche Gesprächssituationen mit der KI zu üben. Nutzer können dabei aus einer Vielzahl vorgegebener Szenarien auswählen. Das Feature ist für Android und iOS verfügbar und richtet sich vor allem an Anfänger, die Englisch oder Spanisch lernen. Im November sollen Inhalte für Französisch hinzukommen.

Die zweite Funktion, "Spracherkennung", soll die Aussprache der Nutzer verbessern. Dabei spricht der Nutzer ins Mikrofon und erhält von der App eine sofortige Bewertung der Aussprachegenauigkeit. Das KI-Modell wurde mit Millionen von Datensätzen aus Babbels Audio-Bibliothek trainiert, einschließlich korrekter und inkorrekter Aussprache, verschiedener Akzente, Dialekte und Stimmlagen. Die KI-Spracherkennung ist für fünf Sprachen verfügbar: Englisch, Französisch, Deutsch, Italienisch und Spanisch. Sie ist auf Android erhältlich und soll in Kürze auch für iOS kommen.

Microsoft hat den KI-gestützten Chatbot "Terminal Chat" in das Windows Terminal eingebaut. Nutzer der Canary-Version können die Funktion aktivieren und in natürlicher Sprache mit Windows kommunizieren.

Anstatt ein eigenes Large Language Model (LLM) zu verwenden, greift die Software auf den Azure OpenAI Service zurück. Anwender müssen einen Zugriffsschlüssel bereitstellen, um die Funktion nutzen zu können.

Terminal Chat generiert aus natürlichen Sprachanweisungen Kommandos, die per Mausklick im Prompt eingefügt werden können. Dabei berücksichtigt die KI, ob die Powershell oder die klassische Eingabeaufforderung im Windows Terminal verwendet wird. Vor der Ausführung der Kommandos sollte jedoch eine genaue Prüfung erfolgen, da bei Tests eines ähnlichen Tools für die Linux-Kommandozeile, Shell GPT, gelegentlich fehlerhafte Befehle vorgeschlagen wurden.

Forscher von MetaApp AI Research und verschiedenen chinesischen Universitäten haben MetaDreamer entwickelt, ein KI-Tool zur schnellen Erstellung von 3D-Modellen basierend auf Textbeschreibungen. Das Team trennte für dieses Tool den Generationsprozess in zwei Hauptphasen: Zunächst formt MetaDreamer das 3D-Objekt, um eine korrekte Darstellung aus allen Blickwinkeln zu gewährleisten und fügt dann in der Texturphase Details und Texturen für ein realistisches Erscheinungsbild hinzu. Diese Vorgehensweise soll verbreitete Probleme bei der Erstellung von 3D-Modellen, etwa Inkonsistenzen aus verschiedenen Perspektiven und langsame Verarbeitungszeiten, umgehen.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

In Tests zeigte MetaDreamer bessere Ergebnisse hinsichtlich Geschwindigkeit, Qualität und Übereinstimmung der Modelle mit den Textbeschreibungen als andere Text-zu-3D-Methoden (etwa Googles Dreamfusion und Nvidias Magic3D). Das Tool erreichte zudem die höchste Punktzahl in den T3Bench-Benchmarks, einem Standard zur Messung der Qualität von 3D-Modellen. Dennoch zeigt MetaDreamer Schwächen, beispielsweise bei der Erstellung von Szenen mit mehreren Objekten. Die Forscher planen, dieses Problem durch ein besseres Verständnis des Modells für die Interaktion von Objekten im 3D-Raum zu beheben.

Generative KI für 3D hat das Potenzial, Prozesse in der Filmproduktion, der Spielebranche oder im Produktdesign deutlich zu beschleunigen. Neben Google und Nvidia arbeiten auch Midjourney und OpenAI an derartigen Systemen. Ein erstes kommerzielles Angebot, das sich derzeit noch in einem kostenlosen Alphatest befindet, ist mit Genie von Luma AI verfügbar.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

(igr)