KI-Update kompakt: Video-KI Sora, Genie 2, AGI-Benchmark, Robo-Ratte

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 4 Min.
Von
Inhaltsverzeichnis

OpenAI hat seine neue Video-KI Sora vorgestellt, die auf Textanweisung realistische Videos von bis zu 20 Sekunden Länge erzeugt. Der Dienst ist zunächst nur in Nordamerika für ChatGPT-Abonnenten verfügbar. Neben dem Hauptmodell gibt es eine schnellere, aber qualitativ schlechtere Version namens Sora Turbo.

Die Nutzung unterliegt strengen Richtlinien, etwa dem Verbot von Gewaltdarstellungen und dem Schutz von Persönlichkeitsrechten. Trotz beeindruckender Realitätsnähe zeigt die KI noch Schwächen bei physikalischen Darstellungen und komplexen Bewegungsabläufen. Alle Videos tragen Wasserzeichen zur Kennzeichnung als KI-generierter Inhalt.

In der Belegschaft von OpenAI regt sich Widerstand gegen die Zusammenarbeit mit dem Rüstungskonzern Anduril. Mitarbeiterinnen und Mitarbeiter äußern in einem internen Forum Bedenken zur militärischen Nutzung ihrer KI-Technik. Die Partnerschaft sieht vor, OpenAIs KI-Modelle mit Andurils Drohnen-Datenbank zu trainieren.

Ziel ist die verbesserte Erkennung und Abwehr unbemannter Flugsysteme für die US-Streitkräfte und Verbündete. Das OpenAI-Management verteidigt den Deal. CEO Sam Altman betont, die Zusammenarbeit beschränke sich auf Verteidigungssysteme. Demokratische Staaten müssten Zugang zur besten Technologie haben, da autoritäre Regime KI ohnehin militärisch nutzen würde.

DeepMind hat mit "Genie 2" ein fortschrittliches KI-System vorgestellt, das aus einem einzelnen Bild komplexe 3D-Umgebungen generieren kann. Diese Welten sind sowohl fĂĽr Menschen als auch KI-Agenten mit Tastatur und Maus navigierbar.

Das System beherrscht physikalische Effekte wie Gravitation und Wasserreflexionen und kann die Umgebung bis zu einer Minute konsistent aufrechterhalten. Im Vergleich zum Vorgänger, der auf 2D-Plattformspiele beschränkt war, stellt dies einen erheblichen Fortschritt dar. Eine nicht optimierte Version läuft bereits in Echtzeit. Ein Hauptziel ist das Training von KI-Agenten, allerdings gibt es noch Herausforderungen bei der Ausgabequalität und Konsistenz längerer Interaktionen.

Der KI-Benchmark ARC-AGI verzeichnet 2024 einen Leistungssprung von 33 auf 55,5 Prozent. Das Ziel von 85 Prozent für den Hauptpreis von 600.000 Dollar wurde jedoch verfehlt. Drei Ansätze dominierten den Wettbewerb: KI-gestützte Programmsynthese, Test-Time-Training und deren Kombination. Die besten Ergebnisse erzielten Teams, die beide Methoden nutzten.

Die Organisatoren planen für 2025 einen neuen Benchmark namens ARC-AGI-2. Der aktuelle Datensatz sei mit 100 Aufgaben zu klein. Der Wettbewerb läuft weiter, bis eine öffentliche Referenzlösung vorliegt.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Das Start-up Ruliad hat ein neues Sprachmodell namens DeepThought-8B veröffentlicht. Es dokumentiert seine Schlussfolgerungen Schritt für Schritt in einem strukturierten JSON-Format.

Trotz seiner geringen Größe von 8 Milliarden Parametern erreicht das Modell in Benchmarks ähnliche Leistungen wie deutlich größere Modelle. Es basiert auf Llama-3.1 und läuft auf Grafikkarten ab 16 GB Speicher. Eine Besonderheit ist die Möglichkeit, in die Argumentationsketten einzugreifen. Das Modell wurde als Open Source veröffentlicht und lässt sich nach Google-Login kostenlos testen.

Podcast: KI-Update
KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Eines Tages sollen Roboter soziale Fähigkeiten beherrschen, die die Zusammenarbeit mit Menschen vereinfachen könnten. Nach dem Stand der Forschung müssten humanoide Roboter, die im Haushalt eingesetzt werden oder kollaborativ mit Menschen arbeiten sollen, Mindestanforderungen an menschliche Verhaltensweisen erfüllen, damit das reibungslos klappt. Um diesem Ziel einen Schritt näherzukommen, haben Robotiker des Beijing Institute of Technology nun zusammen mit Wissenschaftlern der Technischen Universität München (TUM) einen Rattenroboter entwickelt.

Der wurde mit einer Künstlichen Intelligenz (KI) darauf trainiert, soziale Verhaltensweisen von biologischen Ratten zu imitieren. Dazu gehören etwa zwei grundsätzliche Verhaltensweisen: In stressigen Situationen kämpfen Ratten gegeneinander; sind sie glücklich, ringen und kuscheln sie miteinander. Das Ergebnis ist verblüffend: Obwohl die Robo-Ratte aus dem 3D-Drucker nicht sehr realistisch aussieht, wird sie in Labortests von echten Ratten akzeptiert, weil sie sich, wie von den Artgenossen in unterschiedlichen Situationen erwartet, passend bewegt und interagiert.

Das war das KI-Update von heise online vom 10. Dezember 2024. Eine neue Folge gibt es jeden Werktag ab 15 Uhr.

(igr)