CES

Nvidia präsentiert Weltmodell für Entwicklung von Physik-KI

Mit einem Weltmodell will Nvidia die Entwicklung von Physik-KI vorantreiben. Auch neue Sprachmodelle und KI-Blueprints stellt das Unternehmen vor.

In Pocket speichern vorlesen Druckansicht 10 Kommentare lesen
Nvidia mit Begrünung

(Bild: Michael Vi/Shutterstock.com)

Lesezeit: 3 Min.
Von
  • Sven Festag

Nvidia hat mit Cosmos eine neue Plattform für Welt-Grundlagenmodelle vorgestellt. Mit ihr sollen sich KI-Anwendungen entwickeln lassen, die Physik verstehen und so in der Robotik und in autonomen Fahrzeugen zum Einsatz kommen können. Außerdem kündigte Nvidia mit Nemotron eine Familie von Sprachmodellen zur Entwicklung von KI-Agenten für Unternehmen an. Dort sollen sie im Kundensupport, bei der Betrugserkennung oder in der Verwaltung von Lieferketten und Beständen genutzt werden können.

Die Entwicklung von KI-Modellen mit physikalischem Verständnis setzt ein hohes Volumen an Trainingsdaten voraus. Mit Cosmos sollen Entwickler durch die Eingabe von Text, Bildern und Videos sowie Sensor- und Bewegungsdaten physikalisch korrekte Trainingsvideos erhalten, die Tests in der echten Welt ersetzen. Ebenfalls lassen sich in Nvidia Omniverse entwickelte 3D-Szenarien in Videos umwandeln. Das Unternehmen verspricht, Cosmos könne mittels Nvidia Blackwell 20 Millionen Stunden Videomaterial innerhalb von zwei Wochen verarbeiten.

Neben dem großen Sprachmodell Llama Nemotron umfasst die Modellfamilie auch Cosmos Nemotron, ein visuelles Sprachmodell, welches auf die Erkennungs- und Analysefähigkeiten des Weltmodells zurückgreift. In Kombination lassen sich die beiden Sprachmodelle für Anwendungen in Unternehmen nutzen. Denkbar sind etwa Warenlager, deren aktuelle Bestände durch Kameras erfasst werden. Eine KI-Anwendung analysiert die Bilder und gleicht die erfassten Güter mit den gespeicherten Aufzeichnungen ab.

Neben den neuen KI-Modellen präsentierte Nvidia neue Blueprints für KI-Agenten. Dazu arbeitete das Unternehmen teilweise mit Partnern zusammen. Die Vorlagen decken Funktionen für häufig genutzte Einsatzzwecke ab. So sollen Entwickler an Unternehmen angepasste KI-Anwendungen herstellen können, ohne selbst deren Grundfunktionen schaffen zu müssen. Mit den Blueprints sollen sich KI-Agenten erstellen lassen, die etwa Code kommentieren, Repositories strukturieren oder automatisierte Web-Recherchen erstellen.

Eine eigens von Nvidia entwickelte Vorlage umfasst die Umwandlung von PDF-Inhalten zu Podcasts. Ein damit entwickelter KI-Agent soll Texte, Tabellen und Bilder aus PDF-Dateien zusammenfassen und Nutzern als Monolog oder Gespräch zur Verfügung stellen können. Der Hersteller verspricht, dass Anwender so die Informationen effizienter und in ihrer eigenen Geschwindigkeit lernen können. Entwickler können die Blueprints mit vorgefertigten Konfigurationen auf Endgeräten, in Rechenzentren oder in der Cloud ausführen.

Nvidia stellt die KI-Modelle in drei Stufen zwischen 4 und 14 Milliarden Parametern zur Verfügung. Die kleinste Stufe Nano ist für PCs und andere Endgeräte angedacht, mit der Ultra-Stufe zielt Nvidia auf die Nutzung in Rechenzentren. Cosmos- und Nemotron-Modelle stehen unter der Open-Model-Lizenz, die eine kommerzielle Nutzung gestattet, sind aber nicht quelloffen wie NVLM. Unternehmen erhalten die Modelle künftig auch über die Nvidia AI-Enterprise-Plattform und als Teil der NIM Microservices. Einige von ihnen stehen bereits als Vorschau bereit.

Heise Medien ist offizieller Medienpartner der CES 2025.

(sfe)