Blackwell Ultra: Nvidia packt 288 GByte HBM3e auf eine GPU
Blackwell bekommt als Ultra-Version seine schnellste Ausbauform. Zudem entwickelt Nvidia seine erste große Server-CPU mit eigenen Rechenkernen.
Im Bild noch zu sehen: eine Blackwell-GPU der ersten Generation. Äußerlich unterscheidet sie sich kaum bis gar nicht von Blackwell Ultra.
(Bild: c't / csp)
Nvidia hat eine schnellere Version seiner Blackwell-GPU für KI-Rechenzentren angekündigt. Blackwell Ultra alias B300 soll in kompakten Datenformaten bis zu 50 Prozent flotter rechnen und bekommt gleichzeitig ein Speicher-Upgrade von 192 auf 288 GByte HBM3e. Dazu nutzt Nvidia Speicherbausteine mit zwölf statt acht DRAM-Lagen – damit steigt die Kapazität pro Baustein von 24 auf 32 GByte.
Unklar ist, was genau hinter B300 steckt. Zur Präsentation auf Nvidias Hausmesse GTC sprach Nvidia-Chef Jensen Huang von einer 50 Prozent höheren FP4-Rechenleistung: Ein B300 soll 15 statt 10 Petaflops schaffen beziehungsweise bis zu 30 statt 20 mit Sparsity. Dabei werden überflüssige Nullen in Matrizen entfernt. Auch neue "Attention"-Instruktionen standen auf einer Folie.
Im Online-Datenblatt zum Serversystem DGX GB300 mit den neu aufgelegten GPUs gibt Nvidia dagegen eine identische Rechenleistung zur vorherigen GB200-Variante an. Ob Blackwell Ultra also überarbeitete Chips verwendet, womöglich nur höher getaktet ist oder die Real-Rechenleistung hauptsächlich durch den größeren Speicher steigt, bleibt abzuwarten. Große KI-Modelle profitieren massiv von viel schnellem Speicher.
Blackwell-Ultra-Systeme sollen im zweiten Halbjahr 2025 erscheinen – von der einzelnen GPU über Boards mit Nvidias Grace-Prozessoren bis hin zu großen Racks.
(Bild: Nvidia)
Rubin Ultra als Vierfach-Chip
2026 folgt der echte Nachfolger mit neuer Architektur: Rubin. Der erste Ableger sieht Blackwell oberflächlich ähnlich. Es bleibt bei zwei großen Chips auf einem Träger, umrahmt von acht Speicherbausteinen. Nvidia wechselt allerdings auf schnelleren HBM4 und auch die Rubin-GPUs sollen unter der Haube kräftig zulegen: Huang spricht von einer bis zu 3,3-mal höheren Rechenleistung in simplen Datenformaten wie FP4.
Ein stärkeres Augenmerk legte Huang auf die Neuauflage Rubin Ultra für die zweite Jahreshälfte 2027. Sie koppelt zwei Rubin-GPUs, also insgesamt vier Chips und 16 HBM4-Bausteine aneinander. Theoretisch verdoppelt das die Rechenleistung, aber potenziell auch die elektrische Leistungsaufnahme.
(Bild: Nvidia)
Vera-CPU mit Custom-Kernen
Parallel bekommt der Prozessor Grace mit Vera einen Nachfolger. Nvidia wechselt von ARMs Standard-Neoverse-Kernen auf selbst entwickelte Custom-ARM-Kerne. Diese beherrschen anders als die Neoverse-Typen Simultaneous Multithreading (SMT) – die insgesamt 88 Kerne können also 176 Threads parallel abarbeiten.
Videos by heise
Überraschend ist die geringe Kernanzahl verglichen mit der Konkurrenz. Vorteilhaft dürfte vor allem die Systemintegration sein, da auch die Vera-CPUs per schnellem NV-Link-Interconnect mit GPU-Beschleunigern kommunizieren können.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
(mma)