AMD-Grafikchip Arcturus: Compute-Monster mit 8192 Shader-Kernen

RDNA-Architektur für Spieler-Grafikkarten, GCN für Compute-Beschleuniger: AMD plant offenbar einen weiteren Vega-Ableger als Radeon Instinct MI100.

In Pocket speichern vorlesen Druckansicht 36 Kommentare lesen
AMD-Grafikchip Arcturus: Compute-Monster mit 8192 Shader-Kernen

(Bild: Carsten Spille / c't)

Lesezeit: 2 Min.

AMD krempelt seine Grafikarchitektur Graphics Core Next (GCN) für seine Compute-Beschleunigerserie Radeon Instinct um. Schon seit Monaten enthalten AMDs Linux-Patches Neuerungen zu einem Arcturus getauften Grafikchip, der technisch zwar zu Vega (z. B. Radeon VII) zählt, aber ohne 3D-Funktionen keine Spiele rendern kann.

Arcturus soll laut Linux-Patch auf 128 Compute-Units setzen – doppelt so viele wie die beiden Grafikchips Vega 10 und Vega 20. Das spricht für 8192 statt 4096 Shader-Rechenkerne. AMD nennt im Linux-Treiber bereits eine Radeon Instinct MI100, auf der die Arcturus-GPU sitzen dürfte. Der Modellname bezieht sich üblicherweise auf die Rechenleistung im INT8-Format, was gegenüber der Radeon Instinct MI60 einer Steigerung von 60 auf 100 Billionen Operationen pro Sekunde (TOPS) entspräche. FP32 und FP64 wären demnach mit 25 beziehungsweise 12,5 TFLOPS möglich.

Änderungen an der Architektur helfen, die Leistungsaufnahme zu verringern – immerhin weist schon die bisherige Radeon Instinct MI60 eine Thermal Design Power (TDP) von 300 Watt auf. AMD-Ingenieure sprechen von einer fehlenden 3D-Engine. Je nachdem, wie weit die Anpassungen reichen, könnten das Render-Backend oder gar die Textureinheiten wegfallen. Das würde sowohl Energie als auch Chipfläche sparen. Streng genommen ließe sich Arcturus somit eher als Compute- statt Grafikchip bezeichnen.

TechPowerUp hat das BIOS eines MI100-Vorserienmodells ausgewertet, das Taktfrequenzen von 1091 bis 1334 MHz bei einer Total Board Power (TBP) von 200 Watt vorsieht. 32 GByte HBM2-Speicher laufen mit 1000 bis 1200 MHz. Mit vier Speicher-Stacks an 4096 Datenbahnen entspräche das einer Übertragungsrate von 1 bis 1,2 TByte/s. Vorserienmodelle laufen häufig gedrosselt, sodass die finalen Compute-Beschleuniger höhere Werte bei steigender Leistungsaufnahme erreichen könnten.

Radeon-Instinct-Beschleuniger sitzen in Servern und trainieren zum Beispiel KI-Netzwerke. Bilder geben sie dort nicht aus. Mit einer Verdoppelung der Video-Core-Next-Blöcke (zwei statt eine VCN) vergrößert AMD offenbar die Anzahl der Nutzer, welche per Stream auf die Rechenleistung einer Radeon Instinct MI100 zugreifen können. (mma)