Stapelspeicher HBM3: Schnellstes DRAM für Grafikkarten und Beschleuniger

Eine Grafikkarte mit vier HBM3-Stacks käme auf eine Kapazität von 96 GByte und eine Übertragungsrate von fast 3,3 TByte/s.

In Pocket speichern vorlesen Druckansicht 6 Kommentare lesen

(Bild: SK Hynix)

Lesezeit: 2 Min.

SK Hynix hat den ersten Stapelspeicher nach dem Standard High-Bandwidth Memory 3 (HBM3) angekündigt: Ein Stack überträgt 819 GByte/s und fasst bis zu 24 GByte. Hersteller können mehrere Stapel kombinieren, um die Übertragungsrate und Kapazität zu erhöhen. Bei einer typischen Konfiguration mit vier Bausteinen wie bei AMDs früherer Grafikkarte Radeon VII wären beispielsweise 96 GByte und beinahe 3,3 TByte/s drin.

HBM3 setzt genauso wie HBM, HBM2 und HBM2e auf 1024 Datenverbindungen pro Stack. Die zusätzliche Geschwindigkeit entsteht durch höhere Taktfrequenzen von 6,4 Gbit/s pro Pin. Die schnellsten HBM2e-Stapel kamen noch auf 3,6 Gbit/s pro Pin beziehungsweise 461 GByte/s je Stack. Die Speicherhersteller Samsung, SK Hynix und Micron hatten HBM2e als Zwischenschritt eingeschoben, um die Kapazität zu verdoppeln und die Übertragungsrate ausgehend von 256 GByte/s bei HBM2 zu erhöhen, ohne auf HBM3 warten zu müssen.

Die HBM3-Spezifikation ermöglicht jetzt, 12 statt wie bisher maximal 8 SDRAM-Chips zu stapeln. Mit jeweils 16 Gbit kommt SK Hynix so auf 24 GByte. Dabei ist jede einzelne Speicherlage mit einer Dicke von 30 Micrometern dünner als ein Blatt Papier – die Verbindung erfolgt über Through-Silicon Vias (TSVs). Alternativ will SK Hynix auch eine derzeit typische Konfiguration mit 16 GByte anbieten.

Zur Serienproduktion äußert sich SK Hynix in der Mitteilung noch nicht. Traditionell beliefern Speicherhersteller Partner weit vor der offiziellen Markteinführung. SK Hynix merkt an, dass auch HBM3 primär bei High-End-Grafikkarten und Beschleunigermodellen in Rechenzentren zum Einsatz kommen dürfte, etwa in Form von KI-Rechenkarten.

Nach AMDs ersten Gehversuchen mit HBM2 bei Gaming-Grafikkarten gibt es keine aktuellen Radeons oder GeForces mehr mit Stapelspeicher. GDDR6(X) mit besonders hohen Taktfrequenzen hat sich als günstigere und ausreichend schnelle Alternative erwiesen. Die GeForce RTX 3090 schafft damit etwa Übertragungsraten von knapp 1 TByte/s. AMD setzt bei der Radeon-Baureihe RX 6000 hingegen auf einen riesigen SRAM-Puffer in den GPUs, Infinity Cache genannt, um das Speicher-Interface zu entlasten und somit Bandbreite zu sparen.

Im Falle von HBM erhöht das Packaging die Produktionskosten, da die Stapel direkt neben der GPU oder CPU auf einem Träger – üblicherweise in Form eines aktiven Silizium-Interposers – sitzen müssen.

(mma)