Neuer Navy-Supercomputer Blueback mit AMD Epyc Genoa und MI300A

AMD bringt seine Epyc- und MI300A-Prozessoren im nächsten Supercomputer unter: Der Blueback der US-Navy ersetzt drei ältere HPC-Rechner der US-Marine.

6

23.07.2023, 14:01 Uhr

Lesezeit: 2 Min.

c't Magazin

Von

Carsten Spille

Verglichen mit El Capitan, Frontier oder auch nur Lumi ist Blueback zwar ein eher kleiner Supercomputer, aber auch hier fasst AMD weiter Fuß. In der aktuellen Top500-Liste der schnellsten Superrechner würde er sich auf Platz 50 einreihen. Wie Christine Cuicchi, Direktorin des Navy DoD Supercomputing Resource Center kürzlich veröffentlichte, soll der neue Supercomputer, benannt nach der USS Blueback, einem U-Boot der US-Marine, 2024 im Einsatz sein. Mit seinen 17,7 PFlops ersetze er drei ältere Navy-Supercomputer, so Cuicchi.

Das System wird im Navy DoD Supercomputing Resource Center (Navy DSRC) aufgebaut und betrieben vom "Commander, Naval Meteorology and Oceanography Command (CNMOC)" im Stennis Space Center, Mississippi.

Von HPE geliefert

Die Rechenleistung wird dabei primär von AMD Epyc-Prozessoren der Genoa-Generation mit insgesamt 256.512 Kernen gestellt. Käme dabei jeweils der Vollausbau mit 96 Kernen zum Einsatz, wären das 2672 Epyc-Prozessoren. Unterstützt werden sie von 128 MI300A-Beschleunigern, die ihrerseits bis zu 3072 Zen4-Kerne mitbringen, 24 pro APU. Ob sie als eigenständige Rechenknoten arbeiten werden oder als Beschleuniger im Verbund mit einem oder zwei Epyc-Prozessoren arbeiten, ist noch nicht bekannt.

Das System wird von HPE geliefert und stammt aus der EX4000-Reihe. Die Datenverbindung übernimmt ein Slingshot-11-Interconnect von Cray mit 200 GBit/s. Das System wird über 538 TByte Hauptspeicher verfügen und über ein Tiered-Storage-System mit 2 PByte NVMe-Speicher und die zehnfache Menge Festspeicher in einem Cray ClusterStor E1000 Lustre.

AMDs MI300A-Beschleuniger vereint erstmals die aktuellen Zen-4-Prozessorkerne mit Beschleunigerkernen vom Typ CDNA3. Bei der MI250(X) war die Programmierung noch durch die langsame Verbindung zwischen den beiden GCDs erschwert und durch die Tatsache, dass sich beide als einzelne OpenCL-Geräte präsentierten. Die CDNA3-Recheneinheiten im MI300A können mit voller Geschwindigkeit auf den bis zu 128 GByte großen HBM3-Speicher zugreifen – anders als bei der reinen Beschleunigerversion MI300X ist er nur noch 128 GByte groß. MI300A hat 146 Milliarden Transistoren, 78 Prozent mehr als selbst die Bergamo-Epyc-CPUs mit 128 Kernen. Die Beschleunigerversion MI300X hat gar 153 Milliarden Transistoren.