Weltweit schnellster Supercomputer Aurora: Der letzte Blade ist eingebaut

Was lange währt, wird hoffentlich endlich gut: Die Hardware für den 2-Exaflops-Rechner Aurora ist zusammengebaut. Ab November soll er die Top500-Liste anführen.

In Pocket speichern vorlesen Druckansicht 155 Kommentare lesen

Ein Bauteam zeigt sich zufrieden vor dem fertiggestellten Aurora-Supercomputer.

(Bild: Argonne National Laboratory)

Lesezeit: 2 Min.

Intel und das US-amerikanische Forschungslabor Argonne National Laboratory haben die Fertigstellung des Supercomputers Aurora bekanntgegeben. Nach jahrelangen Verzögerungen und Neuentwürfen hat der Partner HPE kürzlich den letzten der insgesamt 10.624 Blades installiert. Die Hardware ist somit komplett, jetzt geht es darum, die Software abzustimmen.

Die 10.624 Blades stecken in insgesamt 166 Racks und behausen jeweils zwei Xeon-Max-Prozessoren aus der Sapphire-Rapids-Familie sowie sechs Max-GPU-Beschleuniger (Codename Ponte Vecchio). Aurora kommt somit auf 21.248 CPUs und 63.744 GPUs. Bei den Prozessoren dürfte es sich um die Xeon Max 9480 handeln; die GPUs stellen laut Intel angepasste Versionen dar, die es sonst nicht zu kaufen gibt.

Insgesamt käme Aurora somit auf 1.189.888 CPU-Kerne. Zusätzlich zu den 10,9 PByte DDR5-RAM (zusammen 5,95 PByte/s) nutzen sowohl die CPUs als auch die GPUs lokales High-Bandwidth Memory vom Typ HBM2e: jeder Prozessor 64 GByte, jeder GPU-Beschleuniger 128 GByte. Das ergibt einen HBM2e-Speicherpool von 1,36 PByte (CPUs, max. 30,5 PByte/s) plus 8,16 PByte (GPUs, max. 208,9 PByte/s).

Spezifikationen von Aurora, die Intel im Mai 2023 geteilt hatte. Die 230 PByte Massenspeicher sind physisch vorhanden, nutzbar sollen davon 220 PByte sein.

(Bild: Intel)

Aufgrund der Größe und der Geschwindigkeit des HBMs zusammen mit KI-spezifischen Erweiterungen in der Hardware soll sich Aurora neben klassischen Workloads auch besonders gut zum Trainieren neuronaler Netze eignen. Das System ist unter anderem zur Krebs-, Klima- und Atomforschung gedacht.

Alle Blades sind wassergekühlt und wiegen jeweils rund 32 Kilogramm. 1024 Blades fungieren als Storage-Nodes und stellen insgesamt 220 PByte nutzbaren Massenspeicher bereit. Die Systeme greifen aufaddiert mit 31 TByte/s auf die Datenträger zu.

Intel und das Argonne National Laboratory erwarten, dass Aurora eine Rechenleistung von mehr als zwei Exaflops bei doppelter Genauigkeit (Floating Point mit 64-Bit-Instruktionen, FP64) schafft. Die nächste Top500-Liste der weltweit schnellsten Supercomputer, die zum November 2023 erscheint, soll Aurora anführen. Bisher führt der Supercomputer Frontier mit Prozessoren und GPU-Beschleunigern von AMD die Liste an – 1,1 Exaflops schafft das System auf Dauer.

Update

Intel hat klargestellt, dass 220 PByte Massenspeicher nutzbar sind.

(mma)