Top500-Supercomputer: Neuer Schwung dank Nvidia H100 und Intel-Chips

Die Gesamtleistung der Superrechner auf der 62. Top500-Liste stieg um 34 Prozent. Nvidias H100 punktet in mehreren Systemen, Intels Aurora enttäuscht.

In Pocket speichern vorlesen Druckansicht 4 Kommentare lesen
Installation des Supercomputers Aurora am Argonne National Laboratory

Installation des Supercomputers Aurora am Argonne National Laboratory

(Bild: Argonne National Laboratory)

Update
Lesezeit: 11 Min.
Von
  • Andreas Stiller
Inhaltsverzeichnis

Nun ist es endlich da, das lang erwartete Aurora-System am Argonne National Lab – mit fünf Jahren Verspätung und ganz anderen Prozessoren als ursprünglich geplant. Eigentlich sollte es im Rahmen des US Exascale Computing Projects, finanziert vom Department of Energy (DOE), ein Exascale-Rechner werden, aber darauf muss man weiter warten. Laut der neuen und nunmehr 62. Top500-Liste der Supercomputer schafft Aurora gerade die Hälfte. Aber das reicht immerhin für Platz 2 hinter dem seit Mitte 2022 amtierenden Spitzenreiter Frontier mit AMD-Technik.

Zwar jubelten im Juni dieses Jahres Intel und HPE, nun sei Aurora endlich "fully equipped" mit allen 10.624 Blades, deshalb waren die Erwartungen hoch. Doch offenbar fehlen immer noch zahlreiche Sapphire-Rapids-Prozessoren (Xeon CPU Max 9470) und vor allem wohl Ponte-Vecchio-Rechenbeschleuniger (Data Center GPU Max 1550), denn der für die Einstufung in die Top500-Liste zugrunde gelegte Linpack-Benchmark (HPL) lief nur mit halber Kraft und kam so nur auf schlappe 585 Petaflops (PFlops). Das ist nur etwas mehr als die Hälfte dessen, was der Frontier des Oak Ridge National Lab ins Feld führt, der damit weiterhin als einziges Exascale-System die Top500-Liste anführt.

Was hatte Intel zuvor getrommelt? Von 52 Teraflops (TFlops) Spitzenleistung pro Ponte-Vecchio-GPU war die Rede. Bei Vollausbau mit 63.744 GPUs wären das allein schon 3,3 Exaflops (EFlops) theoretische Spitzenleistung (RPeak) und da käme noch die Leistung von über einer Million Rechenkernen der Max-9470-Xeons mit HBM-RAM hinzu.

Update

Im Aurora kommt allerdings eine Custom-Version der Data Center GPU Max 1550 zum Einsatz, die rund 31 TFlops leistet.

Top10 der 62. Top500-Liste vom November 2023 (10 Bilder)

Top500-Rang 1

Bleibt mit knapp 1,2 Exaflops weiterhin Nummer 1: Frontier am Oak Ridge National Laboratory der USA.
(Bild: HPE/Oak Ridge National Laboratory)

Okay, Intel hat wohlweislich nicht ganz so hoch gestapelt und lediglich von "über 2 EFlops Peak" gesprochen – aktuell sind es aber nur 1,06 EFlops, denn statt mit 21.248 Xeons und 63.744 GPUs wirkten nur 10.878 Xeons und 32.634 GPUs mit.

Auch die Effizienz von Aurora ist weit schlechter als bislang allgemein angenommen: Im HPL-Benchmark liefert er lediglich 55,3 Prozent seiner theoretischen Spitzenleistung, liegt damit in der Liste auf Platz 295. Zum Vergleich: Der führende Frontier kommt auf 71,1 Prozent.

Und bei der Energieeffizienz sieht es noch krasser aus: 23,7 GFlops/W im Vergleich zu 52,6 GFlops/Watt des Frontier. Fazit: Die Blamage von Intel setzt sich fort.

Frontier kommt überdies mit einem speziell optimierten Linpack-Lauf sogar auf 62,7 GFlops/W, belegt damit Platz 2 der Green500-Liste und liegt damit vor drei weiteren HPE/AMD-Rechnern.

Die Spitze der Green500 markiert mit 65,4 GFlops/W weiterhin der speziell auf Energieeffizienz getrimmte, relativ schwache Rechner Henri am Flatiron-Institut mit Intel Xeon und Nvidia H100.

Drei weitere Systeme sind wie Aurora mit Intels Max-CPUs und Max-GPUs bestückt: Dawn von Dell an der Universität in Cambridge mit 19,5 PFlops (Platz 41), SuperMUC NG Phase 2 von Lenovo am Leibniz-Rechenzentrum mit 17,2 PFlops (Platz 52) und Clementina XXI, ebenfalls von Lenovo, in Argentinien am Servicio Meterologico Nacional mit 3,9 PFlops auf Platz 196.

Intels Data Center GPU Max alias Ponte Vecchio in den Versionen als PCIe-Karte und als 600-Watt-Modul mit 128 GByte HBM2e-RAM.

(Bild: c’t Magazin/C. Windeck)

Alle drei haben aber nur je zwei GPUs pro Prozessor eingebaut, während es bei Aurora derer drei sind. Die Effizienzen variieren sehr, bei den beiden Lenovo-Maschinen sind es 61,5 beziehungsweise 64,7 Prozent, beim Dell-System in Cambridge schlappe 36,1 Prozent. Das hängt natürlich auch davon ab, wie viel Aufwand man in die Optimierung des Linpack-Laufs hineingesteckt hat. Das Leibniz-Rechenzentrum hat auch Energieeffizienz gemessen, die sich aber kaum vom schlechten Aurora-Wert unterscheidet.

Es gibt auch Sapphire-Rapids-Systeme ohne GPUs, etwa der Crossroads der National Nuclear Security Administration, aufgebaut von HPE, der mit 12.708 Xeon-Max-Prozessoren mit je 56 Kernen ins Rennen geht und 30 PFlops (Platz 24) erreicht, mit 75 Prozent HPL-Effizienz. Aber hier ist dann die Energieeffizienz mit 4,8 GFlops/W im Abseits. Viele andere neue Xeon-Cluster haben Nvidia-GPUs eingebaut.

Anders als bei der vorangegangenen Top500-Liste vom Sommer 2023 hat sich in der Spitze der Top10 einiges verändert. Knapp hinter Aurora schob sich mit 561 PFlops ein Cloud-System von Microsoft Azure auf Platz 3, ebenfalls mit Sapphire Rapids, aber mit Nvidia H100 als GPU.

Zwei weitere Systeme mit ebendieser Intel/Nvidia-Kombination belegen die Plätze 8 und 9: Der EuroHPC MareNostrum 5 ACC in Barcelona mit 138 PFlops und Nvidias hauseigener Supercomputer EOS mit 121 PFlops.

Der andere EuroHPC-Rechner in den Top10, Lumi mit AMD-CPUs und -GPUs am Standort Finnland, wurde noch ein bisschen von 309 auf 378 PFlops aufgerüstet (Platz 5). Das reicht aber nicht, um den japanische Fugaku mit ARM64FX mit 442 PFlops zu überholen, der nunmehr Platz vier belegt.

Chinas Sunway TaihuLight mit seinen 93 PFlops ist derweil aus den Top10 verdrängt (Platz 11). Aber China ist bezüglich Top500 ja aus dem Rennen. Aus Protest gegen die Exportbeschränkungen der USA werden schon seit einiger Zeit so gut wie keine Neusysteme mehr gemeldet – diesmal genau Null.

Lenovo als Besitzer der alten IBM-Werke kann aber diverse Neusysteme vermelden, wenn auch nur im chinesischen Ausland. Passenderweise findet parallel zur SC23 das Gipfeltreffen der Asiatisch-Pazifischen Wirtschaftsgemeinschaft (APEC) in den USA statt, wo auch Joe Biden und Xi JinPing miteinander sprechen wollen und vielleicht bahnt sich wieder etwas Entspannung an.