Die Exascale-Ära ist eingeläutet: Die 59. Top500-Liste der Supercomputer

Inhaltsverzeichnis

Trotz des aktuellen Stillstands bleibt China mit den 173 „Altsystemen“ Spitzenreiter bei den Ländern. Die USA konnten allerdings gegenüber der letzten Liste von November 2021 nicht zulegen, sondern hat im Gegenteil nur noch 127 (von zuvor 144) Systemen platziert.

Europa (ohne Russland) hingegen legte von 98 auf 111 zu, den stärksten Zuwachs hatte Deutschland von 26 auf 31. In der installierten Performance sieht das allerdings recht anders aus, hier steht dank des mächtigen Frontiers und der anderen Cray-EX235a-System die USA mit 2,1 EFlops weit vorne vor Europa (816 PFlops), Japan (628 PFlops) und China (530 PFlops).

Innerhalb Europas führt Deutschland (200 PFlops) vor Frankreich (169 PFlops) und der Lumi-Gruppe mit Sitz in Finnland (165 PFlops). Mit recht weitem Abstand folgt dahinter Großbritannien (57 PFlops).

Bei den Herstellern verzerrt Chinas Stillstand auch die Zahlen, dennoch führt hier in Stückzahl weiterhin Lenovo mit 159 vor HPE/Cray mit 98, aber HPE/Cray liegt natürlich mit insgesamt 1,9 EFlops in anderen Regionen als Lenovo mit 445 PFlops.

Trotz der vielen Änderungen im Top10-Bereich gab es nur sehr wenige Neusysteme in der Liste, mit 39 die geringste Erneuerungsrate seit dem fast 30-jährigen Bestehen der Top500-Liste. Neun Neusysteme stehen in den USA, fünf in Deutschland.

In Deutschland dominieren weiterhin die drei Großzentren des Gauss Centre for Supercomputer die Szene, unverändert wie im letzten Jahr: vorne Jülich mit dem Juwels Booster (Bull Sequana, AMD Epyc 7402, Nvidia A100, 44,1 PFlops, Platz 11), gefolgt vom SuperMUC-NG des Leibnizrechenzentrums (LRZ: Lenovo, Xeon Platinum 8174, 19,4 PFlops, Platz 26) und dem Hawk am HLR-Stuttgart (HPE, AMD Epyc 7742, 19,3 PFlops, Platz 27).

Der Noctua 2 am Paderborn Center for Parallel Computing hat AMD-Epyc-7763-Knoten, aber auch welche mit Nvidia A100 sowie mit AMD-/Xilinx-FPGAs (Alveo U280).

(Bild: Uni Paderborn/Jens Simon)

Die Liste der fünf Neuplazierten führt der alpha One des Heidelberger KI-Forschungs- und Anwendungsunternehmens Aleph Alpha mit Platz 73 an. Das Apollo-6500-System von HPE arbeitet mit kleineren AMD EPYC 7F52 (16 Kerne) und Nvidia A100 und kommt auf 7,6 PFlops im Linpack.

Dahinter folgt bei den Neulingen auf Platz 121 der “Noctua 2” der Universität Paderborn, eine BullSequana XH2000, ebenfalls bestückt mit AMD Epyc, aber mit den “dicken” 64-Kernern Epyc 7712 und ohne Beschleuniger, das 4,2 PFlops auf die Matte bringt.

Alex der FAU-Uni Erlangen-Nürnberg setzt ebenfalls auf dickere 64-Kern-AMD-Prozessoren (Epyc 7713), allerdings begleitet von Nvidias A100-Beschleunigern. Damit erzielt er 2,2 PFlops und erreicht Platz 184 (Update: hier wurde irrtümlich Platz 324 genannt). Alex wurde von der Chemnitzer Firma Megware aufgebaut, die gleich noch zwei Intel-Xeon-Systeme in Deutschland neu ins Top500-Rennen bringen konnte: Fritz, ebenfalls an der FAU ("Fritz-Alex-Uni") mit 2,2 PFlops auf Platz 323 und HSuper an der Helmut-Schmidt-Universität der Bundeswehr in Hamburg mit 2,1 PFlops, auf Platz 339. Megware hat mit Lichtenberg an der Uni Darmstadt (Platz 165) und Mogon II (zusammen mit NEC, Platz 397) an der Uni Mainz aktuell noch zwei weitere Systeme in der Liste. Die ostdeutsche Firma Megware wurde 1990 unmittelbar nach der Wende gegründet und konnte seitdem mit 25 Systemen in der Top500 aufwarten, zumeist in Deutschland, aber auch in Österreich und Norwegen.

Intel dominiert zwar mit 388 von 500 Systemen weiterhin die Liste, ist damit jedoch weit von der Dominanz der früheren Jahre entfernt, wo Intel auf bis zu 478 von 500 kam. 94 Systeme sind inzwischen mit AMD bestückt. Was Intel zu denken geben muss, ist, dass 20 der 39 Neusysteme mit AMD-Prozessoren bestückt sind.

Das hat insbesondere auch seinen Grund in der enormen Verspätung der speziell für HPC vorgesehenen Prozessoren. Ursprünglich war für das Exascale-Projekt Aurora ja ein Xeon Phi vorgesehen. Just hier am ISC-Tagungsort in Hamburg hatte Intels damaliger HPC-Chef Kirk Skaugen vor zehn Jahren für 2018 die ersten Exascale-Systeme mit Xeon Phi versprochen. Daraus wurde jedoch nichts, der Xeon Phi wurde eingestampft und Kirk Skaugen wechselte zu Lenovo. Intel versprach dann neue HPC-Prozessoren (Sapphire Rapids) und GPUs (Ponte Vecchio), die aber auf sich warten ließen: Aurora wurde Jahr um Jahr verschoben.

Auch das Leibnizrechenzentrum in München/Garching hat sich auf Intels HPC kapriziert – und mitgewartet. Hoffentlich nicht umsonst, Samuel Becketts Godot kam ja auch nie ... Nun wird aber Aurora am Argonne National Lab schon aufgebaut – allein die Prozessoren und GPUs fehlen noch.

Und damit nach vielen schlechten Erfahrungen nun mit den GPUs nichts anbrennt, hatte Intel vor einigen Jahren den legendären Raja Kudori von AMD abgeworben, der für die Vega-GPUs verantwortlich zeichnete und die Grundlagen für den Nachfolger Instrinct MI250X legte. Und dieser Nachfolger bietet jetzt dem GPU-Platzhirschen Nvidia heftig Paroli. Zwar findet man ihn in der aktuellen Top500-Liste nur in 7 Systemen, die es aber mit 1,32 EFlops in sich haben.

Nvidia hat demgegenüber 154 Rechner mit eigenen GPU-Beschleunigern in der Liste, die insgesamt aber nur auf 1,26 EFlops kommen. Und bei der Energieeffizienz (Green500) belegen wie eingangs erwähnt nun AMDs GPUs die vorderen Plätze, Nvidia ist weit zurückgefallen, am energieeffizientesten ist eine Apollo 6000 in Südkorea auf Platz 6 mit 34 GFlops/Watt.

Alle 500 Systeme zusammen kommen auf eine Leistung von 4,4 EFlops. Die Steigerung gegenüber der letzten Liste vor einem halben Jahr liegt damit mit 45 Prozent dank des neuen Spitzensystems Frontier weit über dem Schnitt der letzten Jahre.

Top10 der 59. Top500-Liste
Platz (zuvor) System (Hersteller) Einrichtung Land CPU-Cores GPU-Cores Linpack Rmax (PFlops) Energie-effizienz (GFlops/W) HPCG (TFlops)
1 Frontier Oak Ridge National Lab USA 9408 × 64 AMD Epyc Milan 37.632 × 256 AMD MI250X 1102 52,2 k.A.
2 (1) Fugaku (Fujitsu) Riken Japan 158.976 × 48 A64FX 2,2 GHz 442 15,4 16.004
3 Lumi  EuroHPC/CSC Finnland + LUMI-Länder 1134  × 64 4620  × 256 AMD MI250X 151,9 51,5 1.936
4 (2) Summit (IBM) Oak Ridge National Lab USA 9.216 × 22 Power9, 3,07 GHz 27.648 × 80 Tesla V100 148,6 14,7 2.926
5 (3) Sierra (IBM) Lawrence Livermore National Lab USA 8.640 × 22 Power9, 3,1 GHz 17.280 × 80 Tesla V100 94,6 12,7 1.796
6 (4) Sunway TaihuLight (NRCPC) National Supercomputing Center in Wuxi China 40.960 × 260 ShenWei 26010, 1,45 GHz 93,01 6,05 481
7 (5)  Perlmutter (HPE/Cray) NERSC USA 1536 × 64 AMD Epyc 7763, 2,45 GHz 6144 × 108 Nvidia A100 70,9 27,3 1.905
8 (6) Selene Nvidia USA 1120 × 64 AMD Epyc 7742, 2,25 GHz 4480 × 108 Nvidia A100 63,5 23,9 1.623
9 (7) Tianhe-2A (NUDT) National Supercomputing Center in Guangzhou China 35.584 × 12 Xeon E5-2692v2, 2,2 GHz 35.584 × 128 Matrix 2000 61,4 3,32 k.A.
10 Adastra GENCI/CINES Frankreich 338 × 64 AMD Milan 1162? x 256 AMD MI250X 46,1 50,03 562,1

(as)