Top500-Supercomputer: Europa hat die zweitmeiste Rechenleistung

Seite 2: Warten auf den Euro-Prozessor

Inhaltsverzeichnis

Noch setzen die europäischen Supercomputer im Rahmen von EuroHPC JU auf amerikanische Prozessoren, aber die Europäische Prozessorinitiative (EPI) will mit dem hauseigenen Rhea-Prozessor im nächsten Jahr zumindest schon mal dessen Leistungsfähigkeit unter Beweis stellen, und zwar mit dem Multinode-Demonstration-Cluster EPAC-1.5. Exascale-Systeme sind für 2025 geplant.

Insgesamt will EuroHPC JU in den nächsten Jahren sieben Milliarden Euro für große und mittlere Super- und Quantencomputer investieren. Diverse Standorte wurden schon festgelegt, darunter sechs für Quantencomputer. Das erste EuroHPC-Exascale-System Jupiter soll nach Jülich.

Schaut man auf die Anzahl der Top500-Systeme pro Nation, liegt Deutschland mit 34 Systemen hinter China (162) und den USA (127), aber vor Japan (31), Frankreich (24) und Großbritannien (15).

Gegenüber der Juniliste sind das drei deutsche Systeme mehr. Vier sind neu, davon zwei Vektor-Rechner mit NEC SX-Aurora Tsubasa beim Deutschen Wetterdienst mit 6,4 PFlops (Platz 89) und 5 PFlops (Platz 114). Ein Lenovo ThinkSystem ist mit 2,3 PFlops (Platz 309) bei einer nicht näher genannten Firma hinzugekommen. Bei der Gesellschaft für wissenschaftliche Datenverarbeitung in Göttingen (GWDG) hat es Grete mit 1,8 PFlops auf Platz 470 geschafft, eine von Megware aufgebaute GPU-Partition mit AMD Milan und Nvidia A100. Grete arbeitet im Rahmen des Verbunds für Nationales Hochleistungsrechnen (HNR), das acht vom Bund unterstützt Rechenzentren und ein Konsortium mehrerer Unis in Deutschland umfasst. Ein Rechner von Huawei Deutschland fiel aus der Liste.

Das Leistungswachstum der Supercomputer auf der Top500-Liste im historischen Vergleich.

Während der Linpack-Benchmark die interne Rechenleistung bei gut parallelisierbaren Aufgaben abbildet, deren Daten zumeist innerhalb der Caches liegen, adressiert der HPCG-Benchmark vorrangig das Speichersystem mit weniger gut parallelisierbaren Anteilen. Daher liegen die ebenfalls in Flops angegebenen Werte weit unter denen des Linpack. Etwas über 100 der Top500-Rechenzentren haben auch hierfür Werte gemeldet. In dieser Disziplin bleibt Fugaku weiterhin mit 16 PFlops an der Spitze, vor dem Frontier (14 PFlops) und Lumi (3,4 PFlops).

Der Top500-Linpack rechnet mit Gleitkomma bei doppelter Genauigkeit (FP64). Für KI sind weitaus geringere Genauigkeiten nötig, zum Teil bis hinunter auf 8 Bit. Und so sieht man etwa für Leonardo, dass er bis zu 10 "KI-Exaflops" leisten soll. Die KI-Werte sind bisher allerdings recht beliebig definiert, hier muss man sich noch auf standardisierte Benchmarks einigen, etwa Facebooks Dynabench.

Bei den Herstellern hält Lenovo stückzahlmäßig seine Spitzenposition mit 160 (zuvor 161) vor HPE (101, zuvor 96), Inspur (50, zuvor 50) und Atos/Bull (43, zuvor 42). Erwähnenswert ist hierbei, dass die mittelständische Firma Megware aus Chemnitz mit 7 platzierten Systemen in Deutschland und Österreich recht gut dabei ist.

Spannend ist der Blick auf Prozessor- und Coprozessorhersteller. Bei ersteren führt stückzahlmäßig weiterhin Intel mit 379 (zuvor 388) vor AMD (101, zuvor 93) und Power (8). Dahinter kommt immer noch nicht ARM, sondern NECs Vector Engine mit inzwischen 6 Installationen. Im November 2006, zu den besten Opteron-Zeiten, konnte AMD mal 113 Top500-Systeme bestücken, da ist man jetzt nahe dran.

Bei der aggregierten Top500-Performance kann AMD dank Frontier, Lumi und so weiter mit 2,4 EFlops die Intel-Konkurrenz düpieren (1,6 EFlops). Bis auf Clara am Deutschen Zentrum für Luft- und Raumfahrt, wo noch ein AMD Naples (Zen 1) wirbelt, sind alle anderen mit Rome (Zen 2) oder Milan (Zen 3) bestückt.

Etwa ein Drittel, genau 178 der 500 Systeme, verwenden Beschleuniger, 10 mehr als in der vorigen Liste. Davon sind 163 (92 Prozent) von Nvidia, AMD hat 9 Systeme auf der Liste, alle mit Instinct MI250X.

Top10 der 60. Top500-Liste
Platz (zuvor) System (Hersteller) Einrichtung Land Linpack Rmax (PFlops) Energie-Effizienz (GFlops/W) HPCG (TFlops) CPU-Cores GPU-Cores
1 Frontier Oak Ridge National Lab USA 1102 52,2 14.054 9408 × 64 AMD Epyc Milan 31.790 × 256 AMD MI250X
2 (1) Fugaku (Fujitsu) Riken Japan 442 15,4 16.004 158.976 × 48 A64FX 2,2 GHz
3 Lumi EuroHPC/CSC Finnland + LUMI-Länder 309,1 51,53 1.936 2352 × 64 AMD Epyc Milan 8085 × 256 AMD MI250X
4 (-) Leonardo EuroHPC/Cineca Italien + EuroHPC 174,7 31,14 2.566 2772 × 32 Intel Xeon 8358 11.088 × 124 Nvidia A100
5(4) Summit (IBM) Oak Ridge National Lab USA 148,6 14,7 2.926 9.216 × 22 IBM Power9 27.648 × 80 Nvidia V100
6 (5) Sierra (IBM) Lawrence Livermore National Lab USA 94,6 12,7 1.796 8.640 × 22 IBM Power9 17.280 × 80 Nvidia V100
7(6) Sunway TaihuLight (NRCPC) National Supercomputing Center in Wuxi China 93 6,05 481 40.960 × 260 ShenWei 26010
8 (7) Perlmutter (HPE/Cray) NERSC USA 70,9 27,3 1.905 1536 × 64 AMD Epyc Milan 6144 × 108 Nvidia A100
9 (8) Selene Nvidia USA 63,5 23,9 1.623 1120 × 64 AMD Epyc Rome 4480 × 108 Nvidia A100
10 (9) Tianhe-2A (NUDT) National Supercomputing Center in Guangzhou China 61,4 3,32 k.A. 35.584 × 12 Intel Xeon E5-2692v2 35.584 × 128 Matrix 2000

(ciw)