Top500-Supercomputer: Europa hat die zweitmeiste Rechenleistung
Seite 2: Warten auf den Euro-Prozessor
Noch setzen die europäischen Supercomputer im Rahmen von EuroHPC JU auf amerikanische Prozessoren, aber die Europäische Prozessorinitiative (EPI) will mit dem hauseigenen Rhea-Prozessor im nächsten Jahr zumindest schon mal dessen Leistungsfähigkeit unter Beweis stellen, und zwar mit dem Multinode-Demonstration-Cluster EPAC-1.5. Exascale-Systeme sind für 2025 geplant.
Insgesamt will EuroHPC JU in den nächsten Jahren sieben Milliarden Euro für große und mittlere Super- und Quantencomputer investieren. Diverse Standorte wurden schon festgelegt, darunter sechs für Quantencomputer. Das erste EuroHPC-Exascale-System Jupiter soll nach Jülich.
Deutsche Superrechner
Schaut man auf die Anzahl der Top500-Systeme pro Nation, liegt Deutschland mit 34 Systemen hinter China (162) und den USA (127), aber vor Japan (31), Frankreich (24) und Großbritannien (15).
Gegenüber der Juniliste sind das drei deutsche Systeme mehr. Vier sind neu, davon zwei Vektor-Rechner mit NEC SX-Aurora Tsubasa beim Deutschen Wetterdienst mit 6,4 PFlops (Platz 89) und 5 PFlops (Platz 114). Ein Lenovo ThinkSystem ist mit 2,3 PFlops (Platz 309) bei einer nicht näher genannten Firma hinzugekommen. Bei der Gesellschaft für wissenschaftliche Datenverarbeitung in Göttingen (GWDG) hat es Grete mit 1,8 PFlops auf Platz 470 geschafft, eine von Megware aufgebaute GPU-Partition mit AMD Milan und Nvidia A100. Grete arbeitet im Rahmen des Verbunds für Nationales Hochleistungsrechnen (HNR), das acht vom Bund unterstützt Rechenzentren und ein Konsortium mehrerer Unis in Deutschland umfasst. Ein Rechner von Huawei Deutschland fiel aus der Liste.
Andere Benchmarks außer Linpack
Während der Linpack-Benchmark die interne Rechenleistung bei gut parallelisierbaren Aufgaben abbildet, deren Daten zumeist innerhalb der Caches liegen, adressiert der HPCG-Benchmark vorrangig das Speichersystem mit weniger gut parallelisierbaren Anteilen. Daher liegen die ebenfalls in Flops angegebenen Werte weit unter denen des Linpack. Etwas über 100 der Top500-Rechenzentren haben auch hierfür Werte gemeldet. In dieser Disziplin bleibt Fugaku weiterhin mit 16 PFlops an der Spitze, vor dem Frontier (14 PFlops) und Lumi (3,4 PFlops).
Der Top500-Linpack rechnet mit Gleitkomma bei doppelter Genauigkeit (FP64). Für KI sind weitaus geringere Genauigkeiten nötig, zum Teil bis hinunter auf 8 Bit. Und so sieht man etwa für Leonardo, dass er bis zu 10 "KI-Exaflops" leisten soll. Die KI-Werte sind bisher allerdings recht beliebig definiert, hier muss man sich noch auf standardisierte Benchmarks einigen, etwa Facebooks Dynabench.
Hersteller-Vergleich
Bei den Herstellern hält Lenovo stückzahlmäßig seine Spitzenposition mit 160 (zuvor 161) vor HPE (101, zuvor 96), Inspur (50, zuvor 50) und Atos/Bull (43, zuvor 42). Erwähnenswert ist hierbei, dass die mittelständische Firma Megware aus Chemnitz mit 7 platzierten Systemen in Deutschland und Österreich recht gut dabei ist.
Spannend ist der Blick auf Prozessor- und Coprozessorhersteller. Bei ersteren führt stückzahlmäßig weiterhin Intel mit 379 (zuvor 388) vor AMD (101, zuvor 93) und Power (8). Dahinter kommt immer noch nicht ARM, sondern NECs Vector Engine mit inzwischen 6 Installationen. Im November 2006, zu den besten Opteron-Zeiten, konnte AMD mal 113 Top500-Systeme bestücken, da ist man jetzt nahe dran.
Bei der aggregierten Top500-Performance kann AMD dank Frontier, Lumi und so weiter mit 2,4 EFlops die Intel-Konkurrenz düpieren (1,6 EFlops). Bis auf Clara am Deutschen Zentrum für Luft- und Raumfahrt, wo noch ein AMD Naples (Zen 1) wirbelt, sind alle anderen mit Rome (Zen 2) oder Milan (Zen 3) bestückt.
Etwa ein Drittel, genau 178 der 500 Systeme, verwenden Beschleuniger, 10 mehr als in der vorigen Liste. Davon sind 163 (92 Prozent) von Nvidia, AMD hat 9 Systeme auf der Liste, alle mit Instinct MI250X.
Top10 der 60. Top500-Liste | ||||||||
Platz (zuvor) | System (Hersteller) | Einrichtung | Land | Linpack Rmax (PFlops) | Energie-Effizienz (GFlops/W) | HPCG (TFlops) | CPU-Cores | GPU-Cores |
1 | Frontier | Oak Ridge National Lab | USA | 1102 | 52,2 | 14.054 | 9408 × 64 AMD Epyc Milan | 31.790 × 256 AMD MI250X |
2 (1) | Fugaku (Fujitsu) | Riken | Japan | 442 | 15,4 | 16.004 | 158.976 × 48 A64FX 2,2 GHz | – |
3 | Lumi | EuroHPC/CSC | Finnland + LUMI-Länder | 309,1 | 51,53 | 1.936 | 2352 × 64 AMD Epyc Milan | 8085 × 256 AMD MI250X |
4 (-) | Leonardo | EuroHPC/Cineca | Italien + EuroHPC | 174,7 | 31,14 | 2.566 | 2772 × 32 Intel Xeon 8358 | 11.088 × 124 Nvidia A100 |
5(4) | Summit (IBM) | Oak Ridge National Lab | USA | 148,6 | 14,7 | 2.926 | 9.216 × 22 IBM Power9 | 27.648 × 80 Nvidia V100 |
6 (5) | Sierra (IBM) | Lawrence Livermore National Lab | USA | 94,6 | 12,7 | 1.796 | 8.640 × 22 IBM Power9 | 17.280 × 80 Nvidia V100 |
7(6) | Sunway TaihuLight (NRCPC) | National Supercomputing Center in Wuxi | China | 93 | 6,05 | 481 | 40.960 × 260 ShenWei 26010 | – |
8 (7) | Perlmutter (HPE/Cray) | NERSC | USA | 70,9 | 27,3 | 1.905 | 1536 × 64 AMD Epyc Milan | 6144 × 108 Nvidia A100 |
9 (8) | Selene | Nvidia | USA | 63,5 | 23,9 | 1.623 | 1120 × 64 AMD Epyc Rome | 4480 × 108 Nvidia A100 |
10 (9) | Tianhe-2A (NUDT) | National Supercomputing Center in Guangzhou | China | 61,4 | 3,32 | k.A. | 35.584 × 12 Intel Xeon E5-2692v2 | 35.584 × 128 Matrix 2000 |
(ciw)