Top500-Supercomputer: Europa hat die zweitmeiste Rechenleistung

Seite 2: Warten auf den Euro-Prozessor

Noch setzen die europäischen Supercomputer im Rahmen von EuroHPC JU auf amerikanische Prozessoren, aber die Europäische Prozessorinitiative (EPI) will mit dem hauseigenen Rhea-Prozessor im nächsten Jahr zumindest schon mal dessen Leistungsfähigkeit unter Beweis stellen, und zwar mit dem Multinode-Demonstration-Cluster EPAC-1.5. Exascale-Systeme sind für 2025 geplant.

Insgesamt will EuroHPC JU in den nächsten Jahren sieben Milliarden Euro für große und mittlere Super- und Quantencomputer investieren. Diverse Standorte wurden schon festgelegt, darunter sechs für Quantencomputer. Das erste EuroHPC-Exascale-System Jupiter soll nach Jülich.

Deutsche Superrechner

Schaut man auf die Anzahl der Top500-Systeme pro Nation, liegt Deutschland mit 34 Systemen hinter China (162) und den USA (127), aber vor Japan (31), Frankreich (24) und Großbritannien (15).

Gegenüber der Juniliste sind das drei deutsche Systeme mehr. Vier sind neu, davon zwei Vektor-Rechner mit NEC SX-Aurora Tsubasa beim Deutschen Wetterdienst mit 6,4 PFlops (Platz 89) und 5 PFlops (Platz 114). Ein Lenovo ThinkSystem ist mit 2,3 PFlops (Platz 309) bei einer nicht näher genannten Firma hinzugekommen. Bei der Gesellschaft für wissenschaftliche Datenverarbeitung in Göttingen (GWDG) hat es Grete mit 1,8 PFlops auf Platz 470 geschafft, eine von Megware aufgebaute GPU-Partition mit AMD Milan und Nvidia A100. Grete arbeitet im Rahmen des Verbunds für Nationales Hochleistungsrechnen (HNR), das acht vom Bund unterstützt Rechenzentren und ein Konsortium mehrerer Unis in Deutschland umfasst. Ein Rechner von Huawei Deutschland fiel aus der Liste.

Das Leistungswachstum der Supercomputer auf der Top500-Liste im historischen Vergleich.

Andere Benchmarks außer Linpack

Während der Linpack-Benchmark die interne Rechenleistung bei gut parallelisierbaren Aufgaben abbildet, deren Daten zumeist innerhalb der Caches liegen, adressiert der HPCG-Benchmark vorrangig das Speichersystem mit weniger gut parallelisierbaren Anteilen. Daher liegen die ebenfalls in Flops angegebenen Werte weit unter denen des Linpack. Etwas über 100 der Top500-Rechenzentren haben auch hierfür Werte gemeldet. In dieser Disziplin bleibt Fugaku weiterhin mit 16 PFlops an der Spitze, vor dem Frontier (14 PFlops) und Lumi (3,4 PFlops).

Der Top500-Linpack rechnet mit Gleitkomma bei doppelter Genauigkeit (FP64). Für KI sind weitaus geringere Genauigkeiten nötig, zum Teil bis hinunter auf 8 Bit. Und so sieht man etwa für Leonardo, dass er bis zu 10 "KI-Exaflops" leisten soll. Die KI-Werte sind bisher allerdings recht beliebig definiert, hier muss man sich noch auf standardisierte Benchmarks einigen, etwa Facebooks Dynabench.

Hersteller-Vergleich

Bei den Herstellern hält Lenovo stückzahlmäßig seine Spitzenposition mit 160 (zuvor 161) vor HPE (101, zuvor 96), Inspur (50, zuvor 50) und Atos/Bull (43, zuvor 42). Erwähnenswert ist hierbei, dass die mittelständische Firma Megware aus Chemnitz mit 7 platzierten Systemen in Deutschland und Österreich recht gut dabei ist.

Spannend ist der Blick auf Prozessor- und Coprozessorhersteller. Bei ersteren führt stückzahlmäßig weiterhin Intel mit 379 (zuvor 388) vor AMD (101, zuvor 93) und Power (8). Dahinter kommt immer noch nicht ARM, sondern NECs Vector Engine mit inzwischen 6 Installationen. Im November 2006, zu den besten Opteron-Zeiten, konnte AMD mal 113 Top500-Systeme bestücken, da ist man jetzt nahe dran.

Bei der aggregierten Top500-Performance kann AMD dank Frontier, Lumi und so weiter mit 2,4 EFlops die Intel-Konkurrenz düpieren (1,6 EFlops). Bis auf Clara am Deutschen Zentrum für Luft- und Raumfahrt, wo noch ein AMD Naples (Zen 1) wirbelt, sind alle anderen mit Rome (Zen 2) oder Milan (Zen 3) bestückt.

Etwa ein Drittel, genau 178 der 500 Systeme, verwenden Beschleuniger, 10 mehr als in der vorigen Liste. Davon sind 163 (92 Prozent) von Nvidia, AMD hat 9 Systeme auf der Liste, alle mit Instinct MI250X.

Top10 der 60. Top500-Liste
Platz (zuvor)	System (Hersteller)	Einrichtung	Land	Linpack Rmax (PFlops)	Energie-Effizienz (GFlops/W)	HPCG (TFlops)	CPU-Cores	GPU-Cores
1	Frontier	Oak Ridge National Lab	USA	1102	52,2	14.054	9408 × 64 AMD Epyc Milan	31.790 × 256 AMD MI250X
2 (1)	Fugaku (Fujitsu)	Riken	Japan	442	15,4	16.004	158.976 × 48 A64FX 2,2 GHz	–
3	Lumi	EuroHPC/CSC	Finnland + LUMI-Länder	309,1	51,53	1.936	2352 × 64 AMD Epyc Milan	8085 × 256 AMD MI250X
4 (-)	Leonardo	EuroHPC/Cineca	Italien + EuroHPC	174,7	31,14	2.566	2772 × 32 Intel Xeon 8358	11.088 × 124 Nvidia A100
5(4)	Summit (IBM)	Oak Ridge National Lab	USA	148,6	14,7	2.926	9.216 × 22 IBM Power9	27.648 × 80 Nvidia V100
6 (5)	Sierra (IBM)	Lawrence Livermore National Lab	USA	94,6	12,7	1.796	8.640 × 22 IBM Power9	17.280 × 80 Nvidia V100
7(6)	Sunway TaihuLight (NRCPC)	National Supercomputing Center in Wuxi	China	93	6,05	481	40.960 × 260 ShenWei 26010	–
8 (7)	Perlmutter (HPE/Cray)	NERSC	USA	70,9	27,3	1.905	1536 × 64 AMD Epyc Milan	6144 × 108 Nvidia A100
9 (8)	Selene	Nvidia	USA	63,5	23,9	1.623	1120 × 64 AMD Epyc Rome	4480 × 108 Nvidia A100
10 (9)	Tianhe-2A (NUDT)	National Supercomputing Center in Guangzhou	China	61,4	3,32	k.A.	35.584 × 12 Intel Xeon E5-2692v2	35.584 × 128 Matrix 2000