Top500-Supercomputer: Neuer Schwung dank Nvidia H100 und Intel-Chips

Seite 2: Chinesische Systeme auf der Liste

Inhaltsverzeichnis

Lenovo behauptet sich trotz der Restriktionen weiterhin gut im Wettbewerb, mit 166 (zuvor 168) Systemen liegt die chinesische Firma klar an der Spitze, die zusammen allerdings insgesamt "nur" 607 PFlops leisten. Demgegenüber hat HPE samt Cray zwar nur 105 Systeme (zuvor 100) platziert, aber mit einer Gesamtleistung von 2,5 EFlops. Dritter ist jetzt Eviden (ehemals Atos/Bull) mit 48 Systemen (zuvor 43/687 PFlops) vor Inspur mit 34 Systemen (zuvor 43/77 PFlops).

China, so verlautete auch schon seit einiger Zeit, soll bereits mehrere Exascale-Systeme in Betrieb haben, mit hausgemachten Prozessoren und Beschleunigern. Einige Details sind inzwischen über den Nachfolger des Sunway-Prozessors SW26010 bekannt, der den Top500-Spitzenreiter TaihuLight seit 2017 antreibt. In einigen Sessions auf der SC23 lassen chinesische Wissenschaftler zumindest ein bisschen etwas zur Performance der neuen Systeme mit über 40 Millionen Kernen heraus. So etwa den Wert für HPL in Mixed Precision (HPL MxP) von über 5 EFlops. Zum Vergleich: der Top500-Spitzenreiter Frontier kommt auf 9,9 EFlops.

In der Länderstatistik führt nun die USA mit 161 vor China mit 104, Deutschland mit 36, Japan mit 32, Frankreich mit 23 und Großbritannien mit 12. Aber die Aussagekraft ist durch den China-Ausstieg natürlich eingeschränkt.

Auf der SC23 kündigte Nvidia die neue "Grace Hopper"-Version GH200 an sowie die Variante Quad GH200.

(Bild: Nvidia)

Hinzu kommt insbesondere in Europa, dass die Aufteilung nach Standorten die nationalen Investitionen und Verantwortlichkeiten nicht wirklich ausdrückt. So ist das EuroHPC-System LUMI in Finnland zu Hause, wird aber von zehn Staaten betrieben, aus der EU sowie Schweiz, Norwegen und Island. Die beiden MareNostrum-Rechner in Spanien werden zu 50 Prozent von der EuroHPC-Joint Undertaking und zu 50 Prozent von Spanien, Portugal und der Türkei betrieben. Ähnliches gilt für Leonardo in Bolognia wo neben der EuroHPC-JU die Länder Österreich, Griechenland, Ungarn, Italien, Slowenien, und Slowakei direkt beteiligt sind.

Auch die vier neu in die Liste eingezogenen BullSequana-XH2000-Systeme in Bolognia sind solche Gemeinschaftssysteme im Rahmen des European Centre for Medium-Range Weather Forecasts (ECMWF), dessen Hauptquartier in Reading/ Großbritannien liegt und das auch Bonn ansässig ist.

Von den insgesamt 50 neuen Systemen auf der 62. Top500-Liste stehen 19 in den USA und ebenfalls 19 in Europa (jeweils vier in Deutschland und Italien), zehn in Asien und jeweils eins in Südamerika und Australien.

Bei den Prozessoren der Neusysteme führt diesmal wieder Intel ganz knapp mit 23 (davon 20 mit Sapphire Rapids) zu 22 gegenüber AMD verteilt auf Zen-2/3/4.

Hinzu kommen drei NEC-Vektormaschinen (zwei davon beim Deutschen Wetterdienst) und zwei A64FX-Systeme für taiwanische Meteorologen.

Insgesamt über alle Systeme in der Liste (inklusive wahrscheinlich gar nicht mehr laufende Systeme, etwa mit Xeon Phi) führt Intel aber nur noch mit 68 Prozentpunkten gegenüber 28 von AMD.

186 der 500 Supercomputer sind derweil mit Beschleunigern bestückt, nur einer mehr als in der vorigen Liste. Davon sind 166 Nvidia-GPUs, 11 AMD Instinct und vier Intel Data Center MAX.

Nvidia hat zu Beginn der SC23 auch bereits die neue H200 Tensor Core GPU vorgestellt, die etwa doppelt so schnell wie die aktuelle H100 sein soll, sowie die für KI optimierte GH200, die das für 2024 geplante Exascale-System Jupiter in Jülich mit 93 EFlops KI-Leistung beglücken soll.

Die Gesamtleistung der Liste ist mit rund 7 EFlops gegenüber der alten Liste um 34 Prozent angestiegen, weit mehr als bei letzten Mal (7,7 Prozent), und liegt damit wieder in den in früheren Zeiten gewohnten Bereichen. Um überhaupt ein System platzieren zu können, muss es aktuell im Linpack mindestens 2,015 PFlops erzielen.

Der ShenWei-SW26010-Prozessors des früheren Top500-Spitzenreiters TaihuLight ist eine Art überdimensionaler Cell-Prozessor, wie ihn IBM, Toshiba und Sony mal gemeinsam entwickelt hatten, sei es für die Playstation 3 oder als "PowerXCell" für Supercomputer. Der PowerXCell 8i des RoadRunner hatte acht solcher "Satelliten" am Zentralgestirn PowerPC.

Der SW26010 vereint gleich vier Zentralprozessoren, die einem DEC-Alpha ähneln sollen, mit jeweils 64 Rechenknechten. Sein Nachfolger SW26010pro hat 6 Zentralprozessoren mit jeweils 64 Satelliten, kommt damit also auf insgesamt 390 Kerne. Die Rechenknechte sind zudem leistungsfähiger geworden, denn die Vektoreinheit wurde von 256 auf 512 Bit erweitert.

Chinesische Wissenschaftler sprechen auf der Konferenz SC23 nun von 39 Millionen beziehungsweise mehr als 40 Millionen Kernen ihres "neuen Sunway-Systems", das unter OceanLight kursiert, gut viermal so viel wie beim Taihulight. Das gäbe schon mal mit der Vektorerweiterung einen Faktor acht, hinzu kommen schnellere Speicher, schnelles Interconnect.

Die Wissenschaftler geben zwar keinen Wert für den Linpack (HPL) an, aber einen für die Mixed-Precision-Version (HPL MxP) von über 5 EFlops. Die bisher veröffentlichten HPL-MXP-Werte weisen einen Speedup von Faktor 4,5 (Fugaku) bis etwa 10 auf. Die Architektur des SW26010pro dürfte eher einen Faktor wie beim Fugaku nahelegen, was einen HPL-Wert von rund 1 Exaflops ergäbe.

Top10 der 62. Top500-Liste
Platz (zuvor) System (Hersteller) Einrichtung Land Linpack Rmax
(PFlops)
Energie-Effizienz
(GFlops/W)
HPCG
(TFlops)
CPU / GPU
1 (1) Frontier (HPE) Oak Ridge National Lab USA 1102 52,6 14054 AMD / AMD
2 (-) Aurora (HPE/Cray) Argonne National Lab USA 585 23,7 Intel / Intel
3 (-) Eagle Microsoft Azure USA 561 Intel / Nvidia
4 (2) Fugaku (Fujitsu) Riken Japan 442 14,8 16004 Fujitsu / –
5 (3, upgrade) Lumi (HPE/Cray) EuroHPC/CSC Finnland +
LUMI-Länder
380 53,4 4586 AMD / AMD
6 (-) Leonardo EuroHPC/Cineca Italien +
EuroHPC JU
289 32,2 3114 Intel / Nvidia
7 (4) Summit (IBM) Oak Ridge National Lab USA 149 14,7 2926 IBM / Nvidia
8 (-) MareNostrum 5 ACC EuroHPC/BSC Spanien +
EuroHPC JU
139 54 Intel / Nvidia
9 (-) EOS DGX Superpod Nvidia USA 121 Intel / Nvidia
10 (5) Sierra (IBM) Lawrence Livermore National Lab USA 94,6 12,7 1796 IBM / Nvidia

(ciw)