Top500 der Supercomputer: AMD dreht auf, China macht Pause

Seite 2: AMD vs. Intel (und ARM)

Inhaltsverzeichnis

Fujitsu konnte ein weiteres A64FX-(ARM-)System mit immerhin 22,1 PFlops (Platz 13) an der Universität Tokio vermelden.

Zwar dominieren Intel-Prozessoren weiterhin die Top500-Liste, aber AMD legt stark zu.

Ansonsten läuft alles auf einen Zweikampf zwischen Intel und AMD hinaus, die beide mit ihren neuen Generationen Xeon-SP Ice Lake (8 Systeme) beziehungsweise AMD Epyc Milan (4 Systeme) dabei sind. Intel musste reichlich Federn lassen, AMD konnte von den insgesamt 58 Neusystemen genau die Hälfte mit Milan und Rome einbringen, Intel nur 26 mit Ice-, Sky- und Cascade Lake. Zurzeit haben damit 49 (zuvor 21) Systeme AMD-Prozessoren, Intel 431 (zuvor 459) in der Liste.

Ähnlich war mal die Lage um das Jahr 2007 herum, als AMD mit dem Opteron Intel reichlich in Bedrängnis bringen konnte. Damals im Juni 2006 kam AMD gar auf 107 Systeme (Intel 287). Nachdem AMD mit der Bulldozer-Mikroarchitektur später an Boden verlor, erobert sich die Zen-Technik der Epycs (derzeit in der dritten Generation Zen 3) das Vertrauen der Szene zurück, derzeit geht's jedenfalls wieder steil bergauf.

Und für die Zukunft sieht für AMD wahrlich nicht schlecht aus, mit großen Projekten wie Frontier, El Capitan und LUMI. Manche könnten noch 2021 in Betrieb gehen und im November Spitzenplätze auf der 58. Top500-Liste erobern. Intels Prestigeprojekt Aurora (mit Sapphire Rapids, Ponte Vecchio, DDR5-RAM, PCIe 5.0 und CXL 1.1) hat sich hingegen weiter auf Mitte 2022 verzögert.

Spannend ist allerdings, ob nicht doch die Chinesen den ersten Superrechner mit mehr als 1 EFlops im LINPACK bringen.

Verstärkt schaut diese Szene aber nicht nur auf Performance, sondern auch auf Energieeffizienz. Vor allem GPUs steigern die Effizienz erheblich. Derzeit sind 144 Systeme mit GPUs oder Akzeleratoren bestückt, das sind aber drei weniger, als vor einem halben Jahr. Fast alle stammen von Nvidia, darunter 26 Systeme mit Ampere A100.

Ein einziges älteres Sugon-System mit AMD Vega 20 fand Einzug. Hier hat AMD mit dem Radeon Instinct also noch viel Luft nach oben.

In der Energieeffizienz-Wertung Green500 liegen im vorderen Top10-Bereich fast nur Systeme mit NVidia-GPUs und AMD Epyc – bis auf den Spitzenplatz. Den hält mit 29,7 GFlops/Watt zum Ärger für Nvidia, wie schon in der vorigen Liste, ganz knapp ein System von Preferred Networks mit Intel Platinum 8260M und einem selbstentwickelten Akzelerator "MN-Core". Die Nvidia/AMD-Kombination auf Platz 2 an der Uni Florida kommt auf 29,52.

Der energieeffizienteste Rechner ohne zusätzliche Beschleuniger ist ein "kleiner Fugaku" bei Fujitsu mit 16,88 GFlops/Watt.

Mit insgesamt rund 2,8 EFlops legt die Gesamtperformance der Systeme in der Liste um etwa 15 Prozent zu – trotz Corona liegt man damit innerhalb der letzten 10 Jahre nicht schlecht. Allerdings gab es nur noch 58 Neusysteme, noch vor zwei, drei Jahren war man eine Quote von 100 und mehr gewöhnt.

Top10 der 57. Top500-Liste
Platz (zuvor) System (Hersteller) Einrichtung Land CPU-Cores GPU-Cores Linpack Rmax (PFlops) Energie-effizienz (GFlops/W) HPCG (TFlops)
1 (1)

Fugaku (Fujitsu)
Riken Japan 158.976 × 48 A64FX 2,2 GHz 442 14,78 16004,5
2 (2) Summit (IBM) Oak Ridge National Lab USA 9.216 × 22 Power9, 3,07 GHz 27.648 × 80 Tesla V100 148,6 14,72 2925,75
3 (3) Sierra (IBM) Lawrence Livermore National Lab USA 8.640 × 22 Power9, 3,1 GHz 17.280 × 80 Tesla V100 94,64 12,72 1795,67
4 (4) Sunway TaihuLight (NRCPC) National Supercomputing Center in Wuxi China 40.960 × 260 ShenWei 26010, 1,45 GHz 93,01 6,05 480,85
5 (-) Perlmutter (HPE/Cray) NERSC USA 1536 × 64 AMD Epyc 7763, 2,45 GHz 6144 × 108 Nvidia A100 64,59 25,55 1905,44
6 (5) Selene Nvidia USA 1120 × 64 AMD Epyc 7742, 2,25 GHz 4480 × 108 Nvidia A100 63,5 23,98 1622,51
7 (6) Tianhe-2A (NUDT) National Supercomputing Center in Guangzhou China 35.584 × 12 Xeon E5-2692v2, 2,2 GHz 35.584 × 128 Matrix 2000 61,4 3,32 k.A.
8 (7) JUWELS Booster Jülich SC Deutschland 1872 × 24 AMD Epyc 7402 3744 × 108 Nvidia A100 44,1 25,01 1275,36
9 (8) HPC5 (DellEMC) Eni Italien 3.640 × 24 Xeon Gold 6252 7280 × 80 Tesla V100 35,45 15,74 860,32
10 (9) Frontera (DellEMC) Texas Advanced Computing Center (TACC) USA 16.016 × 28 Xeon Platinum 8280, 2,7 GHz

23,52 k.A. k.A.

(ciw)