Top500-Liste der Supercomputer: alles Petaflops-Rechner

92 Rechner sind neu in die 53. Top500-Liste der Supercomputer eingezogen. Schnellster Neuling ist der Frontera am Texas Advanced Computing Center.

88

Frontera-Giveaway auf der SC18

(Bild: TACC)

17.06.2019, 09:00 Uhr

Lesezeit: 10 Min.

Von

Andreas Stiller

Die 53. Top500-Liste der Supercomputer verzeichnet nur noch Systeme, die mehr als 1 Billiarde Gleitkomma-Rechenoperationen pro Sekunde schaffen. Genauer geht es um 1 Petaflops (PFlops) an "doppelt genauen" (FP64-)Berechnungen im Benchmark Linpack. Die internationale Supercomputer-Szene arbeitet mit Hochdruck an Exaflops-Systemen, von denen einige Vorläufer auch in der aktuellen Top500-Liste auftauchen, die zur Eröffnung der Internationalen Supercomputer-Konferenz ISC 19 in Frankfurt herauskam.

Wieder einmal ist ein Cloud-System in die Liste eingezogen: Amazon EC2 C5 Instance Cluster us-east-1a. Bestückt mit Xeon Platinum 8124M mit 18 Kernen, erreichte die Amazon-Cloud mit 41.472 Kernen 1,93 PFlops und damit Platz 136. [Update:] Amazon Web Services (AWS) hatte bereits 2010, 2011 und 2013 Cloud-Systeme gemeldet.

Acht Systeme mit Intels neuen "Cascade Lake"-Xeons (mit 20 bis 28 Kernen) haben es bereits in die Top500 geschafft. Ein "Überraschungssystem" mit AMDs kommendem Epyc "Rome" ist jedoch noch nicht dabei. Auch ein weiteres ARM-System neben HPEs Astra findet man bisher nicht.

Ein neues System in den Top10

Die Liste führt weiterhin der amerikanische Summit mit Power9/Nvidia Tesla V100 am Oak Ridge National Laboratory (ORNL) an. Er hat gegenüber der letzten Top500-Liste vom November 2018 noch ein paar Racks hinzubekommen und verfügt nun über 2,4 Millionen Kerne: 2,2 Millionen Nvidia Streaming Cores, der Rest sind Power9-Kerne. Damit stieg seine Performance auf 143,5 PFlops. Platz 2 hält wie gehabt sein kleinerer Power9-Kollege am Lawrence Livermore National Laboratory (LLNL) mit 94,6 PFlops. Auch Platz 3 und 4 sind gleich geblieben: die beiden chinesischen Systeme Sunway TaihuLight mit 93 und Tianhe-2A mit 61,4 Pflops.

Dann aber folgt auf Platz 5 ein Neuling: der Frontera am Texas Advanced Computing Center in Austin. Das Dell-C4130-System kommt ohne Beschleuniger mit 448.448 Xeon Cascade-Lake-Kernen auf 23,516 PFlops und darf sich damit schnellster "Universalrechner" nennen, vor dem SuperMUC-NG in München, der mit 19,5 PFlops Platz 9 belegt.

Der Trend hin zu Beschleunigern hat sich etwas verlangsamt. Intel ist ausgestiegen und hat den Xeon Phi eingestellt (und den X^e erst für 2020 avisiert) und Nvidia musste einen, allerdings nur leichten, Verlust in Kauf nehmen: 125 der 500 Top-Systeme sind mit Nvidia-GPUs bestückt, zuvor waren es noch 127.

"Gallier" vorn, "Goten" verlieren

94 Systeme sind neu in die Liste eingezogen, alle mit Intel-Prozessoren bestückt – alle? Nein das wehrbereite gallische Dorf ist hier das französische Power9-System Pangea III, das beschleunigt mit Nvidia Tesla V100 mit 17,8 PFlops Platz 11 erklimmt.

Aus Deutschland ist nur ein neues System hinzugekommen, der CLAIX an der Universität Aachen, der sich bei den reinen Unirechnern mit 2,5 PFlops auf Platz 92 und damit vor den – ebenfalls von NEC aufgebauten – Mogon II der Johannes Gutenberg-Uni in Mainz schiebt (2 PFlops, Platz 131). Weiterhin klar an der Spitze ist hierzulande der schon erwähnte SuperMUC-NG von Lenovo am Leibniz-Rechenzentrum in München/Garching mit 19,5 PFlops weit vor dem Bull-Sequana-Rechner Juwels Module 1 am Jülicher SC mit 6,2 PFlops.

Top10 der Top500-Liste vom Juni 2019 (12 Bilder)

Nr. 1

Unangefochten weiterhin die Nr. 1: Der Summit am Oak Ridge National Lab mit Power9 und Nvidia V100 hält die Spitze mit 148,6 PFlops

(Bild: Oak Ridge National Lab)

Insgesamt ist Deutschland aber ziemlich abgefallen: Hatte man vor einem halben Jahr noch 17 Systeme mit 60,5 PFlops platziert, sind es jetzt nur noch 14 mit 59,1 PFlops. In der hier ausgewerteten Vorabversion der Top500-Liste wird aber noch der alte SuperMUC Phase 1 am Leibniz-Rechenzentrum aufgeführt, der eigentlich schon längst deinstalliert sein müsste – dann fiele Deutschland noch weiter um 2,9 PFlops zurück und läge stückzahlmäßig gleichauf mit Irland oder den Niederlanden. Unsere Nachbarn und Lieblingsfußballgegner haben jedenfalls kräftig aufgerüstet, ihre Supercomputerleistung hat sich gegenüber der vorigen Liste mehr als verdoppelt. Der geplante Hawk am HLRS in Stuttgart könnte aber schon auf der 54. Top500-Liste für Schub sorgen: Er soll gleich 24 PFlops drauflegen.

Frankreich – als Atommacht auf Supercomputer für Waffensysteme angewiesen – übernimmt in Europa mit 19 Systemen und 67,1 PFlops klar die Führung, Großbritannien hat 18 Systeme mit 40 PFlops und Italien nur 5, dafür recht kräftige Systeme mit insgesamt 30 PFlops.

Der schnellste Supercomputer in Europa bleibt jedoch weiterhin der schweizerische Piz Daint (Cray XC50, Nvidia P100) am CSCS in Lugano mit 21,2 PFlops auf Platz 6. Mit dabei ist nun auch wieder Österreich mit einem Lenovo ThinkSystem, der neue Vienna Scientific Cluster (VSC-4), der sich mit 2,7 PFlops und Platz 82 noch vor den deutschen Unis platziert.

Weltweit hat China mit 219 Systemen (zuvor 229) etwas an die USA (119, zuvor 108) verloren, aber weiterhin fast doppelt so viele Systeme in der Liste. Die amerikanischen Systeme haben dank der beiden Spitzenreiter allerdings deutlich mehr Power, sie kommen zusammen auf 600 PFlops, die chinesischen "nur" auf 466. Auf dem dritten Platz folgt Japan mit 29/117,2 (zuvor 31/109,4 PFlops).

Im kontinentalen Vergleich ist die Verteilung der Rechenpower gegenüber der letzten Liste weitgehend gleich geblieben: Asien führt mit 42,8 % vor Amerika (inklusive Kanada und Brasilien) mit 38,6 % und Europa mit 18 %. Der kleine Rest geht mit 0,55 % nach Ozeanien (5 Rechner in Australien) und mit 0,15 % nach Afrika (3 Rechner in Südafrika).

HPE trumpft mit Cray-Power auf

Hieß es beim letzten Mal noch: "HPE fällt zurück", so hat HPE das inzwischen durch einen finanztechnischen Trick kompensiert: Man hat im letzten Monat einfach Cray aufgekauft. Dieser "Trick" hat ja bei HP Tradition: SGI: 2016, Compaq: 2002, Convex: 1995, Apollo: 1989 ...

Die alte HPE fiel zwar stückzahlmäßig von 45 auf 40 Systeme weiter zurück, kann jetzt aber 39 Cray-Systeme hinzubuchen. Und die haben es bekanntlich in sich. Mit der gemeinsamen Power von 316 PFlops liegt HPE/Cray damit vor dem mit 173 Systemen (zuvor 142) zwar stückzahlmäßig weit vorausliegenden Konkurrenten Lenovo, aber deren Gesamtleistung beträgt nur 306 PFlops. HPE und Lenovo müssen sich jedoch dank der beiden Spitzensysteme Summit und Sierra IBM geschlagen geben, die auch ohne den fraglichen SuperMUC Phase 1, der ohnehin jetzt zu Lenovo gehört, mit nur 13 Systemen auf 321 PFlops kommen.

Im chinesischen Vierkampf konnte sich Lenovo deutlich von der Konkurrenz absetzen, alle anderen haben verloren: Inspur (71, zuvor 86), Sugon/Dawning (57, zuvor 63) und Huawei (7, zuvor 14). Huawei litt dabei sicherlich unter der Kampagne der US-Regierung gegen den Konzern. Ansonsten spielen noch Bull (22, zuvor 21) und DellEMC (17, zuvor 14) eine größere Rolle.

Intel legt weiter zu

Intel hat noch ein bisschen zugelegt: In 478 Systemen (zuvor 476) stecken Xeons. Neben dem einzigen AMD-Epyc-System aus chinesischer Produktion findet man noch zwei alte Opteron-Systeme sowie eines mit ARM Cavium Thunder 2, den chinesischen Sunway TaihuLight mit hausgemachten ShenWei-Prozessoren sowie sechs japanische Sparc-Systeme und 13 mit Power/PowerPC. Dominanter als Intel ist nur noch Linux, das schon vor eineinhalb Jahren 100 Prozent erreicht hat – mehr geht nicht!

Insgesamt ist die Gesamtperformance der Top500-Liste lediglich um 10 Prozent auf 1,56 EFlops gestiegen, der zweitschlechteste Anstiegswert in der über 25-jährigen Geschichte der Liste überhaupt. Interessant ist auch, zu schauen, wie lange es zurückliegt, dass die gesamte Top500-Performance geringer war als die des aktuellen Spitzensystems. Bis zum Juni 2016 waren das regelmäßig etwa 7 bis 8,5 Jahre. In den letzten drei Jahren stieg dieser Wert aber um 2 Jahre auf 10 bis nunmehr 11. Im Juni 2008 lag die Gesamtleistung der Top500 mit 121 PFlops unter der des Summit jetzt. Im Juni 2018 wurde die 1-EFlops-Marke als Gesamtleistung überschritten – danach dürften wir eigentlich erstmals gegen 2028 mit Exaflops-Rechnern rechnen.

Aber die Milliardeninvestitionen weltweit werden das wohl deutlich beschleunigen. So soll der nächste Rechner "Frontier" am Oak Ridge National Laboratory mit AMD Epyc Zen-3 (Milan) schon 2021 etwa 1,5 EFlops liefern. Hinzu kommt Aurora am Argonne National Lab, den Cray/HPE mit Intels geplanten HPC-Xeons und vielleicht mit X^e-GPUs mit mindestens 1 EFlops etwa zur gleichen Zeit aufbauen soll. Und die Chinesen haben auch einiges in petto. Und so wird man in nicht allzu ferner Zeit nicht mehr von Exa-, sondern von Zetta-Scale hören.

Energieeffizienz und Speicher-Speed

Das Top500-Team verwaltet inzwischen auch die Resultate für die Energieeffizienz (Green500) und die vom HPCG-Benchmark, der sich weit stärker an der Speicherperformance orientiert als der für die Top500 zuständige Linpack. Doch hier hat sich gegenüber November 2018 fast nichts getan – hier nur das Gesamtresultat: Die mittlere Energieeffizienz beim Linpack ist von 3,0 GFlops/Watt auf 3,2 GFlops/Watt gestiegen und die mittlere HPCG-Performance von 211,2 auf 213,3 TFlops.

[Updates:] Anzahl der neuen Top500-Systeme von 92 auf 94 korrigiert, Angaben zu Cloud-Systemen korrigiert. Der osterreichische Rechner Vienna Science Cluster ist nicht nur von der Universität Wien, sondern ein Gemeinschaftsprojekt der Universität, der TU und dem Institut für Bodenkultur mit Rechenmöglichkeit für weitere österreichische Universitäten. [/Update]

Top 10 der 53. Top500-Liste der Supercomputer
Platz (vor. Liste)	Rechner (Hersteller)	Betreiber	Land	CPU-Cores	GPU-Cores	Linpack Rmax (PFlops)	Energie-effizienz (GFlops/W)	HPCG (TFlops)
1 (1) upgrade	Summit (IBM)	Oak Ridge National Lab	USA	9216 × 22 Power9, 3,07 GHz	27.648 × 80 Tesla V100	148,6	14,72	2925,75
2 (2)	Sierra (IBM)	Lawrence Livermore National Lab	USA	8640 × 22 Power9, 3,1 Ghz	17.280 × 80 Tesla V100	94,64	12,72	1795,67
3 (3)	Sunway TaihuLight (NRCPC)	National Supercomputing Center in Wuxi	China	40.960 × 260 ShenWei 26010, 1,45 GHz	0	93,01	6,05	480,84
4 (4)	Tianhe-2A (NUDT)	National Supercomputing Center in Guangzhou	China	35.584 × 12 Xeon E5-2692v2, 2,2 GHz	35.584 × 128 Matrix 2000	61,44	3,33	k.A.
5(-)	Frontera (DellEMC)	Texas Advanced Computing Center (TACC)	USA	16016 x 28 Xeon Platinum 8280, 2,7 GHz	0	23,52	k.A.	k.A.
6 (5)	Piz Daint (Cray)	Centro Svizzero di Calculo Scientifico (CSCS)	Schweiz	5704 × 12 Xeon E5-2690v3, 2,6 GHz (+2862 × 18 Xeon E5-2695v4)	5704 × 56 Tesla P100	21,2	10,4	486,39
7 (6)	Trinity (Cray)	DOE/NNSA/LANL/SNL	USA	unbekannte Anzahl Xeon E5 + Xeon Phi 7250. 979.072 Kerne insgesamt	0	20,2	2,66	546,12
8 (7)	ABCI	AIST	Japan	2176 × 20 Xeon Gold 6148, 2,4 Ghz	4352 × 80 Tesla V100	19,88	12,05	k.A.
9 (8)	SuperMUC-NG	Leibniz-Rechenzentrum	Deutschland	12.744 x 24 Xeon Platinum 8174	0	19,48	k.A.	207,84
10 (11) upgrade	Lassen (IBM)	Lawrence Livermore National Lab	USA	1584 x 22 IBM Power9	3168 x 80 Tesla V100	18,20	13,07	k.A.