c't 25/2018
S. 24
News
Top500-Liste der Supercomputer
Aufmacherbild
Bild: Lawrence Livermore National Laboratory

Erste Attacken

Die 52. Top500-Liste der weltweit schnellsten Supercomputer

Bei den Super-Supercomputern gab es im November zwar nur kleinere Änderungen in den Top Ten, aber einen überraschenden Einstieg der AMD-Zen-Mikroarchitektur auf Platz 38 sowie den ersten ARM-Cluster.

Die 52. Top500-Rangliste der Supercomputer enthält erste, zarte Hinweise auf keimende Intel-Konkurrenz: Astra mit 1,529 Petaflops (PFlops) Rechenleistung aus ARM-Prozessoren auf Platz 204 sowie auf Platz 38 den Sugon TC8600 mit AMD-Zen-Technik aus China. 2019 sollen dann die ersten „echten“ AMD-Epyc-Superrechner Einzug halten in die Top500-Liste, der Hawk am Höchstleistungsrechenzentrum Stuttgart mit 23 PFlops wohl sogar in die Top 10.

Recht einsam an der Spitze der Top500-Liste steht seit Juni das IBM-System Summit am US-Atomforschungslabor Oak Ridge National Laboratory (ORNL). Summit verzichtet ebenfalls auf Intel-Technik, darin stecken 8152 Power9-Prozessoren von IBM. Das Gros der Rechenleistung liefern allerdings Tausende Tesla-V100-Karten von Nvidia. Sie machen Summit um rund 50 Prozent schneller als die Nummer drei, den chinesischen Sunway TaihuLight, der vor zwei Jahren die Nummer eins war. Auf Platz zwei rückte durch Aufrüstung ein zweites Power9-/Tesla-V100-System vor, nämlich Sierra vom Lawrence Livermore National Laboratory (LLNL).

Aus diesen Rack-Einschüben HPE Apollo 70 mit je zwei Cavium ThunderX2 wird der Astra mit 2,3 PFlops aufgebaut.

Zwei weitere Top-10-Systeme legten ebenfalls durch Aufrüstung zu, nämlich Trinity in den USA, benannt nach dem ersten Kernwaffenexperiment, und der schweizerische Piz Daint. Letzterer bleibt schnellster europäischer Supercomputer und ließ sich nicht vom schnellsten deutschen beziehungsweise bayrischen überholen, dem SuperMUC-NG am Leibniz Rechenzentrum (LRZ) in Garching.

Das zweitschnellste deutsche System für High Performance Computing (HPC) steht in Jülich, über Juwels hatten wir ebenso wie über SuperMUC-NG in c’t 22/2018 berichtet. Beide kommen ohne Rechenbeschleuniger aus, schöpfen ihre Rechenleistung also nur aus den x86-Kernen der Intel-Xeon-SP-Prozessoren.

Das Jülich Supercomputing Center (JSC), das LRZ und das Höchstleistungsrechenzentrum Stuttgart (HLRS) bilden das Gauss Centre for Supercomputing (GCS), das mit SuperMUC-NG und Juwels satte 25,6 PFlops an (Linpack-)Rechenleistung dazubekommen hat. 2019 soll der rund 39 Millionen Euro teure Hawk weitere rund 20 PFlops bringen. Seine theoretische Rechenleistung soll bei 24 PFlops liegen, für die Top500 zählt jedoch das gemessene Ergebnis im Benchmark Linpack.

Bisher hatte man erwartet, dass Intels nächste Xeon-Generation Cascade Lake im Hawk rechnen wird, doch das Rennen machte AMD: HPE installiert in Stuttgart rund 5000 Cluster-Knoten mit Epyc-Prozessoren der zweiten Generation „Rome“, also mit 7-nm-Prozessoren. AMD will bei diesen Zen-2-Chips ja nicht nur die Anzahl der Kerne pro Chip verdoppeln, sondern auch die AVX-Rechenleistung pro Kern (siehe S. 22). Weil die CPU-Fassung aber dieselbe SP3-Fassung bleibt wie in der aktuellen, ersten Epyc-Generation, haben auch die Rome-Epycs weiterhin acht Speicherkanäle – den vielen Recheneinheiten steht also keine deutlich höhere Datentransferleistung zur Verfügung.

Schon vor einigen Wochen gab AMD stolz bekannt, dass Epycs auch in dem für 2020 geplanten Perlmutter-System alias NERSC-9 am National Energy Research Scientific Computing (NERSC) Center in Berkeley stecken werden. Perlmutter soll in die Exascale-Klasse vorstoßen, also über 100 PFlops schaffen, und zwar in einem ebenfalls neuen Cray-Shasta-System mit leistungsfähigerem Interconnect. Im NERSC-9 soll schon die übernächste Epyc-Generation Milan laufen.

Exaflops-Rennen

52. Top500-Liste

Die USA, China, Japan und die EU arbeiten mit Hochdruck an Exaflops-Superrechnern, die ab 2021 erwartet werden. Alle 500 aktuellen Top500-Systeme zusammen liefern 1,4 EFlops. Um überhaupt auf die Liste zu kommen, waren bei der 52. Liste rund 875 TFlops nötig, also 0,875 PFlops. Nur rund 70 HPC-Systeme liegen noch unter der 1-PFlops-Marke.

Der Supercomputer-Wettstreit ist auch ein militärisches Wettrüsten, vor allem zwischen China und den USA. Viele der großen Supercomputer an den US-Nationallabors – wie Oak Ridge, Los Alamos, Sandia, Lawrence Livermore, Lawrence Berkeley – rechnen für die National Nuclear Security Administration (NNSA) des Department of Energy (DoE) an Simulationen von Atomwaffen. Auch die Atommächte Frankreich und Großbritannien forschen an Waffen, etwa beim Commissariat à l’Energie Atomique (CEA) und beim Atomic Weapons Establishment (AWE). Auf der Gegenseite steht das zweitschnellste chinesische System an der Universität der Volksbefreiungsarmee (NUDT). Aus Russland hingegen tauchen nur drei Rechner in der Top500 auf.

Der Vorsprung der USA (insgesamt 533 PFlops) vor China (438 PFlops) ist dabei geringer als die Rechenleistung des Summit alleine (143 PFlops). China hat dabei mehr als doppelt so viele Top500-Systeme wie die USA (227 statt 109) und legt kräftig nach: Das erwähnte Sugon-System mit der chinesischen AMD-Zen-Version Hygon Dhyana ist ein Prototyp für künftige Exascale-Rechner, der mit zwei weiteren Ansätzen konkurriert, darunter Vorläufern des Tianhe-3A. Das Gros der Rechenleistung in Sugons Zen-System liefern bisher undokumentierte „Deep Computing Processors“ mit je 32 Kernen.

Intel-Dominanz

Tabelle
Tabelle: Top 10 der 52. Top500-Liste der Supercomputer

Fünf der zehn schnellsten Top500-Computer arbeiten mit Prozessoren, die nicht von Intel stammen, also mit IBM Power9, PowerPC, Shenwei 26010 oder AMD Opteron. Doch in 95,2 Prozent aller Top500-Systeme steckt Intels Xeon oder Xeon Phi.

Spannend bleibt die Frage nach PCI Express 4.0 (PCIe 4.0), was AMD für Rome verspricht, Intel aber wohl erst 2020 hinbekommt. Für Supercomputer hat Intel eine Alternative: Die hauseigene Omni-Path Architecture in den „F“-Xeons soll 2019 ihre Geschwindigkeit von 100 auf 200 GBit/s verdoppeln.

Bei den Rechenbeschleunigern dominiert wiederum Nvidia: 128 von 132 Systemen mit Zusatzkarten verwenden Teslas. AMD konnte die Radeon Instinct noch gar nicht positionieren, stattdessen sind Exoten wie der japanische Pezy im Rennen oder der chinesische Matrix-2000 im Tianhe-2A. Dessen Nachfolger MT-3000 mit 512 Kernen soll in rund zwei Jahren dann den Tianhe-3A befeuern.

China liegt auch vorne, was die Hersteller von Supercomputern betrifft: Lenovo liefert mehr als ein Viertel aller Systeme (140) und konnte seinen Anteil auch deutlich steigern (zuvor 120). Es folgen Inspur (86/68), Sugon alias Shuguang alias Dawning (57/55) und Cray (49/56). HPE fiel unterdessen deutlich zurück (45/79), gefolgt von Bull (22/21).

Die Top500-Liste darf man dabei aber nicht als komplette Darstellung der weltweiten Supercomputerszene missverstehen, denn mehrere Faktoren verfälschen das Bild. So tauchen einige extrem starke Systeme überhaupt nicht auf der Liste auf, etwa die der NSA. Umgekehrt nutzen manche Hersteller, vor allem Inspur und Lenovo, die Top500-Liste zur Selbstdarstellung: Sie melden sehr viele identische Cluster bei verschiedenen Kunden, die oft nicht einmal genannt werden. Das verzerrt das Bild deutlich, denn auf der Liste finden sich über 50 nahezu baugleiche Inspur-Rechner bei chinesischen „Industry“-Nutzern. Im Gegenzug stehen 27 neue Lenovo-C1040-Systeme bei US-amerikanischen Internet-Hostern.

Immerhin: Für 62 Systeme finden sich Ergebnisse des HPCG-Benchmarks, der erahnen lässt, welche Systeme flexibler nutzbar sind als bloß für die linearen Gleichungssysteme, die der Linpack repräsentiert. Und für 235 Computer melden ihre Betreiber auch die Leistungsaufnahme, was es wiederum erlaubt, ihre Energieeffizienz einzuschätzen, etwa anhand der Green500-Liste. (ciw@ct.de)