Top500: Supercomputer in der Flaute

Noch immer hat es Intel nicht geschafft, den versprochenen 2-Exaflops-Supercomputer Aurora fertigzustellen. Das schnellste System bleibt ein AMD-Rechner.

In Pocket speichern vorlesen Druckansicht 8 Kommentare lesen
Server,Racks,In,Server,Room,Data,Center.,3d,Render

(Bild: Sashkin/Shutterstock.com)

Lesezeit: 6 Min.
Von
  • Andreas Stiller

Das amerikanische HPE-Cray-System Frontier am Oak Ridge National Lab ist weiterhin mit großem Vorsprung Spitzenreiter der Supercomputer-Rangliste Top500. Er zeigt, dass auch Kleinvieh Mist macht: Dank Optimierungen wurde der weltschnellste Supercomputer noch ein wenig schneller und effizienter. Seine Linpack-Rechenleistung legte um rund 8 Prozent von 1,102 auf 1,194 Exaflops (EFlops) zu, die Effizienz stieg von 52,23 auf 52,69 Gigaflops pro Watt.

Die neue Top500-Liste erscheint in alter Tradition zum Auftakt der Internationalen Supercomputer Conference ISC. Sie ist die nunmehr 61. Iteration, die das Team um den Turing-Preisträger Jack Dongarra sowie Erich Strohmeier halbjährlich zusammengestellt hat. Große Überraschungen gab es diesmal nicht, eher kleine Enttäuschungen. Dazu gehört, dass von dem seit Jahren verschobenen Exaflops-System Aurora mit Intel-Prozessoren und -GPUs (Sapphire Rapid, Ponte Vecchio) immer noch nichts zu sehen ist.

Auf den nächsten 9 Plätzen hat sich nichts weiter getan: Es folgt der japanische Fugaku mit A64FX-ARM-Prozessoren und 442 Petaflops (PFlops) sowie das Lumi-System der EuroHPC/SCS mit Standort Finnland, das ebenfalls auf AMD-Hardware setzt und 309 PFlops erzielt. Erst auf Platz 11 ist ein Neusystem eingezogen, ein Microsoft-Azure-System, das wie Frontier mit AMD-Prozessoren und GPUs bestückt ist und 54 PFlops erreicht.

Top10 der 61. Top500-Liste vom Juni 2023 (10 Bilder)

Nr. 1

Mit nunmehr knapp 1,2 Exaflops weiterhin Nummer 1: Frontier am Oak Ridge National Laboratory der USA. Der Abstand auf Fugaku mit 0,442 EFlops ist gewaltig.
(Bild: HPE/Oak Ridge National Laboratory)

In der Innovationsrate liegen Intel und AMD derweil gleichauf, beide konnten 21 Neusysteme in die Liste einbringen. Hinzu kamen noch zwei neue Fujitsu-Systeme mit A64FX-Arm-Prozessor in Japan. Über die Hälfte der neuen Intel- sowie sieben AMD-Systeme sind anonyme Lenovo-Thinksystems für eine nicht weiter aufgeschlüsselte amerikanische Software-Industrie. Insgesamt ist jetzt die Prozessorverteilung der Top500-Systeme: Intel: 360, AMD: 121, IBM: 7, Fujitsu: 6, NEC: 4, ShenWei: 1, Hygon:1.

AMDs neuer Epyc-Prozessor Genoa der Zen-4-Generation ist derzeit auch noch nicht dabei, hingegen haben es Intels neue Sapphire-Rapids-Prozessoren (Xeon Scalable 84xx) in sieben Systeme geschafft. Das schnellste ist das Nvidia-Testsystem DGX Superpod mit 56-Kernern vom Typ Xeon Platinum 8480C, das bestückt mit Nvidias H100-GPUs 40,1 PFlops erzielt (Platz 14).

Gleich drei deutsche Unis haben sich mit Sapphire-Rapid-Systemen eingebracht. Gewinner ist dabei die TU Darmstadt (Lichtenberg II, Lenovo) mit 3,1 PFlops auf Platz 230, knapp vor der TU Dresden (Barnard, Bull) mit 3,05 PFlops (Platz 238) und der Uni Duisburg-Essen (AmplitUDE, Megware), die mit 1,95 PFlops noch gerade so eben die Liste erreichte (Platz 483). Der schnellste Neuling in Deutschland ist aber mit 9,1 PFlops auf Platz 70 der Goethe-NHR an der Uni Frankfurt, bestückt mit dem etwas älteren AMD Rome (Zen 2) sowie mit AMD Instinct MI210. Hierzulande führt insgesamt wie schon im Herbst letzten Jahres der Juwels Booster des Forschungszentrums Jülich (44,1 PFlops, Platz 12) vor dem SuperMUC-NG des Leibniz-Rechenzentrums in München/Garching (19,5 PFlops, Platz 31) und dem Hawk am HLR Stuttgart (19,3 PFlops, Platz 32).

Für China und Russland sind aus bekannten Gründen nur noch Altsysteme verzeichnet – bis auf eine Ausnahme: Lenovo konnte ein System mit dem „kleinen“ 32-Kerner Xeon Gold 6458Q für den großen chinesischen Automobilkonzern Geely Auto melden, zu dem unter anderem Volvo und Lotus gehören und der mit Mercedes-Benz kooperiert. Hier greift offenbar die strenge amerikanische Exportbeschränkung nicht. So kommt dann im Ländervergleich die USA auf 150 (zuvor 127), China 130 (zuvor 162), Deutschland 36 (zuvor 34) Japan 33 (zuvor 31) und Frankreich 24 (zuvor 24).

Bei den Herstellerfirmen sind durch die Exportbeschränkungen die chinesischen Firmen Huawei, Surgon und Inspur quasi "ausgesperrt", lediglich die durch die Übernahme von IBMs x86-Sparte international agierende Firma Lenovo kann noch 22 neue Systeme melden und behält mit 168 (zuvor 160) klar die Spitze vor HPE (100, zuvor 101), Atos (43, zuvor 43) und Inspur (43, zuvor 50). Aus deutscher Sicht erfreulich: das mittelständische Chemnitzer Unternehmen Megware mischt inzwischen mit 10 (zuvor 7) Systemen mit.

185 (zuvor 178) Rechner sind zusätzlich zu Prozessoren mit eigenständigen Beschleunigern ausgestattet, die allermeisten davon (166) mit Nvidia-GPUs. Fünf Systeme davon verwenden die neueste Version H100. Mit AMD-GPUs warten 11 Systeme auf. Solche Beschleuniger erhöhen nicht nur in vielen Fällen die Performance, sondern auch die Energieeffizienz. Und so sind die ersten 48 Plätze in der Energieeffizienzliste Green500 allesamt Systeme mit Beschleunigern.

Im vorderen Bereich der neuen Green500-Liste blieb weitgehend alles beim Alten. Den Platz 1 mit 65,4 GFlops/Watt hält der Henri des Flatirion Instituts in New York City, der in Zusammenarbeit mit Lenovo und Nvidia speziell auf Effizienz beim Linpack-Lauf getrimmt wurde. Das mit Intel Xeon Platinum 8362 und Nvidia H100 bestückte System wurde allerdings noch ein bisschen aufgerüstet, damit es nicht aus der Liste fällt. Mit nunmehr 2,9 PFlops belegt es beim Linpack Platz 255 (zuvor 405).

Henri hängt eine ganze Phalanx von sechs Systemen mit AMD Milan (Zen 3) und AMD Instinct MI250X ab, vorneweg ein ebenfalls besonders auf Energieeffizienz getrimmter kleiner Bruder des Frontier in Oak Rich namens Frontier TD mit 62,2 GFlops/Watt. Dieser ist aber im Linpack mit 19,2 PFlops (Platz 34) deutlich schneller als Henri. Erst auf Platz 8 gibt es eine Veränderung: Ihn konnte der neue Megware-Rechner der Uni Duisburg-Essen mit 51,34 GFlops/Watt erklimmen. Der erste Rechner ohne zusätzliche Beschleuniger ist der Fugaku auf Platz 49 mit 14,07 GFlops/Watt.

Die Gesamtleistung der Top500-Liste ist diesmal lediglich um 7,7 Prozent auf 5,2 EFlops gestiegen, das ist die zweitniedrigste Steigerung für ein Halbjahr seit Beginn der Top500-Liste im Juni 1993. Nur im November 2019 lag sie mit 5,5 Prozent noch darunter.

Update

Leistungsangaben bei deutschen Supercomputern korrigiert.

(mma)