Hawk: Weltschnellster Supercomputer mit AMD-Prozessoren startet am HLR Stuttgart

Mit über 11.000 AMD-Prozessoren kommt "Hawk" auf eine Spitzenleistung von 26 PFlops. Von der Rechenleistung sollen Wissenschaft und Industrie profitieren.

187

19.02.2020, 17:16 Uhr

Lesezeit: 12 Min.

Von

Andreas Stiller

Hawk: Weltschnellster Supercomputer mit AMD-Prozessoren startet am HLR Stuttgart
- Schwergewichtsweltmeister
- Fast schnellster Industrierechner
Interview: Supercomputer und Nachhaltigkeit

Auf einer Seite lesen

Mit einem Druck auf den virtuellen roten Knopf haben am heutigen Mittwoch Baden-Württembergs Ministerpräsident Winfried Kretschmann, der parlamentarische Staatssekretär Dr. Michael Meister vom Bundesministeriums für Bildung und Forschung und viele weitere Laudatoren den neuen Supercomputer Hawk (Falke) offiziell in Betrieb genommen. Dabei gab Kretschmann seiner Hoffnung Ausdruck, dass der Rechner als Ergebnis nach langer Rechenzeit nicht einfach 42 ausspuckt.

Je 19 Millionen Euro haben Bund und das Land Baden-Württemberg für die Anschaffung des von HPE aufgebauten Großcomputers am Höchstleistungsrechenzentrum Stuttgart (HLRS) beigesteuert. Dazu summieren sich noch die auch nicht unbeträchtlichen Betriebskosten – allein rund 4 Millionen Euro pro Jahr für die Energie. Der Rechner wird vorrangig für die Wissenschaft genutzt, allerdings auch auch von der Industrie, vor allem von zwei großen Automobilkonzernen aus der Umgebung. Industrielle Firmen steuern ebenfalls 6 Millionen Euro bei. Mehr Details zur Verteilung der Rechenzeit im Interview mit HLRS-Chef Prof. Michael Resch.

Ministerpräsident Kretschmann, hier zusammen mit seiner Forschungsministerin Bauer und dem HLRS-Leiter Prof. Resch, hofft, dass der Hawk (im Hintergrund) nicht nur 42 als Resultat ausspuckt.

(Bild: Andreas Stiller)

Der von HPEs SGI-Linie für AMD-Prozessoren konzipierte, mittelwarmwassergekühlte Apollo-9000-Rechner ist in 44 Racks mit insgesamt 11.264 AMD Epyc-7742-Prozessoren bestückt, von denen jeder mit 64 Kernen und 2,25 GHz Takt aufwartet. Diese Kerne erzielen rund 26 PFlops theoretischer Spitzenleistung. Damit ist Hawk in etwa genauso schnell wie Deutschlands bisheriger Spitzenreiter, der SuperMUC-NG am Leibniz-Rechenzentrum in München/Garching.

Schwergewichtsweltmeister

In der Praxis dürfte Hawk aber in vielen Fällen ein gutes Stückchen fixer sein als der mit Intel Xeon SP bestückte SuperMUC-NG, hat er doch weit mehr als doppelt so viele Rechenkerne. Und der SuperMUC-NG kann, wie alle neueren Intel-Rechner, nur dann voll punkten, wenn er die Vektorerweiterung AVX512 wirklich hocheffizient ausnutzen kann (so wie beim Linpack-Benchmark).

Mit seinen 720.896 CPU-Kernen könnte sich Hawk derzeit sogar Weltmeister der Rechner in der "Schwergewichtsklasse" nennen. Die Systeme mit mehr Rechenkernen besitzen entweder GPUs oder Leichtgewichtskerne, wie etwa Intel Xeon Phi oder IBM BlueGene.

Hawk: HPE Apollo 9000
Racks	44
Rechenknoten	5.632
Spitzenperformance	26 PFlops
Prozessor	AMD EPYC 7742 (Rome)
CPUS pro Knoten	2
Kerne pro CPU	64
Rechenkerne insgesamt	720.896
CPU Taktfrequenz	2,25 GHz
DIMMs insgesamt	90.112
Gesamte Systemhauptspeicher	~ 1,44 PB
Interconnect: InfiniBand HDR200
Interconnect-Topologie	Enhanced 9D-Hypercube
Interconnect--Bandbreite	200 Gbit/s
Anzahl InfiniBand Kabel	3.024
Gesamte Kabellänge	~20 km
Storage: DDN EXAScaler mit Infinite Memory Engine (IME)
Festplatten	~2,400
Gesamter Speicherplatz	~25 PByte
Maximale Energieaufname/Rack	~90 kW
Netzteile	2.112
Energie und Kühlung
Energieaufname im Normalbetrieb	~3,5 MW
Energieaufnahme Vollast bei LinPack	~4,1 MW
Kühlsysteme (CDUs)	6
Wasser Einlasstemperatur in die CDUs	25°C
Wasser AustrittsTemperatur zu den CDUs	35°C
Kühlflüssigkeitsmenge	~2.5 m³
Wassereingangstemperatur an den Kühltürmen	16°C
Wasserverdampfung	~9 m³/h

Fast schnellster Industrierechner

Eigentlich wollte das HLRS jedoch lieber mit der Eigenschaft "schnellster Industrierechner der Welt" auftrumpfen und hatte auch gute Chancen, den bisherigen Spitzenreiter in dieser Kategorie, den Power9-Rechner Pangea-III des französischen Mineralölkonzerns Total, von der Spitzenposition zu verdrängen.

Letzte Woche jedoch machte ein anderer europäischer Gas- und Erdölkonzern einen Strich durch diese Rechnung. Der HPC5 (High Performance Computing - Layer 5) von ENI in Italien bringt mit seinen 7280 Nvidia-V100-GPUs 51,7 PFlops auf die Waage und da gesellen sich noch die 22,4 PFlops des vorhandenen HRC4 hinzu, der weiterhin parallel betrieben wird. Bis zu 1 MW elektrischer Leistung holt sich ENI bei schönem Wetter von Solarzellen auf dem Dach.

Das HLRS hingegen hat sein Energiekontingent (maximal beim Linpack-Lauf 4,1 MW) mit Hawk ausgeschöpft und deinstalliert daher nun den Vorgänger Hazel Hen.

Seit über 15 Jahren machen die drie großen Rechenzentren der Gauss Centre for Supercomputing die Spitzenposition in Deutschland unter sich aus — Seit über 15 Jahren machen die drei großen Rechenzentren des Gauss Centre for Supercomputing die Spitzenposition in Deutschland unter sich aus Mal ist der eine an der Spitze, mal der andere ...

(Bild: Andreas Stiller)

Und obwohl Linpack nicht gerade die Paradedisziplin des AMD-Rome-Prozessors ist, dürfte Hawk bei dem für die Platzierung in der Top500-Liste entscheidenden Benchmark auf etwa 20 PFlops kommen, also auch hier etwa auf das Niveau des SuperMUC-NG, der derzeit Platz 9 der Top500-Liste belegt. Vielleicht ist Hawk sogar etwas schneller. Beide deutschen Systeme sind ja pure "General-Purpose Systems", ausschließlich angetrieben von CPUs ohne spezielle Beschleuniger. Aber das HLRS ist mit HPE schon in der Planung der nächsten Ausbaustufe, da könnten dann auch GPUs in die Rechner einziehen.

Das ist beim dritten im Bunde der drei großen, im Gauss Centre for Supercomputing zusammengeschlossenen Rechenzentren, schon fest eingeplant: dem Jülicher SC. Gegen Mai – und somit rechtzeitig vor der Veröffentlichung der nächsten Top500-Liste – kann man dort mit dem bei Atos/Bull bestellten Booster 2 rechnen, ebenfalls bestückt mit AMD-Epyc-Prozessoren, aber vor allen Dingen mit Nvidias nächster GPU-Generation Ampere. Mir rund 70 PFlops theoretischer Spitzenleistung soll der Booster in deutlich höhere Regionen vordringen, falls denn die Software auf GPUs gut skaliert. Alle drei Rechenzentren des Gauss-Centre nehmen am europäischen PRACE-Projekt teil, sodass Wissenschaftler aus ganz Europa hier Rechenleistung nutzen können.