Hawk: Weltschnellster Supercomputer mit AMD-Prozessoren startet am HLR Stuttgart
Mit ĂĽber 11.000 AMD-Prozessoren kommt "Hawk" auf eine Spitzenleistung von 26 PFlops. Von der Rechenleistung sollen Wissenschaft und Industrie profitieren.
Mit einem Druck auf den virtuellen roten Knopf haben am heutigen Mittwoch Baden-Württembergs Ministerpräsident Winfried Kretschmann, der parlamentarische Staatssekretär Dr. Michael Meister vom Bundesministeriums für Bildung und Forschung und viele weitere Laudatoren den neuen Supercomputer Hawk (Falke) offiziell in Betrieb genommen. Dabei gab Kretschmann seiner Hoffnung Ausdruck, dass der Rechner als Ergebnis nach langer Rechenzeit nicht einfach 42 ausspuckt.
Je 19 Millionen Euro haben Bund und das Land Baden-Württemberg für die Anschaffung des von HPE aufgebauten Großcomputers am Höchstleistungsrechenzentrum Stuttgart (HLRS) beigesteuert. Dazu summieren sich noch die auch nicht unbeträchtlichen Betriebskosten – allein rund 4 Millionen Euro pro Jahr für die Energie. Der Rechner wird vorrangig für die Wissenschaft genutzt, allerdings auch auch von der Industrie, vor allem von zwei großen Automobilkonzernen aus der Umgebung. Industrielle Firmen steuern ebenfalls 6 Millionen Euro bei. Mehr Details zur Verteilung der Rechenzeit im Interview mit HLRS-Chef Prof. Michael Resch.
Der von HPEs SGI-Linie fĂĽr AMD-Prozessoren konzipierte, mittelwarmwassergekĂĽhlte Apollo-9000-Rechner ist in 44 Racks mit insgesamt 11.264 AMD Epyc-7742-Prozessoren bestĂĽckt, von denen jeder mit 64 Kernen und 2,25 GHz Takt aufwartet. Diese Kerne erzielen rund 26 PFlops theoretischer Spitzenleistung. Damit ist Hawk in etwa genauso schnell wie Deutschlands bisheriger Spitzenreiter, der SuperMUC-NG am Leibniz-Rechenzentrum in MĂĽnchen/Garching.
Schwergewichtsweltmeister
In der Praxis dürfte Hawk aber in vielen Fällen ein gutes Stückchen fixer sein als der mit Intel Xeon SP bestückte SuperMUC-NG, hat er doch weit mehr als doppelt so viele Rechenkerne. Und der SuperMUC-NG kann, wie alle neueren Intel-Rechner, nur dann voll punkten, wenn er die Vektorerweiterung AVX512 wirklich hocheffizient ausnutzen kann (so wie beim Linpack-Benchmark).
Mit seinen 720.896 CPU-Kernen könnte sich Hawk derzeit sogar Weltmeister der Rechner in der "Schwergewichtsklasse" nennen. Die Systeme mit mehr Rechenkernen besitzen entweder GPUs oder Leichtgewichtskerne, wie etwa Intel Xeon Phi oder IBM BlueGene.
Hawk: HPE Apollo 9000 | |
Racks | 44 |
Rechenknoten | 5.632 |
Spitzenperformance | 26 PFlops |
Prozessor | AMD EPYC 7742 (Rome) |
CPUS pro Knoten | 2 |
Kerne pro CPU | 64 |
Rechenkerne insgesamt | 720.896 |
CPU Taktfrequenz | 2,25 GHz |
DIMMs insgesamt | 90.112 |
Gesamte Systemhauptspeicher | ~ 1,44 PB |
Interconnect: InfiniBand HDR200 | |
Interconnect-Topologie | Enhanced 9D-Hypercube |
Interconnect--Bandbreite | 200 Gbit/s |
Anzahl InfiniBand Kabel | 3.024 |
Gesamte Kabellänge | ~20 km |
Storage: DDN EXAScaler mit Infinite Memory Engine (IME) | |
Festplatten | ~2,400 |
Gesamter Speicherplatz | ~25 PByte |
Maximale Energieaufname/Rack | ~90 kW |
Netzteile | 2.112 |
Energie und KĂĽhlung | |
Energieaufname im Normalbetrieb | ~3,5 MW |
Energieaufnahme Vollast bei LinPack | ~4,1 MW |
KĂĽhlsysteme (CDUs) | 6 |
Wasser Einlasstemperatur in die CDUs | 25°C |
Wasser AustrittsTemperatur zu den CDUs | 35°C |
KĂĽhlflĂĽssigkeitsmenge | ~2.5 mÂł |
Wassereingangstemperatur an den Kühltürmen | 16°C |
Wasserverdampfung | ~9 mÂł/h |
Fast schnellster Industrierechner
Eigentlich wollte das HLRS jedoch lieber mit der Eigenschaft "schnellster Industrierechner der Welt" auftrumpfen und hatte auch gute Chancen, den bisherigen Spitzenreiter in dieser Kategorie, den Power9-Rechner Pangea-III des französischen Mineralölkonzerns Total, von der Spitzenposition zu verdrängen.
Letzte Woche jedoch machte ein anderer europäischer Gas- und Erdölkonzern einen Strich durch diese Rechnung. Der HPC5 (High Performance Computing - Layer 5) von ENI in Italien bringt mit seinen 7280 Nvidia-V100-GPUs 51,7 PFlops auf die Waage und da gesellen sich noch die 22,4 PFlops des vorhandenen HRC4 hinzu, der weiterhin parallel betrieben wird. Bis zu 1 MW elektrischer Leistung holt sich ENI bei schönem Wetter von Solarzellen auf dem Dach.
Das HLRS hingegen hat sein Energiekontingent (maximal beim Linpack-Lauf 4,1 MW) mit Hawk ausgeschöpft und deinstalliert daher nun den Vorgänger Hazel Hen.
Und obwohl Linpack nicht gerade die Paradedisziplin des AMD-Rome-Prozessors ist, dürfte Hawk bei dem für die Platzierung in der Top500-Liste entscheidenden Benchmark auf etwa 20 PFlops kommen, also auch hier etwa auf das Niveau des SuperMUC-NG, der derzeit Platz 9 der Top500-Liste belegt. Vielleicht ist Hawk sogar etwas schneller. Beide deutschen Systeme sind ja pure "General-Purpose Systems", ausschließlich angetrieben von CPUs ohne spezielle Beschleuniger. Aber das HLRS ist mit HPE schon in der Planung der nächsten Ausbaustufe, da könnten dann auch GPUs in die Rechner einziehen.
Das ist beim dritten im Bunde der drei großen, im Gauss Centre for Supercomputing zusammengeschlossenen Rechenzentren, schon fest eingeplant: dem Jülicher SC. Gegen Mai – und somit rechtzeitig vor der Veröffentlichung der nächsten Top500-Liste – kann man dort mit dem bei Atos/Bull bestellten Booster 2 rechnen, ebenfalls bestückt mit AMD-Epyc-Prozessoren, aber vor allen Dingen mit Nvidias nächster GPU-Generation Ampere. Mir rund 70 PFlops theoretischer Spitzenleistung soll der Booster in deutlich höhere Regionen vordringen, falls denn die Software auf GPUs gut skaliert. Alle drei Rechenzentren des Gauss-Centre nehmen am europäischen PRACE-Projekt teil, sodass Wissenschaftler aus ganz Europa hier Rechenleistung nutzen können.