Der erste westliche Exaflops-Supercomputer: Frontier mit CPUs und GPUs von AMD

Die USA sind das zweite Land mit einem Supercomputer der Exascale-Leistungsklasse. Mehr als 1,1 Trillionen Berechnungen pro Sekunde schafft Frontier.

In Pocket speichern vorlesen Druckansicht 72 Kommentare lesen

(Bild: Carlos Jones/ORNL, U.S. Dept. of Energy)

Lesezeit: 3 Min.

Frontier ist doch früher nutzbar als zuletzt in Aussicht gestellt – fast das komplette System ist inzwischen operabel. Somit schafft es Frontier auf eine Rechenleistung von 1,1 Exaflops im Linpack-Benchmark mit doppelter (FP64-)Genauigkeit, in der Spitze sind sogar fast 1,7 Exaflops drin und bei KI-Berechnung dank optimierter Matrizenrechner beinahe 6,9 Exaflops. Ein Exaflops entspricht einer Trillion Berechnungen pro Sekunde oder anders ausgedrückt: eine 1 mit 18 Nullen.

Und das scheint nicht einmal die finale Form von Frontier zu sein, denn rein rechnerischen fehlen dem Supercomputer noch einige Tausend GPU-Beschleuniger, die das System in den nächsten Monaten auf bis zu 2 Exaflops Dauerrechenleistung hieven könnten.

Konkret sollen es einmal 9408 AMD-Prozessoren des Typs Epyc 7A53 werden – angepasste 64-Kerner aus der Zen-3-Familie mit dem eigenen Codenamen Trento (statt Milan). Hinzu kommen pro Prozessor vier GPU-Beschleuniger in Form von AMDs Instinct MI250X, also insgesamt 37.632 Karten mit 75.264 GPUs beziehungsweise gut einer Milliarde Shader-Kernchen (14.080 pro GPU, auf jeder Karte sitzen zwei Chips).

Der 9,2 Petabyte umfassende Hauptspeicher besteht zu gleichen Teilen aus schnellem HBM2e-Stapelspeicher auf den GPUs sowie DDR4-RAM, das an die CPUs gekoppelt ist. Dank Infinity-Fabric-Verbindung teilen sich die Epyc- und Instinct-Chips den Speicherzugriff: Pro Knoten arbeiten sie Cache-kohärent in einer Unified Memory Architecture (UMA) zusammen.

Die Rechenknoten untereinander sind mit dem sogenannten Slingshot-Interconnect verbunden, den die HPE-Sparte Cray entwickelt hat.

Frontier steht am Oak Ridge National Laboratory (ORNL) und ist der erste Supercomputer der Exascale-Klasse, der nicht in China rechnet – dort gibt es Systeme mit chinesischer Technik und über 1 EFlops offenbar schon seit 2021. Eigentlich sollte Aurora mit Intel-Hardware diesen Titel erhalten, allerdings verspätet er sich aufgrund von Intels Verschiebungen immer wieder.

Als weiterer Rekord sind die Supercomputer mit AMD-Hardware die effizientesten High-Performance-Systeme: Frontier kommt bei einer Gesamtleistungsaufnahme von 21,1 Megawatt auf etwas mehr als 52 Gigaflops pro Watt, der Mini-Ableger Crusher alias Frontier TDS sogar auf fast 63. Das effizienteste System mit Nvidia-GPUs ist das "Scalable Module" des südkoreanischen SSC-21 auf Platz 6 mit knapp 34 Gigaflops pro Watt. Zum Einsatz kommen hier allerdings noch A100-Beschleuniger der vergangenen Ampere-Generation und noch keine neuen Hopper-Karten.

US-amerikanische Forschungsteams erhalten im Laufe dieses Jahres Zugriff auf Frontier, unter anderem für Nuklearsimulationen, Krankheitsforschung und die Entwicklung von Künstlicher Intelligenz.

Im März 2022 räumte das Energieministerium der Vereinigten Staaten (Department of Energy, DoE) noch eine Verspätung ein, woraufhin der Mini-Ableger Crusher entstand. Dieses Testsystem hat es unter dem Namen Frontier TDS auf Platz 29 der aktuellen Top500-Liste mit den weltweit schnellsten Supercomputer geschafft.

Im März befürchteten die Verantwortlichen noch eine Inbetriebnahme Frontiers erst im Jahr 2023. Unter der Hand wurde gemunkelt, dass die Verzögerung an der Skalierung von HPEs Slingshot-Interconnect lag, die alle Racks miteinander verkabeln – wohlgemerkt mit insgesamt 90 Kilometern Verkabelung.

(mma)