Supercomputer: DoE kauft Zwischenlösung von AMD/Nvidia, weil Intel nicht liefert

Intels CPUs "Sapphire Rapids" und GPUs "Ponte Vecchio" verspäten sich. Zur Überbrückung setzt das US-Energieministerium auf Hardware von AMD und Nvidia.

In Pocket speichern vorlesen Druckansicht 9 Kommentare lesen

(Bild: Argonne National Laboratory)

Lesezeit: 2 Min.

Eigentlich sollte der Exascale-Supercomputer Aurora dieses Jahr den Betrieb aufnehmen. Weil sich Intels Auslieferung der benötigten Prozessoren und GPU-Rechenbeschleuniger jedoch stärker verzögert als bisher angenommen, haben das Energieministerium der Vereinigten Staaten (Department of Energy, DoE) und das Argonne National Laboratory ein Überbrückungssystem in Auftrag gegeben.

Auroras kleiner Bruder heißt Polaris und verwendet 280 Systeme aus HPEs Baureihe Apollo Gen10 Plus, in denen insgesamt 560 AMD-Epyc-Prozessoren der Serien 7002 (Rome, Zen 2) und 7003 (Milan, Zen 3) stecken, gepaart mit 2240 A100-Beschleuniger von Nvidia.

Mit einer anvisierten FP64-Rechenleistung von 44 PetaFlops liegt Polaris zwar deutlich unter der ExaFlops-Performance von Aurora, befände sich nach aktuellem Stand aber unter den zehn ersten Plätzen der weltweit schnellsten Supercomputer. Den Fokus legt das Argonne National Laboratory auf KI-Berechnungen mit niedrigerer Genauigkeit, wo Polaris 1,4 ExaFlops erreichen soll.

Das System wird zur Überbrückung für erste Projekte benötigt, die auf Rechenleistung angewiesen sind, etwa in der Krebs-, Klima- und Atomforschung. Zudem will man mithilfe von Polaris die Software für Aurora vorbereiten.

Bis Aurora an den Start geht, kann es allerdings noch dauern. AMD, Nvidia und HPE beginnen praktisch sofort mit der Auslieferung. Bis Anfang 2022 soll der Supercomputer vollständig einsatzbereit sein und ab dem Frühling größeren Forschungskreisen zur Verfügung stehen.

Erst danach dürfte das Intel-Exascale-System bereit sein. Dort kommen Xeon-SP-Prozessoren der Baureihe Sapphire Rapids-SP und Tausende Ponte-Vecchio-Rechenbeschleuniger zum Einsatz. Erstere fertigt Intel mit eigener 10-Nanometer-Technik, die GPUs setzen zusätzlich auf TSMC als Zulieferer – einzelne Bausteine des Multi-Chip-Moduls fertigt TSMC mit 7- und 5-nm-Strukturen. Im Oktober 2020 spielten die Verantwortlichen Auroras Verspätung noch herunter.

Beim eigentlich zweiten, nun aber wahrscheinlich ersten US-Exascale-Supercomputer Frontier soll derweil alles nach Plan verlaufen. Er verwendet Epyc-CPUs und Instinct-Beschleuniger von AMD, um auf eine Rechenleistung von 1,5 FP64-ExaFlops zu kommen, und soll noch dieses Jahr startklar sein.

(mma)