Europas schnellster Supercomputer steht wieder in Deutschland

Der Jülicher Jupiter Booster belegt Rang 4 der Top500-Liste der weltschnellsten Supercomputer und ist damit der schnellste Supercomputer in Europa.

vorlesen Druckansicht 88 Kommentare lesen
Erste Container des Supercomputers Jupiter stehen auf ihrem Fundament

Der Supercomputer Jupiter Booster ist modular aus Containern aufgebaut.

(Bild: Forschungszentrum Jülich)

Lesezeit: 3 Min.
close notice

This article is also available in English. It was translated with technical assistance and editorially reviewed before publication.

Der schnellste europäische Supercomputer kommt derzeit wieder einmal aus Deutschland, genauer vom Forschungszentrum Jülich. Jupiter löst damit den italienischen HPC6 als schnellstes System in Europa und den US-Amerikanischen Superrechner Eagle als schnellsten Supercomputer mit Nvidia-Technik ab. Doch weil die jüngste Erweiterung Jupiter Booster noch nicht mit voller Kraft rechnet, verpasst er die Exaflops-Marke recht deutlich. Der Supercomputer soll im Juli 2025 voll in Betrieb gehen.

Eine Teilinstallation schiebt sich in der 65. sogenannten Top500-Liste bereits auf Rang 4 hinter El Capitan, Frontier und Aurora, deren Ränge und Leistungen sich nicht geändert haben. 793,4 Petaflops schafft die aktuelle Ausbaustufe des Jupiter Boosters – und ist somit schon fast 18-mal so schnell wie sein Vorgänger Juwels (44,12 Petaflops).

Diese Messungen finden wie bei Supercomputern üblich mit dem High-Performance-Linpack-Benchmark in doppeltgenauer Gleitkommaarithmetik statt (Floating Point 64 Bit, FP64) und bestehen zum größten Teil aus Matrizenmultiplikationen. Die Top500-Liste ist allerdings nicht ganz komplett, weil viele Hyperscaler wie Amazon, Google, Microsoft und Meta ihre Supercomputer nicht aufnehmen lassen. Auch China reicht seit Jahren keine Ergebnisse mehr ein.

Der Beschleuniger-Teil Booster wird noch von einem klassischen Supercomputer-Teil Jupiter Cluster unterstützt. Bereits im November 2024 schlug das Jupiter Exascale Transition Instrument (JETI) als kleinere Teilinstallation von Jupiter Booster seinen Vorgänger Jewels um Faktor 2. Es belegte zuvor nicht nur Platz 18 der Top500-Supercomputer, sondern auch den sechsten Platz bei den Green 500, der effizientesten Supercomputer.

Die Zusammenstellung des Jupiter und Jupiter Boosters. Im Bild: Head of Jülich Supercomputing Centre Prof. Dr. Dr. Thomas Lippert.

(Bild: c't / csp)

Das System stammt von Eviden beziehungsweise Atos, aus der Reihe BullSequana XH3000 und setzt auf Nvidias Grace Hopper Superchips GH200, die einen 72-kernigen ARM-Prozessor mit einer H100-GPU vereinen. Jede GPU verwendet 96 GByte HBM3-RAM. Insgesamt soll der Jupiter Booster 125 Racks belegen und über rund 24.000 GH200 in 6000 Nodes verfügen. Damit stehen insgesamt enorme 2,3 Petabyte superschneller HBM3-Speicher bereit. Die Kühlung erfolgt mit Warmwasser. Bisher sind rund 4800 Nodes einsatzbereit, die Angabe von 4,8 Millionen Cores in der Top-500-Liste dürfte als Basis jedoch 5884 Rechenknoten haben: (132 Shader-Multiprozessoren + 72 ARM-Kerne) * 4 pro Board * 5884 Nodes.

Zusammensetzung des Jupiter und Jupiter Boosters in Jülich.

(Bild: Forschungszentrum Jülich)

Beim Training von KI-Modellen rechnet der Jupiter Boost noch schneller, weil dort simplere Datenformate wie FP8 zum Einsatz kommen. Das FZ Jülich projektiert mit mehr als 70 KI-Exaflops, wenn der Supercomputer demnächst fertig ist. Nvidia ist sich sicher, dass es über 90 KI-Exaflops werden. Die enorme KI-Performance erreicht das System allerdings nicht nur über die geringe FP8-Genauigkeit, sondern auch über die Verrechnung dünn besetzter Matrizen. Bei voll besetzten Matrizen halbiert sich der Durchsatz wieder.

Jupiter wird laut Planung zudem mit 21 Petabyte schnellem Massenspeicher bestückt, dabei kommen 40 IBM Elastic Storage Server 3500 mit NVMe-SSDs zum Einsatz. Sie sollen zusammen Datentransferraten von bis zu 4 TByte/s beim Lesen und 3 TByte/s beim Schreiben bereitstellen.

65. Top500-Liste der Supercomputer (Juni 2025): Top 10
Rang Name Land CPU-Typ Beschleuniger RMax* Effizienz
1 El Capitan USA MI300A AMD MI300A 1742 PFlops 58,9 GFlops/W
2 Frontier USA Epyc AMD MI250X 1353 PFlops 55,0 GFlops/W
3 Aurora USA Xeon Xeon GPU Max 1012 PFlops 26,2 GFlops/W
4 Jupiter Booster Deutschland GH200 Nvidia GH200 793 PFlops 60,6 GFlops/W
5 Eagle (MS Azure) USA Xeon Nvidia H100 561 PFlops k.A.
6 Eni HPC6 Italien Epyc AMD Instinct MI 478 PFlops 56,5 GFlops/W
7 Fugaku Japan A64FX 442 PFlops 15,4 GFlops/W
8 Alps Schweiz GH200 Nvidia GH200 435 PFlops 61,1 GFlops/W
9 LUMI Finnland Epyc Instinct MI 250X 380 PFlops 53,4 GFlops/W
10 Leonardo Italien Xeon Nvidia A100 241 PFlops 32,2 GFlops/W
*RMax ist die per Linpack gemessene Gleitkomma-Rechenleistung (FP64)

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

(csp)