Europas schnellster Supercomputer steht wieder in Deutschland

Der Jülicher Jupiter Booster belegt Rang 4 der Top500-Liste der weltschnellsten Supercomputer und ist damit der schnellste Supercomputer in Europa.

88

Der Supercomputer Jupiter Booster ist modular aus Containern aufgebaut.

(Bild: Forschungszentrum Jülich)

10.06.2025, 11:12 Uhr

Lesezeit: 3 Min.

c't Magazin

Von

Carsten Spille

Der schnellste europäische Supercomputer kommt derzeit wieder einmal aus Deutschland, genauer vom Forschungszentrum Jülich. Jupiter löst damit den italienischen HPC6 als schnellstes System in Europa und den US-Amerikanischen Superrechner Eagle als schnellsten Supercomputer mit Nvidia-Technik ab. Doch weil die jüngste Erweiterung Jupiter Booster noch nicht mit voller Kraft rechnet, verpasst er die Exaflops-Marke recht deutlich. Der Supercomputer soll im Juli 2025 voll in Betrieb gehen.

Eine Teilinstallation schiebt sich in der 65. sogenannten Top500-Liste bereits auf Rang 4 hinter El Capitan, Frontier und Aurora, deren Ränge und Leistungen sich nicht geändert haben. 793,4 Petaflops schafft die aktuelle Ausbaustufe des Jupiter Boosters – und ist somit schon fast 18-mal so schnell wie sein Vorgänger Juwels (44,12 Petaflops).

Diese Messungen finden wie bei Supercomputern üblich mit dem High-Performance-Linpack-Benchmark in doppeltgenauer Gleitkommaarithmetik statt (Floating Point 64 Bit, FP64) und bestehen zum größten Teil aus Matrizenmultiplikationen. Die Top500-Liste ist allerdings nicht ganz komplett, weil viele Hyperscaler wie Amazon, Google, Microsoft und Meta ihre Supercomputer nicht aufnehmen lassen. Auch China reicht seit Jahren keine Ergebnisse mehr ein.

Der Beschleuniger-Teil Booster wird noch von einem klassischen Supercomputer-Teil Jupiter Cluster unterstützt. Bereits im November 2024 schlug das Jupiter Exascale Transition Instrument (JETI) als kleinere Teilinstallation von Jupiter Booster seinen Vorgänger Jewels um Faktor 2. Es belegte zuvor nicht nur Platz 18 der Top500-Supercomputer, sondern auch den sechsten Platz bei den Green 500, der effizientesten Supercomputer.

Prof. Dr. Dr. Thomas Lippert hält eine Präsentation zum Supercomputer Jupiter — Die Zusammenstellung des Jupiter und Jupiter Boosters. Im Bild: Head of Jülich Supercomputing Centre Prof. Dr. Dr. Thomas Lippert.

(Bild: c't / csp)

Massive Hardware

Das System stammt von Eviden beziehungsweise Atos, aus der Reihe BullSequana XH3000 und setzt auf Nvidias Grace Hopper Superchips GH200, die einen 72-kernigen ARM-Prozessor mit einer H100-GPU vereinen. Jede GPU verwendet 96 GByte HBM3-RAM. Insgesamt soll der Jupiter Booster 125 Racks belegen und über rund 24.000 GH200 in 6000 Nodes verfügen. Damit stehen insgesamt enorme 2,3 Petabyte superschneller HBM3-Speicher bereit. Die Kühlung erfolgt mit Warmwasser. Bisher sind rund 4800 Nodes einsatzbereit, die Angabe von 4,8 Millionen Cores in der Top-500-Liste dürfte als Basis jedoch 5884 Rechenknoten haben: (132 Shader-Multiprozessoren + 72 ARM-Kerne) * 4 pro Board * 5884 Nodes.

Auflistung der Komponenten des Supercomputers Jupiter Booster — Zusammensetzung des Jupiter und Jupiter Boosters in Jülich.

(Bild: Forschungszentrum Jülich)

Beim Training von KI-Modellen rechnet der Jupiter Boost noch schneller, weil dort simplere Datenformate wie FP8 zum Einsatz kommen. Das FZ Jülich projektiert mit mehr als 70 KI-Exaflops, wenn der Supercomputer demnächst fertig ist. Nvidia ist sich sicher, dass es über 90 KI-Exaflops werden. Die enorme KI-Performance erreicht das System allerdings nicht nur über die geringe FP8-Genauigkeit, sondern auch über die Verrechnung dünn besetzter Matrizen. Bei voll besetzten Matrizen halbiert sich der Durchsatz wieder.

Jupiter wird laut Planung zudem mit 21 Petabyte schnellem Massenspeicher bestückt, dabei kommen 40 IBM Elastic Storage Server 3500 mit NVMe-SSDs zum Einsatz. Sie sollen zusammen Datentransferraten von bis zu 4 TByte/s beim Lesen und 3 TByte/s beim Schreiben bereitstellen.

65. Top500-Liste der Supercomputer (Juni 2025): Top 10
Rang	Name	Land	CPU-Typ	Beschleuniger	RMax*	Effizienz
1	El Capitan	USA	MI300A	AMD MI300A	1742 PFlops	58,9 GFlops/W
2	Frontier	USA	Epyc	AMD MI250X	1353 PFlops	55,0 GFlops/W
3	Aurora	USA	Xeon	Xeon GPU Max	1012 PFlops	26,2 GFlops/W
4	Jupiter Booster	Deutschland	GH200	Nvidia GH200	793 PFlops	60,6 GFlops/W
5	Eagle (MS Azure)	USA	Xeon	Nvidia H100	561 PFlops	k.A.
6	Eni HPC6	Italien	Epyc	AMD Instinct MI	478 PFlops	56,5 GFlops/W
7	Fugaku	Japan	A64FX	–	442 PFlops	15,4 GFlops/W
8	Alps	Schweiz	GH200	Nvidia GH200	435 PFlops	61,1 GFlops/W
9	LUMI	Finnland	Epyc	Instinct MI 250X	380 PFlops	53,4 GFlops/W
10	Leonardo	Italien	Xeon	Nvidia A100	241 PFlops	32,2 GFlops/W
*RMax ist die per Linpack gemessene Gleitkomma-Rechenleistung (FP64)

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.

Preisvergleiche immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.