Europas schnellster Supercomputer steht wieder in Deutschland
Der Jülicher Jupiter Booster belegt Rang 4 der Top500-Liste der weltschnellsten Supercomputer und ist damit der schnellste Supercomputer in Europa.
Der Supercomputer Jupiter Booster ist modular aus Containern aufgebaut.
(Bild: Forschungszentrum Jülich)
Der schnellste europäische Supercomputer kommt derzeit wieder einmal aus Deutschland, genauer vom Forschungszentrum Jülich. Jupiter löst damit den italienischen HPC6 als schnellstes System in Europa und den US-Amerikanischen Superrechner Eagle als schnellsten Supercomputer mit Nvidia-Technik ab. Doch weil die jüngste Erweiterung Jupiter Booster noch nicht mit voller Kraft rechnet, verpasst er die Exaflops-Marke recht deutlich. Der Supercomputer soll im Juli 2025 voll in Betrieb gehen.
Eine Teilinstallation schiebt sich in der 65. sogenannten Top500-Liste bereits auf Rang 4 hinter El Capitan, Frontier und Aurora, deren Ränge und Leistungen sich nicht geändert haben. 793,4 Petaflops schafft die aktuelle Ausbaustufe des Jupiter Boosters – und ist somit schon fast 18-mal so schnell wie sein Vorgänger Juwels (44,12 Petaflops).
Diese Messungen finden wie bei Supercomputern üblich mit dem High-Performance-Linpack-Benchmark in doppeltgenauer Gleitkommaarithmetik statt (Floating Point 64 Bit, FP64) und bestehen zum größten Teil aus Matrizenmultiplikationen. Die Top500-Liste ist allerdings nicht ganz komplett, weil viele Hyperscaler wie Amazon, Google, Microsoft und Meta ihre Supercomputer nicht aufnehmen lassen. Auch China reicht seit Jahren keine Ergebnisse mehr ein.
Der Beschleuniger-Teil Booster wird noch von einem klassischen Supercomputer-Teil Jupiter Cluster unterstützt. Bereits im November 2024 schlug das Jupiter Exascale Transition Instrument (JETI) als kleinere Teilinstallation von Jupiter Booster seinen Vorgänger Jewels um Faktor 2. Es belegte zuvor nicht nur Platz 18 der Top500-Supercomputer, sondern auch den sechsten Platz bei den Green 500, der effizientesten Supercomputer.
(Bild: c't / csp)
Massive Hardware
Das System stammt von Eviden beziehungsweise Atos, aus der Reihe BullSequana XH3000 und setzt auf Nvidias Grace Hopper Superchips GH200, die einen 72-kernigen ARM-Prozessor mit einer H100-GPU vereinen. Jede GPU verwendet 96 GByte HBM3-RAM. Insgesamt soll der Jupiter Booster 125 Racks belegen und über rund 24.000 GH200 in 6000 Nodes verfügen. Damit stehen insgesamt enorme 2,3 Petabyte superschneller HBM3-Speicher bereit. Die Kühlung erfolgt mit Warmwasser. Bisher sind rund 4800 Nodes einsatzbereit, die Angabe von 4,8 Millionen Cores in der Top-500-Liste dürfte als Basis jedoch 5884 Rechenknoten haben: (132 Shader-Multiprozessoren + 72 ARM-Kerne) * 4 pro Board * 5884 Nodes.
(Bild: Forschungszentrum Jülich)
Beim Training von KI-Modellen rechnet der Jupiter Boost noch schneller, weil dort simplere Datenformate wie FP8 zum Einsatz kommen. Das FZ Jülich projektiert mit mehr als 70 KI-Exaflops, wenn der Supercomputer demnächst fertig ist. Nvidia ist sich sicher, dass es über 90 KI-Exaflops werden. Die enorme KI-Performance erreicht das System allerdings nicht nur über die geringe FP8-Genauigkeit, sondern auch über die Verrechnung dünn besetzter Matrizen. Bei voll besetzten Matrizen halbiert sich der Durchsatz wieder.
Jupiter wird laut Planung zudem mit 21 Petabyte schnellem Massenspeicher bestückt, dabei kommen 40 IBM Elastic Storage Server 3500 mit NVMe-SSDs zum Einsatz. Sie sollen zusammen Datentransferraten von bis zu 4 TByte/s beim Lesen und 3 TByte/s beim Schreiben bereitstellen.
| 65. Top500-Liste der Supercomputer (Juni 2025): Top 10 | ||||||
| Rang | Name | Land | CPU-Typ | Beschleuniger | RMax* | Effizienz |
| 1 | El Capitan | USA | MI300A | AMD MI300A | 1742 PFlops | 58,9 GFlops/W |
| 2 | Frontier | USA | Epyc | AMD MI250X | 1353 PFlops | 55,0 GFlops/W |
| 3 | Aurora | USA | Xeon | Xeon GPU Max | 1012 PFlops | 26,2 GFlops/W |
| 4 | Jupiter Booster | Deutschland | GH200 | Nvidia GH200 | 793 PFlops | 60,6 GFlops/W |
| 5 | Eagle (MS Azure) | USA | Xeon | Nvidia H100 | 561 PFlops | k.A. |
| 6 | Eni HPC6 | Italien | Epyc | AMD Instinct MI | 478 PFlops | 56,5 GFlops/W |
| 7 | Fugaku | Japan | A64FX | – | 442 PFlops | 15,4 GFlops/W |
| 8 | Alps | Schweiz | GH200 | Nvidia GH200 | 435 PFlops | 61,1 GFlops/W |
| 9 | LUMI | Finnland | Epyc | Instinct MI 250X | 380 PFlops | 53,4 GFlops/W |
| 10 | Leonardo | Italien | Xeon | Nvidia A100 | 241 PFlops | 32,2 GFlops/W |
| *RMax ist die per Linpack gemessene Gleitkomma-Rechenleistung (FP64) | ||||||
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
(csp)