AMD Opteron erobert Spitzenposition der Supercomputer

Mit großem Abstand konnte sich der mit AMD-Sechskern-Prozessoren bestückte Supercomputer Jaguar des Oak Ridge National Laboratory vor dem Roadrunner der Konkurrenz aus Los Alamos platzieren.

In Pocket speichern vorlesen Druckansicht 209 Kommentare lesen
Lesezeit: 6 Min.
Von
  • Andreas Stiller

Mit einem komfortablen Vorsprung konnte sich der Supercomputer Jaguar des National Center for Computational Science in Oak Ridge (ORNL) klar an die Spitze der am heutigen Montag auf der Supercomputer-Konferenz SC09 in Portland/Oregon veröffentlichten Top500-Liste setzen. Das von Cray errichtete und inzwischen auf 224.162 Opteronkerne aufgerüstete XT5-HE-System erreichte mit 1,75 PFlops im Linpack-Benchmark eine um fast 70 Prozent höhere Performance als der bisherige Spitzenreiter Roadrunner des Los Alamos National Laboratory. Seine theoretische Spitzenleistung knackt mit 2,33 PFlops sogar die 2-PFlops-Marke.

Der Jaguar des Oak Rigde National Laboratory ist der Petaflops-Rechner, der allein auf AMDs Opteron-CPUs basiert

(Bild: Oak Rigde National Laboratory)

Wie dieser "große Sprung des Jaguars" im dritten Anlauf zustande kam – dazu finden Sie im c't-Hintergrund einen Gastkommentar von Prof Dr. Hans W. Meuer, dem Mitgründer der Top500-Liste und Veranstalter der "Internationalen Supercomputer" in Deutschland. Mit dem Jaguar steht nach dem von Intel aufgebauten ASCI-Red-System "Paragon" – mit seinen 8192 Pentium-Pro-Prozessoren Top500-Spitzenreiter von Sommer 1997 bis Sommer 2000 – wieder ein Allzwecksystem an der Spitze der für die Top500 gemeldeten schnellsten Supercomputer. Hierbei ist allerdings zu berücksichtigen, dass manche kommerzielle Großsysteme (etwa die von Google, Microsoft oder Amazon) an diesem Rennen der HPC-Szene nicht teilnehmen.

Auch in dem jetzt auf Platz zwei verdrängten System "Roadrunner" sind zahlreiche Opterons zu finden, den Löwenanteil der Performance tragen hier jedoch die 13.600 PowerXCell-8i-Prozessoren von IBM. Das der militärischen Forschung (vornehmlich Atombombensimulationen) verschriebene Los Alamos National Labs musste allerdings einige Einheiten des Rechners anderen Aufgaben widmen, sodass die aktuelle Performance mit 1042 TFlops etwas niedriger ist als zuvor.

Platz drei macht den AMD-Erfolg komplett, denn auch hier thront nun ein Cray-XT5-Rechner des National Institute for Computational Sciences der University of Tennessee (NISC) mit 16.488 Sechskern-Opterons (98.928 Kerne), der 831,7 TFlops erzielt. Ganz knapp dahinter folgt auf Platz vier der mit IBM-Bluegene/P bestückte JuGene des Forschungszentrums Jülich mit 825 TFlops. Hinter dem deutsche Rechner konnte sich der chinesische Rechner Tianhe-1 des nationalen Supercomputer-Centers in Tianjin platzieren, der mit insgesamt 71.680 Intel-Nehalem- und -Harpertown-Kernen gemischt bestückt ist und der zusätzlich AMD/ATI-GPUs (eine GPU pro CPU) einsetzt.

Intel baute seine Spitzenposition mit 396 Xeon- und 6 Itanium-Systemen noch geringfügig aus (zuvor 399 ), AMD bleibt mit 42 etwa auf gleichem Niveau (zuvor 43), Power verliert etwas von 55 auf 52. Als "Exoten" konnten sich zwei SPARC64-VII, ein NEC-SX9 und ein System mit dem GRAPE-DR-Prozessor platzieren. Die USA haben mit 277 Systemen ein wenig Dominanz eingebüßt, in der letzten Liste vom Juni 2009 waren es noch 291. Dahinter folgen Großbritannien mit 45 (zuvor 44), Deutschland mit 27 (zuvor 29) und Frankreich mit 27 (zuvor 23). Als Vierter ist China mit 21 Systemen im Rennen. In Performance ausgedrückt ist Deutschland allerdings dank der leistungsfähigen Jülicher Rechner mit nunmehr insgesamt 2,3 PFlops weiterhin klarer Zweiter hinter den USA mit 16,4 PFlops. Großbritannien kommt auf 1,6 PFlops, dann folgt China, das mit 1,34 PFlops sowohl Frankreich (1,24 PFlops) als auch den asiatischen Konkurrenten Japan (1 PFlops) überholen konnte.

Mit bei den deutschen Rechnern dabei sind die drei QPACE-Systeme auf den Plätzen 109 bis 111 mit jeweils 43 TFlops. Sie wurden von den Universitäten Regensburg, Wuppertal und dem Forschungszentrum Jülich in Zusammenarbeit mit IBM speziell für Quantenchromodynamics entwickelt. Dazu verwenden sie PowerXCell-8i-Prozessoren mit sehr schnellen Links per Netzwerkprozessor (Xilinx-FPGA) zu den direkten Nachbar-Knoten im 3D-Torus. Herausragend ist hierbei ihre Energieeffizienz, die mit 773 MFlops/Watt weit vor den anderen PowerXCell-8i-Systemen mit IBM-Blades (458 MFlops/Watt) oder den Bluegene/P-Systemen (378 MFlop/Watt) rangiert. Der effizienteste Allzweckrechner ist gemäß den angegebenen Verbrauchswerten ein Opteron-Quadcore-Blade 6440 von Sun an der ETH Zürich mit 341 MFlops/Watt.Bei den Herstellern verteidigt Hewlett Packard die Spitzenposition gegenüber IBM mit 210 gegenüber 186 Systemen vor Cray und SGI, beide mit 19, und Dell mit 16. In der Performance jedoch führt IBM mit 9,74 vor HP mit 6,36 und Cray mit 4,5 PFlops. Bei den Betriebssystemen spielt Microsofts Windows 2008 HPC mit nur noch vier Systemen in den Top500 weiterhin nur eine untergeordnete Nebenrolle.

Dank 70 Prozent Effizienz (Linpack- gegenüber Spitzenleistung) konnte sich das erste 10-GBit-Ethernetsystem, ein IBM-BladeCenter LS22 in China, gerade so eben in die Liste auf Platz 486 eintragen. Das effizienteste Gigabit-Ethernet-System der Welt ist mit 63 Prozent Effizienz weiterhin der Rechner der Graviationswellenforscher in Hannover.

Das letzte System auf Platz 500, ein IBM-BladeCenter JS21 mit 20 TFlops, hatte in der Juni-Liste noch Platz 334 inne. Die Leistung aller Top500-Systeme zusammengerechnet ist allerdings gegenüber der Juni-Liste nur um bescheidene 23 Prozent auf 27,7 PFlops gestiegen, das liegt deutlich unter dem bisherigen langjährigen Schnitt der Steigerungsrate bei den Supercomputern von rund 40 Prozent pro Halbjahr

Top10 der 34. Top500-Liste der Supercomputer
Platz Rechner (Hersteller) Betreiber Land Platz im Jun. 09 Prozessoren (Cores) Rmax (TFlops)
1 Jaguar (Cray XT5) Oak Ridge National Lab USA 2 224.162 6C-Opteron, 2,6 GHz 1759
2 Roadrunner (IBM) DOE/NNSA/LANL USA 1 122.440 (SPE:3,2 GHz +PPC:3,2 GHz+DC-Opteron:1,8GHz) 1042
3 Kraken (Cray XT5) NICS/Univ. of Tennessee USA 6 98.928 6C-Opterons 2,6 GHz 831,7
4 JuGene (IBM BlueGene/P) Forschungszentrum Jülich Deutschl. 3 294.912 PowerPC 450, 850 MHz 825,5
5 Tianhe-1 (NUDT) National SuperComputer Center Tianjin China - 71.680 Xeon E5540/5350 +ATI GPU 563,1
6 Pleiaden (SGI-Altix) NASA USA 4 563.200 QC-Xeon 3 GHz/Nehalem EP 2,93 GHz 544,2
7 eServer BlueGene (IBM) DOE/NNSA/LLNL USA 5 212.992 PowerPC 440, 700 MHz 478,2
8 Blue Gene/P (IBM) Argonne National Laboratory USA 7 163.840 PowerPC 450, 850 MHz 450,3
9 Ranger (Sun Blade x6420) Univ. of Texas, TACC USA 8 62.976 QC-Opteron, 2 GHz 433,2
10 Red Sky (Sun Blade x6275) Sandia Lab USA 41.616 Xeon x5570, 2,93 GHz 423,9

Siehe dazu auch:

  • Der große Sprung des Jaguar, ein Gastkommentar von Prof Dr. Hans W. Meuer, dem Mitgründer der Top500-Liste und Veranstalter der "Internationalen Supercomputer" in Deutschland.

(as)