Top 500 der Supercomputer: Deutschland wieder gut dabei

Vor allem dank der mächtigen Supercomputer im Forschungszentrum Jülich konnte der Standort Deutschland seine Position im Ranking der Top-500-Liste deutlich verbessern.

In Pocket speichern vorlesen Druckansicht 126 Kommentare lesen
Lesezeit: 6 Min.
Von
  • Andreas Stiller

Juropa im FZ Jülich besteht aus zwei zusammengeschalteten Xeon-Rechnern von Bull und Sun, hier die Bull-Novascale-Racks.

(Bild: FZ Jülich)

Vor allem dank der mächtigen Supercomputer im Forschungszentrum Jülich konnte der Standort Deutschland seine Position im Ranking der Top-500-Liste deutlich verbessern. Diese halbjährlich herausgegebene Liste, die auf dem einfachen Linpack-Benchmark fußt, wurde heute morgen in Hamburg zum Auftakt der internationalen Supercomputerkonferenz ISC2009 bekannt gegeben.

Unter den Top 10 der schnellsten Rechner der Welt konnte Jülich gleich zwei Systeme platzieren, beide wurden erst vor Kurzem eingeweiht: Der auf 294.912 IBM-BlueGene/P-Kerne aufgerüstete JuGene erreichte mit 825,5 TFlop/s Platz 3 und das Juropa-System – zusammengesetzt aus Bull Novascale und Sun-Blades – kam mit insgesamt 26.304 Intel-Nehalem-Kernen auf 274,8 TFlop/s. Alle anderen Systeme der Top10 stehen in den USA, auf Platz eins weiterhin der militärisch genutzte Roadrunner des Los-Alamos Laboratory mit Opteron- und PowerXcell-8i-Prozessoren, der 1,1 PFlop/s erreicht, sowie knapp dahinter wie schon vor einem halben Jahr der von Cray aufgebaute "Jaguar", der mit seinen 37.538 Opteron-Quadcores mit 1,06 PFlop/s ebenfalls noch knapp die Petaflops-Marke knackt. Ein interessanter Newcomer ist auf Platz 14 das BlueGene/P-System an der King Abdullah University of Science and Technology in Saudia Arabien, der mit 185 TFlop/s knapp vor dem Dawning 5000A in Schanghai mit 181 TFlop/s die Spitzenposition für den asiatischen Raum eroberte.

Dawning 5000A ist dabei eines von den wenigen Systemen, die mit Microsoft HPC 2008 betrieben werden. Microsoft konnte seinen Anteil in der Liste von genau einem Prozent nicht weiter ausbauen.

Die USA dominieren die Supercomputerszene klar, und zwar mit 291 Systemen in der Liste – genauso viele wie vor einem halben Jahr. Dahinter folgt Großbritannien mit 44 (zuvor 45), Deutschland mit 29 (zuvor 24) und Frankreich mit 23 (zuvor 26). In Performance ausgedrückt ist dank Jülicher Power Deutschland aber mit nunmehr 2,1 PFlops/s klarer Zweiter hinter den USA (13,7 PFlop/s). Großbritannien kommt auf 1,2 PFlop/s und Frankreich auf 1 PFlop/s. Es folgen Japan, China, Kanada und Schweden.

Bei den Firmen konnte Hewlett-Packard mengenmäßig seinen vor einem halben Jahr erstmals erzielten Vorsprung vor IBM noch etwas weiter ausbauen mit 213 (zuvor 209) gegenüber 188 (189) Systemen. Weit dahinter folgen gleichauf Cray und SGI mit jeweils 20 Systemen und dann Dell mit 16, von denen zwei zusammen mit Sun aufgebaut wurden. In Performance ausgedrückt dominiert jedoch weiterhin IBM (8,9 PFlop/s, zuvor 6,5 PFlop/s) vor HP (5,7 PFlop/s, zuvor 4,2 PFlop/s) und Cray (3,1 PFlop/s zuvor 2,5 PF/s)

Bei den Prozessoren hat Intel mit 399 von 500 Systemen deutlicher als je zuvor die Nase vorn. Bereits 22 Systeme sind mit dem erst vor drei Monaten eingeführten Xeon-Nehalem-EP (Codename Gainestown) bestückt, man findet aber nur noch 6 Itanium-Systeme (zuvor 9). IBM Power (inklusive Cell) hat mit nunmehr 55 (zuvor 60) etwas an Boden verloren; stärker noch AMD mit 43 von zuvor 60.

Schaut man allerdings allein auf die Top 50, so dreht sich der Spieß bei den wirklich großen Eisen um. Hier führt AMD mit 18 vor Power mit 16 und Intel mit 14 Systemen. Mit dabei sind noch ein Vektorrechner von NEC (SX9) und ein Supercomputer von Fujitsu mit SPARC64VII. Zwei Systeme mit dem nagelneuen AMD-Hexcore-Prozessor Istanbul konnten sich dabei auch bereits platzieren – vom schon länger erhältlichen energieschluckenden Sechs-Kern-Gegenstück von Intel namens Dunnington indes keine Spur.

In der Energieeffizienz führen die Systeme mit IBM-PowerXCell-Prozessoren mit dem Bestwert von 536 MFlop/s pro Watt (ein QS22-Cluster an der Universität Warschau). In die Phalanx der PowerXCell konnte nur der japanische Spezialrechner GRAPE-DR eindringen, der 428 MFlop/s pro Watt erreicht. Dann folgen die BlueGene-Kollegen. Von den Allzweckrechnern übernahm ein IBM Dataplex-System mit Xeon X5560 die Führung mit 301 MFlop/s pro Watt. Der effizienteste AMD Quad-Core in einer Cray XT4 kam auf 232 MFlop/s pro Watt. Für die Hexcore-Opteron-Systeme fehlen dabei noch die Angaben über den Energieverbrauch.

Der schnellste Cluster mit Gigabit-Ethernet-Interconnects ist jetzt der Xeon-Cluster der Universität Toronto mit 169 TFlop/s auf Platz 16. In Europa führt in dieser Disziplin weiterhin der Rechner Atlas der Gravitationswellenforscher in Hannover auf Platz 134. Mit 63 Prozent Effizienz des Interconnects (Linpack-Leistung zu theoretischer Peak-Leistung) führt er in diesem Punkt allerdings weltweit klar und hängt damit sogar viele InfiniBand-Systeme ab. Er könnte zudem in der Rangliste viel weiter vorne mitspielen, da er inzwischen erheblich aufgerüstet wurde, nur fanden die Forscher bislang keine Zeit, ihn neu zu "linpacken". Ähnliche Zeitprobleme haben aber auch andere Forschungseinrichtungen, etwa das Oak Ridge National Laboratory, das seinen Cray-Rechner Jaguar auf Platz 2 auch weiter aufgerüstet hat, es aber noch nicht für einen zeitraubenden Linpack-Lauf freistellen konnte.

Trotz aller Superlative sieht man möglicherweise auch hier, wenn auch in kleinem Maße, die Auswirkung der aktuellen Finanzkrise, denn die Rechenleistung aller Rechner in der Liste zusammen nahm diesmal "nur" um 34 Prozent auf 22,6 PFlop/s zu – das liegt ein wenig unter dem langjährigen Schnitt von rund 40 Prozent pro Halbjahr, beim vorigen Mal betrug die Zunahme noch 45 Prozent. Um überhaupt noch auf die Liste zu gelangen, musste ein Rechner 17 TFlop/s leisten (zuvor 12,6 TFlop/s).

Top Ten der 33.Top-500-Liste der Supercomputer vom Juni 2009
Platz Rechner (Hersteller) Betreiber Land Platz im Nov. 08 Prozessoren (Cores) Rmax (TFlop/s)
1 Roadrunner (IBM) DOE/NNSA/LANL USA 1 129.600 (SPE:3,2 GHz +PPC:3,2 GHz+DC-Opteron:1,8GHz) 1105
2 Jaguar (Cray XT5) Oak Ridge National Lab USA 2 150.152 QC-Opteron, 2,3 GHz 1059
3 JuGene (BlueGene/P) Forschungszentrum Jülich Deutschland 11 (up) 294.912 PowerPC 450, 850 MHz 825,5
4 SGI-Altix NASA USA 3 51.200 QC-Xeon, 3 GHz 487
5 eServer BlueGene (IBM) DOE/NNSA/LLNL USA 4 212.992 PowerPC 440, 700 MHz 478,2
6 Cray XT5 NICS/Univ. of Tennessee USA 15 (up) 66.00 QC-Opterons 2,3 GHz 463,3
7 Blue Gene/P (IBM) Argonne National Laboratory USA 5 163.840 PowerPC 450, 850 MHz 450,3
8 Ranger (Sun) Univ. of Texas, TACC USA 6 62.976 QC-Opteron, 2 GHz 326
9 eServer BlueGene/P (IBM) DOE/NNSA/LLNL USA 147.456 PowerPC 450, 850 MHz 415,7
10 Juropa (Bull/Sun) Forschungszentrum Jülich Deutschland 26.304 Xeon X5570 2,93 GHz 274,8

(as)