Runde 40

USA dominiert, China schließt auf und Intel lässt alle anderen Prozessorhersteller weit hinter sich – da hat sich mit der 40. TOP500-Liste nichts geändert. Anderes gilt hingegen für die Positionen einzelner Systeme und die erreichten Rechenleistungen.

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
Lesezeit: 7 Min.
Von
  • Nikolai Zotow
Inhaltsverzeichnis

(Bild: RZ Jülich)

An der Spitze der TOP500, der Liste der schnellsten Supercomputer gab es Positionswechsel: Crays XK7 Titan“ am Oak Ridge Lab verdrängt mit 17,6 PFlop/s (Petaflops pro Sekunde) den einstigen Spitzenreiter Sequoia von IBM am Lawrence Livermore National Lab, der 16,3 PFlop/s erreicht.

Titan verdankt seine Rechenleistung 18.688 Tesla-K20X-GPUs von NVIDIA und derselben Menge an 16-Core-Opteron-CPUs von AMD – insgesamt kommt die Nummer eins auf 560.640 Cores. Der XK7 ist Nachfolger des XK6 „Jaguar“ am selben Institut, der ebenfalls mit Opertons vom Type 6274 lief, aber ältere 2090-GPUs von NVIDIA nutzte und damit auf seinen 298.592 Rechenkernen nur 1,9 PFlop/s erzielte.

Sequoia ist bei derselben Konfiguration wie im Juni 2012 geblieben: ein Blue Gene/Q von IBM mit 1.572.864 Power-BQC-Cores. Auf dem dritten Platz konnte sich der japanische K Computer von Fujitsu behaupten, der mit derselben Ausstattung im Jahr 2011 noch der Spitzenreiter war. Er erreicht nach wie vor 10,5 PFlop/s mit 705.024 Prozessoren vom Typ BC-SPARC64. Mira hingegen, ein Blue Gene/Q wie Sequoia, fiel mit derselben Ausstattung (786.432 Cores, 8.162,4 TFlop/s) wie im Juni von Platz 3 auf 4 zurück.

Bei den deutschen Supercomputern konnte sich JUQUEEN im Forschungszentrum Jülich mit seiner Leistung von 4,1 PFlop/s und 393.216 Power-BQC-Prozessoren im Blue Gene/Q-System von Platz 8 auf Platz 5 vorschieben. Überholt hat er SuperMUC am Leibniz-Rechenzentrum in Garching bei München, der 2,9 PFlop/s mit 147.456 BC-Xeons der E5-Klasse wie vor einem halben Jahr erreicht. Im Sommer lag SuperMUC auf Platz 4 noch vor JUQUEEN.

Insgesamt stellt IBM sechs der zehn schnellsten Rechner. Der Zuwachs der kumulierten Rechenkapazität der Top 10 ist enorm: 2011 lag der Einstieg dort noch bei 1,04 PFlop/s, ein Jahr später müssen es bereits 1,5 PFlop/s sein. Vor einem Jahr lag die addierte Rechenkapazität der zehn Schnellsten bei etwas mehr als 22 PFlop/s, im November 2012 sind es über 68 PFlop/s. Alle Systeme auf den ersten zehn Rängen laufen unter Linux.

Nebenrolle: Obwohl der schnellste Supercomputer mit GPUs als Hilfsprozessoren arbeitet, sind die hybriden Systeme noch in der Unterzahl (Abb. 1).

(Bild: TOP500)

Die geografische Verteilung ist im Großen und Ganzen gleich geblieben. Die USA stellen mit 252 Rechnern über die Hälfte aller Systeme, Asien verbessert sich um ein System auf nun 123. Europa verliert einen Platz und ist mit 105 Supercomputern in den Rängen, wovon aus Großbritannien 24, aus Frankreich 21 und aus Deutschland 20 Rechner kommen. Die kumulierte Rechenleistung liegt hierzulande aber mit 10,4 PFlop/s deutlich über der britischen mit 7,3. Derzeit sind 22 Rechner schneller als 1 PFlop/s, die Gesamtleistung aller TOP500-Rechner wuchs von 123,4 im Juni 2012 auf 162,1 PFlop/s an.

Das traditionelle Kopf-an-Kopf-Rennen zwischen IBM und HP geht weiter. Mit 193 hat Big Blue 20 Systeme weniger in der Liste, HP hingegen hat sich von 141 auf 147 Platzierungen steigern können. Insgesamt hält HP aber lediglich 11 % an der Gesamtrechenleistung, IBM 40,8 %. Konkurrent Cray kann mit seinen 30 Systemen (+3) 17 % bieten. Bemerkenswert ist außerdem, dass der Itanium nun aus der Liste verschwunden ist.

Kraftprotz: Titan
am Oak Ridge Lab in Tennessee belegt Platz eins mit seiner Kombination aus Xeon-CPUs und K20-GPUs (Abb. 2).

(Bild: Oak Ridge Lab)

Bei den Interconnects in der TOP500 gewinnt InfiniBand weiterhin gegenüber Ethernet. Im Vergleich zur letzten TOP500-Liste stieg der Anteil um 15 Systeme mehr auf nunmehr 226.

Am Rand des Kampfes um die Plätze war zu hören, dass Microsoft nach seinem Abschied aus dem HPC-Segment wieder mitmischen will. Mit seinem Cloud-Dienst Azure und dem aktualisierten HPC Update Pack 2012 möchte das Redmonder Unternehmen unter dem Motto „Big Compute on Windows Azure“ wieder mitmischen. Das Einstiegsangebot besteht aus acht Prozessorkernen und 60 GByte RAM, die Obergrenze liegt bei der doppelten Kapazität. Die Server sind ausgestattet mit 2,6 GHz schnellen Xeons vom Typ E5-2670 und DDR3-RAM (1600 MHz). Als internes Netz fungiert ein 40 GBit/s schnelles QDR-InfiniBand (Quad Data Rate) mit Remote Direct Memory Access (RDMA). Die Besonderheit ist, dass Microsoft RDMA in einer virtualisierten Umgebung anbietet.

Hoch gewachsen: Der Blue Gene „Sequoia“ am Lawrence Livermore National Laboratory in Kalifornien musste die Führung abgeben (Abb. 3).

(Bild: Lawrence Livermore National Laboratory)

Texas Instruments (TI), zuletzt im Juni 2008 auf Platz 409 in der Liste vertreten, kündigte besonders energiesparende Prozessoren an, die aus einer ARM-CPU und einem Digital Signal Prozessor (DSP) bestehen. Damit will TI die Schwierigkeiten mit den autonom arbeitenden DSPs in den Griff bekommen. Bis dato muss ein externer, mit CPUs bestückter Host die Anwendungs-Kernel liefern, da es für Linux oder das zum Parallelisieren wichtige Message Passing Interface (MPI) keine passenden Bibliotheksschnittstellen gibt – für ARM-Plattform jedoch schon.

Zu den Neuzugängen in den Top 10 gehört Stampede, ein System von Dell, aufgebaut aus deren PowerEdge-C8220-Servern, das im Texas Advanced Computing Center an der University of Texas in Austin steht. Es verwendet den jüngst von Intel vorgestellten Xeon Phi. Mit den Koprozessoren (vorher bezeichnet als MIC) erreicht es 2,6 PFlop/s. In der TOP500 existieren sechs weitere hybride Systeme derselben Art. NVIDIA mit Kepler K20 sowie AMD FirePro S10000 haben ihre neuesten Beschleunigerchips ins Spiel gebracht.

Am Rande der TOP500-Verkündung auf der International Conference for High Performance Computing, Networking, Storage and Analysis 2012 (SC12) in Salt Lake City [1] sorgte AMD für Schlagzeilen anderer Art. Der Prozessorhersteller hat JPMorgan Chase & Co mit der Suche nach einem potenziellen Interessenten für das Unternehmen beauftragt. Im Konkurrenzkampf mit dem ungleich größeren Rivalen Intel, der die Top 500-Liste ohnehin dominiert, dürfte AMD alleine nicht über die notwendigen finanziellen Mittel verfügen, um auf die Dauer Paroli bieten zu können.

arbeitet als Freelancer im IT-Bereich und nimmt für iX Korrespondentenaufgaben wahr.

[1] Nikolai Zotow; Systeme; TOP500: USA dominiert, China holt auf; iX 12/2012, S. 16

[2] Holm Landrock; Supercomputer; Es rappelt in der Liste; TOP500: Zwei deutsche Superrechner unter den ersten zehn; iX 7/2012, S. 10

Alle Links: www.ix.de/ix1301100

Mehr Infos

Der TOP500-Wettlauf

Alle halbe Jahre stellen sich bis auf wenige Ausnahmen die Rechner aus dem Bereich High Performance Computing (HPC) einem Wettbewerb, in dem sie sich mit ihrer Rechengeschwindigkeit beim Lösen von linearen Gleichungssystemen mit dem Linpack messen. Der Test, einst von Jack Dongarra entwickelt, bildet seit 1993 das Rückgrat der TOP500.

Als Maßstab (Rmax) dienen die durchgeführten Gleitkommaoperationen (Floating Point Operations) pro Sekunde (Flop/s). Die Bestwerte sind seit 1993 von rund 60 Gigaflop/s (mit der CM-5 von Thinking Machines) auf fast 20 Petaflop/s 2012 angewachsen (0,3 x 106). Der Linpack, an dessen Algorithmen sich wenig geändert hat, war ursprünglich ein in FORTRAN geschriebenes Programm, das inzwischen als Bibliothek in einer C++-Umgebung eingebunden ist. In den Listen erscheint zusätzlich ein zweiter theoretischer Spitzenwert „Rpeak“, der die hochgerechnete Rechenleistung angibt, ermittelt aus der Zahl der Cores, der darin enthaltenen Recheneinheiten und dem Prozessortakt.

(rh)