SC09: SGI stellt Altix UV gegen Cray XT6

Cray ruht sich nicht auf den Jaguar-Lorbeeren aus, sondern kĂĽndigt die XT6-Systeme mit kommenden AMD-Prozessoren an; SGI kontert mit Intels Nehalem-EX.

In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Lesezeit: 5 Min.

In der Cray XT6 koppelt ein SeaStar2+ je zwei Opteron-6000-Prozessoren an.

(Bild: Cray)

Die Spitzenposition der Top500-Liste des XT5-Systems Jaguar ist für die zwischenzeitlich kriselnde Firma Cray von enormer Bedeutung. Auf der Supercomputing 09 kündigt das Unternehmen nun prompt die überarbeitete Supercomputerbaureihe XT6 an; wichtigster Unterschied zu XT5: Statt der etwa auch im Jaguar eingebauten AMD-Opterons mit sechs Kernen (Istanbul, 2,6 GHz) sollen in der XT6 zunächst die Opteron-6100-Prozessoren mit acht oder zwölf Kernen (Maranello) zum Einsatz kommen, später dann die Interlagos-Opterons mit zwölf oder 16 Kernen. Je zwei physische Prozessoren mit zusammen 16 bis 32 Kernen bilden einen Compute Node mit 32 oder 64 GByte DDR3-Hauptspeicher; die AMD-Prozessoren kommunizieren per HyperTransport (mit 6,4 GByte/s) mit dem SeaStar2+-Controller, der die Verbindung zu den anderen Rechenknoten herstellt. In jedes flüssigkeitsgekühlte XT6-Rack passen 192 Prozessoren, also 1536 bis 3072 CPU-Kerne; die elektrische Anschlussleistung pro Rack beträgt 45 bis 54 Kilowatt.

Anders als die zuletzt erfolgreichen Hybrid-Superrechner, in denen neben Allzweckprozessoren beispielsweise Grafikchips oder andere Spezialprozessoren als Co-Prozessoren einen wesentlichen Anteil der gesamten Rechenleistung liefern, tragen in den Cray-XT-Maschinen Standard-x64-Prozessoren die Last. Das hat fĂĽr manche Rechenaufgaben Vorteile, weil sich die Programmierer nicht auf die Spezialarchitektur der Co-Prozessoren einstellen mĂĽssen.

SGI setzt bei der Altix UV auf NUMALink 5.

(Bild: SGI)

Auch die mittlerweile mit Rackable vereinte Marke SGI baut Superrechner aus Standardprozessoren; eine Spezialität ist hier die NUMALink-(5-)Verbindung, die eine große Zahl einzelner Rechenknoten statt zu einem Cluster zu einem "massiv-parallelen" (MPP-)Conmputer mit gemeinsamem Hauptspeicheradressbereich (shared memory) verschaltet. Bereits im vergangenen Jahr waren erste Hinweise auf die neueste Altix-Generation Ultraviolet zu hören, nun hat SGI sie als Altix UV offiziell vorgestellt – obwohl Intel die darin verbauten Nehalem-EX-Prozessoren mit bis zu acht Kernen noch gar nicht richtig eingeführt hat. Ähnlich wie Cray verknüpft auch SGI jeweils zwei (der eigentlich für Server mit mindestens vier CPU-Fassungen entwickelten) Nehelam-EX-Xeons, die auf einem Blade sitzen und ihrerseits Speichermodule anbinden, mit einem Spezial-Chip (UV Hub) mit den anderen Blades beziehungsweise Prozessoren. Bei der Altix UV 1000 stecken jeweils 16 Blades in einem "Enclosure" (mit acht 2837-Watt-Netzteilen), zwei Enclosures passen in ein Rack. Bis zu vier Racks, also 256 CPU-Fassungen mit 2048 CPU-Kernen und 16 TByte RAM, lassen sich direkt verschalten und liefern dann zusammen eine theoretische Spitzenleistung von 18,6 TFlops.

NUMALink 5 koppelt 256 CPU-Fassungen auf 128 Blades in vier Racks; hier ist nur ein viertel aller Kabel abgebildet.

(Bild: SGI)

Laut SGI lassen sich aber bis zu 512 Racks miteinander koppeln, dann stehen 262.144 CPU-Kerne mit theoretisch knapp 2,38 PFlops bereit – also mehr, als die 224.162 Opteron-Kerne des Jaguar liefern können (2,33 PFlops). Deshalb wohl spricht SGI vom weltschnellsten Supercomputer – obwohl eine dermaßen große Altix-UV-Installation offenbar noch nirgends läuft. SGI kann aber schon einige Altix-UV-Kunden vorweisen, etwa das HLRN II in Hannover und Berlin.

Der "Vorsprung" der Altix UV ist recht knapp: Die Hexa-Core-Opterons des Jaguar laufen mit 2,6 GHz, dabei liefern die zwei 128-Bit-SSE-Einheiten jedes Kerns zusammen 10,4 GFlops. Rechnet man die SGI-Angaben zur Altix UV um, dann kommen wohl Octo-Core-Nehalems mit 2,266 GHz Taktfrequenz zum Einsatz, bei denen jeder Kern (mit ebenfalls zwei 128-Bit-SSE-Einheiten) Dual-Precision-(DP-)Gleitkommazahlen mit 9,07 TFlops verarbeitet. Sobald also Cray den XT6 ebenfalls mit Octo-Cores oder gar 12-Cores ähnlicher Taktfrequenz bestückt, ist der Altix-UV-Vorsprung dahin. Interessant wäre noch eine Angabe zur Effizienz – immerhin gibt es für Jaguar einen Linpack-Wert: Mit 1,759 PFlops reizt er dabei ziemlich genau 75 Prozent seines theoretischen Potenzials aus.

Mehrere Altix-UV-1000-Systeme mit je 256 CPU-Fassungen lassen sich wiederum koppeln, hier zu einem System mit 16.384 Prozessoren und 131.072 Kernen.

(Bild: SGI)

Zu der Kooperation zwischen Intel und Cray war bisher nichts Neues zu hören, sie scheint sich bisher auf den "Mini-HPC-Cluster" CX1 zu beschränken. Mit NEC will Intel unterdessen die Kooperation intensivieren; künftig will NEC ebenfalls den Nehalem-EX in Supercomputern einsetzen, aber weiterhin auch Vektorrechner bauen. Intel hat auch angekündigt, eine Hexa-Core-Version des Nehalem-EX für HPC-Anwendungen zu verkaufen, die höhere Taktfrequenzen als die Octo-Core-Version erreicht. Im Vergleich zum Nehalem-EP, also der Xeon-5500-Baureihe für Server mit zwei Fassungen, können die Nehalem-EX-Versionen sehr viel mehr Speicher anbinden. Im kommenden Jahr will Intel auch den Westmere-EP einführen, in dem ein 32-Nanometer-Hexa-Core steckt.

Zur Supercomputing-Konferenz 2009 und den technischen Highlights siehe auch:

(ciw)