SC09: SGI stellt Altix UV gegen Cray XT6
Cray ruht sich nicht auf den Jaguar-Lorbeeren aus, sondern kündigt die XT6-Systeme mit kommenden AMD-Prozessoren an; SGI kontert mit Intels Nehalem-EX.
Die Spitzenposition der Top500-Liste des XT5-Systems Jaguar ist für die zwischenzeitlich kriselnde Firma Cray von enormer Bedeutung. Auf der Supercomputing 09 kündigt das Unternehmen nun prompt die überarbeitete Supercomputerbaureihe XT6 an; wichtigster Unterschied zu XT5: Statt der etwa auch im Jaguar eingebauten AMD-Opterons mit sechs Kernen (Istanbul, 2,6 GHz) sollen in der XT6 zunächst die Opteron-6100-Prozessoren mit acht oder zwölf Kernen (Maranello) zum Einsatz kommen, später dann die Interlagos-Opterons mit zwölf oder 16 Kernen. Je zwei physische Prozessoren mit zusammen 16 bis 32 Kernen bilden einen Compute Node mit 32 oder 64 GByte DDR3-Hauptspeicher; die AMD-Prozessoren kommunizieren per HyperTransport (mit 6,4 GByte/s) mit dem SeaStar2+-Controller, der die Verbindung zu den anderen Rechenknoten herstellt. In jedes flüssigkeitsgekühlte XT6-Rack passen 192 Prozessoren, also 1536 bis 3072 CPU-Kerne; die elektrische Anschlussleistung pro Rack beträgt 45 bis 54 Kilowatt.
Anders als die zuletzt erfolgreichen Hybrid-Superrechner, in denen neben Allzweckprozessoren beispielsweise Grafikchips oder andere Spezialprozessoren als Co-Prozessoren einen wesentlichen Anteil der gesamten Rechenleistung liefern, tragen in den Cray-XT-Maschinen Standard-x64-Prozessoren die Last. Das hat für manche Rechenaufgaben Vorteile, weil sich die Programmierer nicht auf die Spezialarchitektur der Co-Prozessoren einstellen müssen.
Auch die mittlerweile mit Rackable vereinte Marke SGI baut Superrechner aus Standardprozessoren; eine Spezialität ist hier die NUMALink-(5-)Verbindung, die eine große Zahl einzelner Rechenknoten statt zu einem Cluster zu einem "massiv-parallelen" (MPP-)Conmputer mit gemeinsamem Hauptspeicheradressbereich (shared memory) verschaltet. Bereits im vergangenen Jahr waren erste Hinweise auf die neueste Altix-Generation Ultraviolet zu hören, nun hat SGI sie als Altix UV offiziell vorgestellt – obwohl Intel die darin verbauten Nehalem-EX-Prozessoren mit bis zu acht Kernen noch gar nicht richtig eingeführt hat. Ähnlich wie Cray verknüpft auch SGI jeweils zwei (der eigentlich für Server mit mindestens vier CPU-Fassungen entwickelten) Nehelam-EX-Xeons, die auf einem Blade sitzen und ihrerseits Speichermodule anbinden, mit einem Spezial-Chip (UV Hub) mit den anderen Blades beziehungsweise Prozessoren. Bei der Altix UV 1000 stecken jeweils 16 Blades in einem "Enclosure" (mit acht 2837-Watt-Netzteilen), zwei Enclosures passen in ein Rack. Bis zu vier Racks, also 256 CPU-Fassungen mit 2048 CPU-Kernen und 16 TByte RAM, lassen sich direkt verschalten und liefern dann zusammen eine theoretische Spitzenleistung von 18,6 TFlops.
Laut SGI lassen sich aber bis zu 512 Racks miteinander koppeln, dann stehen 262.144 CPU-Kerne mit theoretisch knapp 2,38 PFlops bereit – also mehr, als die 224.162 Opteron-Kerne des Jaguar liefern können (2,33 PFlops). Deshalb wohl spricht SGI vom weltschnellsten Supercomputer – obwohl eine dermaßen große Altix-UV-Installation offenbar noch nirgends läuft. SGI kann aber schon einige Altix-UV-Kunden vorweisen, etwa das HLRN II in Hannover und Berlin.
Der "Vorsprung" der Altix UV ist recht knapp: Die Hexa-Core-Opterons des Jaguar laufen mit 2,6 GHz, dabei liefern die zwei 128-Bit-SSE-Einheiten jedes Kerns zusammen 10,4 GFlops. Rechnet man die SGI-Angaben zur Altix UV um, dann kommen wohl Octo-Core-Nehalems mit 2,266 GHz Taktfrequenz zum Einsatz, bei denen jeder Kern (mit ebenfalls zwei 128-Bit-SSE-Einheiten) Dual-Precision-(DP-)Gleitkommazahlen mit 9,07 TFlops verarbeitet. Sobald also Cray den XT6 ebenfalls mit Octo-Cores oder gar 12-Cores ähnlicher Taktfrequenz bestückt, ist der Altix-UV-Vorsprung dahin. Interessant wäre noch eine Angabe zur Effizienz – immerhin gibt es für Jaguar einen Linpack-Wert: Mit 1,759 PFlops reizt er dabei ziemlich genau 75 Prozent seines theoretischen Potenzials aus.
Zu der Kooperation zwischen Intel und Cray war bisher nichts Neues zu hören, sie scheint sich bisher auf den "Mini-HPC-Cluster" CX1 zu beschränken. Mit NEC will Intel unterdessen die Kooperation intensivieren; künftig will NEC ebenfalls den Nehalem-EX in Supercomputern einsetzen, aber weiterhin auch Vektorrechner bauen. Intel hat auch angekündigt, eine Hexa-Core-Version des Nehalem-EX für HPC-Anwendungen zu verkaufen, die höhere Taktfrequenzen als die Octo-Core-Version erreicht. Im Vergleich zum Nehalem-EP, also der Xeon-5500-Baureihe für Server mit zwei Fassungen, können die Nehalem-EX-Versionen sehr viel mehr Speicher anbinden. Im kommenden Jahr will Intel auch den Westmere-EP einführen, in dem ein 32-Nanometer-Hexa-Core steckt.
Zur Supercomputing-Konferenz 2009 und den technischen Highlights siehe auch:
- Supercomputerkonferenz setzt neue Maßstäbe
- Intel demonstriert Larrabee mit über 1 Teraflops
- Tesla-Rechenkarten mit Fermi-Chips
- AMD Opteron erobert Spitzenposition der Supercomputer
(ciw)