ISC'10: 1 Petaflop/s in einem einzigen Rack

SGI kündigt an, noch 2010 Supercomputer auszuliefern, die 1 PFlop an Gleitkommarechenleistung in einem einzigen Rack vorhalten. Außerdem seien jetzt die ersten Altix-Ultraviolet-Superrechner im Einsatz.

In Pocket speichern vorlesen Druckansicht 22 Kommentare lesen
Lesezeit: 3 Min.

Anlässlich der Supercomputerkonferenz ISC'10 in Hamburg hat SGI angekündigt, noch vor Ablauf des Jahres Hybrid-Superrechner zu liefern, die 1 Petaflop/s an Rechenleistung in einem einzigen Rack vorhalten. Zum Vergleich: Der Cray-XT5-Teil des aktuellen Top500-Spitzenreiters Jaguar leistet 1,382 PFlops (PDF-Datei) und belegt 200 Racks.

Allerdings vergleicht SGI vermutlich Äpfel mit Birnen: In der Top500-Liste geht es um die mit dem Benchmark Linpack gemessene, also wenigstens mit hoch optimiertem Code praktisch nutzbare Gleitkommarechenleistung bei der Verarbeitung doppelt genauer (Dual-Precision-)Zahlenwerte, während als Spitzenwerte von GPGPU-Beschleunigerkarten meistens das theoretische Maximum bei Single-Precision-(SP-)Berechnungen erwähnt wird. So nennt etwa Nvidia für die wohl ab August lieferbare Tesla C2050 mit Fermi-Chip 1,03 TFlops an SP- und 0,515 TFlops an DP-Rechenleistung, Konkurrent Intel will mit dem Linpack rund 0,36 TFlops gemessen haben und verspricht für die Larrabee-Version Knights Ferry 0,517 TFlops im Linpack.

SGI will jedenfalls PCI-Express-Beschleunigerkarten mit GPUs von AMD oder Nvidia sowie auch Karten mit Tilera-Prozessoren offerieren. Doch selbst wenn man von der theoretischen SP-Gleitkommaleistung ausgeht, sind 1 PFlops pro Rack ein hoch gestecktes Ziel. Aktuelle x64-Prozessoren tragen vergleichsweise wenig Rechenleistung bei, Spitzenreiter ist zurzeit der 12-Kerner Opteron 6176 SE mit 2,3 GHz und 2 SSE-Einheiten pro Kern, der also 110,4 DP-GFlops beziehungsweise 220,8 SP-GFlops als theoretisches Maximum erreicht. Davon passen in einen Schrank einer Altix ICE 8000 genau 128 Stück, die dann zusammen rund 28 SP-TFlops liefern könnten – dann fehlen noch immer 972 TFlops für 1 PFlops. Selbst wenn es SGI schafft, 128 Beschleunigerkarten (je zwei pro Altix-ICE-Blade) in einem Rack zusätzlich unterzubringen, mit Energie zu versorgen und zu kühlen, so müsste jede einzelne Karte über 7,5 TFlops Rechenleistung liefern – hier könnte man sich zurzeit höchstens Multi-GPU-Karten mit neuen Chips von AMD (Northern/Southern Islands) oder Nvidia vorstellen.

SGI-Konkurrent IBM hat mit dem iDataPlex dx360 M3 im Intelligent Cluster kürzlich ein HPC-System mit 84 Tesla-Karten pro Rack angekündigt, im Tsubame 2.0 in Tokio wird HP sogar je drei Tesla-Karten pro Compute Node einsetzen.

Auf der ISC'10 kündigte SGI außerdem an, die ersten Altix-UV-Supercomputer (Ultraviolet) ausgeliefert zu haben. Zu den ersten Empfängern in Europa gehören das LRZ in München sowie das HLRN II in Berlin und Hannover. An den beiden letztgenannten Standorten werden jeweils vier (PDF-Datei) Altix UV mit je 32 Dual-CPU-Blades, also 512 Kernen und 2 TByte gemeinsamem RAM installiert, die unter SLES 11 laufen. (ciw)