IBMs PowerXCell 8i mit DDR2 und über 100 GFlop/s Rechenleistung

Das Los Alamos National Laboratory verrät schon mal ein paar Einzelheiten über die Prozessoren des geplanten Roadrunners, der im Sommer 2008 die PetaFlop/s-Schallmauer durchstoßen soll.

In Pocket speichern vorlesen Druckansicht 117 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Andreas Stiller

Die Los Alamos Labs benennen ihn schon, den PowerXCell 8i (Klicken für vergrößerte Auflösung)

Noch hat IBM keine offiziellen Einzelheiten über den nächsten Cell-Prozessor (Codename Cell eDP) mit schneller doppelt-genauer Gleitkommarithmethik verlauten lassen, aber der erste Großkunde, das Los Alamos National Laboratory (LANL) hat schon mal den Handelsnamen PowerXCell 8i, seine (theoretische) Gleitkomma-Performance von 102,4 GFlop/s und sein Speicherinterface (4 GByte DDR 2 mit bis zu 25 GByte/s) in einer Architektur-Beschreibung für den für Sommer 2008 erwarten ersten PetaFlop/s-Rechner Roadrunner verraten (PDF). Rambus-Speicher XDR, der vor allem auf Wunsch von Sony in das bisherige Cell-Design eingebaut wurde, ist bei der nächsten Cell-Generation also vom Tisch – wie intern bei IBM verlautete nicht wegen der Technik oder der Performance, sondern wegen seiner eingeschränkten Kapazität.

Die hohe Gleitkommaleistung kommt durch die acht Rechenkerne (SPEs), durch SIMD und dem mächtigen FMAC-Befehl zustande, der Multiplikation und Addition in einem Schwung ausführt. Das ergibt dann insgesamt 32 Gleitkommaoperationen pro Takt. Bei 3,2 GHz Takt erhält man folglich 102,4 GFlop/s. Zusätzlich könnte auch noch der PowerPC-Hauptprozessor mit seiner AltiVec-Recheneinheit einige GFlop/s beisteuern. Der FMAC-Befehl in doppelter Genauigkeit arbeitet allerdings nur noch mit drei Operanden (A=B*C+A), ist also nicht so mächtig wie das Pendant in einfacher Genauigkeit, das vier Operanden unterstützt. (A=B*C+D) – so wie es übrigens auch bei SSE5 von AMD vorgesehen ist.

Der Roadrunner im Los Alamos National Laboratory soll mit 12.690 PowerxCell-Prozessoren, die theoretisch insgesamt brutto 1,3 Petaflop/s schaffen, die 1 PetaFlop/s-Marke im Linpack-Benchmark knacken. IBMs zugehörige neue Blade-Plattform heißt QS22. Als Datenzulieferer und -Verwalter des Roadrunner sollen 6912 Dual-Core-Opteron-Prozessoren in 3456 Knoten dienen, wofür energiesparende 1,8-GHz-Versionen ausreichen. Anders als bei den neuen Quad-Core-Prozessoren hat AMD mit denen ja keine Probleme. (as)