zurück zum Artikel

Red Storm: Cray stellt massiv-parallelen Rechner XT3 vor

Uwe Harms

Auf Basis des Red-Storm-Projekts an den Sandia Labs, mit dem unter Einsatz von 11.648 AMD-Opteron-Prozessoren eine Spitzenleistung von 42 TeraFlop/s erreicht werden soll, entwickelte Cray einen kommerziellen Höchstleistungsrechner.

Gemeinsam mit den Sandia National Labs [1] entwickelte Cray [2] in einem 93-Millionen-Dollar-Projekt den Rechner Red Storm [3], der derzeit bei Sandia installiert wird [4]. Die 11.648 AMD-Opteron-Prozessoren in 140 Kabinetten erreichen zusammen eine Spitzenleistung von 42 TeraFlop/s. Insgesamt stehen 10 TeraByte Haupt- und 240 TeraByte Plattenspeicher zur Verfügung.

Auf dieser Basis hat Cray nun ein kommerzielles System marktreif gemacht und sieht es als Nachfolger der massiv-parallelen und erfolgreichen Rechner Cray T3D und T3E. Im Unterschied zur XD1 [5], die als Einstiegsmodell ins High Performance Computing (HPC) [6] zu sehen ist, ist die XT3 für die höchsten Benutzeranforderungen gedacht. Die Besonderheit des Rechners ist das Cray-spezifische Verbindungsnetzwerk, wie bei der T3E ein 3D-Torus. Die SeaStar-Kommunikationsprozessoren und Router-Chips entlasten die Rechenprozessoren vom Message-Passing und der Ein/Ausgabe zum globalen Dateisystem -- hier hat Cray Lustre [7] ausgewählt. Die SeaStar-Router sind mit den sechs Nachbarn verbunden und verfügen über eine dauerhafte Bandbreite von 4 GBit/s.

Als Rechenknoten nutzt Cray die jeweils aktuellen 64-Bit-Prozessoren aus AMDs Opteron-Baureihe. Der Hersteller kann die XT3 auch auf die kommenden Dual-Core-Prozessoren [8] nachrüsten. Als Betriebssystem hat Cray Unicos/lc ausgewählt, mit einem Mikrokernel für die Rechenknoten und dem vollen Systemumfang für die Login-, Netzwerk- und Einausgabeprozessoren. Für die Serviceprozessoren ist Suse Linux vorgesehen. Das Betriebssystem und die SeaStar-Kommunikationsprozessoren unterstützen mehr als 30.000 CPUs.

Besonderen Wert hat Cray auf die Zuverlässigkeit gelegt; so dient ein eigenes System mit Prozessoren, Software und Netzwerk zum Darstellen und Verwalten der wichtigsten Hardware- und Software-Komponenten. Es unterstützt das Wiederaufsetzen von Jobs bei Hard- oder Software-Fehlern und das automatische Ausschalten von fehlerhaften Komponenten, sodass die übrigen Teile des Systems funktionsfähig bleiben. Damit will Cray eine mittlere Zeit zwischen dem Auftreten von Fehlern von 400 Stunden bei 1000 Prozessoren sicherstellen.

Siehe zum High Perfomance Computing auch:

(Uwe Harms) / (jk [10])


URL dieses Artikels:
https://www.heise.de/-109141

Links in diesem Artikel:
[1] http://www.sandia.gov/
[2] http://www.cray.com/
[3] https://www.heise.de/news/Supercomputer-Red-Storm-verstaerkt-TeraGrid-Projekt-106163.html
[4] https://www.heise.de/news/Cray-baut-Superrechner-fuers-US-Energieministerium-102260.html
[5] http://www.cray.com/products/xd1/index.html
[6] https://www.heise.de/news/Cray-liefert-XD1-Supercomputer-aus-107069.html
[7] http://www.lustre.org/
[8] https://www.heise.de/news/Fall-Processor-Forum-Mehr-zu-AMDs-Doppelprozessor-Toledo-Update-107133.html
[9] http://www.heise.de/kiosk/archiv/ct/04/07/084/
[10] mailto:jk@heise.de