Nvidia verdoppelt Leistung der Tesla-Rechenknechte

Nvidias zweite Coprozessor-Generation erreicht im Viererpack als 1-HE-Rackeinschub eine Rechenleistung von 4 TeraFLOPs.

In Pocket speichern vorlesen Druckansicht 43 Kommentare lesen
Lesezeit: 2 Min.

Auf engstem Raum packt Nvidia 4 TeraFLOPS Rechenleistung beim Tesla S1070.

Parallel zum neuen Grafikchip GT200 präsentiert Nvidia auch seine davon abgeleiteten Applikationsbeschleuniger Tesla C1060 und S1070. Auf der Erweiterungskarte Tesla C1060 sitzt ein T10P-Chip mit 240 sogenannten Thread-Prozessoren (TP), welche mit 1,33 GHz Taktfrequenz arbeiten, sowie 4 GByte GDDR3-Speicher. Durch den mit 800 MHz getakteten 512-Bit-Speicherbus steht eine maximale Speicherbandbreite von 102 GByte/s zur Verfügung. Im Vergleich zu den Vorgängern der Tesla-8-Serie soll sich die Single-Precision-Rechenleistung bei der zweiten Tesla-Generation von 500 GigaFLOPS auf 1 TeraFLOPS verdoppelt haben. Damit tritt der Tesla C1060 in direkte Konkurrenz zum AMD FireStream 9250. Die typische Leistungsaufnahme gibt Nvidia mit 160 Watt an. Der voluminöse Kühler der 27 Zentimeter langen Karte benötigt den Raum eines zweiten Steckplatzes.

Der Tesla C1060 unterscheidet sich äußerlich von einer GeForce GTX 280 nur durch die fehlenden DVI-Ausgänge.

Gleich vier T10P-GPUs verbaut der Hersteller in den Tesla-S1070-Rackeinschub mit einer Höheneinheit. Die Performance der insgesamt 960 TP mit 1,5 GHz Taktfrequenz soll 4 TeraFLOPS erreichen. Jeder Chip besitzt, wie beim Tesla C1060, 4 GByte GDDR3-Speicher (800 MHz) mit einem 512 Bit Interface. Die Anbindung des externen Coprozessors mit einer typischen Leistungsaufnahme von 700 Watt erfolgt per Kabel über zwei Interface-Karten mit PCI Express 2.0 und jeweils 16 Lanes. Durch Zusammenschalten von Rechnern mit mehreren Tesla-Einschüben lassen sich leicht Cluster aus mehreren Zehntausend Thread-Prozessoren aufbauen.

Laut Nvidia verwenden bereits über 250 Firmen die Rechenleistung von GPUs für HPC-Anwendungen, wie Molekül- und Wettersimulationen, Auswertung von seismischen Daten in der Ölförderung und Chipdesign. Mit den neuen Tesla-Beschleunigern veröffentlicht der Hersteller auch Version 2.0 von CUDA. Das Entwicklerpaket für GPGPU-Applikationen unterstützt nun auch Multi-Core-Prozessoren. Über Preise und Markteinführung der neuen Tesla-Serie gibt es noch keine Informationen. (chh)