Nachbrenner für Supercomputer: Nvidia stellt Tesla K40 vor

Nvidias neue Tesla-K40-Karte soll die HPC-Anwendungen gegenüber dem K20-Vorgänger um 20 bis 40 Prozent beschleunigen.

18.11.2013, 15:00 Uhr

Lesezeit: 2 Min.

Von

Andreas Stiller

Tesla K40 bringt 20 bis 40 Prozent mehr Performance

(Bild: Nvidia)

Nvidias neue Beschleunigerkarte für High Performance Computing HPC, unter dem Namen Tesla K40 vorgestellt, hat jetzt alle 2880 Rechenkerne des Kepler-Chips aktiviert. Der Prozessortakt beträgt 745 MHz (K20X: 732 MHz), er kann aber im neuen Turbo-Boost in zwei Schritten auf 810 oder gar 875 MHz steigen.

Außerdem bietet K40 mit 12 GByte doppelt so viel Kartenspeicher wie der Vorgänger. Der Speocher wird zudem schneller (mit 3 GHz) getaktet, sodass die Speicherbandbreite bei 288 statt 250 GByte/s liegt. Das Interface ist nun auch offiziell für PCIExpress 3.0 spezifiziert.

Die theoretische Rechenleistung steigt von 3,93 auf 4,29 TFlops bei Rechnungen in einfacher Genauigkeit und von 1,31 auf 1,43 TFlops bei doppelter Genauigkeit. Real erzielbar sind bei der Matrixmultiplikation SGEMM nun 3,22 TFlops und DGEMM 1,33 GFlops.

Tesla K40 im Vergleich zu K20X: Mehr Kerne, doppelt so viel Speicher, höherer Takt und endlich auch für PCIExpress 3.0 spezifiziert.

(Bild: Nvidia)

Im Schnitt soll die Performance bei den HPC-üblichen Applikationen um 20 bis 40 Prozent zulegen. Bei Ansys Fluent soll die Tesla K40 gegenüber einem Knoten mit zwei Xeon E5-2680 die Performance um 90 Prozent steigern. Einen Preis für die Karte hat Nvidia nicht genannt, sondern auf die Partner verweisen.

IBM hat im Rahmen der OpenPower-Initiative angekündigt, im nächsten Jahr Power8-Systeme mit Nvidia Tesla herauszubringen, vermutlich mit eben dieser Tesla K40.

Zur Programmierung gab es schon vor ein Paar Tagen Neuigkeiten: CUDA 6 ist fertig, das den Umgang mit Unified Memory "dramatisch" vereinfachen soll, zum Teil ist gegenüber normaler C/C++-Programmierung nur eine Zeile hinzuzufügen. Außerdem wird Linux GCC mit der nächsten Version die mit einfachen Pragmas gesteuerte Parallelisierung OpenACC unterstützen. (as)