Nachbrenner fĂĽr Supercomputer: Nvidia stellt Tesla K40 vor
Nvidias neue Tesla-K40-Karte soll die HPC-Anwendungen gegenüber dem K20-Vorgänger um 20 bis 40 Prozent beschleunigen.
Nvidias neue Beschleunigerkarte für High Performance Computing HPC, unter dem Namen Tesla K40 vorgestellt, hat jetzt alle 2880 Rechenkerne des Kepler-Chips aktiviert. Der Prozessortakt beträgt 745 MHz (K20X: 732 MHz), er kann aber im neuen Turbo-Boost in zwei Schritten auf 810 oder gar 875 MHz steigen.
Außerdem bietet K40 mit 12 GByte doppelt so viel Kartenspeicher wie der Vorgänger. Der Speocher wird zudem schneller (mit 3 GHz) getaktet, sodass die Speicherbandbreite bei 288 statt 250 GByte/s liegt. Das Interface ist nun auch offiziell für PCIExpress 3.0 spezifiziert.
Die theoretische Rechenleistung steigt von 3,93 auf 4,29 TFlops bei Rechnungen in einfacher Genauigkeit und von 1,31 auf 1,43 TFlops bei doppelter Genauigkeit. Real erzielbar sind bei der Matrixmultiplikation SGEMM nun 3,22 TFlops und DGEMM 1,33 GFlops.
Im Schnitt soll die Performance bei den HPC-ĂĽblichen Applikationen um 20 bis 40 Prozent zulegen. Bei Ansys Fluent soll die Tesla K40 gegenĂĽber einem Knoten mit zwei Xeon E5-2680 die Performance um 90 Prozent steigern. Einen Preis fĂĽr die Karte hat Nvidia nicht genannt, sondern auf die Partner verweisen.
IBM hat im Rahmen der OpenPower-Initiative angekündigt, im nächsten Jahr Power8-Systeme mit Nvidia Tesla herauszubringen, vermutlich mit eben dieser Tesla K40.
Zur Programmierung gab es schon vor ein Paar Tagen Neuigkeiten: CUDA 6 ist fertig, das den Umgang mit Unified Memory "dramatisch" vereinfachen soll, zum Teil ist gegenüber normaler C/C++-Programmierung nur eine Zeile hinzuzufügen. Außerdem wird Linux GCC mit der nächsten Version die mit einfachen Pragmas gesteuerte Parallelisierung OpenACC unterstützen. (as)