GTC 2012: Nvidias Doppel-Kepler fürs Supercomputing

Auf der Rechenkarte Tesla K10 sitzen gleich zwei GK104-Grafikchips. Sie bieten eine hohe Single-Precision-Leistung und greifen auf insgesamt 8 GByte Speicher zu.

20

15.05.2012, 21:00 Uhr

Lesezeit: 2 Min.

Von

Martin Fischer

Auf der Tesla K10 sitzen zwei GK104-Grafikchips mit jeweils 1536 Kernen.

Nvidia hat auf der GPU Technology Conference eine neue Tesla-Rechenkarte mit insgesamt 8 GByte Speicher vorgestellt: die Tesla K10. Auf ihrer Platine sitzen gleich zwei Kepler-GPUs mit jeweils 1536 Rechenkernen, die im 28-Nanometer-Verfahren gefertigt werden und auf die Kepler-Architektur setzen. Bis dato bot Nvidia lediglich Tesla-Rechenkarten mit einer GPU an.

Die Kalifornier nutzen für die Tesla K10 den GK104-Grafikchip, der bereits Ende März auf der Consumer-Grafikkarte GeForce GTX 680 debütierte und auch auf der GeForce GTX 670 und der Dual-GPU-Grafikkarte GTX 690 zum Einsatz kommt.

Die Entscheidung für den Gamer-Chip GK104 mag zunächst verwundern, denn er schafft die für große Teile des HPC-Marktes wichtigen Berechnungen mit doppelter Genauigkeit (Double Precision/DP) nur mit einem Vierundzwanzigstel seiner Single-Precision(SP)-Performance. Daher vermarktet Nvidia die Tesla K10 ausschließlich als Beschleuniger für Single-Precision-Berechnungen. Bei diesen ist sie im Vergleich mit der Rechenkarte M2090 – auf ihr sitzt aber nur eine 40-nm-Fermi-GPU mit 512 Kernen – um den Faktor 3,5 leistungsfähiger.

Die Tesla K10 soll laut Nvidia ein deutlich besseres Performance-pro-Watt-Verhältnis haben.

Laut Nvidia soll jede GPU der K10 theoretisch 2,29 Billionen Gleitkommaoperationen pro Sekunde (TFlops) schaffen. Das würde eine Taktfrequenz von 745 MHz pro GPU bedeuten. Sie liegt damit deutlich geringer als jene der beiden GPUs der Spieler-Grafikkarte GeForce GTX 690, die mit 915 MHz laufen und daher jeweils 2,8 TFlops erreichen. Die geringeren Taktfrequenzen sollen vor allem die Leistungsaufnahme und folglich die Wärmeentwicklung verringern.

Beide GPUs der Tesla K10 können jeweils auf 4 GByte ECC-geschützten GDDR5-Speicher über 256 Datenleitungen zugreifen. Die Datentransferrate beträgt 320 GByte/s pro Karte, pro GPU bleibt sie allerdings etwas hinter der M2090 zurück (177,6 GByte). Bei den Transfers zwischen Haupt- und Grafikspeicher ist die Tesla K10 im Vorteil, denn sie schafft dank PCIe 3.0 bis zu 16 GByte/s.

Laut Nvidia sind die typischen Einsatzgebiete der Tesla K10 die Bild- und Signalverarbeitung sowie bestimmte physikalische Berechnungen, etwa in der Erdbebenforschung. Die Karten sollen ab Ende Mai erhältlich sein. Zum genauen Preis machte Nvidia noch keine Angaben, spricht aber von einem Bereich zwischen 1500 und 2500 US-Dollar. Als Partner listet die Firma Dell, HP, IBM, SGI, Supermicro und APPRO.

Bezeichnung	Tesla K10		vgl. Tesla M2090
GPU-Architektur	Kepler GK104		Fermi
GPU-Anzahl	2		1
	pro Karte	pro GPU
SP-Performance	4,58 TFlops	2,29 TFlops	1,3 TFlops
DP-Performance	0,19 TFlops	0,095 TFlops	0,66 TFlops
Rechenkerne	3072	1536	512
Speichergröße	8 GByte	4 GByte	6 GByte
Transferrate	320 GByte/s	160 GByte/s	177,6 GByte/s
PCI Express	3,0 (16 GByte/s)		2.1 (8 GByte/s)