SC12: Nvidia präsentiert Tesla-Rechenbeschleuniger mit GK110-GPU

Im Rahmen der Supercomputer-Konferenz hat Nvidia gleich zwei neue Tesla-Rechenbeschleuniger vorgestellt: die Tesla K20 und K20X. Beide setzen auf die neue GK110-GPU.

In Pocket speichern vorlesen Druckansicht 81 Kommentare lesen
Lesezeit: 3 Min.

Im Titan-Supercomputer stecken 18688 Tesla K20X mit je 2688 Kernen.

(Bild: ornl.gov)

Nvidia hat im Rahmen der Supercomputer-Konferenz SC12 in Salt Lake City (US-Bundesstaat Utah) erste Rechenbeschleuniger mit der im Mai angekündigten GK110-GPU vorgestellt: die Tesla K20 und Tesla K20X. Beide unterstützen die neuen Funktionen Dynamic Parallelism und Hyper-Q. Außerdem sind sie durch eine höhere Zahl von Rechenkernen bei einfach- und doppeltgenauen Berechnungen (SP/DP) wesentlich leistungsfähiger.

Von der Tesla K20 gibt es Ausführungen für Server (passiv) und Workstations (aktiv gekühlt). Ihre GPU beherbergt 2496 Shader-Rechenkerne und greift auf 5 GByte Speicher zu – dies war bereits vorab ans Licht gelangt. Die Transferrate ist mit 208 GByte/s relativ konservativ angesetzt – laut Nvidia-Manager Sumit Gupta soll das aber völlig ausreichen. Wichtiger als eine höhere Datentransferrate war für Nvidia die Einhaltung der TDP von 225 Watt.

Ausschließlich für den Server-Einsatz ist die schnellere Tesla K20X gedacht, deren TDP 235 Watt beträgt. Sie hat 14 statt 13 SMX-Cluster und daher insgesamt 2688 Shader-Rechenkerne. Außerdem erhöht Nvidia die Transferrate auf 250 GByte/s und spendiert 6 GByte RAM. Alle Karten bieten ECC-geschützte Speicher und Caches. Ob es noch Versionen mit 12 GByte Speicher geben soll, ließ Nvidia offen.

Beide Rechenkarten hat Nvidia vorsichtshalber nur für PCIe 2.0 spezifiziert, weil es mit mit manchen Xeon-E5-Boards noch Probleme gab. Nvidia unterstrich gegenüber heise online, dass die Hardware PCIe 3.0 unterstütze, das Grafikkarten-BIOS die Karten jedoch auf PCIe 2.0 festsetzt. Es stehe den OEMs allerdings frei, für OEM-Systeme K20-Karten mit "freigeschaltetem" PCIe 3.0 einzusetzen.

Die Tesla K20 gibt es auch für Workstations, die K20X nur für Server.

(Bild: Nvidia)

Hinsichtlich ihrer Rechenleistung ist die Tesla K20X rund 12 Prozent schneller als die K20 und schafft 3,95 Billionen Gleitkommaberechnungen pro Sekunde (TFlops) bei einfacher Genauigkeit. Das entspricht dem dreifachen Wert des Vorgängers Tesla M2090. Bei dem für die Wissenschaft besonders wichtigen Double-Precision-Berechnungen ist sie immerhin doppelt so schnell wie die M2090 (1,31 versus 0,665 TFlops).

Doch die praktische Rechenleistung liegt immer unterhalb dieser theoretischen Werte. Allerdings will Nvidia durch die Kepler-GK110-Architektur auch den praktischen Spitzenwert deutlich erhöht haben. Satte 1,22 TFlops soll die Tesla K20X bei DGEMM-Berechnungen schaffen – das wäre sogar dreimal so viel wie die M2090 (0,43 TFlops) und ein gewaltiger Effizienzsprung.

Nvidia hat innerhalb der letzten Monate bereits tausende der neuen Rechenbeschleuniger an namhafte Institute ausgeliefert. Allein im Titan-Supercomputer vom Oak Ridge National Lab stecken 18 688 Tesla K20X. 90 Prozent der Spitzenleistung von 27 Petaflops geht dabei auf das Konto der GPUs. Im Linpack erreicht Titan laut Nvidia 17,59 Petaflops.

Zum Preis der Server-Varianten äußerte sich Nvidia nicht. Die Workstation-Tesla K20 war kurzzeitig für 2950 Euro (ohne Mehrwertsteuer) gelistet. PNY wird die Karte für 3090 Euro (ohne MwSt.) verkaufen. Sie soll Mitte November verfügbar sein, die Tesla K20X frühestens Ende November.

Rechenkarte Tesla K20 Tesla K20X
GPU GK110 GK110
Fertigung 28 nm 28 nm
Transistoren 7,1 Milliarden 7,1 Milliarden
Shader-Rechenkerne 2496 2688
Rechengruppen 13 SMX 14 SMX
GPU-Taktfrequenz 705 MHz 735 MHz
Speicher 5 GByte GDDR5 6 GByte/s
Datentransferrate 208 GByte/s 250 GByte/s
ECC-Schutz ja ja
Single-Precision-Leistung 3,52 TFlops 3,95 Tflops
Double-Precision-Leistung 1,17 TFlops 1,31 Tflops
Maximale Leistungsaufnahme 225 Watt 235 Watt
Neue Funktionen Dynamic Parallelism, Hyper-Q, GPUDirect mit RDMA Dynamic Parallelism, Hyper-Q, GPUDirect mit RDMA
Ausführungen Server, Workstations Server
PCI Express 2.0 2.0

(mfi)