Nvidia Tesla V100: PCIe-Steckkarte mit Volta-Grafikchip und 16 GByte Speicher angekündigt

Die Tesla V100 soll es auch als PCIe-Steckkarte geben. Mit etwas geringerem Takt, dafür aber wesentlich geringerer Leistungsaufnahme soll sie noch 2017 erhältlich sein.

In Pocket speichern vorlesen Druckansicht 10 Kommentare lesen
Nvidia Tesla V100: PCIe-Steckkarte mit Volta-Grafikchip und 16 GByte Speicher angekündigt

Tesla V100 PCIe

(Bild: Nvidia)

Lesezeit: 2 Min.

Nvidia hat auf der International Supercomputing Conference eine PCIe-Ausführung der Rechenkarte Tesla V100 vorgestellt. Sie enthält wie die SXM2-Variante einen Volta-Grafikchip mit 5120 Rechenkernen und 640 Tensor Cores. Allerdings fällt die GPU-Taktfrequenz der PCIe-Variante etwas niedriger aus, sie liegt bei zirka 1370 statt 1455 MHz. Entsprechend reduziert sich die theoretische Rechenleistung leicht von 15 auf 14 TFlops bei einfacher Genauigkeit (FP32) und von 7,5 auf 7 TFlops bei doppelter Genauigkeit (FP64). Auswirkungen hat das auch auf die für Deep-Learning-Anwendungen wichtige Tensor-Rechenleistung, die von 120 auf 112 TFlops sinkt.

Auch der PCIe-Variante stehen 16 GByte HBM2-Speicher zur Verfügung. Die Transferrate liegt bei 900 GByte/s. Den schnellen Interconnect NVLink 2.0 bietet die PCIe-Karte nicht. Nvidia spezifiziert ihre Leistungsaufnahme mit maximal 250 Watt; die SXM2-Variante darf bis zu 300 Watt verheizen.

Nvidia zufolge soll die Tesla V100 bei Physik-Anwendungen (QUDA) rund 50 Prozent schneller sein als die Vorgängerkarte Tesla P100, bei cuFFT soll der Vorsprung sogar bei 70 Prozent liegen. In einem von Nvidia veröffentlichten Deep-Learning-Benchmark braucht ein Verbund von acht Tesla V100 7,4 Stunden zum Trainieren eines neuronalen Netzes, acht Tesla P100 benötigen für das gleiche Ergebnis demnach 18 Stunden, acht Tesla K80 sogar 44 Stunden. Der Grund für die besonders hohe Zeitersparnis liegt in den neuen Deep-Learning-Spezialeinheiten, den Tensor Cores. Die Volta-GPU GV100 enthält 640 solcher aufs Training und Inferencing von neuronalen Netzwerken zugeschnittenen Kerne.

SXM2-Variante der Tesla V100 mit NVLink 2.0

(Bild: heise online/Martin Fischer)

Die Tesla V100 PCIe ist direkt für den Einsatz in Server-Racks gedacht. Entsprechend besitzt sie auch nur einen Passivkühlkörper, die Wärme wird über den Luftzug der Server-Kühlung abgeführt. Noch in diesem Jahr soll die Tesla V100 PCIe erhältlich sein und in ersten Server-Produkten auftauchen, etwa von Hewlett Packard Enterprise. Wann genau und zu welchem Preis die Tesla V100 PCIe verfügbar sein soll, hat Nvidia nicht bekannt gegeben.

Marktübersicht Grafikkarten (21 Bilder)

Nvidia GTX 1080 Ti

Das schnellste Modell der aktuellen Generation von Nvidia ist gleichzeitig auch die schnellste Single-GPU-Grafikkarte der Welt, die Titan XP ausgenommen. Vor allem für Gamer, die Grafik-Einstellungen ausreizen wollen, bringt die 1080 Ti ordentlich Leistung. So ist sie mit 11 GB GDDR5X-Speicher ausgestattet, der hochgetaktete Pascal-Grafikchip hat außerdem 3584 Shader-Rechenkerne. Im Test erwies sich die Highend-Grafikkarte ideal zum Spielen in 4K. Ihre Leistungsaufnahme hielt sich in Grenzen und auch die Lautstärke war in Anbetracht der Leistung vergleichsweise gering.

(mfi)