Nvidia Tesla T4: KI-Beschleuniger mit 8 TFlops bei 75 Watt Leistungsaufnahme
Die Tesla T4 entfacht dank modernem Turing-Grafikchip eine besonders hohe Rechenleistung bei einer Leistungsaufnahme von nur 75 Watt.
Nvidia hat die neue Tesla-Rechenkarte T4 im Rahmen der GPU Technology Conference Japan vorgestellt. Sie setzt auf eine Turing-Grafikeinheit, die neben herkömmlichen Rechenkernen auch sogenannte Tensor Cores zur Beschleunigung von KI-Berechnungen enthält. Diese 320 Tensor Cores unterstützen neben FP16 auch die Datenformate INT8 und INT4. Mit INT8 erreichen sie eine Rechenleistung von 130 TOPS, bei INT4 sogar 260 TOPS. Gleitkommaberechnungen mit einfacher Genauigkeit laufen über die 2560 Shader-Rechenkerne, die dann theoretisch bis zu 8,1 TFlops erreichen.
Nvidia-eigene Benchmarks
Nvidia hat einige Inferencing-Benchmarks im Vergleich mit einem Intel Xeon Gold 6140 veröffentlicht: So soll die Tesla T4 bei Resnet50 bis zu 27 Mal, bei DeepSpeech2 bis zu 21 Mal und bei GNMT bis zu 36 Mal schneller rechnen als Intels Server-Prozessor. Vergleiche mit anderen Grafikkarten hat Nvidia nicht publiziert.
Die Video-Engine der Turing-GPU soll doppelt so leistungsfähig sein wie die des Pascal-Vorgängers. Nvidia zufolge dekodiert die Tesla P4 bis zu 38 Full-HD-Videostreams gleichzeitig.
Nvidia stattet die Tesla T4 mit 16 GByte GDDR6-Speicher aus, der eine Transferrate von 320 GByte/s erreicht. Die Rechenkarte ist mit einer Leistungsaufnahme von 75 Watt spezifiziert und speist sich ausschlieĂźlich aus dem PCIe-3.0-Slot. Erste Kunden sollen unter anderem Google und Microsoft sein. Nvidia hat keinen Preis bekannt gegeben. (mfi)