Nvidia präsentiert Rechenbeschleuniger Tesla M4 und Tesla M40

Die Tesla M4 ist kompakt und fĂĽr Bild- und Videoverarbeitung geeignet. Die Tesla M40 ist ein wahres Rechenmonster und nimmt es auch mit den anspruchsvollsten Anwendungen auf.

In Pocket speichern vorlesen Druckansicht 69 Kommentare lesen
Tesla M40

Tesla M40

(Bild: Nvidia)

Lesezeit: 2 Min.

Nvidia hat zwei neue Tesla-Rechenbeschleuniger fürs High Performance Computing vorgestellt: die Tesla M4 und die Tesla M40. Beide Karten haben Grafikchips mit Maxwell-Architektur, die einerseits sehr effizient sind, sich andererseits aber nicht für Berechnungen mit doppelter Genauigkeit eignen. Die besonders leistungsfähige Tesla M40 ist speziell für Anwendungen im Bereich Deep Learning gedacht, die eine sehr hohe Rechenleistung erfordern. Die kompakte Tesla M4 hat Nvidia auf Anwendungen im Bereich der Bild- und Videoverarbeitung getrimmt.

Die Tesla M4 enthält einen Maxwell-v2-Grafikchip mit 1024 Shader-Rechenkernen. Seine theoretische Rechenleistung gibt Nvidia mit 2,2 Billionen Gleitkommaoperationen pro Sekunde an (TFlops). Die Grafik- und Rechendaten legt er in seinem 4 GByte großen Speicher ab, dessen Transferrate 88 GByte/s beträgt. Für die beschriebene Leistung ist die Tesla M4 außerordentlich kompakt: Sie passt dank Low-Profile-Bauform auch in sehr flache Server und verheizt dabei nur zwischen 50 und 75 Watt.

Die Tesla M40 ist besonders fĂĽr Deep-Learning-Anwendungen geeignet.

(Bild: Nvidia)

Weit leistungsfähiger und größer ist die Tesla M40. Sie belegt zwei Steckplätze und kommt in Standard-Bauhöhe daher. Unter dem langen Kühlkörper sitzt ein GM200-Grafikchip mit 3072 Shader-Rechenkernen, der bei Maximaltakt eine Rechenleistung von 7 TFlops erreicht – natürlich bei einfacher Genauigkeit. Im Vergleich zur Tesla M4 hat die M40 12 statt nur 4 GByte Speicher, der mit 288 GByte extrem schnell angebunden ist.

Die hohe Performance fordert allerdings bei der Leistungsaufnahme ihren Tribut: 250 Watt sind selbst für eine Rechenkarte kein Pappenstil. Nvidia hat zur Tesla M40 lediglich einen Benchmark veröffentlicht, für den sie die Performance der Rechenkarte mit der eines Intel-Prozessors E5-2697v2 (2,7 GHz, 64 GByte RAM, CentOS 6.2) in der Caffe-Deep-Learning-Anwendung vergleicht. Nach einem speziellen Nvidia-Benchmark beträgt die Trainingszeit mit der Tesla M40 nur einen Tag, während die CPU für die gleichen Berechnungen acht Tage braucht.

Die Tesla M4 und Tesla M40 sind laut Nvidia Datacenter-Produkte und werden folglich nur in kompletten Servern von OEM-Herstellern verbraut. Nvidia erklärte gegenüber c't, dass die Tesla M40 ab Ende November verfügbar sein soll, die Tesla M4 ab dem Frühjahr 2016. (mfi)