Tesla K20: Mit Hyper-Q um Faktor 2,5 schneller

Nvidia zeigt mit den ersten Tesla-K20-Benchmarks, welche Performance-Vorteile die Funktion Hyper-Q in der Praxis versprechen kann.

In Pocket speichern vorlesen Druckansicht 16 Kommentare lesen
Lesezeit: 2 Min.

Mit aktiviertem Hyper-Q zeigt die Tesla K20 in Verbindung mit einem 16-Kern-Prozessor eine deutlich höhere Performance.

(Bild: Nvidia)

Nvidia hat erste, für die wissenschaftliche Gemeinde interessante Benchmarkwerte des für Dezember erwarteten Rechenbeschleunigers Tesla K20 veröffentlicht. Sie zeigen den durch die neue Funktion Hyper-Q zustande kommenden Performance-Vorteil bei massiv parallelen MPI-Berechnungen (Message Passing Interface). Als Beispiel nutzt Nvidia den CP2K-Code für atomare und molekulare Simulationen, der im High Performance Computing häufig eingesetzt wird. Der Benchmark simuliert dabei 864 Wassermoleküle mit einem 16-Kern-Interlagos-System von AMD und einer Tesla-K20-Rechenkarte.

Die Rechenkarte Tesla K20 soll ab Dezember für 3200 US-Dollar erhältlich sein.

(Bild: Nvidia/c't)

Via Hyper-Q verarbeitet die Tesla K20 dank ihrer GK110-GPU nun bis zu 32 MPI-Threads gleichzeitig – das vermeidet CPU-Leerlaufzeiten –, andere Kepler- und Fermi-GPUs von Nvidia schaffen nur jeweils einen MPI-Prozess. Dadurch lassen sich im Benchmark-Beispiel mit dem 16-Kern-Prozessor auch 16 MPI-Prozesse auf der GK110-GPU ausführen. Das hat eine um den Faktor 2,5 höhere Performance zur Folge im Vergleich zum Durchlauf mit deaktiviertem Hyper-Q.

Nvidia betont, dass man den Simulationscode nicht extra für Hyper-Q anpassen müsse. Erforderlich sei lediglich die Installation des CUDA-5-Frameworks und eine Tesla K20 mit GK110-GPU.

Dank Hyper-Q verarbeitet eine GK110-GPU bis zu 32 MPI-Prozesse.

(Bild: Nvidia/c't)

Letztere ist laut Nvidia ab Dezember für rund 3200 US-Dollar erhältlich und beherrscht neben Hyper-Q auch die Funktion Dynamic Parallelism. Dadurch erzeugt ein auf der GPU ablaufender Thread bei Bedarf neue Kernels und verarbeitet somit beispielsweise auch rekursive Funktionen eigenständig. Die Tesla-K20-GPU soll 2496 oder 2688 Shader-Rechenkerne enthalten und ECC-geschützten Speicher bieten. Maximal darf der Rechenbeschleuniger 300 Watt aufnehmen. Bei Double-Precision-Berechnungen soll die Tesla K20 eine um den Faktor 3 höhere Leistung zeigen als Tesla-Karten mit Fermi-Prozessoren. (mfi)