Tesla K20: Mit Hyper-Q um Faktor 2,5 schneller
Nvidia zeigt mit den ersten Tesla-K20-Benchmarks, welche Performance-Vorteile die Funktion Hyper-Q in der Praxis versprechen kann.
Nvidia hat erste, für die wissenschaftliche Gemeinde interessante Benchmarkwerte des für Dezember erwarteten Rechenbeschleunigers Tesla K20 veröffentlicht. Sie zeigen den durch die neue Funktion Hyper-Q zustande kommenden Performance-Vorteil bei massiv parallelen MPI-Berechnungen (Message Passing Interface). Als Beispiel nutzt Nvidia den CP2K-Code für atomare und molekulare Simulationen, der im High Performance Computing häufig eingesetzt wird. Der Benchmark simuliert dabei 864 Wassermoleküle mit einem 16-Kern-Interlagos-System von AMD und einer Tesla-K20-Rechenkarte.
Via Hyper-Q verarbeitet die Tesla K20 dank ihrer GK110-GPU nun bis zu 32 MPI-Threads gleichzeitig – das vermeidet CPU-Leerlaufzeiten –, andere Kepler- und Fermi-GPUs von Nvidia schaffen nur jeweils einen MPI-Prozess. Dadurch lassen sich im Benchmark-Beispiel mit dem 16-Kern-Prozessor auch 16 MPI-Prozesse auf der GK110-GPU ausführen. Das hat eine um den Faktor 2,5 höhere Performance zur Folge im Vergleich zum Durchlauf mit deaktiviertem Hyper-Q.
Nvidia betont, dass man den Simulationscode nicht extra für Hyper-Q anpassen müsse. Erforderlich sei lediglich die Installation des CUDA-5-Frameworks und eine Tesla K20 mit GK110-GPU.
Letztere ist laut Nvidia ab Dezember für rund 3200 US-Dollar erhältlich und beherrscht neben Hyper-Q auch die Funktion Dynamic Parallelism. Dadurch erzeugt ein auf der GPU ablaufender Thread bei Bedarf neue Kernels und verarbeitet somit beispielsweise auch rekursive Funktionen eigenständig. Die Tesla-K20-GPU soll 2496 oder 2688 Shader-Rechenkerne enthalten und ECC-geschützten Speicher bieten. Maximal darf der Rechenbeschleuniger 300 Watt aufnehmen. Bei Double-Precision-Berechnungen soll die Tesla K20 eine um den Faktor 3 höhere Leistung zeigen als Tesla-Karten mit Fermi-Prozessoren. (mfi)