Parallelprogrammierung: CUDA 7.5 bringt tiefergehendes Profiling

Neue Features in Nvidias Visual Profiler helfen, gezielter Codebereiche und Assembler-Instruktionen identifizieren zu können, die für Performanceprobleme in der Plattform für parallele Berechnungen sorgen.

In Pocket speichern vorlesen Druckansicht
Parallelprogrammierung: CUDA 7.5 bringt tiefergehendes Profiling
Lesezeit: 1 Min.
Von
  • Alexander Neumann

Nvidia bietet seine Architektur für parallele Berechnungen CUDA (Compute Unified Device Architecture) jetzt auf seiner Entwickler-Website in der Version 7.5 als kostenlosen Download an. Zu den Neuerungen der Plattform für parallele Berechnungen zählen ein 16 bittiges Datenformat (FP16) für Gleitkommazahlen zum Speichern von mehr Daten im GPU-Speicher bei zugleich geringerer Speicherdatenübertragsrate, neue GEMVI-Routinen in der cuSPARSE-Bobliothek und Möglichkeiten zum Profiling auf Instruktionsebene.

Zwar gehen Nvidias Profiling-Werkzeuge schon ziemlich tief in den Code, mit den neuen Profiling-Mitteln im Visual Profiler sollen Entwickler jedoch viel gezielter spezifische Codebereiche und Assembler-Instruktionen identifizieren können, die für Performanceprobleme im CUDA-Code sorgen. Mit CUDA 7.5 soll man des Weiteren unter Windows betriebene CUDA-Anwendungen via Windows Remote Desktop laufen lassen können.

Experimenteller Natur ist derzeit noch die Unterstützung von GPU-Lambdas. Dabei handelt es sich um auf C++11 aufbauende anonyme Funktionsobjekte, die sich über spezielle Spezifizierer im gerätespezifischen Code festlegen lassen. Das soll letztlich der Verarbeitung parallelen Code zugute kommen. (ane)