Nvidia passt CUDA 11.8 an Hopper- und Ada-Lovelace-Beschleuniger an

Mit Version 11.8 richtet Nvidia seine Programmierplattform CUDA schrittweise auf die spezifischen Fähigkeiten der GPU-Plattformen Hopper und Ada Lovelace aus.

In Pocket speichern vorlesen Druckansicht
CUDA 11.6 ist einsatzbereit für 128-Bit-Ganzzahlwerte
Lesezeit: 2 Min.

Nvidia hat das neue Release 11.8 seiner Programmierplattform CUDA freigegeben. Das Update liefert erste Erweiterungen des Programmiermodells, die spezifisch auf die Beschleunigerarchitekturen Hopper und Ada Lovelace ausgerichtet sind. Entwicklerinnen und Entwickler sollen dadurch unmittelbar von Performancegewinn ihrer CUDA-Anwendungen für die neuen GPU-Plattformen profitieren.

Die vollständige Anpassung des Programmiermodells an die Hopper-Architektur will Nvidia laut Ankündigung erst ab CUDA 12.x vollziehen, das aktuelle Release bietet aber bereits zahlreiche Neuerungen, die unter anderem auf die größere Speicherbandbreite, die höheren Taktraten sowie die gestiegene Anzahl an Streaming-Multiprozessoren in den GPU-Beschleunigern der Serien Hopper und Ada Lovelace zur Verfügung stehen.

Die in CUDA 11.7 eingeführte Funktion des Lazy Kernel Loading hat das Nvidia-Entwicklerteam nun auch für die CPU-Module implementiert, sodass Libraries und Funktionen künftig auch auf den CPUs schneller geladen werden – im Idealfall sogar mit reduziertem Speicherbedarf. Lazy Loading ist in CUDA 11.8 noch nicht standardmäßig aktiviert, Entwicklerinnen und Entwickler können es jedoch über die Umgebungsvariable CUDA_MODULE_LOADING=LAZY steuern, um es für eigene Anwendungen zu testen.

Für die Leistungsoptimierung auf der Hopper-Plattform stellt das CUDA-Tool Nsight Compute erweiterte Optionen bereit. Damit lassen sich etwa die Thread Block Cluster debuggen, die das gezielte Performancetuning von Hopper-GPUs ermöglichen sollen. Darüber hinaus lässt sich mit Nsight Compute der Tensor Memory Accelerator (TMA) untersuchen, der auf der Hopper-Plattform den Datentransfer zwischen Global und Shared Memory beschleunigen soll.

Ein Überblick zu den weiteren Neuerungen in CUDA 11.8 wie Vereinfachungen bei der JetPack-Installation oder die verbesserte MPS-Signalbehandlung beim Unterbrechen und Beenden von Applikationen finden sich im Nvidia-Developer-Blog. Das neue Release des CUDA Toolkit steht auf den Nvidia-Servern offiziell für Windows und Linux zum Download parat.

(map)