CUDA 11.6 ist einsatzbereit für 128-Bit-Ganzzahlwerte

Mit dem Update der Programmierplattform CUDA reicht Nvidia auch neue Funktionen für den Cooperative Groups Namespace nach.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
CUDA 11.6 ist einsatzbereit für 128-Bit-Ganzzahlwerte
Lesezeit: 2 Min.

Nvidia hat ein neues Release seiner Programmierplattform freigegeben: CUDA 11.6. Mit dem Update setzt das Unternehmen seine Bemühungen fort, das Programmiermodell zu erweitern, um Entwicklerinnen und Entwicklern mehr Leistung bei der GPU-Beschleunigung von Applikationen liefern zu können sowie den Einsatz weiterer Datentypen wie 128-Bit-Integer zu ermöglichen.

Bereits in CUDA 11.5 hatte Nvidia den Compiler für die Verarbeitung des Datentyps (__int128) angepasst – allerdings zunächst nur im Rahmen einer Preview. Ab sofort bietet die Programmierplattform inklusive der Compiler sowie der übrigen Entwicklerwerkzeuge offiziell vollständigen Support für 128-Bit-Ganzzahlwerte. Dieser Datentyp lässt sich nun uneingeschränkt nutzen, sofern auch der hostseitige Compiler ihn unterstützt.

Zusätzliche Funktionen stehen Entwicklerinnen und Entwicklern auch für den Cooperative Groups Namespace zur Verfügung (s. Abb.). Die Neuerungen sollen vor allem zu besserer Konsistenz bei der Benamung, dem Funktionsumfang sowie der Dimension und Größe von Einheiten beitragen.

Neue Funktionen für den Cooperative Groups Namespace

(Bild: developer.nvidia.com)

Die auf GSP (GPU System Processor) ausgelegte neue Treiberarchitektur gilt ab sofort als Standardmodus für sämtliche GPUs der Serien Turing und Ampere. Die alte Architektur bleibt zwar weiterhin verfügbar, soll aber lediglich als Fallback-Alternative dienen. Als veraltet (deprecated) gilt darüber hinaus CentOS Linux 8, das Ende 2021 den End-of-Life-Status erreicht hat. Zugunsten eines neuen Programmiermodells sollten sich Entwicklerinnen und Entwickler zudem vom Einsatz der Funktion cudaDeviceSynchronize() für die geräteinterne Parallelisierung von Fork und Join verabschieden.

Neu hinzugekommen in CUDA 11.6 ist die API cudaGraphNodeSetEnabled, mit der sich einzelne Nodes eines instanziierten Graphen deaktivieren lassen. Die Funktion bleibt vorläufig allerdings auf Kernel Nodes beschränkt. Über die ebenfalls neue API cudaGraphNodeGetEnabled lässt sich der aktuell eingestellte Zustand von Nodes abfragen.

Der Ankündigungsbeitrag im Nvidia-Developer-Blog bietet einen umfassenden Überblick sämtlicher Neuerungen in CUDA 11.6. Das neue Release steht auf den Nvidia-Servern offiziell für Windows und Linux zum Download parat und wird mit dem LTS-Treiber R510 ausgeliefert.

(map)