CUDA 10.1 enthält neue GEMM-Bibliothek

Die neue Bibliothek soll mit flexibler API und Tensorkernunterstützung für INT8-Inputs und anormal-komplexe Matrix-Multiplikationen bei FP16 aufwarten.

In Pocket speichern vorlesen Druckansicht
CUDA 10.1 enthält neue GEMM-Bibliothek
Lesezeit: 1 Min.
Von
  • Alexander Neumann

Nvidia hat die Version 10.1 des Parallelprogrammierungswerkzeugs CUDA freigegeben. Als vermutlich wichtigstes neues Feature weist der Grafikkartenhersteller eine neue GEMM-Bibliothek (generalisierte Matrix-Matrix-Multiplikationen) aus. Darüber hinaus gibt es einige weitere Neuerungen und Updates bei der Performance der bereits inkludierten Bibliotheken. Außerdem hat Nvidia die Graphs APIs von CUDA überarbeitet.

Bei der GEMM-Bibliothek handelt es sich um cuBLASLt, die mit offenbar flexibler API und Tensorkernunterstützung für INT8-Inputs und anormal-komplexe Matrix-Multiplikationen bei FP16 (Floating Points) aufwartet. Dann ist von den neuen selektiven Eigensolver-Funktionen SYEVDX und SYGVDX in der cuSOLVER-Bibliothek und einer bis zu 1,5-fachen Leistungssteigerung für Vollspektrum-Eigensolver die Rede.

Bei der nvJPEG-Bibliothek gibt es neue Kodierungs- und Batch-Dekodierungsfunktionen, und bei der cuRAND-Library verspricht man sich eine bis zu 4-mal schnellere Leistung für eine breite Palette von Zufallszahlengeneratoren. Schließlich weist Nvidia auch eine verbesserte Performance und eine bessere Unterstützung für Fork/Join-Kernel in den Graphs APIs hin.

Darüber hinaus enthält CUDA 10.1 etliche Bugfixes, das Werkzeug unterstützt des Weiteren neue Betriebssysteme und das Performanceanalysewerkzeug Nsight Systems und der interaktive Kernel-Profiler Nsight Compute wurden ebenfalls überarbeitet. Detailliert werden die Neuerungen in den Release Notes beschrieben. Ansonsten steht CUDA 10.1 steht ab sofort zum Download über das Nvidias Developer-Programm bereit.

(ane)