CUDA 10.1 enthält neue GEMM-Bibliothek
Die neue Bibliothek soll mit flexibler API und TensorkernunterstĂĽtzung fĂĽr INT8-Inputs und anormal-komplexe Matrix-Multiplikationen bei FP16 aufwarten.
- Alexander Neumann
Nvidia hat die Version 10.1 des Parallelprogrammierungswerkzeugs CUDA freigegeben. Als vermutlich wichtigstes neues Feature weist der Grafikkartenhersteller eine neue GEMM-Bibliothek (generalisierte Matrix-Matrix-Multiplikationen) aus. DarĂĽber hinaus gibt es einige weitere Neuerungen und Updates bei der Performance der bereits inkludierten Bibliotheken. AuĂźerdem hat Nvidia die Graphs APIs von CUDA ĂĽberarbeitet.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier eine Vimeo-Video (Vimeo LLC) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Vimeo LLC) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Bei der GEMM-Bibliothek handelt es sich um cuBLASLt, die mit offenbar flexibler API und TensorkernunterstĂĽtzung fĂĽr INT8-Inputs und anormal-komplexe Matrix-Multiplikationen bei FP16 (Floating Points) aufwartet. Dann ist von den neuen selektiven Eigensolver-Funktionen SYEVDX und SYGVDX in der cuSOLVER-Bibliothek und einer bis zu 1,5-fachen Leistungssteigerung fĂĽr Vollspektrum-Eigensolver die Rede.
4-mal schnellere Leistung
Bei der nvJPEG-Bibliothek gibt es neue Kodierungs- und Batch-Dekodierungsfunktionen, und bei der cuRAND-Library verspricht man sich eine bis zu 4-mal schnellere Leistung fĂĽr eine breite Palette von Zufallszahlengeneratoren. SchlieĂźlich weist Nvidia auch eine verbesserte Performance und eine bessere UnterstĂĽtzung fĂĽr Fork/Join-Kernel in den Graphs APIs hin.
Darüber hinaus enthält CUDA 10.1 etliche Bugfixes, das Werkzeug unterstützt des Weiteren neue Betriebssysteme und das Performanceanalysewerkzeug Nsight Systems und der interaktive Kernel-Profiler Nsight Compute wurden ebenfalls überarbeitet. Detailliert werden die Neuerungen in den Release Notes beschrieben. Ansonsten steht CUDA 10.1 steht ab sofort zum Download über das Nvidias Developer-Programm bereit.
(ane)