CUDA 9.2 erhält neue Library für lineare Algebra

Das neueste Release von Nvidias GPU-Programmierschnittstelle beschleunigt rekurrente und Convolutional Neural Networks, dank Optimierungen der cuBLAS-Library.

In Pocket speichern vorlesen Druckansicht
Release Candidate von CUDA 9 erschienen
Lesezeit: 1 Min.
Von
  • Matthias Parbel

Seit Veröffentlichung der CUDA-Version 9 ist die GPU-Programmierschnittstelle nicht nur für Nvidias Volta-GPUs und die Programmierung der Tensor Cores optimiert, auch das Programmiermodell Cooperative Groups für besseres Thread Management steht Entwicklern zur Verfügung. Mit Version 9.2 liefert Nvidia nun unter anderem zahlreiche Verbesserungen in den Libraries cuBLAS und cuFFT nach, die schnellere Berechnungen beim High Performance Computing (HPC) und dem Deep Learning versprechen. Speziell für Probleme der linearen Algebra ist mit CUTLASS 1.0 außerdem eine Sammlung von C++-Templates hinzugekommen, die sich für die Implementierung von General Matrix to Matrix Multiplication (GEMM) auf allen Ebenen der CUDA-Thread-Hierarchie eignen.

Die Optimierungen der Libraries sollen nach Angaben von Nvidia die verschiedenen Berechnungen bis zum Faktor 5 beschleunigen. Die erweiterte cuBLAS-Library verschafft Entwicklern höhere Verarbeitungsleistung beim Einsatz von rekurrenten und Convolutional Neural Networks. Um Fast-Fourier-Transform-Berechnungen (FFT) von Primzahlen-Matrizen zu beschleunigen, stellt die cuFFT-Library optimierte Bluestein Kernel bereit. Darüber hinaus hat Nvidia die CUDA Runtime dahingehend verbessert, dass CUDA Kernel im Idealfall doppelt so schnell starten als bisher.

Nähere Informationen zu den weiteren Optimierungen der GPU-Programmierschnittstelle finden sich in den Release Notes zu CUDA 9.2. CUDA 9.2 steht ab sofort zum Download frei verfügbar. (map)