AMD auf der Supercomputing-Konferenz SC16: OpenCompute mit ROCm, aber kein Zen

Mit ROCm und OpenCAPI wird AMD hoffähig für OpenPower, Google und ARM64. Von Zen gabs jedoch wenig und von Vega so gut wie gar nichts.

29

18.11.2016, 07:40 Uhr

Lesezeit: 3 Min.

Von

Andreas Stiller

ROCm, das steht für Radeon OpenCompute Platform. Dieses Opensource-Konzept für OpenCompute hatte AMD im vergangenne Jahr im Rahmen der Boltzmann-Initive angekündigt und Zug um Zug auf die neuen Architekturen Hawai und Polaris übertragen. Jetzt ist man schon bei ROCm 1.3.

Grundlage sind LLVM, Native Compiler und OpenCL (Version 1.2+ soll demnächst herauskommen). Neben OpenSource-Treibern ist als wichtiger Bestandteil auch ein Tool dabei, das CUDA-Software in das Heterogeneous Compute Interface for Portability (HIP) übersetzt – und jetzt auch wieder zurück zu CUDA, falls man das braucht. Vollautomatisch klapp das noch nicht, ein bisschen Handarbeit gehört noch dazu.

Vor wenigen Wochen hat AMD zusammen mit Dell EMC, HPE und den Platinum-OpenPower-Mitgliedern IBM, Google, Nvidia, Mellanox und Xlinx OpenCAPI gegründet. Damit muss OpenPower bei der GPU nicht allein auf Nvidia setzen. Auch die ARM-Welt, hier vor allem Cavium, kann Radeon-Treiber nutzen. Den ersten wichtigen Erfolg konnte AMD jetzt im Verlaufe der SC16 vermelden: Google wird Radeon ins Cloud-Angebot einbinden. Den Name "FirePro“, so hat AMD jetzt klargestellt, wird man in der Zukunft nicht mehr nutzen, nur "Radeon Pro“.

Das Trendthema Deep Learning spielt auch bei AMD eine große Rolle. Schon die Architekturen Hawaii und Polaris beherrschen „Halbe Genauigkeit“ fp16, allerdings geht das dort nicht viel schneller als Single Precision, spart allerdings Bandbreite und Speicherbedarf. Bei der nächsten Generation Vega, so munkelt man, dürfte das anders werden. Von Vega war auf der SC16 allerdings noch nichts zu sehen.

Und Zen?

Auch wer gehofft hatte, einen Prototypen der nächsten Prozessorgeneration Zen mit bis zu 32 Kernen (Naples) auf der Supercomputer-Konferenz SC16 in Salt Lake City vorgeführt zu bekommen, wurde enttäuscht. Nicht mal hinter den Kulissen konnten die vielen Interessierten aus Wissenschaft, Forschung und Industrie laufende Zen-Systeme bewundern.

Es gab in den NDA-Sessions nur Folien, allerdings mit durchaus interessanten Werten für SPECint2006. Wenn man Naples in dieser Disziplin mit Intels Werten für den Haswell – gemessen mit gcc und nicht mit dem Intel Compiler -- vergleicht, kann er danach einigermaßen mithalten. Noch sind die Werte allerdings ohne Hyper-Threading, damit gibt derzeit noch ein paar Probleme.

Wenn alles funktioniert, soll er sogar in etwa on par mit dem Skylake EP (Xeon E5 2698v5) sein. Woher AMD die mußmaßlichen Skylake-Werte her hat, bleibt allerdings offen. Für die in der HPC-Szene auch nicht ganz unwichtigen Gleitkommawerte (SPECfp, Linpack) schwieg sich AMD aus. Bei dem anderen wichtigen Benchmark HPCG, der hauptsächlich von der Speicherbandbreite abhängt, müsste Zen mit seinen bis zu acht Speicherkanälen jedoch gut dabei sein.