AMD trommelt für heterogene Prozessoren

Die Heterogeneous System Architecture (HSA) soll effiziente Kombiprozessoren bringen; Wissenschaftler zeigen, wie CPU- und GPU-Kerne automatisch kooperieren.

In Pocket speichern vorlesen Druckansicht 43 Kommentare lesen
Lesezeit: 2 Min.

Ende vergangener Woche hat der Chiphersteller AMD seine Pläne für künftige Prozessoren veröffentlicht. Demnach soll die im Rahmen eines offenen Gremiums spezifizierte Heterogeneous System Architecture (HSA) in einigen Jahren besonders effiziente und leistungsfähige Kombiprozessoren ermöglichen. Darin sollen beispielsweise GPU-Kerne hohe Gleitkomma-Rechenleistung beisteuern und CPU-Kerne Single-Thread-Integer-Aufgaben effizient verarbeiten.

Eine mögliche Programmiersprache für solche Zwecke wäre OpenCL, deren Kommandos dann eine darunter liegende "virtuelle Befehlssatz-Architektur" (virtual ISA) auf die beim jeweiligen Kombiprozessor vorhandenen Funktionseinheiten optimal verteilt, wie Joe Macri von AMD auf der DesignCon erläutert hat (YouTube-Video). Auf dem Fusion Developer Summit 12 will AMD Mitte Juni mehr Details zu HSA verraten und möglicherweise Partnerfirmen nennen.

Schon vorher, nämlich Ende Februar auf dem International Symposium on High Performance Computer Architecture (HPCA), wollen Forscher der Uni North Carolina (NCSU) ein Verfahren vorstellen, welches die Verarbeitung allgemeiner Berechnungen durch GPU-Kerne beschleunigen soll – rund 20 Prozent Plus stellten die Wissenschaftler durchschnittlich in ihrem Benchmark-Mix fest. Einer der Tricks bei den "CPU-Assisted GPGPU on Fused CPU-GPU Architectures" ist, dass der CPU-Teil Daten aus dem Hauptspeicher vorausschauend in einen gemeinsamen L3-Cache lädt, bevor die GPU sie benötigt.

Einen solchen gemeinsam verwendeten Last-Level Cache (LLC), der auf demselben Die sitzt wie CPU- und GPU-Kerne, hat AMD bisher nicht realisiert und scheint ihn auch für die demnächst erwarteten Trinity-APUs nicht zu planen – diese haben nach bisherigen Spekulationen wie ihre Llano-Vorgänger bloß L2-Caches. Erst mit den für 2013 geplanten Kaveri-APUs sollen bei AMD erste HSA-Funktionen Einzug halten, etwa kohärente Speicherbereiche für CPU und GPU.

Intels Sandy-Bridge-Prozessoren (Core i-2000) besitzen einen gemeinsamen Cache für GPU- und CPU-Kerne, doch hier fehlt eine OpenCL-Implementierung für den GPU-Teil – Intels OpenCL-SDK 1.5 unterstützt nur CPU-Kerne. Der GPU-Kern lässt sich für bestimmte Zwecke aber mit Intels Media SDK programmieren. Intel scheint es mit OpenCL auf der GPU-Seite nicht so eilig zu haben und steckt mehr Aufwand in AVX, AVX2 und die Many Integrated Cores-(MIC -)Architektur, früher Larrabee. (ciw)