ARM-Revolution im Rechenzentrum: Wie es ARM-Prozessoren in Server schafften

Seite 2: ARMv8: Einführung von 64 Bit

Inhaltsverzeichnis

Im Oktober 2011 stellte ARM die neue Befehlssatzarchitektur ARMv8 vor, die die Aufteilung in die drei Profillinien A, R und M fortführte und die in den ARM-Prozessoren aktueller Smartphones und Embedded Devices zu Einsatz kommt.

ARMv8 bot eine Erweiterung auf 64 Bit, war aber auch weiterhin für reine 32-Bit-Prozessoren definiert. So blieb das Profil ARMv8-M grundsätzlich 32-bittig, R und A gibt es für beides. Landläufig versteht man allerdings unter ARMv8 immer die 64/32-Bit-Architektur, die eigentlich korrekter als AArch64/32 bezeichnet werden sollte.

64 Bit ist aber keinesfalls einfach nur eine Erweiterung, eher andersherum: Mit der 64-bittigen ARMv8-Architektur schuf ARM einen völlig neuen Prozessor, der noch alten 32-Bit-Code effizient ausführen kann. Allerdings will ARM spätestens ab 2023 auf diese dann schon recht obsolete Legacy-Unterstützung verzichten. Den ersten rein 64-bittigen ARM-Chip gibt es aber jetzt schon, den Cortex-A510 auf Basis von ARMv9.0.

Der ThunderX2 war der einzige 64-bittige-ARMv8-Chip, der wirklich eine Rolle auf dem Markt spielte. Er machte, geboren als Vulcan bei Raza Microelectronics, bis zu seinem Ende bei Marvell eine lange Odyssee durch.

(Bild: Cavium)

Nützlich für den Übergang war, dass die 64-Bit-Befehle weiterhin 32 Bit lang und ähnlich wie ihre 32-Bit-Pendants codiert sind. Im 64-Bit-Modus war dann aber doch vieles anders. So fiel ein zentrales Feature der klassischen ARM-Architektur weg, nahezu alle Befehle konditioniert ausführen zu können. Das gilt jetzt weitgehend nur noch für Sprungbefehle.

Auch das Interrupt-Konzept wurde völlig neu gestaltet. An Erweiterungen sind Thumb-2, NEON, VFPv4-D16 und VFPv4 obligatorisch, optional kamen Kryptoeinheiten für AES und SHA hinzu. Insbesondere zog mit ARMv8.2-A im Januar 2016 die neue, von Fujitsu entwickelte Scalable Vector Extension (SVE) als Option ein. Das sind immerhin insgesamt 522 neue Befehle.

Man darf bei SVE allerdings nicht automatisch an Fujitsus Implementierung im A64FX-Prozessor mit seinen zwei 512-Bit-Vektoreinheiten denken. Denn wie der Name Scalable andeutet, ist die tatsächliche Vektorlänge in Hardware flexibel zwischen 128 und 2048 Bit. De facto gibt es derzeit außer beim A64FX keine andere ARM-Implementierung, die mehr als 128 Bit für SVE oder das später eingeführte SVE2 bietet.

ARMv8.4-A führte im November 2017 unter anderem weitere Kryptoerweiterungen ein, ARMv8.5-A definierte im September 2018 die MTE (Memory Tagging Extension) für gesicherten Speicher. Fürs High-Performance-Computing und für KI brachte ARMv8.6-A im September 2019 zahlreiche Goodies wie General Matrix Multiply und den Datentyp Bfloat16.

Im März 2021 gelang ARM dann wieder ein großer Wurf mit der neuen Befehlssatzgeneration ARMv9-A. Hier wurden wichtige neue Fähigkeiten festgelegt, viele davon sind allerdings zumindest für ARMv9.0-A optional. SVE2 hingegen ist obligatorisch. Es umfasst eine Erweiterung der alten ARM-SIMD-Einheit NEON im Zusammenspiel mit SVE. Optional sind die Scalable Matrix Extension SME, Transactional Memory und ein erheblich erweitertes Sicherheitskonzept namens Confidential Compute Architecture (CCA).

SVE2 verbindet die erweiterte NEON-Einheit mit SVE.

(Bild: ARM)

SME bietet Optimierungen für Matrixmultiplikation und -transposition und führt einen neuen Streaming-Modus ein. Transactional Memory wird derzeit von Intel Xeon und Power 9 angeboten. Es kann etwa bei Datenbankservern erhebliche Performancevorteile bieten – um so stärker, je mehr Prozessoren in einem SMP-System zusammengeschaltet sind. CCA umfasst mit der "Realm" Memory Extension RME eine Erweiterung von TrustZone sowie einen Security Monitor. Damit sollen auch Drittanbieter eigene gesicherte Zonen einrichten können, bei TrustZone ist das auf den Hersteller beschränkt. Und der Security Monitor soll einen geschützten Parallelbetrieb von gesicherten und ungesicherten Applikationen auf der gleichen Anlage garantieren – das ist ein Feature, an dem die amerikanischen National Laboratories hochgradig interessiert sind, etwa das Los Alamos National Laboratory.