ARM-Revolution im Rechenzentrum: Wie es ARM-Prozessoren in Server schafften

Seite 3: Neoverse: bereit für die großen Eisen

Inhaltsverzeichnis

Mit den ARMv9-Features kann sich ARM in der Oberklasse der Server mehr als sehen lassen, insbesondere dann, wenn die optionalen Features auch eingebaut sind. Zunächst brachte ARM kleine ARMv9-Chips für den Mobile- und Desktopbereich heraus: Den bereits erwähnten rein 64-bittigen Cortex-A510, den Cortex-A710 und den Cortex-X2.

Für Server hatte ARM auf der Hotchips-Konferenz 2018 die ersten Neoverse-Plattformen auf ARMv8-Basis für "Cloud to Edge" vorgestellt, die drei große Baukastenlinien umfassen:

  • Serie V: High Performance und KI;
  • Serie N: Energie/Performance balanciert für Scale-out-Anwendungen;
  • Serie E: Energieeffizienz.

Als erste Plattform für Hyperscale wurde N1 Ares auf Basis von ARMv8.2+-A (das Plus steht für einige Erweiterungen von ARMv8.3-8.5-A) mit 64 Kernen vorgestellt, dessen Architektur zum Teil auf dem Cortex-A76 beruht, aber andere Caches und ein anderes Mesh-Interconnect aufweist. Wie der A76 ist er für den 7-nm-Prozess konzipiert. Das Design ist auf bis zu 128 Kerne ausgelegt. Mit 105 Watt/SoC und etwa 190 SPECint2017-Rate bietet er etwa 30 Prozent bessere Performance/Watt als beispielsweise ein älterer Cortex-A72. Für kleine Edge-Systeme gibt es 8-Kerner mit 25 Watt/SoC und 20 SPECint2017-Rate.

Die erste E1-Plattform, Helios, baut ebenfalls auf einem vorhandenen Cortex-Prozessor auf – hier auf dem Cortex-A65AE. Auch Helios arbeitet mit ARMv8.2+-A, anders als Aries aber mit SMT.

ARMs Neoverse-N2-Kerne (Perseus) kommen derweil in Gestalt des Marvell Octeon 10 als erster ARMv9-Serverchip überhaupt auf den Markt, zumindest als Muster, gefertigt in TSMCs 5-nm-Prozess. Marvells Octeon 10 hat bis zu 36 Kerne pro Chip und unterstützt DDR5-Speicher und PCIe Gen 5. ARMs N2-Kerne bieten SVE2 in der kleinsten Ausführung mit zweimal 128 Bit, die mächtigen Features Transactional Memory und CCA sind allerdings unter ARMv9.0-A noch nicht an Bord. Zu betonen ist hier der große Performancesprung gegenüber Neoverse N1 insbesondere bei der Zahl der Instruktionen pro Takt, die um 40 Prozent größer sein soll.

Der performanceoptimierte Neoverse-V1-Kern mit dem Codenamen Zeus basiert wie der N1 noch auf ARMv8.2+, ist hardwaremäßig aber deutlich erweitert, mit verdoppelter Skalarität – bis zu acht Befehle vom Decoder – und mit einer Verdoppelung der Zahl der Vektoreinheiten. Gebündelt bieten diese dann zweimal SVE mit je 256 Bit. Das entspricht an Vektorleistung den AVX2-Einheiten im AMD Epyc oder einer AVX512-Einheit aktueller Intel Xeons.

Neoverse V1 (Zeus): Mit breiter Skalarität und zwei 256-Bit-SVE-Einheiten auf High Performance getrimmt. Erste Chips werden für Ende 2022 erwartet.

(Bild: ARM)

Die Neoverse-Roadmap: N2 hat derweil allerdings V1 überholt, erste V1-Chips werden erst Ende des Jahres 2022 erwartet, N2-Chips (Octeon 10) für ARMv9.0-A will Marvell noch im Jahr 2021 bemustern.

(Bild: ARM)

Unmittelbar nach der Vorstellung der 64-bittigen ARMv8-Architektur im Oktober 2011 machten sich fast ein Dutzend Firmen auf, ARM-Chips für den Servermarkt zu designen: Samsung, Broadcom, Qualcomm, Cavium, Caldexa, Applied Micro, AMD, Marwell. Davon haben die meisten ihre Pläne begraben oder ihr Design verkauft, oder sie gingen wie Caldexa in Konkurs. AMD etwa gab mit Start der Epyc-Familie seine ARM-Ambitionen und seine SeaMicro-Mikroserverlinie auf – jedenfalls vorerst. Andeutungen von AMDs CFO Devinder Kumar auf einem Technikforum der Deutschen Bank im September 2021 zeigen jedoch, dass man ARM weiterhin im Blick hat.

Samsung hat derweil sein Design aus der Serversphäre verabschiedet und für andere Märkte umgewidmet. Broadcom wurde von der HP-Großtochter Adago aufgekauft, der Vulcan-Prozessor – der auch nur zusammen mit der Firma NetLogic eingekauft war – ging als ThunderX2 an Cavium, die ihren eigenen ThunderX beerdigten. Cavium wiederum wurde im Juli 2018 von der israelischen Firma Marvell übernommen, die die ThunderX-Linie zunächst weiterführte. Auf der Hotchips-Konferenz im August 2020 präsentierte man noch den ThunderX 3 auf Basis von ARMv8.3, um ihn und damit die ganze ThunderX-Linie kurz danach einzustampfen – und ganz auf die neuen Neoverse-Kerne zu setzen. Schon im Juni 2021 stellte man den Octeon 10 vor: den ersten, der auf ARM Neoverse N2 mit ARMv9-Architektur beruht.

Applied Micro wurde im November 2016 von der Firma Macom übernommen und das ARMv8-Design X-Gene 3 an den Investment-Riesen Carlyle Group verhökert, der es einem frisch gegründeten Start-up namens Ampere Computing übergab. Diese neue ARM-Entwicklungsfirma wurde ausgerechnet von der ehemaligen Software-Chefin von Intel, Renee James, gegründet, die zwar wenig Hardware-, aber viel Managementerfahrung aufweist und die vielleicht noch ein Hühnchen mit Intel zu rupfen hatte. Für die Hardware nahm sie zwei erfahrene Top-Leute von Intel mit: Atiq Bajwa als CTO und Rohit Vidwans als Chief Engineering & Manufacturing Officer. In kürzester Zeit schaffte es Ampere, wichtige Partner wie Lenovo, Oracle und Cloudflare zu gewinnen.

Wie Marvell führte auch Ampere die übernommene X-Gene-Linie nicht fort, sondern wechselte zu ARM Neoverse, jedenfalls zunächst einmal. Fertiggestellt ist derweil der Ampere Altra mit 80 Kernen auf Basis von ARM Neoverse N1 (ARMv8) mit einigen Modifikationen. Seit Kurzem gesellt sich der Altra Max mit 128 Kernen hinzu. Ein weiterer neuer Player ist das von ehemaligen Apple-Entwicklern gegründete Start-up Nuvia, das Anfang des Jahres 2021 von Qualcomm aufgekauft wurde. Was Nuvia in petto hat, weiß man nicht so genau, vermutlich einen Konkurrenzchip zu Apples M1, aber vielleicht wird sich auch Qualcomm wieder auf den Servermarkt wagen.

In China kamen Firmen wie die Huawei-Tochter HiSilicon mit ihrer Neoverse-N1-CPU Hi 1620 und Phytium hinzu. Phytium hatte im Jahr 2016 auf der Hotchips-Konferenz den ARMv8-Prozessor Mars vorgestellt.