Neoverse V3 / N3: ARM bläst zum Angriff auf AMD, Intel und teils Nvidia

Die neue ARM-Kerngeneration Neoverse V3 und N3 erledigt insbesondere KI-Berechnungen schneller. Den CPU-Baukasten weitet ARM aus.

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
Nahaufnahme einer Maschine, die Chips von einem Silizium-Wafer entnimmt und auf ein Substrat aufbringt.

(Bild: IM Imagery/Shutterstock.com)

Lesezeit: 4 Min.
Inhaltsverzeichnis

ARM kündigt seine CPU-Kerne für die nächste Server-Prozessorgeneration an. Neoverse V3 (Codename Poseidon) ist der neue schnellste Server-Kern aus dem ARM-Baukasten und eignet sich für Prozessoren mit bis zu 128 Kernen. Darunter positioniert sich der kompaktere und sparsamere Neoverse N3 für 64-Kern-CPUs.

Obwohl ARM keine tiefgreifenden Änderungen an der Architektur vornimmt, sollen die Geschwindigkeitsvorteile teils erheblich sein –, insbesondere bei KI-Algorithmen. KI-Datenanalysen soll der Neoverse N3 beinahe dreimal schneller erledigen als der N2. Der V3 soll in dieser Disziplin immerhin 84 Prozent schneller sein als der V2. Bei klassischen Rechenaufgaben verspricht ARM ein Performance-Plus von 9 bis 30 Prozent (N3) beziehungsweise 9 bis 16 Prozent (V3).

ARM-eigene Benchmarks zu den neuen Serverkernen.

(Bild: ARM)

Hauptsächlich hat ARM den Level-2-Cache pro Kern vergrößert und das Speichermanagement sowie die Sprungvorhersage verbessert. Neue ARM-Prozessoren sollen sowohl den Last-Level-Cache als auch den Arbeitsspeicher effizienter nutzen.

Die wachsenden Caches zeichnen sich branchenweit als Trend ab. V3-Kerne können ARM-Kunden gleich mit bis zu 3 MByte L2-Cache konfigurieren (V2: max. 2 MByte). Beim Wechsel von N2 auf N3 verdoppelt sich der maximale L2-Cache auf 2 MByte. Davon profitieren KI-Algorithmen am stärksten – der Leistungssprung erfolgt ohne neue Datenformate. Die gängigen Varianten INT8 und Bfloat16 beherrscht schon die 2er-Generation.

Blockdiagram zum Neoverse N3. Die angegebenen Verbesserungen gelten allerdings auch für den V3.

(Bild: ARM)

Sogenannte Compute Subsystems (CSS) sind künftig nicht mehr auf die N-Serie limitiert, sondern lassen sich auch mit dem Neoverse V3 konfigurieren. Bei den CSS können sich ARM-Kunden praktisch einen kompletten Prozessor zusammenstellen, der außer den CPU-Kernen auch Komponenten wie den Interconnect, I/O-Blöcke und Speichercontroller von ARM enthält. Das Ganze lässt sich auch in Chiplet-Bauweise konfigurieren, inklusive Stapelspeicher à la HBM3.

Einen Ausblick vom September 2022 kann ARM derweil nicht einhalten: Die neuen Neoverse-Plattformen unterstützen doch noch kein PCI Express 6.0, sondern begnügen sich mit PCIe 5.0.

Beispielkonfiguration für einen Prozessor mit V3-Kernen und gekoppeltem KI-Beschleuniger.

(Bild: ARM)

Bisher haben Firmen wie Amazon (Graviton4) und Nvidia (Grace) ARMs Neoverse-Kerne eingekauft und die restlichen Bestandteile selbst entworfen. Die Branchenriesen dürften diesen Weg auch künftig gehen, um die Designs auf die eigenen Bedürfnisse zu optimieren. Microsoft verwendete bei Cobalt 100 hingegen Neoverse N2 als CSS.

Mit CSS will ARM auch kleinere Firmen abholen und stichelt dabei gegen AMD und Intel: "One size doesn't fit all" – ein Standard-Prozessor von der Stange eigne sich nicht für alle Einsatzbereiche gleich gut. Wie weit sich individuelle Vorteile bei einem fertigen CSS-Design von ARM einbringen lassen, ist allerdings unklar.

Mit dem Vorgehen brüstet sich ARM auch gegen Nvidias mutmaßliche Pläne, künftig (Semi-)Custom-Chips für Kunden anbieten zu wollen. Nvidia fischt damit in ARMs potenziellem Kundenbecken: Selbst, wenn die Nvidia-Chips ARM-Kerne verwenden, nimmt ARM mehr Geld ein, wenn Firmen komplette Designs einkaufen.

Mit schnelleren und zusätzlichen CPU-Kernen pro Prozessorfassung nimmt ARM zudem der Firma Ampere Wind aus den Segeln. Die bietet bislang 192-Kerner mit eigener Architektur an, allerdings scheinen sie noch nicht im produktiven Einsatz zu sein.

Außerdem hat AMD bereits 2023 den Epyc 9804 "Bergamo" mit 128 x86-Kernen vom Typ Zen 4c auf den Markt gebracht und Intel will bald den 288-Kerner Sierra Forrest vorstellen. Diese "Cloud native"-Prozessoren sollen die ARM-Konkurrenz in Schach halten.

Unter den Codenamen Adonis und Dionysus entwickelt ARM bereits die nächsten Neoverse-Kerne, vermutlich V4 und N4 genannt.

(mma)