ARM-Revolution im Rechenzentrum: Wie es ARM-Prozessoren in Server schafften

Seite 4: Das Geschäft mit der Cloud

Inhaltsverzeichnis

Auch die großen Cloud-Provider rührten sich. Zuerst kam Amazon mit dem Graviton aus der Reserve, nun ist man schon beim Graviton2 auf Basis von ARMs Neoverse N1. Mittlerweile bietet Amazon fünf verschiedene Instanzenfamilien dafür an – und hat jetzt den Graviton3 vorgestellt. Im November 2021 war noch nicht klar, ob der Prozessor auf Neoverse N2 (ARMv9) oder V1 (ARMv8) basiert.

Cloudflare hat die ersten Altras von Ampere im Einsatz und berichtete im Juni 2021 begeistert von 57 Prozent mehr Performance per Watt. Auch die Oracle Cloud Infrastructure (OCI) setzt Ampere Altra ein. Auf der SC21 stellte Oracle seine positiven Erfahrungen mit HPC-Anwendungen in der Cloud vor. In der für Kunden wichtigen Metrik Performance per Dollar schlugen sich die Systeme laut Oracle sehr gut: nahezu so schnell wie ein AMD Epyc Milan, aber mit 7 PFlops/Dollar um 34 Prozent günstiger.

Auch in China wird zunehmend auf ARM in der Cloud gesetzt. Im Oktober 2021 hat die Handels- und Kommunikationsplattform Alibaba ihren 128-Kern-ARM Yitian 710 vorgestellt. Ob Alibaba dabei auf Neoverse-Kerne setzt oder auf eigene, ist derzeit unklar. Laut Alibaba soll er im SPEC2017-Benchmark so schnell sein wie zwei aktuelle Intel Xeons mit je 32 Kernen. In der Cloud von Google-Konkurrent Baidu kann man zwar noch keine Neoverse-, aber Instanzen mit Broadcoms Cortex-A72-CPU Stingray wählen.

Auch der größte chinesische Internetkonzern, Tencent, hat nicht weiter beschriebene ARM-Neoverse-Prozessoren im Einsatz und lässt verlauten: "ARM delivers 28 % better performance than traditional architectures and 100 % better power performance."

Und schließlich gibt es ja noch Microsoft und Google. Von Microsoft erwartet man eigene ARM-Prozessoren für die Azure-Cloud. Bislang weiß man allerdings nur, dass Microsoft eine Architekturlizenz für 32 Bit hat – aber nicht alle Lizenznehmer werden veröffentlicht. Intern stehen für die Produktion jedenfalls Instanzen mit Marvell ThunderX2 zur Verfügung. Inwieweit Google für seine riesigen Serverfarmen ARM-Kerne einsetzt, darüber kann man nur spekulieren. In der Google Cloud kann man derzeit lediglich Intel- und AMD-Instanzen wählen. Im Frühjahr 2021 hat Google Uri Frank, Intels Director of Product Development, abgeworben, der in Israel ein Center für eine eigene SoC-Entwicklung aufbauen soll. Hier wird als mögliche Grundlage ARM vermutet – aber Google-Mutter Alphabet ist auch Mitglied bei der RISC-V-Foundation und bei OpenPower.

Mit dem von Fujitsu gebauten Fugaku steht ein System mit dem ARM-Prozessor A64FX seit Mitte des Jahres 2019 an der Spitze der TOP500-Liste der Supercomputer. Hinzu kommen noch ein paar kleinere A64FX-Systeme in Japan sowie auf Platz 393 der ThunderX2-Rechner Astra von HPE am Sandia National Lab. In Europa gibt es ein paar kleinere Installationen mit ThunderX2, etwa Fulham und Isambard in Großbritannien. Aber inoffiziell weiß man, dass China inzwischen weit schnellere Systeme besitzt, diese nur noch nicht gemeldet hat. Spitzenreiter dürfte mit 1,3 Exaflops der Tianhe-3 in Guangzhou sein, der von Phytium-ARM-Prozessoren angetrieben wird, zusammen mit speziellen Beschleunigern Matrix-2000+.

Mit ARM Neoverse V1 (Zeus) wollen im Jahr 2022 zwei bedeutende Teilnehmer im oberen HPC-Segment mitspielen: Rhea von SiPearl und ETRI K-AB21. Rhea ist der Prozessor der Europäischen Prozessor-Initiative (EPI), an der 17 EU-Staaten teilnehmen, die rund eine Milliarde Euro in das Gesamtprojekt EuroHPC stecken. So wie es ausschaut, soll Rhea 72 Neoverse-V1-Kerne haben und eine Schnittstelle zu Intels geplanter Xeon-GPU Ponte Vecchio. ETRI ist das südkoreanische Energy Technology Research Institute, dessen Neoverse-V1-CPU 16 TFlops abliefern soll.

Am Horizont der Neoverse-Linien taucht jedoch bereits Poseidon auf, der – anders als in der griechischen Mythologie – deutlich mächtiger als sein Bruder Zeus sein soll. Mit diesem Design will ARM-Neubesitzer Nvidia Anfang 2023 ganz groß in das CPU-Geschäft im High-Performance-Computing einsteigen: 10-fach höhere Performance und 30-fach höhere aggregierte Speicherbandbreite als aktuelle Serversysteme, das hat Nvidias Chef Jensen Huang auf der Entwicklerkonferenz im Frühjahr 2021 für Grace verkündet. Grace dürfte wohl all die beschriebenen ARMv9-Optionen wie SME, Transactional Memory und CCA anbieten. Mit welcher Vektorbreite SVE aufgebaut sein wird, weiß man noch nicht.

Mit Grace auf Basis der nächsten ARM-Neoverse-Generation Poseidon will Nvidia auch den CPU-Markt im HPC-Bereich aufmischen, natürlich im Zusammenspiel mit einer GPU (rechts).

(Bild: Nvidia)

Bestellungen liegen bereits vor. Das Schweizer nationale Supercomputer-Zentrum SCSC, das viele Jahre lang Europas schnellsten Rechner Piz Daint betrieb, will mit Grace und der nächsten Nvidia-GPU-Generation mit dem kommenden Alps in den Exascale-Bereich. Dank NVLINK-5-Verbindungen soll Grace besonders schnell mit den hauseigenen GPUs kommunizieren können. Daneben hat auch das Los Alamos National Lab bereits einen etwas kleineren Rechner mit Grace und Nvidia-GPUs geplant. Auf der SC21 verriet Steven Poole vom Los Alamos National Lab, dass der Rechner den Namen Vendito tragen und über 100 PFlops Spitzenleistung liefern soll.