zurück zum Artikel

Apple M1 in ARM-Macs: weitere technische Details und erste Benchmarks analysiert

| Christof Windeck

Apple verrät traditionell wenig über seine Prozessorkerne, doch erste Benchmarks und Daten des A14 offenbaren Details des M1.

Apple hat sehr vollmundige Versprechungen zur Leistungsfähigkeit und Effizienz des neuen System-on-Chip M1 verkündet, aber keine gängigen Benchmarks veröffentlicht. Nun sind erste Ergebnisse im Geekbench 5 aufgetaucht, die den M1 bei der Multi-Core-Performance deutlich vor den aktuell schnellsten x86-Mobilprozessoren mit 15 bis 30 Watt TDP zeigen, also Intel Core i7-1185G7 (4 Kerne) und AMD Ryzen 7 Pro 4750U (8 Kerne). Aber auch Erkenntnisse zum Apple A14 aus dem iPhone 12, der eng mit dem M1 verwandt ist, verraten mehr über die M1-Technik.

Laut Apple enthält der M1 acht Rechenkerne [1], eine GPU mit ebenfalls acht Kernen beziehungsweise Shader-Clustern sowie eine Neural Engine mit 16 Kernen für KI- und Machine-Learning-Algorithmen. Die GPU lässt sich ebenfalls als Beschleuniger für manche Rechenaufgaben einspannen.

Im System-on-Chip (SoC) M1 stecken außerdem Controller für I/O-Schnittstellen (Thunderbolt/USB4, PCIe 4.0) sowie Funktionen, die zuvor der separate Sicherheitschip T2 mit eingebautem SSD-Controller erledigte, inklusive einer Secure Enclave (SE). Letztere ist für biometrische Authentifizierung (Face ID, Touch ID) und Bezahlfunktionen wichtig.

Zudem hat der M1 einen RAM-Controller, der bis zu 16 GByte Speicher anbindet, vermutlich mit zwei 64-Bit-Kanälen für LPDDR4 oder LPDDR4X.

Das System-on-Chip Apple M1

(Bild: Apple)

Ein internes "Fabric" verknüpft die einzelnen Funktionsblöcke sowie einen zusätzlichen Cache, der Speicherzugriffe abfängt. Die CPU-Kerne sind in zwei Gruppen aufgeteilt, die jeweils einen eigenen L2-Cache haben. Jeder einzelne CPU-Kern hat wiederum L1-Cache, wie auch bei x86 üblich separat für Befehle (Instructions), abgekürzt L1I, und Daten (L1D).

ARM-Macs: Apples Umstieg auf eigene Prozessoren

Der M1 hat je vier besonders leistungsfähige und besonders effiziente CPU-Kerne. Apple hat es nicht offiziell bestätigt, aber laut Experten lauten die Codenamen für die starken Kerne "Firestorm" und für die effizienteren "Icestorm".

Jeder Firestorm-Kern hat laut Apple 192 KByte L1I-Cache und 128 KByte L1D-Cache. Diese Datenpuffer sind sehr viel größer als etwa bei Intels aktuellen „Tiger Lake“-CPUs [11] (48 KByte L1I/32 KByte L1D) und AMD Zen 2 (je 32 KByte). Allerdings haben die x86-Prozessoren zusätzlich sogenannte Micro-Op-(µOP-)Caches, die besonders effizient arbeiten.

Apples Angaben zu den starken und effizienten ARM-Kernen im M1

(Bild: Apple)

Apples unterschiedliche ARM-Kern-Gruppen können jeweils noch auf einen gemeinsamen L2-Cache zugreifen: Die vier Firestorms auf zusammen 12 MByte, die vier Icestorms auf 4 MByte. Hinzu kommt noch der Fabric-Cache, dessen Kapazität Apple nicht verraten hat und der aus Sicht der CPU-Kerne als L3-Cache dient.

Das "Apple Silicon" A14 Bionic [12] ist sehr ähnlich aufgebaut wie der M1 und hat ebensoviele effiziente Icestorm-Kerne sowie eine Neural Engine mit ebenfalls 16 Kernen. Im A14 sitzen aber nur zwei starke Firestorm-Kerne mit kleinerem L2-Cache (8 MByte) und eine GPU mit 4 statt 8 Kernen. Außerdem takten die Rechenwerke im A14 wohl grundsätzlich niedriger, weil er in iPhones und im iPad Air 4 weniger Abwärme abführen kann und weniger Akkustrom ziehen kann als in den Macs.

Nominelle Taktfrequenzen von A14 und M1 verrät Apple nicht, ebensowenig wie die Thermal Design Power (TDP). Letztere liegt bei Smartphone-SoCs wie dem A14 üblicherweise um 5 Watt, aber schon dabei würde sich ein Smartphone auf Dauer stark erhitzen und ein 11-Wattstunden-Akku (3,7 Volt/3000 mAh) wäre in kaum mehr als 2 Stunden leer. Im Mittel liegt die Leistungsaufnahme des Chips also weitaus niedriger, zumal das Display meistens mehr Energie braucht und auch das Modem Strom schluckt.

Apple verrät die Thermal Design Power des M1 nicht genau, ordnet ihn aber um 10 Watt ein.

(Bild: Apple)

Bei der Vorstellung des M1 hat Apple Vergleiche mit anderen Chips bei 10 Watt angestellt – vermutlich liegt er also zwischen 10 Watt im MacBook Air ohne Lüfter und 15 bis 20 Watt bei Lüfterkühlung. Prozessoren der „U“-Klassen von AMD und Intel haben 15 bis 28 Watt TDP, aber auch hier kommt es entscheidend auf die Qualität des Kühlsystems des jeweiligen Notebook-Herstellers an. Per configurable TDP (cTDP) lassen sich diese Prozessoren in einem weiten Bereich einstellen und liefern dann mehr oder weniger Rechenleistung, weil sie sich bei anhaltender Last rasch heruntertakten müssen. Das gilt auch für den M1, wie Apple bei der Vorstellung erklärte: Im MacBook Pro 13 Zoll mit Lüfter sei seine dauerhafte Rechenleistung (sustained Performance) höher.

Hinweise auf die Taktfrequenzen von A14 und M1 liefern aber Resultate aus der Online-Datenbank des Benchmarks Geekbench 5. Dort ist für einen A14 die Angabe 2,99 GHz [13] zu finden und im M1-Resultat aus einem lüfterlosen MacBook Air ein Wert von 3,2 GHz [14]. In einem MacBook Pro 13 Zoll oder Mac mini mit Lüfter taktet der M1 möglicherweise noch etwas höher.

Diese Taktfrequenzen sind jedoch deutlich niedriger als die Turbo-Frequenzen von Core i7-1185G7 (4,8 GHz) und AMD Ryzen 7 Pro 4750U (4,1 GHz) [15]. Für höhere Taktfrequenzen benötigen sowohl ARM- als auch x86-Kerne höhere Kernspannungen, was mit deutlich höherer Verlustleistung einhergeht. Je „breiter“ Datenpfade ausgelegt sind, also je mehr Rechenwerke und Transistoren mit höherer Spannung und Taktrate laufen, desto stärker wachsen die Verluste beim Hochtakten.

Umso beeindruckender sind die Ergebnisse, die A14 und M1 im Geekbench 5 erzielen. Im Single-Core-Lauf, der sicherlich auf einem starken Firestorm-Kern arbeitet, sind es 1596 (A14) beziehungsweise 1732 Punkte (M1). Der Vorsprung des M1 von 8,5 Prozent beruht weitgehend auf dem höheren Takt, der größere L2-Cache hat keinen großen Einfluss.

Apple M1 und A14 im Geekbench 5
CPU Angaben laut Geekbench-Datenbank Benchmark-Ergebnisse
Gerät Takt Betriebssystem Single-Core Multi-Core
Apple M1 MacBook Air 3,19 GHz macOS 11.0 1732 7545
Apple A14 iPhone 12 Pro 2,99 GHz iOS 14.1 1596 4008
Intel Core i7-1185G7 MSI MS-14C4 4,79 GHz Windows 10 1610 6113
AMD Ryzen 7 Pro 4750U Lenovo ThinkPad T14 4,19 GHz Windows 10 1162 6509
Intel Core i7-1165G7 Dell XPS13 4,70 GHz Linux 5.8 1726 5313

Im Vergleich zu einem Core i7-1185G7 in einem MSI-Notebook [16] liegt der M1 in der Multi-Core-Wertung um 23 Prozent vorne, bei Single-Core ist er 7,5 Prozent schneller. Es gibt aber auch Geekbench-5-Werte eines Core i7-1165G7 unter Linux [17], die ihn in der Single-Core-Performance fast gleichauf zeigen – aber hier ist er bei Multi-Core viel schwächer.

Intels Tiger Lakes wie die genannten Core i7-1185G7 und 1165G7 haben allerdings auch nur je vier Kerne und Simultaneous Multi-Threading (SMT alias Hyper-Threading), während beim M1 alle acht Kerne gleichzeitig arbeiten – schnelle und effiziente gemeinsam. Daher ist ein Vergleich mit dem bisher Multithreading-stärksten 15-Watt-Notebookprozessor spannend, dem AMD Ryzen 7 Pro 4750U mit acht Kernen und SMT, also insgesamt 16 Threads. Doch selbst der liegt im Geekbench 5 Multi-Core um rund 15 Prozent hinter Apples M1 [18] – denn seine Zen-2-Kerne liefern 33 Prozent weniger Single-Core-Performance als ein Apple Firestorm bei 3,2 GHz. Mit dem Ryzen 5000U (Cezanne) mit Zen 3 könnte sich das aber 2021 verschieben.

Mehr von c't Magazin Mehr von c't Magazin [19]

Die zusätzlichen Beschleuniger des M1 sollen sich dank UMA optimal nutzen lassen.

(Bild: Apple)

Apple spricht bei den „Firestorm“-Kernen von „Ultra-Wide Execution Architecture“ und meint damit, dass sie besonders viele parallel arbeitende Rechenwerke enthalten. Laut Analysen der US-Webseite Anandtech [20] hat einer der starken A14-Kerne unter anderem vier Gleitkomma-Einheiten, die zu ARMs SIMD-Einheiten „Neon“ [21] kompatibel sind.

Wenn diese Einschätzung zutrifft, dann ist die Ausstattung des Firestorm mit Recheneinheiten für „Single Instruction, Multiple Data“ (SIMD) vergleichbar mit der aktueller AMD- und Intel-Kerne, die jeweils zwei AVX2-Einheiten haben. Denn letztere verarbeiten jeweils einen 256-Bit- oder zwei 128-Bit-Vektoren in einem Rutsch, während jede der vier Neon-Einheiten eines Firestorm-Kerns einen 128-Bit-Wert schafft. Für Integer- und andere Berechnungen hat Firestorm dann aber mehr Einheiten als die aktuellen x86-Kerne für Notebooks.

Um seine vielen Recheneinheiten auch kontinuierlich auslasten zu können, also um möglichst viel Rechenarbeit pro Taktzyklus zu liefern (Instructions per Cycle, IPC), brauchen die Firestorm-Kerne auch große Caches. Zudem können sie laut Anandtech besonders viele Instruktionen zwischenpuffern, um sie so umzusortieren, dass sie die verfügbaren Rechenwerke ausnutzen – das nennt man ein großes Out-Of-Order-Fenster (OOO-Window).

Apple hat seine starken ARM-Kerne also für die gleichzeitige Verarbeitung möglichst vieler Befehle und Daten pro Takt ausgelegt und schöpft so aus niedrigerer Taktfrequenz mehr Rechenleistung als andere Prozessoren. Aber auch umgekehrt wird ein Schuh daraus: Bei einem dermaßen „breiten“ Rechenkern, der auch viele Datenleitungen und große Caches benötigt, steigt die Leistungsaufnahme bei höherem Takt stark an. Hier müssen die Entwickler einen optimalen Kompromiss finden.

Apple hilft dabei, dass man auch Betriebssystem und Compiler in der eigenen Hand hat: Damit lassen sich die CPU-Rechenwerke optimal ausreizen.

Die effizienteren Icestorm-Kerne sind „schmaler“ gebaut als die Firestorms, haben kleinere Caches und takten niedriger. Es schalten also pro Zyklus weniger Transistoren und die lassen sich auch sparsamer auslegen, weil sie nicht so hoch takten müssen.

Apple betont aber auch, dass man bei A14 und M1 zusätzliche Rechenbeschleuniger optimal einbindet, beispielsweise für KI-Funktionen wie das Skalieren von Fotos. Dabei wiederum sei die Unified Memory Architetcure (UMA) des „Apple Silicon“ hilfreich, weil unterschiedliche Rechenwerke direkt auf gemeinsame Daten zugreifen können, ohne sie zuvor in jeweils eigene RAM-Adressbereiche kopieren zu müssen. Es gibt also eine zentrale Speicherverwaltung, die auch alle Caches der beteiligten Rechenwerke auf dem jeweils aktuellen Stand hält (Cache-Kohärenz).

Diese Konzept ist aber nicht neu, vor einigen Jahren warb etwa AMD dafür als Heterogeneous System Architecture (HSA) [22] und Intel beschreibt derartige Funktionen [23] schon für die 2014 eingeführte, achte Generation der integrierten Grafik (Gen-8-GPU).

Möglicherweise bezieht Apple bei der UMA-Implementierung in A14/M1 aber mehr Rechenwerke ein – etwa die Neural Engine – und sorgt via Compiler und dem „Accelerate Framework“ [24] dafür, dass App-Entwickler sie leichter nutzen können als bei x86-CPUs unter Windows.

Mehr von c't Magazin Mehr von c't Magazin [25]

ARM hat mit dem Cortex-X1 zwar einen angeblich besonders starken Rechenkern [26] angekündigt, der rund 30 Prozent schneller sein soll als der Cortex-A77. Trotzdem ist derzeit kein M1-Konkurrent in Sicht.

Denn der Cortex-A77 steckt in leicht modifizierter Form als Kryo 585 Gold im aktuellen Qualcomm Snapdragon 865 [27]. Dieser wiederum schafft im Geekbench 5 Single-Core nicht einmal 900 Punkte [28]. Der stärkste Kern des Samsung Exynos 990 ist etwa 10 Prozent schneller [29], kommt aber nicht über 1000 Single-Core-Punkte.

Ein Cortex-X1 würde also erst mit etwa 30 Prozent höherer Taktfrequenz als ein Cortex-A77 an Apples Firestorm-Kern herankommen – und steckt noch in keinem ARM-SoC, das man bisher kaufen kann. Mit Samsung Exynos 1080 und MediaTek MT8195 wurden gerade die ersten Chips mit Cortex-A78 angekündigt, von dem der Cortex-X1 als stärkere Variante abgeleitet ist. Somit ist derzeit nicht absehbar, wann ein anderes ARM-SoC mit vergleichbarer Peformance wie Apples M1 erscheinen könnte.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung [30].

(ciw [31])


URL dieses Artikels:
https://www.heise.de/-4958755

Links in diesem Artikel:
[1] https://www.heise.de/news/Apple-praesentiert-ARM-Mac-mit-Achtkernprozessor-4953652.html
[2] https://www.heise.de/hintergrund/Apple-M1-Der-Anfang-von-Intels-Ende-oder-nicht-4958885.html
[3] https://www.heise.de/news/ARM-Macs-Mehr-Details-zum-Apple-M1-4958755.html
[4] https://www.heise.de/news/Kommentar-Der-neue-Mac-zwischen-Altbackenem-und-der-Zukunft-des-Computers-4954675.html
[5] https://www.heise.de/news/ARM-Macs-mit-Thunderbolt-USB-4-Das-USB-Namenschaos-geht-weiter-4958692.html
[6] https://www.heise.de/news/Kein-Thunderbolt-4-keine-neue-Webcam-keine-eGPU-Was-den-ARM-Macs-fehlt-4954109.html
[7] https://www.heise.de/news/Mac-Rechner-mit-ARM-Prozessoren-Wi-Fi-6-und-6K-Unterstuetzung-fuer-alle-4954185.html
[8] https://www.heise.de/news/Apple-praesentiert-ARM-Mac-mit-Achtkernprozessor-4953652.html
[9] https://www.heise.de/news/Eigene-Chips-Apple-wirbt-Intel-Ingenieure-ab-4062889.html
[10] https://www.heise.de/news/Apple-schnappt-ARM-seinen-Lead-CPU-Architect-weg-4456091.html
[11] https://www.heise.de/news/Tiger-Lake-Intel-startet-die-11-Core-i-Generation-4884417.html
[12] https://www.heise.de/news/iPhone-12-Pro-Max-mit-5G-Mobilfunk-und-A14-Prozessor-4926674.html
[13] https://browser.geekbench.com/v5/cpu/4667329
[14] https://browser.geekbench.com/v5/cpu/4661599
[15] https://www.heise.de/news/Mobilprozessoren-AMD-Ryzen-Pro-4000U-SMT-fuer-alle-4716673.html
[16] https://browser.geekbench.com/v5/cpu/3710380
[17] https://browser.geekbench.com/v5/cpu/4306696
[18] https://browser.geekbench.com/v5/cpu/4603562
[19] https://www.heise.de/ct/
[20] https://www.anandtech.com/show/16226/apple-silicon-m1-a14-deep-dive/2
[21] https://www.heise.de/news/Vergleichs-Benchmark-Cinebench-R23-unterstuetzt-ARM-MacBooks-4957396.html
[22] https://www.heise.de/news/AMD-ARM-Co-veroeffentlichen-Heterogeneous-System-Architecture-1-0-2581449.html
[23] https://software.intel.com/en-us/file/compute-architecture-of-intel-processor-graphics-gen8pdf
[24] https://developer.apple.com/documentation/accelerate?language=objc
[25] https://www.heise.de/ct/
[26] https://www.heise.de/news/Mobilprozessoren-ARM-bringt-neue-CPU-und-GPU-Kerne-fuer-High-End-Smartphones-4766260.html
[27] https://www.heise.de/news/Qualcomm-Snapdragon-865-Plus-Erster-Smartphone-Prozessor-knackt-3-GHz-4839372.html
[28] https://browser.geekbench.com/v5/cpu/4665248
[29] https://browser.geekbench.com/v5/cpu/4665599
[30] https://www.heise.de/Datenschutzerklaerung-der-Heise-Medien-GmbH-Co-KG-4860.html
[31] mailto:ciw@ct.de