Chipstapel gegen Brechstange
High-End-Prozessoren Ryzen 9 7950X3D und Core i9-13900KS im Vergleich
Im Duell um das Siegertreppchen bei Gaming-CPUs setzen AMD und Intel auf komplett unterschiedliche Konzepte. Wir haben die Spitzenmodelle nicht nur bei 3D-Spielen, sondern auch bei professionellen Anwendungen gegeneinander antreten lassen.
Beim Kampf um die Performancekrone bei Desktop-PC-Prozessoren geht es außer um verkaufte Stückzahlen hauptsächlich ums Prestige. Im Herbst 2022 schickten AMD und Intel ihre neuen CPU-Generationen Ryzen 7000 „Raphael“ und Core i-13000 „Raptor Lake“ ins Rennen. Während AMD mit gleich drei Neuerungen wie Zen-4-Architektur, AM5-Plattform und 5-Nanometer-Fertigung vorlegte, konterte Intel mit mehr Kernen und höherem Takt.
Zum Jahresbeginn folgen nun die neuen Spitzenmodelle Core i9-13900KS Special Edition und Ryzen 9 7950X3D, die vor allem bei PC-Spielen neue Leistungsrekorde holen sollen. Im Vergleich zur bisherigen Top-CPU Core i9-13900K darf die Special Edition als erster x86-Prozessor bis auf 6 GHz hochtakten. Zudem erlaubt der Chiphersteller beim Core i9-13900KS, das schon bisher absurde Power-Limit von dauerhaft 253 Watt mit passendem Mainboard und starkem Kühler auf 320 Watt zu erhöhen.
In die dritte Dimension
AMD wählt einen anderen Weg. Statt höherem Takt verdoppelt AMD beim Ryzen 9 7950X3D und 7900X3D den Level-3-Cache zu den weiter erhältlichen Ryzen 9 7950X und 7900X auf insgesamt 128 MByte. Von diesem größeren Pufferspeicher profitieren Programme mit vielen Speicherzugriffen zugleich auf wenige verschiedene Daten, insbesondere 3D-Spiele. Mit 32 MByte pro CPU Core Die (CCD), den sich jeweils acht Kerne teilen, haben schon die Ryzen 7000X vergleichsweise viel Zwischenspeicher [1]. Die neu hinzugekommenen 64 MByte packt AMD in einen separaten Chip anstatt neuere, größere CCDs zu fertigen. Das verringert die Kosten, denn mit der Größe eines Chips sinkt die Ausbeute. Es erhöht zudem die Flexibilität in der Produktion.
Der Cache sitzt jedoch nicht neben den CCDs und dem I/O-Die auf dem Träger, sondern AMD geht in die dritte Dimension und stapelt ihn als sogenannten 3D V-Cache oben auf eines der beiden CCDs der Ryzen 9 7000X3D. Das hat den Vorteil, dass die Latenzen kurz bleiben. Unsere Messungen bestätigen, dass die Antwortzeit des L3-Cache mit und ohne Stapelspeicher jeweils rund 12 Nanosekunden beträgt.
AMD hat bereits von vornherein die für 3D V-Cache notwendigen, vertikalen Anschlussleitungen aus Kupfer in den CPU Core Dies untergebracht. Durch diese Through-Silicon-Vias (TSV) kommuniziert der Stapelcache mit dem darunterliegenden CCD. An der Kontaktstelle sind die beiden Chips jedoch nicht verlötet, sondern verklebt und die Kupferleitungen liegen direkt aufeinander auf. Der seitliche Abstand zwischen zwei TSVs beträgt im Minimum lediglich neun Mikrometer.
Das Halbleiter-Die mit dem zusätzlichen Cache ist kleiner als das darunter liegende CPU Core Die und deckt lediglich den Bereich des normalen L3-Caches ab und nicht die am Rand sitzenden CPU-Kerne. Aus thermischen und strukturellen Gründen packt AMD deshalb seitlich Blankochips darauf. Damit die CCDs mit und ohne 3D V-Cache auf die gleiche Höhe kommen, schleift AMD das CPU Core Die bei der Fertigung stärker ab.
Ungleiche Kerne
Im Unterschied zu den Achtkernern Ryzen 7 5800X3D und dem kommenden Ryzen 7 7800X3D, bei denen es nur ein CPU Core Die gibt, auf dem der zusätzliche 3D-Cache sitzt, bestehen die Ryzen 9 7000X3D mit 12 und 16 Kernen aus zwei CCDs. Aus Kosten- und Performancegründen hat sich AMD entschieden, bei diesen Prozessoren nur eines der beiden CCDs mit Stapelcache auszurüsten. Denn durch das aufgebrachte Cache-Die verschlechtert sich die Wärmeabgabe. Deshalb limitiert AMD die Leistungsaufnahme bei den Ryzen 7000X3D auch auf 162 Watt (120 Watt TDP) statt 230 Watt (170 Watt TDP) und schränkt außer den maximalen Taktraten auch das Overclocking ein.
Um das Problem abzumildern, gibt es im Ryzen 9 7900X3D und Ryzen 9 7950X3D zwei unterschiedlich schnelle CCDs: Eines, das mit dem Spitzentakt arbeitet und ein zweites mit zusätzlichen 64 MByte L3-Cache. Das Problem fürs Betriebssystem ist es nun, die Anwendungen, speziell 3D-Spiele, den richtigen Kernen zuzuweisen.
Schon seit einigen Jahren kennt der Scheduler von Windows 10 und 11 die Besonderheiten der Ryzen-CPUs, dass diese aus mehreren CPU Core Dies bestehen können. Weil die Kommunikation mit Kernen im anderen CCDs über das I/O-Die wesentlich länger braucht, packt Windows die Threads einer Anwendung möglichst auf die Kerne eines CCDs. Und da nicht alle Kerne den höchsten Turbotakt erreichen, markiert AMD die besten Kerne, denen das Betriebssystem primär Software-Threads zuweist.
Bei den Ryzen 9 7000X3D ist das Ganze noch komplexer, denn der Scheduler muss nun zusätzlich entscheiden, ob maximaler Takt oder aber großer Cache gefordert sind. AMD liefert deshalb einen aktualisierten Chipsatztreiber, der unter anderem einen zusätzlichen Hintergrunddienst installiert. Dieser hilft dem Betriebssystem, 3D-Spiele dem CCD mit dem größeren Cache zuzuweisen. Zusammen mit der in Windows integrierten Xbox Game Bar erkennt er, wenn ein Spiel im Vollbildmodus beziehungsweise im Vordergrund läuft. Zudem tauchen im Geräte-Manager bei einem Ryzen 9 7000X3D zusätzlich der AMD 3D V-Cache Performance Optimizer und das AMD PPM Provisioning File auf.
Einstellungsmarathon
Damit die Ryzen-Prozessoren mit dem zusätzlichen Cache rund laufen, gibt es von AMD einen Katalog an Dingen, die zu beachten sind. An erster Stelle stehen ein aktuelles BIOS fürs Mainboard sowie ein installierter AMD-Chipsatz-Treiber ab Version 5.01.03.005. Damit die Erkennung korrekt funktioniert, muss zudem in den Systemeinstellungen von Windows der Spielemodus aktiviert sein. Des Weiteren sollen Anwender laut AMD die Xbox Game Bar App über den Microsoft Store aktualisieren und sie selbstredend auch nicht deaktivieren.
Beim im April erscheinenden Ryzen 7 7800X3D dürfte ein Teil oder gar alles davon entfallen. Denn dieser Prozessor hat nur acht Kerne und besteht deshalb nur aus einem einzelnen CCD mit 3D V-Cache.
In der Praxis führt das Software- und Treiberkonglomerat dazu, dass bei 3D-Spielen nur das CCD mit 3D V-Cache aktiv ist und alle anderen acht CPU-Kerne sich per Core-Parking-Funktion abschalten, selbst wenn Spiele mehr als 16 Threads ausreizen. Der Task-Manager von Windows 11 bestätigte uns das. Laufen weitere Anwendungen, sodass insgesamt mehr als acht Kerne ausgelastet sind oder wechselt man zu einer anderen Anwendung, nutzt der Scheduler wieder alle 16 Kerne des Ryzen 9 7950X3D.
Intel ändert beim Core i9-13900KS Special Edition im Unterschied zu AMD nichts am Silizium, sondern dreht die Taktschraube einfach noch etwas weiter als beim Core i9-13900K [2]. Statt 5,8 GHz darf er mit bis 6 GHz laufen. Allerdings gilt das nur für Last auf maximal zwei Kernen und solange die CPU-Temperatur unter 70 Grad Celsius bleibt. Ist beides nicht erfüllt, bleibt es wie beim Core i9-13900K bei 5,4 GHz. Den Nominaltakt hat Intel beim Core i9-13900KS ebenfalls um 200 MHz auf 3,2 GHz für die acht P- und 2,4 GHz für die 16 E-Cores erhöht.
Damit das klappt, steigt die Processor Base Power von 125 auf 150 Watt. Allerdings handelt es sich dabei nur um eine theoretische Größe, denn der Core i9-13900KS darf dauerhaft 253 Watt verheizen. Mit Intels Segen dürfen Nutzer auf ausgewählten Z690- und Z790-Mainboards mit leistungsfähigen Wandlerschaltungen die Power Limits im Extreme-Power-Delivery-Modus auf 320 Watt und den Maximalstrom von 307 auf 400 Ampere erhöhen. Um die Hitze abzuführen, haben wir auf die CPU die Wasserkühlung Arctic Liquid Freezer II 420 mit drei 14-Zentimeter-Lüftern gebaut. Dennoch erreichte die CPU unter Volllast innerhalb weniger Sekunden ihre Drosseltemperatur von 100 Grad Celsius.
Takt gegen Cache
Im Duell der beiden Spitzen-CPUs Core i9-13900KS und Ryzen 9 7950X3D gibt es wie schon bei den Vorgängern Core i9-13900K gegen Ryzen 9 7950X, zumindest was Anwendungen betrifft, keinen klaren Sieger. Mit bis zu 6 GHz Takt holt sich Intel die Krone bei der Singlethreading-Leistung und kommt auf sehr gute 2324 Punkte im Rendering-Benchmark Cinebench R23. In dieser Disziplin rechnet er rund 13 Prozent schneller als die AMD-Konkurrenz.
Bei Software, die viele Threads nutzt, liegt mal der eine, mal der andere der High-End-Prozessoren vorne. Im Cinebench R23 knackt der Core i9-13900KS mit 320 Watt Power Limit die 40.000-Punkte-Marke. Mit den standardmäßigen 253 Watt schmilzt der Vorsprung auf den Ryzen 9 7950X ohne 3D-Cache von 5 auf 1,7 Prozent zusammen. Intel-Domäne ist das Rekodieren von Videos mit Handbrake, was der 13900KS 26 Prozent schneller erledigt als der 7950X3D.
Dem Ryzen mit 3D-Cache liegen vor allem wissenschaftliche Anwendungen mit großen Datenmengen und vielen Speicherzugriffen. In SRMP (Surface-Related Multiples Prediction) wertet er seismische Daten zehn Prozent schneller aus. Die Benchmark-Suite Rodinia Life Science absolviert er 37 Prozent flotter, die unter anderem Bilddaten eines schlagenden Herzens analysiert sowie thermische Hotspots bei Prozessoren und Partikelbewegungen simuliert. Nur geringe Unterschiede gibt es beim Kompilieren des Linux-Kernels mit Kcbench und dem Dateienkomprimieren mit 7-Zip.
Paradisziplin des jüngsten Ryzen-Sprosses sind aber 3D-Spiele. Dort lässt er bei Full-HD-Auflösung (1920 × 1080 Pixel) sämtliche Desktopprozessoren hinter sich. Intels 6-GHz-Monster muss sich je nach Titel mit einem Rückstand 15 bis 25 Prozent geschlagen geben. Die alte Weisheit, dass Spiele eher von wenigen, aber sehr schnellen CPU-Kernen profitieren, ist zwar damit nicht hinfällig. Aber statt Gigahertz zählen MByte beim L3-Cache einfach mehr.
Bei 4K-Auflösung (3840 × 2160 Pixel) bestimmt jedoch meist die Grafikkarte und nicht der Prozessor die Bildrate. In Szenen mit vielen Physikeffekten limitiert aber weiter die CPU. Bei Horizon Zero Dawn erreichen der Ryzen 7 5800X und Ryzen 9 7950X3D mit einer GeForce RTX 4090 beispielsweise im Schnitt 149 beziehungsweise 160 fps. Das 1-Prozent-Perzentil der langsamsten Einzelbilder liegt mit 103 zu 119 fps aber wesentlich weiter auseinander.
AMD versus AMD
Im direkten Vergleich des Ryzen 9 7950X3D mit dem 7950X hängt es ebenfalls von den Anforderungen der Software ab, wer als Sieger die Arena verlässt. Software wie der Rendering-Benchmark Cinebench R23, der wenig auf den Speicher zugreift, aber viele Kerne auslastet, läuft auf dem Ryzen 9 7950X3D sogar um sechs Prozent langsamer. Das liegt daran, dass der 16-Kerner mit Zusatzcache ein geringeres Power-Limit hat und deshalb nicht so hoch taktet.
Bei 3D-Spielen trumpft der große L3-Cache dagegen mit seinen Stärken auf: Im Schnitt liegt die Bildrate bei Full-HD-Auflösung um 15 Prozent höher, bei F1 22 sind es sogar 34 Prozent. Bei Anwendungen nähern sich Ryzen 9 7950X3D und 7950X an. Durch den zusätzlichen Cache rechnen Profianwendungen der Rodinia-Life-Science-Suite und SRMP rund 10 Prozent schneller. Beim Kompilieren, Video rekodieren und Dateien komprimieren schrumpft der Bonus durch den großen Cache auf null bis zwei Prozent zusammen.
Beim älteren Ryzen 7 5800X3D mit 3D V-Cache ist die Performancedifferenz zum normalen 5800X bei Anwendungen wesentlich größer. Vermutlich liegt das schlicht am Sättigungseffekt. Der Sprung von 32 auf 96 MByte L3-Cache bei den Ryzen 5000er ist relativ betrachtet größer als von 64 auf 128 MByte bei den 7000ern. Die 340 Euro teure Zen-3-CPU macht trotz der älteren Architektur bei 3D-Spielen noch immer eine gute Figur und kann mit den aktuellen Prozessoren mithalten.
Zum Vergleich haben wir außerdem bezahlbare CPUs wie den Achtkerner Ryzen 7 7700X und den 14-Kerner Core i5-13500 für 350 beziehungsweise 265 Euro in den Vergleich genommen, die in wesentlich mehr Gaming-PCs stecken werden als die über 750 Euro teuren High-End-Chips. Diese fallen bei Multithreading-Anwendungen klar zurück. Für Gamer empfiehlt sich in diesem Preissegment eher der Ryzen 7 7700X, während Office-Anwender mit dem Core i5-13500 besser bedient sind.
Die Effizienzwertung im Spitzenduell kann der Ryzen 9 7950X3D dank des geringeren Power-Limits von 162 Watt klar für sich entscheiden. Mit 186 Cinebench-Punkten pro Watt Gesamtleistungsaufnahme des Systems hängt er nicht nur den Core i9-13900KS klar ab, sondern auch alle anderen CPUs im Test. Egal, ob AMD oder Intel, oberhalb von 150 Watt arbeiten moderne Prozessoren sehr ineffizient. Für ein wenig mehr an Performance muss man überproportional viel Energie in den Chip pumpen. Das demonstriert Intel sehr schön, wenn man die Effizienz bei 253 und 320 Watt vergleicht: Für die dreieinhalb Prozentpünktchen Performancegewinn im Cinebench R23 schluckt der Rechner gleich 62 Watt beziehungsweise 17 Prozent mehr Strom.
Fazit
Den Titel der schnellsten Gaming-CPU holt sich der Ryzen 9 7950X3D dank des zusätzlichen Cache mit großem Abstand auf den Core i9-13900KS und Ryzen 9 7950X. Statt stumpf die Leistungsaufnahme hochzudrehen, hat AMD mit 3D V-Cache einen smarten Weg gewählt, um die Performance zu steigern. Dadurch arbeitet der Ryzen 9 7950X3D mit niedriger TDP effizienter als die anderen High-End-CPUs, muss aber bei einzelnen Anwendungen zurückstecken. In dieser Disziplin kann Intel mit den hohen Taktfrequenzen vorlegen.
Wer keine 750 Euro für einen Prozessor ausgeben will, sollte für einen neuen Gaming-PC noch bis April warten, wenn der günstigere Achtkerner Ryzen 7 7800X3D in den Handel kommt. Wer schon einen AM4-Rechner sein Eigen nennt, kann das System mit dem derzeit recht günstigen Ryzen 7 5800X3D aufrüsten. Bei Spielen überholt er viele modernere CPUs. (chh@ct.de)