Intel kündigt die ersten Battlemage-Grafikkarten an

Intel kündigt die beiden ersten Battlemage-Grafikkarten offiziell an: Arc B580 und B570 ab dem 13. Dezember 2024 respektive 16. Januar 2025 im Handel.

101

(Bild: Intel)

03.12.2024, 15:46 Uhr

Lesezeit: 6 Min.

c't Magazin

Von

Carsten Spille

Intels neue Grafikchip-Architektur "Battlemage" debütierte bereits im September. Damals noch als – im Vergleich zu gesteckten Karten – schwachbrüstige integrierte Grafik in den Lunar-Lake-Mobilprozessoren Core Ultra 200V.

Ab dem 13. Dezember kommen die ersten Grafikkarten mit der überarbeiteten Architektur für den PCI-Express-Steckplatz von Desktop-PCs in den Handel. Diese Karten sollen dabei in WQHD-Auflösung mit 2560 × 1440 Pixeln runde 10 Prozent schneller als Nvidias GeForce RTX 4060 sein und auch ihre Vorgänger Arc A750 um ein rundes Viertel abhängen. Eine gewichtige Rolle spielt gerade in der Auflösung oberhalb von Full HD auch der mit 12 GByte 50 Prozent größere Grafikspeicher.

Intel bringt dabei wie schon bei den Vorgängern Alchemist (Arc A-Reihe) von der B580 eine "Limited Edition" genannte, eigene Version mit einer unverbindlichen Preisempfehlung von 249 US-Dollar auf den Markt. Intel konnte uns 10 Tage vor dem Verkaufsstart noch keine Euro-Preise nennen, inklusive Steuern und abzüglich Wechselkurs könnte es aber auf 269 Euro in Deutschland hinauslaufen. Hierzulande soll es auch Karten von Acer, Asrock und Sparkle geben, international sind auch Gunnir, Maxsun und Onix mit von der Partie.

In der Explosionszeichnung sieht man gut, dass auch Intel auf ein kurzes PCB mit viel größerem Kühlkörper setzt.

(Bild: Intel)

Die ab 16. Januar folgende, etwas schwächere B570 mit 10 GByte Grafikspeicher kommt ab 219 US-Dollar (mit Steuern wohl circa 239 Euro) nur von den Partnern in den Handel. Zu ihr gibt Intel noch keine eigene Leistungseinschätzung ab. Anhand der Eckdaten dürfte auch sie es noch über das Niveau der Vorgängergeneration in Form der Arc A750 schaffen, an der RTX 4060 jedoch schwer zu knappsen haben.

Die Arc B580 hat eine Thermal Design Power von 190 Watt, die kleinere B570 kommt mit 150 Watt aus. Dennoch erhalten beide einen klassischen Achtpin-Stromstecker, um die maximal 75 Watt aus dem PCIe-4.0-x8-Anschluss aufzustocken und Lastspitzen abzufangen. Intel gab auf c’t-Nachfrage an, auch an einem der größten Kritikpunkte der Vorgängergeneration, der Leistungsaufnahme im Leerlauf, gearbeitet zu haben. In vielen Fällen sei man in dieser Hinsicht nun konkurrenzfähig, liege bei bestimmten Kombinationen aus hochauflösendem Display und hoher Bildwiederholrate aber noch zurück.

Ab 13. Dezember gibt es die Arc B580-Karten, im Januar 2025 sollten die günstigeren B570-Modelle folgen.

(Bild: Intel)

Leistungsschau

Bisher gibt es nur die Performance-Werte aus Intels Vorabinformationen. Eigene Messwerte von c’t werden zum Verkaufsstart im Heft und auf heise online folgen.

Intel stellt die B580 mit 12 GByte hauptsächlich gegen die Vorgängerin Arc A750, Nvidias GeForce RTX 4060 und AMDs Radeon RX 7600 – allesamt mit nur 8 statt 12 GByte Grafikspeicher. Der größere Speicher und die zum Teil höhere Speichertransferrate befördern die Leistung stärker, je höher die Auflösung. Kein Wunder also, dass Intel die WQHD-Auflösung mit 2560 × 1440 Bildpunkten als Ziel festlegt.

Im Vergleich mit älteren, verbreiteten Grafikkarten wie der GeForce GTX 1060 oder 1660 Super liegt der Neuling natürlich deutlich vorn. Intel nennt Faktor 2,79 gegenüber ersterer und knapp 2 gegenüber der 1660 Super.

Gegenüber der Arc A750 soll die neue B580 im Schnitt um 24 Prozent vorn liegen. Die Bildraten, die Intel angibt, überspannen den Bereich von 48 Bilder pro Sekunde (fps) in Dragons Dogma 2 und The Last of Us Part I bis zu mehreren Hunderten fps in Monster Hunter Rise und League of Legends. In einigen der 47 Spiele muss man dafür aber auf die Hilfe des KI-gestützten Upscalers XeSS zurückgreifen, um flüssige Bildraten zu erzielen wie die 60 fps im Shoooter Robocop Rogue City oder die 81 fps in Starfield. Prozentual reicht die Spanne von einem Gleichstand im CPU-limitierten League of Legends und DOTA 2 bis hin zu 78 Prozent in Fortnite – letzteres wiederum nur unter Zuhilfenahme von XeSS.

Gegenüber einer GeForce RTX 4060 sei man bis zu 43 Prozent flotter in Cyberpunk 2077 unterwegs, ließ Intel in den Vorabinformationen wissen. Andere Spiele wie Control, Diablo IV oder F1 24 seien zwischen einem Viertel und einem Drittel flotter – dort, wo fraglich, aber ohne Angabe, ob Raytracing aktiv oder ausgeschaltet war.

Mit Raytracing dürfte es jedenfalls deutlich enger zugehen, denn Intel sieht den selbst errechneten Performance-pro-Dollar-Vorsprung gegenüber der 4060 von 32 auf 25 Prozent schrumpfen.

Xe2 – mehr Speicher, mehr KI

Der unter dem Codenamen BMG-G21 entwickelte Chip wird bei der taiwanischen Chipschmiede TSMC im bewährten N5-Prozess hergestellt und misst laut Intel 272 mm². Er enthält dabei 19,6 Milliarden Transistoren – beide Kenngrößen liegen trotz der enthaltenen Verbesserungen deutlich unter denen des Vorgängers ACM-G10. Der Grund: Der Vorgänger trug als Arc A770 bis zu 32 Xe-Cores, die B580-GPU hat nur 20 aktive Xe-Cores (18 bei der B570), ist also eine Nummer darunter angesiedelt. Wann ein entsprechender BMG-G10 kommt, ist indes noch offen. Im Unklaren ließ Intel auch, ob die GPU mit Xe-Cores der Vollausbau ist, oder ob eventuell noch eine sechste Renderslice vorhanden sein könnte. Die veröffentlichten Schemata sind indes geduldige Renderbilder, die der realen Einheitenverteilung entsprechen können, aber nicht müssen.

Das funktionale Blockdiagramm des BGM-G21-SoCs zeigt die fünf Render-Slices mit den Xe2-Cores und den Media-Engines.

(Bild: Intel)

Mit neuer Anordnung der Ausführungseinheiten, Umstellung auf ein effizienteres SIMD-Format mit geringerem Anteil an Steuerlogik zugunsten höheren Durchsatzes und anderer Verbesserungen will Intel 70 Prozent mehr Leistung pro Xe-Core herausgeholt haben und die Leistung pro Watt um 50 Prozent erhöht haben.

Neben Verbesserungen an der Architektur der XE-Cores – auch gegenüber den Arc 140V im Core Ultra 200V wurden noch Dinge geändert – unterstützen die Battlemage-GPUs nun auch zusätzliche Daten-Formate in den XMX-Einheiten, die hauptsächlich Matrix-Matrix-Multiplikationen für KI-Anwendungen übernehmen sollen. Bis hinab zu 2-Bit-Integerzahlen (INT2) und dem von Nvidia verbreiteten Tensor-Format TF32 ist alles dabei, was nützlich sein könnte.

Intel hat auch eigene KI-Benchmarks gezeigt, die die Anzahl der Token pro Sekunde in vier verschiedenen augesuchten Large-Language-Models messen. Dort will man unter Verwendung der ONNX-Runtime mit DirectML knapp 40 bis gut 50 Prozent schneller als die Nvidia-Karten sein. Ob diese allerdings auch mit ONNX gemessen wurden oder unter Nvidias hauseigener und oft schnellerer CUDA-Umgebung, bleibt offen.

Intel Arc B580/B570 im Vergleich
	Arc B570	Arc B580	Arc A 750	Arc A 770 LE
Chip	BMG-G21	BMG-G21	ACM-G10	ACM-G10
Herstellung	TSMC N5 (272 mm², 19,6 Mrd. Transistoren)	TSMC N5 (272 mm², 19,6 Mrd. Transistoren)	TSMC N6 (406 mm², 21,7 Mrd. Transistoren)	TSMC N6 (406 mm², 21,7 Mrd. Transistoren)
Render-Slices	5	5	7	8
Xe-/RT-Cores	18/18	20/20	28/28	32/32
Shader-Cores	2304	2560	3584	4096
Durchsatz (KI-TOPS, INT8)	203	233	229	262
Durchsatz (TFLOPS, FP32)	11,5	13,7	14,7	17,2
Chiptakt	2500 MHz	2670 MHz	2050	2100 MHz
Grafikspeicher	10 GByte	12 GByte	8 GByte	16 GByte
Speicherschnitstelle	160 Bit	192 Bit	256 Bit	256 Bit
Speichertransferrate	380 GByte/s	456 GByte/s	512 GByte/s	560 GByte/s
Total Board Power	150 Watt	190 Watt	225 Watt	225 Watt
PCIe	4.0 x8	4.0 x8	4.0 x16	4.0 x16
Displayengine	3 × DP2.1 (UHBR13.5), 1 × HDMI 2.1	3 × DP2.1 (UHBR13.5), 1 × HDMI 2.1	3 × DP2.0 (UHBR10), 1 × HDMI 2.0	3 × DP2.0 (UHBR10), 1 × HDMI 2.0
Videoengine	u.a. AV1, HEVC, VP9, XAVC-H	u.a. AV1, HEVC, VP9, XAVC-H	u.a. AV1, HEVC, VP9	u.a. AV1, HEVC, VP9
Marktstart	16.01.25	13.12.24	12.10.22	12.10.22
UVP (plus Steuern)	219 US-$	249 US-$	k.A.	k.A.