Intel kündigt die ersten Battlemage-Grafikkarten an
Intel kündigt die beiden ersten Battlemage-Grafikkarten offiziell an: Arc B580 und B570 ab dem 13. Dezember 2024 respektive 16. Januar 2025 im Handel.
Intels neue Grafikchip-Architektur "Battlemage" debütierte bereits im September. Damals noch als – im Vergleich zu gesteckten Karten – schwachbrüstige integrierte Grafik in den Lunar-Lake-Mobilprozessoren Core Ultra 200V.
Ab dem 13. Dezember kommen die ersten Grafikkarten mit der überarbeiteten Architektur für den PCI-Express-Steckplatz von Desktop-PCs in den Handel. Diese Karten sollen dabei in WQHD-Auflösung mit 2560 × 1440 Pixeln runde 10 Prozent schneller als Nvidias GeForce RTX 4060 sein und auch ihre Vorgänger Arc A750 um ein rundes Viertel abhängen. Eine gewichtige Rolle spielt gerade in der Auflösung oberhalb von Full HD auch der mit 12 GByte 50 Prozent größere Grafikspeicher.
Intel bringt dabei wie schon bei den Vorgängern Alchemist (Arc A-Reihe) von der B580 eine "Limited Edition" genannte, eigene Version mit einer unverbindlichen Preisempfehlung von 249 US-Dollar auf den Markt. Intel konnte uns 10 Tage vor dem Verkaufsstart noch keine Euro-Preise nennen, inklusive Steuern und abzüglich Wechselkurs könnte es aber auf 269 Euro in Deutschland hinauslaufen. Hierzulande soll es auch Karten von Acer, Asrock und Sparkle geben, international sind auch Gunnir, Maxsun und Onix mit von der Partie.
Die ab 16. Januar folgende, etwas schwächere B570 mit 10 GByte Grafikspeicher kommt ab 219 US-Dollar (mit Steuern wohl circa 239 Euro) nur von den Partnern in den Handel. Zu ihr gibt Intel noch keine eigene Leistungseinschätzung ab. Anhand der Eckdaten dürfte auch sie es noch über das Niveau der Vorgängergeneration in Form der Arc A750 schaffen, an der RTX 4060 jedoch schwer zu knappsen haben.
Die Arc B580 hat eine Thermal Design Power von 190 Watt, die kleinere B570 kommt mit 150 Watt aus. Dennoch erhalten beide einen klassischen Achtpin-Stromstecker, um die maximal 75 Watt aus dem PCIe-4.0-x8-Anschluss aufzustocken und Lastspitzen abzufangen. Intel gab auf c’t-Nachfrage an, auch an einem der größten Kritikpunkte der Vorgängergeneration, der Leistungsaufnahme im Leerlauf, gearbeitet zu haben. In vielen Fällen sei man in dieser Hinsicht nun konkurrenzfähig, liege bei bestimmten Kombinationen aus hochauflösendem Display und hoher Bildwiederholrate aber noch zurück.
Leistungsschau
Bisher gibt es nur die Performance-Werte aus Intels Vorabinformationen. Eigene Messwerte von c’t werden zum Verkaufsstart im Heft und auf heise online folgen.
Intel stellt die B580 mit 12 GByte hauptsächlich gegen die Vorgängerin Arc A750, Nvidias GeForce RTX 4060 und AMDs Radeon RX 7600 – allesamt mit nur 8 statt 12 GByte Grafikspeicher. Der größere Speicher und die zum Teil höhere Speichertransferrate befördern die Leistung stärker, je höher die Auflösung. Kein Wunder also, dass Intel die WQHD-Auflösung mit 2560 × 1440 Bildpunkten als Ziel festlegt.
Im Vergleich mit älteren, verbreiteten Grafikkarten wie der GeForce GTX 1060 oder 1660 Super liegt der Neuling natürlich deutlich vorn. Intel nennt Faktor 2,79 gegenüber ersterer und knapp 2 gegenüber der 1660 Super.
Gegenüber der Arc A750 soll die neue B580 im Schnitt um 24 Prozent vorn liegen. Die Bildraten, die Intel angibt, überspannen den Bereich von 48 Bilder pro Sekunde (fps) in Dragons Dogma 2 und The Last of Us Part I bis zu mehreren Hunderten fps in Monster Hunter Rise und League of Legends. In einigen der 47 Spiele muss man dafür aber auf die Hilfe des KI-gestützten Upscalers XeSS zurückgreifen, um flüssige Bildraten zu erzielen wie die 60 fps im Shoooter Robocop Rogue City oder die 81 fps in Starfield. Prozentual reicht die Spanne von einem Gleichstand im CPU-limitierten League of Legends und DOTA 2 bis hin zu 78 Prozent in Fortnite – letzteres wiederum nur unter Zuhilfenahme von XeSS.
Gegenüber einer GeForce RTX 4060 sei man bis zu 43 Prozent flotter in Cyberpunk 2077 unterwegs, ließ Intel in den Vorabinformationen wissen. Andere Spiele wie Control, Diablo IV oder F1 24 seien zwischen einem Viertel und einem Drittel flotter – dort, wo fraglich, aber ohne Angabe, ob Raytracing aktiv oder ausgeschaltet war.
Mit Raytracing dürfte es jedenfalls deutlich enger zugehen, denn Intel sieht den selbst errechneten Performance-pro-Dollar-Vorsprung gegenüber der 4060 von 32 auf 25 Prozent schrumpfen.
Xe2 – mehr Speicher, mehr KI
Der unter dem Codenamen BMG-G21 entwickelte Chip wird bei der taiwanischen Chipschmiede TSMC im bewährten N5-Prozess hergestellt und misst laut Intel 272 mm². Er enthält dabei 19,6 Milliarden Transistoren – beide Kenngrößen liegen trotz der enthaltenen Verbesserungen deutlich unter denen des Vorgängers ACM-G10. Der Grund: Der Vorgänger trug als Arc A770 bis zu 32 Xe-Cores, die B580-GPU hat nur 20 aktive Xe-Cores (18 bei der B570), ist also eine Nummer darunter angesiedelt. Wann ein entsprechender BMG-G10 kommt, ist indes noch offen. Im Unklaren ließ Intel auch, ob die GPU mit Xe-Cores der Vollausbau ist, oder ob eventuell noch eine sechste Renderslice vorhanden sein könnte. Die veröffentlichten Schemata sind indes geduldige Renderbilder, die der realen Einheitenverteilung entsprechen können, aber nicht müssen.
Mit neuer Anordnung der Ausführungseinheiten, Umstellung auf ein effizienteres SIMD-Format mit geringerem Anteil an Steuerlogik zugunsten höheren Durchsatzes und anderer Verbesserungen will Intel 70 Prozent mehr Leistung pro Xe-Core herausgeholt haben und die Leistung pro Watt um 50 Prozent erhöht haben.
Neben Verbesserungen an der Architektur der XE-Cores – auch gegenüber den Arc 140V im Core Ultra 200V wurden noch Dinge geändert – unterstützen die Battlemage-GPUs nun auch zusätzliche Daten-Formate in den XMX-Einheiten, die hauptsächlich Matrix-Matrix-Multiplikationen für KI-Anwendungen übernehmen sollen. Bis hinab zu 2-Bit-Integerzahlen (INT2) und dem von Nvidia verbreiteten Tensor-Format TF32 ist alles dabei, was nützlich sein könnte.
Intel hat auch eigene KI-Benchmarks gezeigt, die die Anzahl der Token pro Sekunde in vier verschiedenen augesuchten Large-Language-Models messen. Dort will man unter Verwendung der ONNX-Runtime mit DirectML knapp 40 bis gut 50 Prozent schneller als die Nvidia-Karten sein. Ob diese allerdings auch mit ONNX gemessen wurden oder unter Nvidias hauseigener und oft schnellerer CUDA-Umgebung, bleibt offen.
Intel Arc B580/B570 im Vergleich | ||||
Arc B570 | Arc B580 | Arc A 750 | Arc A 770 LE | |
Chip | BMG-G21 | BMG-G21 | ACM-G10 | ACM-G10 |
Herstellung | TSMC N5 (272 mm², 19,6 Mrd. Transistoren) | TSMC N5 (272 mm², 19,6 Mrd. Transistoren) | TSMC N6 (406 mm², 21,7 Mrd. Transistoren) | TSMC N6 (406 mm², 21,7 Mrd. Transistoren) |
Render-Slices | 5 | 5 | 7 | 8 |
Xe-/RT-Cores | 18/18 | 20/20 | 28/28 | 32/32 |
Shader-Cores | 2304 | 2560 | 3584 | 4096 |
Durchsatz (KI-TOPS, INT8) | 203 | 233 | 229 | 262 |
Durchsatz (TFLOPS, FP32) | 11,5 | 13,7 | 14,7 | 17,2 |
Chiptakt | 2500 MHz | 2670 MHz | 2050 | 2100 MHz |
Grafikspeicher | 10 GByte | 12 GByte | 8 GByte | 16 GByte |
Speicherschnitstelle | 160 Bit | 192 Bit | 256 Bit | 256 Bit |
Speichertransferrate | 380 GByte/s | 456 GByte/s | 512 GByte/s | 560 GByte/s |
Total Board Power | 150 Watt | 190 Watt | 225 Watt | 225 Watt |
PCIe | 4.0 x8 | 4.0 x8 | 4.0 x16 | 4.0 x16 |
Displayengine | 3 × DP2.1 (UHBR13.5), 1 × HDMI 2.1 | 3 × DP2.1 (UHBR13.5), 1 × HDMI 2.1 | 3 × DP2.0 (UHBR10), 1 × HDMI 2.0 | 3 × DP2.0 (UHBR10), 1 × HDMI 2.0 |
Videoengine | u.a. AV1, HEVC, VP9, XAVC-H | u.a. AV1, HEVC, VP9, XAVC-H | u.a. AV1, HEVC, VP9 | u.a. AV1, HEVC, VP9 |
Marktstart | 16.01.25 | 13.12.24 | 12.10.22 | 12.10.22 |
UVP (plus Steuern) | 219 US-$ | 249 US-$ | k.A. | k.A. |
(csp)