Intel Xe-Grafik: Gaming-Version, Raytracing und Fertigung auĂźer Haus
Intel hat seine kommende Xe-Grafikarchitektur mit Details unterfüttert: Raytracing soll an Bord sein, dazu hohe Taktraten und zusätzliche Ausführungseinheiten.
Mit der neuen Grafikarchitektur Xe, die als integrierte Prozessorgrafik mit den Tiger-Lake-Prozessoren debütieren soll, hat Intel große Pläne. Unter anderem soll sie vom Low-Power-Chip bis zum Rechenzentrum skalieren. Dafür mussten die Ingenieure an Xe einiges umbauen. Details dazu hat Intel nun auf dem Architecture-Day vorgelegt – und dabei gleich noch eine neue, außer Haus gefertigte Gaming-Variante und Raytracing-Support in Hardware angekündigt. Die ersten Karten sollen 2021 kommen.
Von der IGP bis zum Rechenzentrum
Mit vier Xe-Varianten will Intel den kompletten Markt von der integrierten Grafik bis zum Exascale-Beschleuniger fĂĽr Supercomputer abdecken. Den Xe-Einstieg gibt es bei der integrierten Tiger-Lake-Grafik mit der Variante Xe LP, darĂĽber kommt die neu angekĂĽndigte HPG-Version zum Einsatz, die ĂĽber Mid-Range bis zur High-End-Grafik reicht.
FĂĽr KI-Anwendungen im Rechenzentrum ist dann Xe HP gedacht und ganz oben im Portfolio ĂĽbernimmt die HPC-Version, die als Ponte Vecchio den Exaflops-Supercomputer Aurora befeuern soll. Mehr als nur denkbar ist, dass jede Version neben spezieller Anpassungen auf Transistorebene auch Spezialfunktionen wie Tensor-Kerne, hohen FP64-Durchsatz fĂĽr Supercomputer oder eben Raytracing-Hardware fĂĽr Gamer bietet.
Den Anfang macht Xe LP, der als energieeffiziente Version für die integrierte Grafik und Einsteiger-Grafikkarten DG1 sowie die Server-Chips SG1 gedacht ist. Gegenüber heutiger integrierte Grafik soll Xe LP mit 96 Ausführungseinheiten und 1536 Gleitkommaoperationen pro Takt schon auf dem Papier gehörig zulegen – hinzu kommen Verbesserungen durch Änderungen an der Architektur, etwa den schnelleren Caches oder schlicht der Optimierung für höhere Taktraten.
Ein wenig aussagekräftiges Diagramm, welches Intel zeigte, deutet Frequenzen von 1,8 GHz für Xe LP an - allerdings bei höherer Spannung gegenüber der aktuellen Gen11-Grafik in Ice-Lake-Prozessoren, die nur rund 1,1 GHz schaffen. Daher ist fraglich, ob solch hohe Takte auch bei integrierter Grafik oder nicht doch eher bei den dedizierten Grafikchips DG1 und SG1 zu finden sein werden.
High Performance Gamer aushäusig
Die neu angekündigte Variante "Xe HPG" soll das Beste von LP, HP und HPC vereinen: Die Effizienz bei Rechenaufgaben von HPC, die Skalierbarkeit der HP-Variante und die Grafikeffizienz von Xe LP. Hinzu kommt – erstmals von Intel bestätigt – Hardware-Unterstützung für Raytracing über die etwas krude Formulierung "With Hardware Dedicated Raytracing". Viel mehr war dazu noch nicht zu erfahren, außer der Ankündigung, gerade diese Variante mit externer Prozesstechnik, also bei einem Chipauftragsfertiger wie TSMC oder Samsung, herzustellen. Dass Intel diesen Schritt aufgrund weiterer Verzögerungen bei der eigenen 7-Nanometer-Technik gehen muss, hatte die Firma während der Bekanntgabe der Quartalszahlen einräumen müssen.
360 Hz, 8K-Video und AV1-Decoder
Ebenfalls komplett überarbeitet hat Intel die Media Engine von Xe LP, also die Display Controller und Video-Einheit. Künftig unterstützt die Grafik über DisplayPort 1.4 und HDMI 2.0 eine Auflösung von bis zu 8K, also 8192 × 4096 Pixel. Maximal sollen Displays mit 360 Hz und Adaptive Sync unterstützt werden. Xe LP entlastet den Prozessor bei der Videowiedergabe von 8K-Inhalten mit 60 Bildern pro Sekunde. Erstmals ist auch ein Hardware-Decoder für den lizenzfreien AV1-Codec mit an Bord, dessen Einsatz bei den meisten großen Streamingdiensten als gesetzt gilt.
Bei der Data-Center-Variante Xe HP setzt Intel auch auf eine möglichst hohe Transcoding-Leistung – nach eigenen Angaben mit einer Qualität, die mit Offline-Transcoder die auf der CPU laufen vergleichbar ist. In einer Demo zeigte man erstes Xe-Silizum, welches 10 4K60-HEVC-Streams parallel in Echtzeit kodierte.
Xe-Skalierung per Kachel
Eine Demo der Skalierbarkeit der Xe-HP-Architektur zeigte eine einzelne Tile einer "Intel XeHP HD Graphics NEO", die unter Linux (ohne genauere Distributionsangabe) rund 10,6 TFlops FP32-Rechendurchsatz erreichte, also 10,6 Billionen Gleitkommarechenschritte pro Sekunde. Das ist in etwa das Performance-Niveau einer schnellen Radeon RX 5700 XT. Dann schalteten die Intel-Ingenieure zwei und schlieĂźlich vier Tiles, also Chip-Instanzen hinzu, und erreichten in dem synthetischen Benchmark eine nahezu perfekte Skalierung der Rechenleistung. Die Kunst ist freilich, dies auch bei komplexeren Berechnungen oder bei echter Grafiklast hinzubekommen.
Der Xe-HP-Chip lief dabei mit 1,3 GHz und hatte laut mitlaufendem Log 2048 Compute Units – höchstwahrscheinlich also 4096 FP32-FMA pro Takt.
(csp)