NachzĂĽgler
Während AMD schon das Geld zählt, ist Nvidia noch am Präsentieren: Fast ein halbes Jahr ist AMD schon mit DirectX-11-Grafikkarten am Markt und Nvidia enthüllt erst jetzt die Architektur des GF100-Grafikchips. Und noch immer erzählen die Nachzügler nur die halbe Geschichte.
Der Rahmen war großartig: Im berühmtem MGM Grand Hotel in Las Vegas gab Nvidia Mitte Januar endlich spannende Details zur Architektur des lang erwarteten DirectX-11-Grafikchips GF100 aka Fermi preis. Konkurrent AMD setzte seit September 2009 schon über zwei Millionen DirectX-11-kompatible Grafikchips vom Typ RV870 [1] ab und hat bis März seine HD-5000er-Serie komplettiert [2] – gerade dann, wenn Nvidia erstmals hoffentlich fertige Produkte zeigen kann. Die Spieler erwarten vor allem einen kräftigen Leistungsgewinn. Nvidia verspricht diesen natürlich, nur mit Belegen hält sich die Firma auch jetzt noch zurück.
GrundriĂź
(Bild:Â Nvidia)
Der modular aufgebaute GF100-Grafikchip besteht aus rund drei Milliarden Transistoren und wird vom taiwanischen Halbleiterfertiger TSMC im 40-Nanometer-Verfahren hergestellt. Er umfasst im Vollausbau insgesamt vier sogenannte Graphics Processing Clusters (GPC), die jeweils über eine eigene Raster-Engine verfügen und vier Streaming Multiprocessors (SM) enthalten. Jede der 16 SMs beherbergt 32 Shader-Einheiten, die Nvidia als CUDA-Kerne bezeichnet. Insgesamt besitzt der GF100-Chip, zumindest im höchsten Ausbau, also 512 solcher Kerne – der aktuelle GT200b-Chip kommt auf maximal 240.
Die SMs verfügen über jeweils einen eigenen 64 KByte großen, konfigurierbaren Zwischenspeicher (Shared Memory/L1-Cache) und teilen sich einen 768 KByte fassenden L2-Cache, auf den alle Einheiten lesend und schreibend zugreifen können. Beim GT200b war lediglich das Auslesen von Texturdaten aus einem 256 KByte großen L2-Cache möglich. Pro GF100-SM sorgen 16 Load/Store-Einheiten für den Transfer der Daten zwischen den Rechenkernen und den Caches.
(Bild:Â Nvidia)
Sechs 64-Bit-Speichercontroller binden den Grafikchip über 384 Datenleitungen an die GDDR5-Speicherbausteine an, die beim High-End-Modell insgesamt wohl 1536 MByte an Daten fassen. Läuft der Speicher also beispielsweise mit einer Taktfrequenz von 2000 MHz, ergibt das eine Speicherbandbreite von 192 GByte/s. Zum Vergleich: AMD koppelt GDDR5-Speicher und Grafikchip auf der Radeon HD 5870 mit 256 Leitungen und erreicht bei 2400 MHz lediglich knapp 154 GByte/s. Bei der Datentransferrate, die für die 3D-Leistung besonders bei hohen Auflösungen in Verbindung mit Antialiasing wichtig ist, liegt Nvidia demnächst also vorn.
Textureinheiten
(Bild:Â Nvidia)
An jedem der 16 SMs ist ein Cluster mit vier Textureinheiten (TMUs) angedockt, die nun effizienter arbeiten sollen und unter anderem auch spezielle DirectX-11-Texturkompressionsformate und sogenannte „Gather4“-Operationen unterstützen. Insgesamt verfügt der GF100 also über lediglich 64 TMUs. Dies scheint für einen Chip, mit dem Nvidia die Leistungskrone zurückholen will, auf den ersten Blick zu wenig, besaß doch der GT200b einer GeForce GTX 285 bereits 80 TMUs. Neben dem größeren L2-Cache spielt jedoch auch die Taktfrequenz eine Rolle. Liefen die 80 TMUs einer GeForce GTX 285 mit 648 MHz (Graphics Clock, wie auch die Rasterendstufen/ROPs), will Nvidia die Textureinheiten des GF100 schneller ansteuern, nämlich mit der Hälfte der Taktfrequenz der Shader-Rechenkerne. Diese Shader-Kernfrequenz (Hotclock) betrug beim GT200b 1476 MHz (GeForce GTX 285), beim GF100 dürfte sie sich in ähnlichen Regionen bewegen. Insgesamt soll die Leistung der 64 GF100-Textureinheiten bis zu 60 Prozent höher sein als die der 80 GT200-TMUs.
Kantenglättung
Die unter anderem für die Kantenglättung (Antialiasing/AA) wichtigen Rasterendstufen dürften jedoch weiterhin mit der langsameren Graphics Clock laufen, im GF100-Grafikchip sind derer 48 vorhanden (GeForce GTX 285: 32, Radeon HD 5870: 32), unterteilt in insgesamt sechs ROP-Partitionen. Die Kantenglättungsleistung will Nvidia deutlich verbessert haben, besonders beim achtfachen Antialiasing soll die Bildrate nicht mehr so drastisch einbrechen wie noch beim GT200b-Chip. So sei der GF100 bei achtfacher Kantenglättung um den Faktor 2,3 schneller als der GT200b einer GeForce GTX 285. Zudem unterstützt die GF100-GPU nun auch 32x Coverage Sampling Antialiasing [3], das acht Farb- und 24 Coverage-Samples zur Kantenglättung auswertet, und bietet zusätzlich verbessertes Transparenz-Multisampling, das nun auch die Coverage-Samples zum Glätten von Alpha-Test-Texturen heranzieht.
Tessellation-Turbo
(Bild:Â Nvidia)
Um den Anforderungen von DirectX 11 gerecht zu werden, müssen Grafikchips auch Hardware-Tessellation unterstützen, durch das sich geometrische Details von Polygonmodellen verfeinern lassen. Beim GF100-Chip beinhaltet jeder Streaming Multiprocessor eine eigene Tessellation-Engine (PolyMorph Engine). Da die 16 Tessellation-Engines geometrische Daten parallel bearbeiten, soll die Tessellation-Leistung der GF100-GPU bis zu sechsmal höher sein als die des RV870-Chips der AMD-Konkurrenzkarte Radeon HD 5870, der auf lediglich eine Tessellator-Einheit setzt. Diese Behauptungen stützt Nvidia jedoch auf speziell für den GF100-Chip selektierte Geometrie-Benchmarks. Wie hoch die tatsächliche Spieleleistung der GF100-Grafikkarte im Vergleich zu den derzeitigen AMD-Spitzenmodellen sein wird, steht weiterhin in den Sternen. Für in diesem Jahr erscheinende DirectX-11-Spiele dürfte zumindest die angenommene höhere Tessellation-Leistung des GF100 im Vergleich zum RV870 keine größere Bedeutung haben, da auch die AMD-Spitzenkarten problemlos mit den in aktuellen und kommenden Spielen implementierten Tessellation-Stufen zurechtkommen sollten.
Wir warten weiter …
Auch wann man die ersten GeForce-Grafikkarten mit GF100-Chips tatsächlich kaufen kann, ist weiterhin unklar. Wahrscheinlich wird Nvidia die Anfang März in Hannover stattfindende IT-Messe CeBIT nutzen, um die endgültigen Spezifikationen und Produktbezeichnungen der GF100-Grafikkarten zu veröffentlichen. Zumindest das High-End-Modell mit 512 Shader-Einheiten dürfte nicht unter 450 Euro zu haben sein – und zudem ordentlich Watt verheizen.
Literatur
[1] Martin Fischer, Schnell und sparsam, Die ersten DirectX-11-Karten: Radeon HD 5870 und 5850
[2] Martin Fischer, AMD Radeon HD 5670 kostet weniger als 100 Euro
[3] Martin Fischer, 3D-Walze, Kantenglättungsmodi von AMD und Nvidia (mfi)