zurück zum Artikel

Nvidias GF100: 512 Shader-Kerne und 64 Textureinheiten

Cebit Martin Fischer

Nvidia hat einige Details des bereits lange erwarteten GF100-Grafikchips veröffentlicht, der allerdings nicht vor Mitte MĂ€rz erscheinen dĂŒrfte.

WĂ€hrend AMD [1] seit September 2009 bereits ĂŒber 2 Millionen zu DirectX 11 kompatible Grafikchips abgesetzt hat, sind Nvidias [2] GeForce-Konkurrenzkarten mit GF100-Grafikchips noch immer nicht erhĂ€ltlich. Zumindest die neuentwickelte Architektur der zukĂŒnftigen Tesla-Rechenkarten hat Nvidia bereits zu deren AnkĂŒndigung im vergangenen Jahr erlĂ€utert [3]. Nun gab die kalifornische Firma am Rande der CES in Las Vegas einige Details zu den ab Mitte MĂ€rz erwarteten GeForce-Grafikkarten mit DirectX-11-UnterstĂŒtzung preis, verschwieg jedoch die finalen Taktfrequenzen, machte keine Angaben zur Leistungsaufnahme und zeigte auch keine aussagekrĂ€ftigen Vergleichsbenchmarks.

Die GF100-GPU nutzt 16 Streaming Multiprocessors mit jeweils 32 Shader-Rechenkernen.

(Bild: Nvidia)

Der GF100-Grafikchip besteht im Vollausbau aus insgesamt vier sogenannten Graphics Processing Clusters (GPC), die jeweils ĂŒber eine eigene Raster-Engine verfĂŒgen und vier Streaming Multiprocessors (SM) enthalten. Die insgesamt 16 SMs besitzen jeweils einen 64 KByte großen konfigurierbaren Zwischenspeicher (Shared Memory/L1) und teilen sich einen 768 KByte fassenden, vereinheitlichten L2-Cache (Read/Write) sowie sechs 64-Bit-SpeicherkanĂ€le. Der Grafikchip ist dadurch ĂŒber 384 Datenleitungen an den GDDR5-Speicher angebunden. Zum Vergleich: AMD koppelt GDDR5-Speicher und Grafikchip auf der Radeon HD 5870 mit 256 Leitungen. Hinsichtlich der verfĂŒgbaren Speicherbandbreite liegt Nvidia hier zumindest vorn.

Jede SM beherbergt 32 Shader-Einheiten, die Nvidia als CUDA-Kerne bezeichnet. Insgesamt besitzt der GF100-Chip, zumindest im höchsten Ausbau, also 512 solcher Kerne – der aktuelle GT200b-Chip kommt auf maximal 240 Einheiten. 16 Load/Store-Einheiten sorgen pro SM fĂŒr den Transfer der Daten zwischen den Rechenkernen und den Zwischenspeichern.

An jedem Streaming Multiprocessor sitzen unter anderem 4 Textureinheiten und eine Tessellation-Engine.

(Bild: Nvidia)

An jedem der 16 SMs ist ein Cluster aus vier Textureinheiten (TMUs) angedockt, die nun effizienter arbeiten sollen und unter anderem auch spezielle DirectX-11-Texturkompressionsformate und Gather4-Operationen unterstĂŒtzen. Insgesamt verfĂŒgt der GF100 also ĂŒber lediglich 64 TMUs. Dies scheint fĂŒr einen Chip, mit dem Nvidia die Leistungskrone beanspruchen will, zu wenig, besaß doch bereits der GT200b einer GeForce GTX 285 gleich 80 TMUs. Der Knackpunkt scheint hierbei jedoch die Taktfrequenz zu sein. Liefen die 80 TMUs einer GeForce GTX 285 mit nur 648 MHz („Graphics Clock“, wie auch die Rasterendstufen/ROPs), will Nvidia die Textureinheiten beim GF100 mit einer deutlich höheren Taktfrequenz ansteuern. UnbestĂ€tigten GerĂŒchten zufolge sollen die Textureinheiten gar so flott wie die Shader-Rechenkerne laufen („Hotclock“), was ihre geringe Anzahl mehr als kompensieren wĂŒrde. Diese Taktfrequenz betrug beim GT200b 1476 MHz (GeForce GTX 285), beim GF100 dĂŒrfte sie sich ebenfalls in Ă€hnlichen Regionen bewegen.

Die unter anderem fĂŒr die KantenglĂ€ttung (Antialiasing/AA) wichtigen ROPs dĂŒrften jedoch weiterhin mit der langsameren "Graphics Clock" laufen, im GF100-Grafikchip sind davon 48 vorhanden (GeForce GTX 285: 32, Radeon HD 5870: 32), unterteilt in insgesamt 6 ROP-Partitionen. Die KantenglĂ€ttungsleistung will Nvidia deutlich verbessert haben, besonders beim achtfachen Antialiasing soll die Bildrate nicht mehr so drastisch einbrechen wie noch beim GT200b-Chip. So sei der GF100 um bis zu den Faktor 2,3 schneller als der GT200b einer GeForce GTX 285. Zudem unterstĂŒtzt die GF100-GPU nun auch 32x Coverage Sampling Antialiasing, bei dem acht Farb- und 24 Coverage-Samples zur KantenglĂ€ttung genutzt werden, und bietet zudem verbessertes Transparency Multisampling.

Beim Echtzeit-Raytracing soll der GF100 bis zu viermal so schnell sein wie eine GT200b-GPU.

(Bild: Nvidia)

Bei dieser Tessellation-Demo soll Nvidias GF100 rund dreimal so schnell sein wie AMDs RV870.

(Bild: Nvidia)

Um den Anforderungen von DirectX 11 gerecht zu werden, mĂŒssen Grafikchips Tessellation unterstĂŒtzen, durch das sich geometrische Details von Polygonmodellen verfeinern lassen. Beim GF100-Chip beinhaltet jeder Streaming Multiprocessor eine eigene Tessellation-Engine (PolyMorph Engine). Laut Nvidia bearbeiten die 16 Tessellation-Engines geometrische Daten parallel, dadurch soll die Tessellation-Leistung der GF100-GPU bis zu sechsmal höher sein als die des RV870-Chips der AMD-Konkurrenzkarte Radeon HD 5870. Diese Behauptungen fußen jedoch auf speziell fĂŒr den GF100-Chip selektierten Geometrie-Benchmarks. Wie hoch die tatsĂ€chliche Spieleleistung der GF100-Grafikkarte im Vergleich zu den derzeitigen AMD-Spitzenmodellen sein wird, steht weiterhin in den Sternen.

Auch wann die ersten GF100-Karten in den Handel kommen sollen, ist noch immer unklar. Brancheninsider gehen jedoch nicht von einem Marktstart vor Mitte MĂ€rz aus. Zumindest die Anfang MĂ€rz in Hannover stattfindende IT-Messe Cebit dĂŒrfte Nvidia nutzen, um die finalen Spezifikationen der GF100-Grafikkarten zu veröffentlichen. Bis dahin hat Konkurrent AMD seine DirectX-11-Serie von HD-5000-Karten bereits komplettiert. (mfi [4])


URL dieses Artikels:
https://www.heise.de/-906002

Links in diesem Artikel:
[1] http://www.amd.com
[2] http://www.nvidia.com
[3] http://www.heise.de/newsticker/meldung/GTC-Nvidia-enthuellt-die-Architektur-der-naechsten-GPU-Generation-798337.html
[4] mailto:mfi@heise.de