Radeon HD 4800 übertrumpft Konkurrenz auf allen Gebieten

AMD überholt den Konkurrenten Nvidia mit dem Radeon HD 4800 trotz niedrigerer Kosten und geringerem Energiebedarf bei Rechenleistung und Funktionsumfang.

In Pocket speichern vorlesen Druckansicht 520 Kommentare lesen
Lesezeit: 9 Min.
Von
  • Manfred Bertuch

Grafikkarten mit AMDs High-End-GPU Radeon HD 4870 bieten bei Straßenpreisen um die 270 Euro ein gutes Preis-/Leistungsverhältnis.

Im Wettlauf um den schnellsten Grafikprozessor schickt AMD die Radeon-HD-4800-Serie (Codebezeichnung RV770) ins Rennen und meldet damit wieder seinen Anspruch auf die technologische Führerschaft an. Während Konkurrent Nvidia beim GeForce GTX 280 lediglich 933 GFLOPS bei einfacher Genauigkeit vorweisen kann, sprintet der Radeon HD 4870 gleich mit 1200 GFLOPS davon. Möglich machen dies 800 skalare Shader-ALUs, die bei einem Chiptakt von 750 MHz zwei Operationen (MAD - Multiply and Add) pro Takt ausführen können. Die ALUs sind in 10-SIMD-Einheiten zu jeweils 16 Fünfergruppen angeordnet. Trotz der großen Anzahl von Recheneinheiten kommt der Chip mit "nur" 956 Millionen Transistoren aus, während Nvidia 1,4 Milliarden Transistoren benötigt. Da AMD außerdem sparsame und kompakte 55-nm-Transistoren verwendet (Nvidia: 65 nm), soll eine Grafikkarte mit dem Radeon HD 4870 maximal 160 Watt aus dem Netzteil ziehen (Nvidia: 236 Watt). AMD unterstützt zudem den parallelen Betrieb von maximal vier Grafikkarten (CrossFireX), um die Leistung weiter zu steigern.

Ein derart günstiges Verhältnis von Rechenleistung zu Stromaufnahme erscheint auf den ersten Blick fast unglaubwürdig, schließlich will AMD damit die Leistung pro Watt von rund 4,5 GFLOPS/W bei den Radeon HD 3800 auf rund 8 GFLOPS/W fast verdoppelt haben. GPU-Architekt Eric Demers beteuert aber, dass man sich ein ganzes Jahr Zeit genommen habe, um die Zahl der benötigten Transistoren zu verringern und die Effizienz des Designs zu steigern. So habe man bei den Rechenkernen den Verbrauch an Chipfläche um beachtliche 40 Prozent senken können. Auch das aufwendige Ringbus-Speicherinterface ist aus diesem Grund durch eine direkte Kopplung der Render-Backends und der Level-2-Caches an die Speicher-Controller ersetzt worden, was viel Chipfläche spart und weniger Strom benötigt. Durch den Einsatz von GDDR5-Speicher, der mit einer hohen Taktfrequenz von 1800 MHz läuft, benötigt AMD auch keinen 512 Bit breiten Speicherbus wie Nvidia, sondern lediglich einen 256-Bit-Bus, der zudem die Kosten für Chip und Leiterplatte niedrig hält.

Die Zahl der Textureinheiten hat AMD im gleichen Maß wie die ALU-Anzahl erhöht. Den jetzt 40 Textureinheiten der 4800er-Chips stehen aber 80 Textureinheiten beim GeForce GTX 280 gegenüber. AMD will dank optimierter Datenpfade zum Texture-Cache aber trotzdem konkurrenzfähig sein. Die Zahl der Rasterendstufen (ROPs) hat AMD nicht gesteigert, sondern bei 16 belassen. Jede Stufe kann jetzt pro Takt aber doppelt so viele Z-/Stencil- und Blend-Operationen durchführen. Beides soll die Leistung bei Antialiasing steigern, die bei den Vorgänger-Chips noch eine Schwachstelle war. AMD behauptet sogar, dass man ohne größeren Leistungsverlust jetzt achtfaches Antialiasing benutzen kann. Auch die hochwertigen Custom-Edge-Detect-Filter, welche die Subpixel um die Kanten herum anordnen, sollen jetzt mit höheren Bildraten laufen. Dazu trage auch ein schnellerer Datenpfad zwischen den ROPS und den Shader-ALUs bei.

Zehn vierfache Textureinheiten versorgen die zehn SIMD-Einheiten mit Daten. Jede SIMD-Einheit enthält sechzehn mal fünf skalare Recheneineinheiten.

Für eine höhere Leistung in der Geometrie-Shader-Konfiguration hat AMD die Zahl der gleichzeitig aktiven GS-Thread vervierfacht und die Menge der auf dem Chip speicherbaren Geometrie-Daten erhöht. Die Tessellation-Einheit, die sich bei den Vorgängern noch an DirectX 9 anlehnte, unterstützt jetzt Instancing und entspricht mehr den Gepflogenheiten von DirectX 10 und DirectX 10.1. Zu der relativ geringen Stromaufnahme trägt auch ein aggressiveres Powermanagement bei, das von einem eigens dafür zuständigen Microcontroller gesteuert wird.

Die Video-Engine (UVD2) ist wie Nvidias PureVideo in der Lage, zwei Video-Streams für die Picture-in-Picture-Funktion zu dekodieren. Neu hinzugekommen sind Funktionen, die DVD-Material auf HD-Format heraufskalieren und den Farbkontrast automatisch regeln. Die Radeon-HD-4800-Grafikkarten können über HDMI 7.1-Mehrkanalton mit 192 kHz und 24 Bit/Sample ausgeben. Für den PowerDirector 7 soll es ein Plug-in geben, das Videos mithilfe der Shader-ALUs 19 Mal schneller transkodiert als die CPU.

AMD gibt ferner bekannt, dass man die Physik-Software von Havok in erster Linie auf die Phenom-CPUs optimieren werde und die Physikberechnung der Spiele nur dann auf die GPU auslagern will, wenn dies tatsächlich sinvoll ist. AMD möchte eben auch CPUs verkaufen. In der Froblin-Demo zeigte AMD aber, dass man auch KI-Berechnungen auf die GPU auslagern kann. Das Bewegungsmuster einer großen Zahl von Individuen ähnele dem von Flüssigkeiten und lasse sich mit Hilfe einer partiellen Differentialgleichung zweiter Ordnung berechnen. So habe man etwa das Path Finding einer Völkerwanderung aus rund 65.000 Spielfiguren auf dem Radeon-HD-4800-Chip mit 45 Bildern/s berechnen können. Mit zusätzlicher Bildberechnung in HD-Auflösung und vierfachem Antialiasing habe die Bildrate immer noch bei 31 fps gelegen. Die GPU soll dabei eine durchschnittliche Leistung von 911 GFLOPS erreicht haben. Für die Spielfiguren setzte AMD ein Level-of-Detail-System ein, das die Spielfigur je nach Entfernung aus 900 bis 6000 Polygonen zusammensetzt. Bei Naheinstellungen kann der 4800er-Chip mit seiner Tessellation-Engine die Polygonzahl bis auf 1,6 Millionen ansteigen lassen, um feinste Details darzustellen. Die Gesamtzahl der pro Bild verwendeten Polygone soll zwischen 6 und 8 Millionen liegen. Aktuelle Spiele verwenden heute selten mehr als 2 Millionen Polygone pro Bild. SEGA und der koreanische Spieleentwickler NHN (kommender Titel: "Cloud 9") kündigen an, DirectX 10.1 und Tessellation unterstützen zu wollen.

Natürlich empfiehlt AMD seinen Grafikprozessor auch als Beschleuniger für rechenintensive Anwendungen und hat bereits die FireStream 9250 für professionelle Anwendungen angekündigt. Diese dürften auch von den 240 GFLOPS in doppelter Genauigkeit profitieren, der GTX 280 erreicht hier lediglich 90 GFLOPS. Neu ist zudem ein 16-kByte-Datenpuffer in jeder SIMD-Einheit, über den Prozesse kommunizieren können und den Nvidia ebenfalls bietet. Zusätzlich gibt es noch einen globalen Datenpuffer auf dem Chip. Eine FFT (Fast Fourier Transformation) soll mit Hilfe dieser Datenbuffer siebenmal schneller laufen. AMD kündigt an, zukünftige Versionen seiner Compute-SDKs an den offenen Standard OpenCL anpassen zu wollen.

Der leistungsschwächere Radeon HD 4850 arbeitet ebenfalls mit 800 Shader-ALUs und ist auch bei allen anderen Einheiten mit dem 4870 identisch. Er ist mit 625 MHz lediglich 17 Prozent langsamer getaktet. Sein GDDR3-Speicher arbeitet mit 993 MHz. Entsprechende Grafikkarten haben eine Leistungsaufnahme von moderaten 110 Watt und belegen dank ihres flachen Kühlers nur einen Steckplatz.

In ersten Test konnte sich eine Radeon HD 4850 sogar in Nvidias Paradedisziplin Crysis gegen eine GeForce 9800 GTX behaupten. Bei 1280 × 1024 Bildpunkten und der Qualitätseinstellung „high“ berechnen beide rund 25 Bilder/s. Im 3DMark Vantage erzielt die 4850er-Karte einen Wert von H3944 Punkten. Die Nvidia-Karte liegt mit H3283 Punkten rund 17 Prozent zurück. Interessant ist, dass AMD mit seinen 40 Textureinheiten im Multitexturing-Test 650,99 GTexel/s erreicht, während die GeForce 9800 GTX mit ihren 64 Textureinheiten bei 603 GTexel/s liegt. Weitere Ergebnisse inklusive der Resultate des Radeon HD 4870 bringt c´t in Ausgabe 15.

Auch bei AMD belegen die Shader-ALUs den größten Teil der 260 Quadratmillimeter großen Chipfläche.

AMD steigert zudem sein Linux-Engagement und hat bereits Register-Informationen für Open-Source-Treiber bereit gestellt. Auf den Treiber-CDs der 4800-Karten sollen sich bereits AMDs eigene Linux-Treiber befinden, mit denen AMD bald auch CrossFireX unterstützen will.

Radeon-HD-4870-Grafikkarten mit 512 MByte GDDR5-Speicher sollen rund 280 Euro kosten und im Juli in den Handel kommen. Damit bringt AMD bereits die GeForce GTX 260 in Bedrängnis, die etwa auf dem gleichen Leistungsniveau liegen soll, aber noch deutlich über 300 Euro kostet. Nvidias Flaggschiff GeForce GTX 280 will AMD mit der Radeon HD 4870 X2 (R700) schlagen, die zwei 4870er-GPUs auf einer Karte vereint und im Zeitraum Juli/August verfügbar sein soll. Grafikkarten mit dem Radeon HD 4850 sind bereits seit einigen Tagen zu Preisen zwischen 140 und 180 Euro im Handel.

Im Vergleich zu den Radeon HD 4800 wirken die erst kürzlich vorgestellten GeForce-GTX-260/280-GPUs der Konkurrenz technisch überholt. Schon die Vorgänger der 4800er-GPUs hatten Nvidia die Tessellation-Engine und die Unterstützung von DirectX 10.1 voraus. Jetzt bietet AMD noch den leistungsfähigen GDDR5-Speicher, ein deutlich besseres Verhältnis von Preis und Performance sowie die geringere Leistungsaufnahme. Nvidias Händler reagieren bereits mit Preissenkungen bei allen konkurrierenden Produkten. Nvidia selbst hat eine GeForce 9800 GTX+ zum Preis von rund 230 Euro angekündigt, die aber lediglich einen um 9 Prozent höheren Chiptakt als eine 9800 GTX bietet. (Manfred Bertuch) / (chh)