Nvidia Quadro RTX A6000 und A40: Ampere für Workstations und Rechenzentren

Nvidias A40 und Quadro RTX A6000 sollen mit voller GA102-GPU, bis zu 40 TFlops und 48 GByte GDDR6 in Rechenzentrum und Workstation für mächtig Dampf sorgen.

In Pocket speichern vorlesen Druckansicht 13 Kommentare lesen
Nvidia Quadro RTX A6000 und A40 Datacenter-Beschleuniger

Nvidia Quadro RTX A6000

(Bild: Nvidia)

Lesezeit: 4 Min.
Inhaltsverzeichnis

Nvidia kündigt Grafikkarten-Typ Nummer 4 und 5 auf Basis der Ampere-Architektur an, wenn man den reinen Rechenzentrums-Beschleuniger A100 nicht mitzählt. Die Quadro RTX A6000 und die Nvidia A40 nutzen den Vollausbau des GA102-Grafikchips, der schon GeForce RTX 3080 und RTX 3090 antreibt. Dabei bleiben die beiden Profi-Karten aber trotz höherer Rechenleistung als die RTX 3090 im Zwei-Slot-Format und bei einer Thermal Design Power (TDP) von 300 Watt.

Die Quadro RTX A6000 ist eine klassische, knapp 27 Zentimeter lange 2-Slot-Karte mit Radiallüfter, der die erwärmte Luft aus dem Gehäuse pustet (Direct Heat Exhaust mit Blower). Die A40 hat keinen Lüfter, sondern soll den üblicherweise starken Luftstrom in Server-Gehäusen nutzen.

Beide Karten verwenden den Vollausbau des GA102-Grafikchips mit 84 Shader-Multiprozessoren und 10.752 Rechenkernen – 2 SMs und 256 Kernchen mehr als das Gaming-Topmodell, die GeForce RTX 3090. Ihre TDP ist bei 300 Watt abgeriegelt, weswegen sie auch mit einem einzelnen Achtpol-Stromanschluss auskommen.

Nvidia gibt im Vorfeld keine Taktraten für den Grafikchip an, wohl aber die mögliche Rechenleistung. Diese wird üblicherweise auf Basis des Boost-Taktes berechnet, der aber gerade bei knappem TDP-Budget womöglich nicht durchweg gehalten werden kann. Die Angaben der gerundeten 40 respektive 38 TFlops sind daher als eher optimistisch zu sehen, liegen aber noch 10 respektive 5 Prozent oberhalb der GeForce RTX 3090, die mit 350 Watt selten unter ihren 1,7-GHz-Boost drosseln muss.

Nvidia A40 fürs Datenzentrum

(Bild: Nvidia)

Beim Speicher geht Nvidia allerdings auf Nummer sicher – in doppelter Hinsicht. Er fasst auf beiden Karten 48 GByte und ist mit dem Speicherschutz ECC versehen. Zudem handelt es sich "nur" um den herkömmlichen GDDR6-Typ, nicht den neuen GDDR6X, der auf den GeForce-Karten zum Einsatz kommt. Mit GDDR6X wären aktuell aufgrund fehlender 2-GByte-Speicherchips noch keine 48 GByte möglich. Nvidia stattet beide Karten mit den vollen 384 Datenleitungen der integrierten Memory-Controller aus, taktet den RAM aber auf der A40 etwas niedriger. Jeweils zwei Karten lassen sich mit NVLink (aggregierte 112,5 GByte/s) verbinden. Die vollständigen technischen Daten finden Sie in der Tabelle unten.

Auch zur Virtualisierung sollen beide Karten verwendbar sein – unter anderem mit Nvidia Grid, dem Quadro Virtual Data Center Workstation und dem Virtuel Compute Server. Damit lassen sich virtuelle GPUs mit 1, 2, 3, 4, 6, 8, 12, 16, 24 und 48 GByte erstellen. Die Virtualisierung funktioniert allerdings nur bei abgeschalteten Display-Ports. Auf der A40 (wiederum ohne Tesla-Zusatz) sind sie ab Werk abgeschaltet und müssen in der Software erst aktiviert werden, auf der Quadro RTX A6000 ist es andersrum.

Wie schon die Founders Edition der GeForce RTX 3000 verzichtet auch die Quadro RTX A6000 auf den USB-C-Anschluss Virtual Link. Monitore bis zur 8K-Auflösung bindet sie über vier DisplayPorts 1.4 an. Die A40 wird auf Kundenwunsch, die gern auf die aktiv belüfteten Quadros in Rechenzentren verzichten wollten, mit Display-Ausgängen ausgestattet. Allerdings hat sie als passiv gekühlte Karte nur drei DP 1.4a, damit sie den Luftstrom im Server-Gehäuse besser nutzen kann.

Die Quadro RTX A6000 soll ab Dezember verfügbar sein, erste OEM-Systeme – wie bei der A40 – sollen Anfang 2021 in den Handel kommen. Preise nannte Nvidia im Vorfeld noch nicht, die Quadro RTX 8000 mit 48 GByte und Turing-Grafikchip kostet zurzeit rund 6000 Euro.

Quadro RTX im Vergleich
Nvidia Quadro RTX A6000 Nvidia A40 GeForce RTX 3090 FE GeForce RTX 3080 10 GB FE GeForce RTX 3070 FE
GPU Ampere (GA102) Ampere (GA102) Ampere (GA102) Ampere (GA102) Ampere (GA104)
Graphics Processing Cluster (GPC) 7 7 7
6
6
Shader-Rechenkerne 10752
10752
10496 8704 5888
GPU-/Turbo-Takt k. A.
(Turbo zw. 1837-1883 MHz)
k. A.
(Turbo zw. 1744-1790 MHz)
1400 / 1695 MHz 1440 / 1710 MHz 1500 / 1725 MHz
theoretische Rechenleistung FP32 40 TFlops 38 TFlops 35,6 TFlops 29,8 TFlops 20,3 TFlops
Grafikspeicher 48 GByte GDDR6 (ECC) 48 GByte GDDR6 (ECC) 24 GByte GDDR6X 10 GByte GDDR6X 8 GByte GDDR6
Speichertransferrate
768 GByte/s 696 GByte/s 936 GByte/s 760 GByte/s 448 GByte/s
Rasterendstufen 112 112 112 96 96
Raytracing- / Tensor-Kerne 84 / 336 84 / 336 82 / 328 68 / 272 46 / 184
Leistungsaufnahme (Total Graphics Power)
300 Watt 300 Watt 350 Watt 320 Watt 220 Watt
Stromanschlüsse 1 × 8-polig 1 × 8-polig 1 × 12-polig (Adapter auf 2 × 8-Pol) 1 × 12-polig (Adapter auf 2 × 8-Pol) 1 × 8-polig
Systemschnittstelle PCIe 4.0 x16 PCIe 4.0 x16 PCIe 4.0 x16 PCIe 4.0 x16 PCIe 4.0 x16
Multi-GPU NVLink (max. 2 Karten) NVLink (max. 2 Karten) NVLink (max. 2 Karten)
Nicht unterstützt Nicht unterstützt
Display-Anschlüsse Display-Link 1.4 (4) Display-Link 1.4 (3) Display-Link 1.4 (3), HDMI 2.1 (1) Display-Link 1.4 (3), HDMI 2.1 (1) Display-Link 1.4 (3), HDMI 2.1 (1)
Preis k. A. k. A. 1499 Euro (UVP) 699 Euro (UVP) 499 Euro (UVP)

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

(csp)