Ampere-System DGX A100: Nvidia ersetzt Intel durch AMD

In dem High-Performance-Computing-System DGX A100 stecken im Gegensatz zum Vorgänger keine Intel-Prozessoren mehr. AMD bietet mehr CPU-Kerne und PCIe 4.0.

In Pocket speichern vorlesen Druckansicht 113 Kommentare lesen
Ampere-System DGX A100: Nvidia ersetzt Intel durch AMD

(Bild: Nvidia)

Lesezeit: 2 Min.

Nvidia verbaut in seinem Ampere-Serversystem DGX A100 zwei Epyc-Prozessoren von AMD, die acht Tesla-A100-Beschleunigerkarten mit Arbeitsaufträgen füttern. Das ist ein Novum, denn bisher setzte Nvidia stets auf Kooperationen mit Intel und IBM. Im Vorgänger DGX-2 mit acht Tesla-V100-GPUs etwa steckten zwei 24-Kerner Xeon Platinum 8168, im kleineren DGX-1 mit acht Tesla V100 zwei 20-Kerner Xeon E5-2698 v4.

Im DGX A100 kommen nun zwei Epyc 7742 mit 1 TByte DDR4-RAM zum Einsatz, die nicht nur mit jeweils 64 CPU-Kernen deutlich mehr Rechenleistung bieten, sondern über PCI Express 4.0 statt PCIe 3.0 mit den Tesla-A100-Beschleunigerkarten kommunizieren. Intel bringt PCIe 4.0 erst mit der kommenden 10-Nanometer-Servergeneration Ice Lake-SP, die Ende 2020 erscheinen soll.

PCIe 4.0 ermöglicht überhaupt erst den Einsatz der acht PCIe-x16-Netzwerkkarten Mellanox ConnectX-6 HDR mit jeweils einem 200-Gigabit-Ethernet-Anschluss zur Verbindung mehrerer DGX-A100-Server. Die 128 Lanes der Epyc-Prozessoren reichen dafür allerdings nicht aus, weshalb Nvidia PCIe-4.0-Switches verbaut. Die Übertragungsrate von PCIe 3.0 x16 würde den Hersteller auf 100-Gigabit-Ethernet beschränken. Die Beschleunigerkarten untereinander sind derweil über sechs NVLink-3.0-Switches mit Übertragungsraten von 600 GByte/s (bi-direktional) zwischen allen GPUs verbunden.

Der Einsatz von Epyc-Prozessoren im DGX A100 führt derweil zu bemerkenswertem Marketing, bei dem AMD-CEO Lisa Su Nvidia über Twitter zur Vorstellung des GA100-Grafikchips gratuliert. Wohlgemerkt sind beide Unternehmen im Grafikkartengeschäft Konkurrenten, jedoch nähern sich AMDs CPU-Sparte und Nvidia schon seit Jahren an. Nvidia betont bei Ryzen-Neuvorstellungen regelmäßig, was für „verlockende Paare“ AMDs CPUs und die eigenen GeForce-Grafikkarten abgeben. AMD hilft das womöglich, die Assoziation "Intel + Nvidia" und "AMD + AMD" zu entkräften.

Alternativ zum DGX A100 bietet Nvidia zwei HGX-A100-Boards mit acht beziehungsweise vier Tesla-A100-Beschleunigerkarten an, aber ohne sonstige Hardware. Das heißt, Serverbetreiber müssen die Boards selbst mit Prozessoren, RAM, Datenträgern und Netzwerkkarten koppeln. (mma)