A800 für China: Nvidia umgeht US-Exportbeschränkungen mit gebremstem Nvlink
Nvidia verkauft wieder schnelle GPU-Beschleuniger nach China. Die A800-Karten haben eine kleine Einschränkung, entsprechen sonst aber den westlichen Modellen.
Nvidia hat nach der Einführung neuer US-Exporteinschränkungen gegen chinesische Firmen den GPU-Beschleuniger A800 speziell für China aufgelegt. Drei verschiedene Ausführungen entsprechen beinahe eins zu eins der bisherigen A100, lediglich den Nvlink-Interconnect bremst Nvidia um 33 Prozent: Mehrere A800-Karten kommunizieren mit einer Übertragungsrate von 400 GByte/s untereinander und nicht wie bisher mit 600 GByte/s. Diese Einschränkung erfordert keine neuen Chips.
Die A800-Karten listete vorübergehend der chinesische Serveranbieter Omnisky – archiviert ist die Seite noch aufrufbar. Gegenüber der Nachrichtenagentur Reuters bestätigte Nvidia die Neuauflage: "Die Nvidia-A800-GPU, die im dritten Quartal in Produktion gegangen ist, ist ein weiteres Alternativprodukt zur Nvidia-A100-GPU für Kunden in China. Die A800 erfüllt den Freigabetest der US-Regierung für eine reduzierte Exportkontrolle und kann nicht so programmiert werden, dass sie [die Limitierung] überschreitet", sagte ein Nvidia-Sprecher.
Blick auf die genauen Bestimmungen
Nvidia (und auch AMD im Falle von Instinct-Beschleunigern) betrifft insbesondere der Punkt 3A090.a der neuen Exportbeschränkungen, die das US-Wirtschaftsministerium (Department of Commerce) in einem juristischen Dokument definiert:
"Integrierte Schaltungen, die eine aggregierte bidirektionale Übertragungsrate über alle Ein- und Ausgänge von 600 GByte/s oder mehr zu oder von integrierten Schaltungen – ausgenommen flüchtige Speicher – haben oder programmierbar sind, und eine der folgenden Eigenschaften aufweisen", dürfen nicht nach China verkauft werden.
Zu den angeführten Eigenschäften zählt: Das Produkt aus der Bit-Länge eines beliebigen Datenformats multipliziert mit der Rechenleistung (in Tera-Operationen pro Sekunde, TOPS) darf den Wert 4800 nicht überschreiten. Im Falle von GPUs ist das für KI-Formate wie 8-bittige Integer-Operationen (INT8) relevant, bei denen die A100 bis zu 1248 INT8-TOPS schafft – das entspräche einem Wert von 9984. Die Nachfolgerin H100 ist nochmals deutlich schneller und verwendet einen Nvlink mit bis zu 900 statt 600 GByte/s.
Übliches Vorgehen bei Exporteinschränkungen
Wahlweise mit einer Reduzierung der Taktfrequenz beim Nvlink oder mit einer Teildeaktivierung der Links ist die hohe Rechenleistung für den Export nicht mehr relevant. Alternativ dürfte Nvidia nur noch Beschleuniger mit stark reduzierter Rechenleistung nach China verkaufen. Ein langsamerer Interconnect ist für Server und Rechenzentren jedoch das kleinere Übel – insbesondere Berechnungen großer 3D- oder KI-Modelle in GPU-Clustern dürften somit nicht mehr ganz so schnell laufen.
Eine derartige Umgehung von Exporteinschränkungen ist derweil branchen- und länderübergreifend ein völlig übliches Vorgehen. Sollte die US-Regierung etwas dagegen haben, müssen die Vorgaben weiter angepasst werden.
(mma)