Xilinx ACAP: Neue Chipgeneration fordert Prozessoren und GPUs heraus

Der neue Xilinx-CEO Victor Peng kündigt eine neue Produktkategorie ACAP an, die FPGA ablösen soll. Noch in diesem Jahr soll der Tape-out für 7 nm erfolgen.

In Pocket speichern vorlesen Druckansicht 84 Kommentare lesen
Xilinx ACAP: neue Chipgeneration fordert Prozessoren und GPUs heraus
Lesezeit: 4 Min.
Von
  • Andreas Stiller

Xilinx neue Adaptive Compute Acceleration Platform (ACAP) soll weit über die Fähigkeiten bisheriger FPGAs hinausgehen. Mit dieser neuen ACAP-"Produktkategorie" wirft Xilinx nun den Hut in den Ring im Kampf um Trendthemen wie Machine Learning, Genomik, Videokodierung, Datenanalyse, Finanzsoftware …

Die erste Generation mit Projektnamen Everest, deren Entwicklung über 1 Milliarde US-Dollar gekostet hat, soll immerhin mit 50 Milliarden Transistoren gefertigt im 7-nm-Prozess noch in diesem Jahr Tape-Out feiern. Über 20 Mal so schnell wie der aktuelle FPGA-Chip Virtex VU9P soll er beim Maschinenlernen rechnen, um Faktor 10 bis 100 schneller als aktuelle CPUs bei modernen Workloads arbeiten und außerdem mehr Einsatzmöglichkeiten als GPUs und ASICs bieten.

Das grobe Blockbild des ersten ACAP-Chips mit Codenamen Everest. Feinheiten hat Xilinx noch nicht verraten.

(Bild: Xilinx)

Verteilter Speicher, Hardware-programmierbare DSP-Blöcke, ein Vielkern-SoC und ein oder mehrere per Software programmierbare, aber mit konfigurierbarer Hardware bestückt Compute Engines, die alle per Netzwerk auf dem Chip verknüpft sind – das sind die groben Eckdaten. Sicherheitsblöcke, Powermanagement, programmierbare Speichercontroller, CCIX, PCI, Ethernet, 5G-Wifi, diverse weitere I/O, ADC und DAC’s gehören natürlich dazu, alles programmierbar in C/C++, OpenCL und Python – oder für erfahrene FPGA-Programmierer auch auf RTL-Ebene.

„Datacenter first“ so lautet die Strategie von Xilinx, etwa im Cloud-Bereich in der FPGA-Cloud vom Amazon (AWS F1). Was FPGAs hier schon leisten können, zeigen aktuelle Virtex-9-Ultrascale+-Einheiten (V09P) in AWS-F1, verglichen mit der auf Xeon E5-2666v3 beruhenden AWS Compute-Plattform C4.8large Instances. Mit F1 soll das Kodieren von H.265 (v2.3) etwa 10 Mal so schnell gehen und ein Elasticsearch von 1 TByte unstrukturierter Daten gut 40 Mal so schnell.

Eine Genanalyse (bei der üblichen Suchtiefe von "30x Coverage") soll laut Xilinx eine mit Virtex bestückte Bio-IT-Plattform von Dragen im Rady-Kinder-Krankenhaus für genomische Medizin in nur 20 Minuten geschafft haben, während der Xeon-Server der Klinik dafür 33 Stunden brauchte.

Die KI-Leistung bei Inference (mit Spracherkennung) ihrer Kintex-UltraScale-FPGAs verglich Xilink mit einem etwas urigen "Xeon Core i7 5930K", gemeint ist tatsächlich der Core i7-5930K, wie man einem auf der FPGA2017 veröffentlichten Paper entnehmen kann. Das mit zahlreichen FPGAs bestückte System ESE der Tsingua-Universität hängt danach den Core i7-5930K um Faktor 43 und eine Nvidia-Titan X um Faktor 3 ab und war dabei mit 41 Watt insbesondere bei dichten Matrizen zudem deutlich effizienter.

Victor Peng: kaum sechs Wochen als CEO im Amt, kann er mit einer großen Ankündigung aufwarten

(Bild: Xilinx)

AMD hat fürs Jahresende erste Grafik-Chips, gefertigt im 7-nm-Prozess angekündigt – diese wird man aber wohl auch erst 2019 wirklich im Handel sehen. Nvidias Volta-Nachfolger Ampere –der übrigens schon im Juli 2017 im Prozessorgeflüster verpetzt wurde – wird mutmaßlich noch vergleichsweise konservativ in 12 oder 10 nm bei TSMC gefertigt. Intel hadert für große Chips derweil noch mit dem 10-nm-Prozess, doch Intels Prozess entspricht mit seinen tatsächlichen Strukturgrößen eher dem 7-nm genannten von TSMC. Er wird als 10+ und 10++nm-Prozess in zwei Stufen verbessert, was etwas dauern dürfte. Die nächste Xeon-Generation Ice Lake jedenfalls dürfte in 10+ nm erst im Laufe des Jahres 2019 erscheinen.

Wenn Xilinx also wirklich in diesem Jahr das Tape-out für 7 nm schafft und im nächsten Jahr ausliefern kann, ist die Firma ganz vorne mit einem hochinteressanten Produkt dabei. (as)