SC12: HPC-Cluster mit Nvidia-Mobilgrafik und ARM-SoCs
Die italienische Firma E4 Computer Engineering kündigt zwei "Microcluster" mit acht oder zwölf Knoten und acht bis 24 Nvidia-Quadro-Grafikprozessoren an; dank ARM-SoCs sollen sie besonders effizient rechnen.
Im Rahmen des EU-Projektes Mont Blanc entwickelt die Firma Seco gemeinsam mit Nvidia Komponenten für Superrechner mit ARM-SoCs. Die italienische Firma E4 Computer Engineering verknüpft nun acht bis 24 Blades mit Qseven-Modulen mit Tegra-3-Prozessoren sowie GPGPU-Beschleunigern des Typs Quadro 1000M zu vergleichsweise sparsamen HPC-Clustern. Nach dem Nvidia-Projekt "Carma" – CUDA for ARM – heißen die E4-Systeme Carma Microcluster oder Carma Cluster.
Der Microcluster mit acht Blades, von denen jedes jeweils ein ARM-SoC und ein GPU-Modul trägt, kommt mit einem 520-Watt-Netzteil aus. Die maximale Rechenleistung gibt E4 mit 2,16 TFlops bei Gleitkommaberechnungen mit einfacher Genauigkeit (Single Precision) an. Das entspricht der Rechenleistung der acht Quadro-1000M-Grafikchips, deren jeweils 96 CUDA-Cores zusammen 270 GFlops erreichen. Die CUDA-2.1-Cores verarbeiten allerdings nur FP32-Werte und keine Dual-Precision-Zahlen.
Nvidia verkauft ein einzelnes dieser Blades als Carma-Devkit via Seco für rund 630 Euro auch an Entwickler. E4 wiederum packt im Carma Cluster bis zu 12 Knoten zusammen; bestückt mit Carma2-Boards besitzt jeder Knoten dann zwei Quadro 1000M, insgesamt kommen 6,48 TFlops an SP-Rechenleistung zusammen. E4 baut dazu ein 1,5-kW-Netzteil ein. Den Carma-Cluster kann man auch ausschließlich mit Tegra-3-Prozessoren kaufen, dann stecken insgesamt 48 dieser SoCs mit je vier Cortex-A9-Kernen drin, also 192 ARM-Kerne. Dafür reicht ein 400-Watt-Netzteil. Optional sind außer dem Qseven-Board QuadMo747-X/T30
mit Tegra T30 auch andere erhältlich.
Bei dem von der EU mit rund 8 Millionen Euro geförderten Projekt Mont Blanc arbeiten etwa auch das Forschungszentrum Jülich und das Leibniz-Rechenzentrum Garching mit. Ziel sind effiziente Exascale-Supercomputer; 2017 soll ein System mit 200 PFlops auf der Top500-Liste stehen. Für den ersten HPC-Prototypen hat Mont Blanc jetzt das ARM-SoC Samsung Exynos 5 mit zwei Cortex-A15 ausgewählt, wie anlässlich der Konferenz SC12 bekannt gegeben wurde.
Nvidia arbeitet im Rahmen des Project Denver an SoCs mit selbst entwickelten ARM-Kernen, hat aber ebenfalls eine Lizenz für den Cortex-A15. Dieser könnte in der Tegra-Version Wayne zum Einsatz kommen. Bei den selbst entwickelten ARM-Kernen könnte es sich um 64-Bit-Versionen handeln, wie sie etwa auch AMD, STMicroelectronics, Calxeda, Applied Micro und andere planen – zum Teil aber auf Basis der ARM-Designs Cortex-A57 und -A53. (ciw)