SC12: HPC-Cluster mit Nvidia-Mobilgrafik und ARM-SoCs

Die italienische Firma E4 Computer Engineering kündigt zwei "Microcluster" mit acht oder zwölf Knoten und acht bis 24 Nvidia-Quadro-Grafikprozessoren an; dank ARM-SoCs sollen sie besonders effizient rechnen.

In Pocket speichern vorlesen Druckansicht 7 Kommentare lesen
Lesezeit: 3 Min.

Im Rahmen des EU-Projektes Mont Blanc entwickelt die Firma Seco gemeinsam mit Nvidia Komponenten für Superrechner mit ARM-SoCs. Die italienische Firma E4 Computer Engineering verknüpft nun acht bis 24 Blades mit Qseven-Modulen mit Tegra-3-Prozessoren sowie GPGPU-Beschleunigern des Typs Quadro 1000M zu vergleichsweise sparsamen HPC-Clustern. Nach dem Nvidia-Projekt "Carma" – CUDA for ARM – heißen die E4-Systeme Carma Microcluster oder Carma Cluster.

Der Microcluster mit acht Blades, von denen jedes jeweils ein ARM-SoC und ein GPU-Modul trägt, kommt mit einem 520-Watt-Netzteil aus. Die maximale Rechenleistung gibt E4 mit 2,16 TFlops bei Gleitkommaberechnungen mit einfacher Genauigkeit (Single Precision) an. Das entspricht der Rechenleistung der acht Quadro-1000M-Grafikchips, deren jeweils 96 CUDA-Cores zusammen 270 GFlops erreichen. Die CUDA-2.1-Cores verarbeiten allerdings nur FP32-Werte und keine Dual-Precision-Zahlen.

Das Carma-Board von Seco mit Tegra 3 auf einem Qseven-Modul verkauft auch Nvidia an Entwickler.

(Bild: Nvidia)

Nvidia verkauft ein einzelnes dieser Blades als Carma-Devkit via Seco für rund 630 Euro auch an Entwickler. E4 wiederum packt im Carma Cluster bis zu 12 Knoten zusammen; bestückt mit Carma2-Boards besitzt jeder Knoten dann zwei Quadro 1000M, insgesamt kommen 6,48 TFlops an SP-Rechenleistung zusammen. E4 baut dazu ein 1,5-kW-Netzteil ein. Den Carma-Cluster kann man auch ausschließlich mit Tegra-3-Prozessoren kaufen, dann stecken insgesamt 48 dieser SoCs mit je vier Cortex-A9-Kernen drin, also 192 ARM-Kerne. Dafür reicht ein 400-Watt-Netzteil. Optional sind außer dem Qseven-Board QuadMo747-X/T30
mit Tegra T30 auch andere erhältlich.

Die Roadmap des von der EU mit 8,11 Millionen Euro geförderten Projektes Mont Blanc sieht ungefähr 2017 einen Cluster mit 200 PFlops aus 10 Megawatt vor.

(Bild: Seco)

Bei dem von der EU mit rund 8 Millionen Euro geförderten Projekt Mont Blanc arbeiten etwa auch das Forschungszentrum Jülich und das Leibniz-Rechenzentrum Garching mit. Ziel sind effiziente Exascale-Supercomputer; 2017 soll ein System mit 200 PFlops auf der Top500-Liste stehen. Für den ersten HPC-Prototypen hat Mont Blanc jetzt das ARM-SoC Samsung Exynos 5 mit zwei Cortex-A15 ausgewählt, wie anlässlich der Konferenz SC12 bekannt gegeben wurde.

Nvidia arbeitet im Rahmen des Project Denver an SoCs mit selbst entwickelten ARM-Kernen, hat aber ebenfalls eine Lizenz für den Cortex-A15. Dieser könnte in der Tegra-Version Wayne zum Einsatz kommen. Bei den selbst entwickelten ARM-Kernen könnte es sich um 64-Bit-Versionen handeln, wie sie etwa auch AMD, STMicroelectronics, Calxeda, Applied Micro und andere planen – zum Teil aber auf Basis der ARM-Designs Cortex-A57 und -A53. (ciw)