Supercomputer aus günstigen Open-Compute-Komponenten
Penguin Computing baut für das US-amerikanische Atomwaffen-Forschungsinstitut NNSA einen Linux-Cluster aus günstigen Standardkomponenten nach Spezifikationen des Open Compute Project (OCP).
Supercomputer sind teuer. Um wenigstens die Hardware-Kosten zu senken, hat das Atomwaffen-Forschungsinstitut NNSA (National Nuclear Security Administration) schon vor einigen Jahren das Programm Commodity Technology Systems (CTS) ins Leben gerufen. Der Einsatz von Standard-Komponenten (Commodities) soll den Bau von Superrechnern billiger machen, die in Zukunft in den US-amerikanischen Atomforschungszentren Los Alamos (LANL), Lawrence Livermore (LLNL) und Sandia (SNL) zum Einsatz kommen (Tri-Lab).
Nun hat die kalifornische Firma Penguin Computing einen mit 39 Millionen US-Dollar dotierten Auftrag zur Beschaffung von High-Performance-Computing-(HPC-)Clustern aus preiswerten Komponenten erhalten. Penguin verwendet Racks und Server-Einschübe nach Spezifikationen des Open Compute Project (OCP), das ursprünglich von Facebook ins Leben gerufen wurde, um billigere Hardware für die eigenen Cloud-Rechenzentren zu beschaffen.
Unter dem Namen Tundra Extreme Scale (Tundra ES) offeriert Penguin OCP-Racks, die 36 Einschübe mit je drei OCP-Modulen aufnehmen. Sie lassen sich flexibel mit Compute- und Storage-Knoten füllen.
Diese kommen derzeit von der taiwanischen Firma Gigabyte. In den Dual-Xeon-Einschüben Relion 1930g und Relion 1930e sitzen Mainboards vom Typ Gigabyte MH70-HD0. Der Relion 1930g kommt mit 10-Gigabit-Ethernet, der Relion 1930e lässt sich mit 40- oder 50-GbE-Karten, InfiniBand- oder Omni-Path-Adaptern bestücken.
Der IceBreaker 1905g ist ein Storage-Server mit Xeon E3-1200 v3 und einigen Festplatten, außerdem gibt es Einschübe nur für Festplatten.
Penguin offeriert auch bereits ein Modul mit dem ARMv8-Prozessor Cavium ThunderX namens Valkre 1030c. Künftig soll der Einschub Relion1030 Phi mit Xeon Phi folgen.
RapidIO als ARM-Interconnect
Unterdessen hat die HPC-Arbeitsgruppe des OCP Pläne veröffentlicht, den in Telco-Servern und Embedded Systems etablierten Interconnect RapidIO zur kohärenten Verbindung zwischen ARMv8-SoCs zu nutzen. Zur "ARM 64-bit Coherent Scale Out Task Group" bei RapidIO.org gehören außer ARM noch Firmen wie AMD, Cavium, Xilinx und Marvell. Unter anderem sollen die von ARM zur internen Verbindung von SoC-Komponenten entwickelten AMBA-Protokolle AXI4/ACE auf RapidIO abgebildet werden. (ciw)