PathForward: 258 Millionen US-Dollar für Exascale-Supercomputer

Die US-Regierung fördert die HPC-Entwicklung bei AMD, Cray, HPE, IBM, Intel und Nvidia, um möglichst schnell Exaflops-Superrechner zu bekommen.

5

Supercomputer Cori mit Cray-Technik

(Bild: NERSC)

16.06.2017, 14:09 Uhr

Lesezeit: 3 Min.

Von

Christof Windeck

Das US-Department of Energy (DoE) zahlt im Rahmen des PathForward-Programms in den nächsten drei Jahren 258 Millionen US-Dollar an sechs Computerfirmen, um die Entwicklung von Komponenten von Exascale-Supercomputern zu beschleunigen. Ein solches HPC-System liefert mindestens etwa 1 Exaflops an Rechenleistung; der bisher schnellste Top500-Superrechner Sunway TaihuLight schafft 0,093 EFlops und steht in China.

Es geht den US-Amerikanern also auch darum, wieder die Vormacht im Supercomputing zu ergattern: Immerhin liegen die USA noch bei der addierten Gesamtleistung der Top500-Systeme vorne. Viele Superrechner werden in der Rüstungs- und Atomwaffenforschung eingesetzt, sind aber bekanntlich auch für zahlreiche Bereiche der zivilen Wirtschaft und Wissenschaft wichtig.

Die Ankündigung von PathForward erfolgt wenige Tage vor der Supercomputing-Konferenz ISC High Performance 2017 in Frankfurt, bei der auch die neue Top500-Liste veröffentlicht werden wird.

Im Februar hatte das National Supercomputer Center (NSCC) im chinesischen Tianjin gegenüber der Zeitung China Daily angekündigt, noch vor 2020 den Tianhe-3 mit Exaflops-Leistung in Betrieb zu nehmen. Er soll mit chinesischen Prozessoren arbeiten – wie der TaihuLight mit seinen 40.960 Sunway SW26010 (ShenWei 26010/申威26010).

Auch die EU will Milliarden in Exascale-Systeme investieren: Hier müssen die Pläne neu geschmiedet werden, weil die Briten mit dem Brexit aus vielen Programmen aussteigen.

Leistung pro Watt

Zwei technische Probleme sind von herausragender Bedeutung: Die Leistungsaufnahme des Gesamtsystems im Zaum zu halten – der erwähnte Sunway TaihuLight schluckt über 15 Megawatt – und Daten zwischen Clusterknoten beziehungsweise Rechenwerken schnell und sparsam zu übertragen.

Schon lange vor der neuen PathForward-Initiative des Exascale Computing Project (ECP) haben die nun mit Fördermitteln versorgten Firmen AMD, Cray, HPE, IBM, Intel und Nvidia auf diesen Gebieten geforscht. 2012 beispielsweise flossen 62 Millionen für FastForward, 2014 nochmals 100 Millionen US-Dollar für FastForward2. Doch 2015 forderte Obama, die Projekte sollten beschleunigt werden.

AMD hat etwa CPU-GPU-Kombichips mit aufgestapeltem High-Bandwidth Memory (HBM) für Exascale-Rechner untersucht.

Interconnects

Intel entwickelt einerseits den Rechenbeschleuniger Xeon Phi, andererseits die hauseigene Omni Path Architecture (OPA), um Xeon Phi, Xeon-SP und ganze Clusterknoten untereinander zu vernetzten. Bei einigen Xeon-SP wird OPA direkt im Prozessor integriert sein, wie beim Xeon Phi.

Cray wiederum nutzt seit Jahren Interconnects wie SeaStar, Gemini und Aries, die Clusterknoten in der Struktur eines 3D-Torus vernetzen. Aries wurde im Rahmen des DARPA-Programms HPCS entwickelt und erlaubt auch eine enger vermaschte Dragonfly-Struktur. Intel hat die Interconnect-Abteilung von Cray 2012 gekauft. Cray Shasta verwendet Intels OPA.

HPE sieht sich mit The Machine mit ARM-SoCs und 160 TByte RAM gut gerüstet; hier kommt der optische Interconnect X1 mit bis zu 1,2 TBit/s zum Einsatz. Für PathForward will HPE aber auch Gen-Z verwenden, um Prozessoren, RAM und nichtflüchtigen Speicher in einem gemeinsamen Adressraum zu nutzen.

IBM setzt unter anderem auf Power9 mit PCI Express 4.0, OpenCAPI und NV-Link 2.0, um Nvidias Tesla-Beschleuniger kohärent anzubinden. (ciw)