Intel und SGI projektieren Exaflops-System

Mit Many Integrated Cores will Intel mehr als die hundertfache Performance im Vergleich zum aktuellen Supercomputer-Spitzenreiter bei lediglich doppeltem Energieverbrauch erreichen.

In Pocket speichern vorlesen Druckansicht 15 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Andreas Stiller

Intel will sich bei Supercomputern noch lange nicht geschlagen geben: Mithilfe von Many Integrated Cores (MIC) will der Prozessormarktführer mit Partnern, allen voran SGI, die Rechenleistung gegenüber der aktuellen Nummer 1 der SupercomputerTop500-Liste, dem japanischem K Computer mit SPARC64VIII-Prozessor, um mehr als den Faktor 100 beschleunigen. Dabei soll sich der Energieverbrauch nur um maximal den Faktor 2 steigern.

Doch noch ist der einst als Grafikprozessor Larrabee geplante MIC-Chip ein früher Prototyp namens Knights Ferry, der nur mit einfacher Genauigkeit rechnen kann. Erst sein Nachfolger Knights Corner ist für den Markt gedacht, hergestellt im 22-nm-Prozess, ausgestattet mit über 50 Kernen und mit doppelter Genauigkeit. Er wird zunächst als PCI-Expresskarte herauskommen, soll dann aber bald als Coprozessor zumindest im gleichen Gehäuse wie der Hauptprozessor, hieß es auf der Supercomputerkonferenz ISC2011 in Hamburg

Damit man jetzt schon für MIC programmieren kann, hat Intel an über 50 Universitäten und Forschungseinrichtungen wie Jülich, CERN, KISTI und das Leibnizrechenzentrum in München (LRZ ) Prototypenkarten mit bis zu 32 Kernen und 1,2 GHz Takt herausgegeben – samt C++-und Fortran-Softwareumgebung, wie die Mathematikbibliothek MKL, Debugger und Profiler. Im Nu, berichtete Arndt Bode vom LRZ, konnte man damit seine Algorithmen auf MIC anpassen und – beschränkt auf einfache Genauigkeit – erhebliche Performancesteigerungen gegenüber dem Hauptprozessor erzielen: Nur ein Pragma bei OpenMP, und schon laufe die Schleife auf MIC. Bode zeigte unter anderem die Ergebnisse von TifaMMy auf Knights Ferry mit 32 Kernen und 1,2 GHz, die sich bei größeren Matrixgrößen dem theoretischen Maximalwert von 620 GFlops nähern.

Verglichen mit den aktuellen GPU-Werten liegen ansonsten die nackten Performancewerte – etwa die einfachgenaue Matrixmultiplikation SGEMM – mit real erzielten 722 GFlops ganz gut im Rennen, zusammen mit den Hauptprozessoren kommt die MKL beim SGEMM auch bereits über 1 Teraflops. Intel zeigt zudem in der begleitenden Ausstellung auch einen Knoten mit acht Knights-Ferry-Karten, die 7,4 Teraflops erzielen. (as)