Der smartere Benchmark
Supercomputer werden bislang vor allem nach ihrer reinen Rechenleistung bemessen. Der "Graph500"-Test soll nun auch den Umgang mit komplexen Daten erfassen.
- Christopher Mims
Supercomputer werden bislang vor allem nach ihrer reinen Rechenleistung bemessen. Der "Graph500"-Test soll nun auch den Umgang mit komplexen Daten erfassen.
Es gibt Dutzende sinnvolle Methoden, die Leistung der schnellsten Supercomputer der Welt zu bestimmen – von der Geschwindigkeit der internen Kommunikationsnetze zwischen den einzelnen Prozessorknoten bis zur Schnelligkeit ihres Speicherzugriffes. Am bekanntesten ist aber das sogenannte Linpack-Benchmark-Paket. Es wird eingesetzt, um die Reihenfolge der vielbeachteten Top500 festzulegen, auf die die gesamte High-Performance-Computing-Szene (HPC) mit Argusaugen schaut.
Eine Kommission aus 30 renommierten HPC-Experten hat nun aber ein neues Ranking vorgeschlagen, das nicht nur "raw power" der Maschinen, sondern auch den Umgang mit komplexen Daten bewerten soll. Die Graph500-Liste misst, wie gut die Rechner mit komplexen mathematischen Funktionen umgehen können.
Derlei Graphen sind die Lingua Franca in zahllosen technischen Bereichen: egal ob in der Biomedizin, wo Proteinfaltungen berechnet werden müssen, im Sektor der Finanznetze, wo Betrügereien mit Hilfe komplexer Funktionen frühzeitig erkannt werden können oder im Internet-Segment, wo soziale Netzwerke manche harte mathematische Nuss zu knacken haben. Stets gilt: Je schneller solche Funktionen abgearbeitet werden, desto besser.
Die erste Graph500-Liste wurde vor einigen Wochen auf der "Supercomputing 2010"-Konferenz in New York vorgelegt. Die Liste ist so neu, dass bislang nur die Ergebnisse von neun Systemen vorliegen. "Intrepid", ein Supercomputer des US-Energieministeriums auf Basis von IBMs BlueGene/P, ist momentan führend – mit nur 8192 seiner 40960 Knoten.
Intrepid gelang es, beeindruckende 6,6 Giga-edges pro Sekunde (GE/s) zu erzielen. Damit ist gemeint, dass das System 6,6 Milliarden Mal pro Sekunden von einem Knoten (oder auch Vertex) innerhalb eines künstlich geschaffenen Graphen zum nächsten springen konnte.
Diese hohe Geschwindigkeit ist notwendig, um sich durch sehr große Graphen zu bewegen. Will man beispielsweise die kürzeste Anzahl von Verbindungen zwischen zwei Mitgliedern eines sozialen Netzwerks ermitteln, müsste ein Rechner je nach Intelligenz der verwendeten Algorithmen zahllose mögliche Wege durch den sozialen Graphen "ablaufen". Dabei kommt es nicht mehr nur auf pure Rechenkraft an.
Interessanterweise sind zwei Systeme auf Platz drei und vier der Graph500-Liste, die relativ wenige Prozessoren besitzen: Zwei Cray XMT-Maschinen am Pacific Northwest National Laboratory und an den Sandia National Laboratories. 128 CPUs erreichten dabei 1,2 GE/s. Das bedeutet, dass sie bis zu zehnmal schneller pro Knoten arbeiten als das BlueGene/P-System Intrepid. Eine groĂźe Ăśberraschung ist das allerdings nicht, sind die Cray XMTs doch explizit fĂĽr solche Berechnungen optimiert.
"John Thale, der das drittplatzierte System auf der Graph500-Liste betreibt, meinte, es habe ihn nur ein bis zwei Stunden gekostet, den Code zu schreiben, damit der Benchmark lief. Bei konventionellen Systemen dauert das Tage", sagt Shoaib Mufti, Direktor im Bereich Wissensmanagement bei Cray.
Solche Spezialisierungen sind es auch, die für zukünftige datenintensive Anwendungen notwendig werden, auf die sich Betreiber von Supercommputern mehr und mehr konzentrieren müssen. Richard Murphy von den Sandia National Laboratories, das an der Finanzierung der Graph500-Liste beteiligt ist, meint, das sei der entscheidende Punkt. Wer konventionelle Systeme nur beschleunige, könne die neuen Anforderungen nicht meistern. Eine Tiefenanalyse von Daten, um komplizierte Beziehungen zwischen zwei Teilinformationen zu ermitteln, sei nur mit angepasster Technik möglich.
Das, was jetzt mit dem traditionellen Linpack-Benchmark gemessen wird, dürfte den HPC-Experten zufolge also immer mehr in den Hintergrund rücken – so sexy die darin repräsentierte, gewaltige Leistung auch sein mag. (bsc)