"Wir könnten heute einen Petaflop-Rechner bauen"
David Turek, Vice President Deep Computing bei IBM im Interview mit Technology Review über den Stand des Roadrunner-Projektes, Blue Gene, Sinn und Unsinn von Petaflop-Computern und den internationalen Wettbewerb.
Kaum ein anderes Unternehmen hat den Markt der Groß- und Superrechner in den vergangenen Jahren so aufgerollt, wie IBM. Als weltweit schnellster Supercomputer und Spitzenreiter in den Top500 – einer internationalen Rangliste von Supercomputern – gilt derzeit IBMs eServer Blue Gene am Lawrence Livermore Labs. Er kommt auf eine Spitzenleistung von 280,6 Teraflops (Billionen Rechenoperationen pro Sekunde). Im vergangenen Herbst vermeldeten AMD und IBM, dass sie an einem Rechner arbeiten, der erstmals die Petaflop-Marke (Tausend Billionen Rechenoperationen pro Sekunde) knacken soll. Der geplante hybride Supercomputer "Roadrunner" soll am Los Alamos National Laboratory errichtet werden. Erstmals kommen dabei auch 16.000 der für Video-Spielekonsolen entworfenen Cell-Prozessoren zum Einsatz. David Turek, Vice President Deep Computing bei IBM, sprach im Interwiew mit Technology Review über den Stand des Roadrunner-Projektes, Blue Gene, Sinn und Unsinn von Petaflop-Computern und den internationalen Wettbewerb.
TR: Wie ist der aktuelle Status des Roadrunner-Projektes?
David Turek: Das Roadrunner-Projekt läuft jetzt seit einigen Monaten. Ein substanzieller Opteron-Cluster ist jetzt hier. Der zweite Teil Teil des Projektes besteht darin, die Software-Installation zu vollenden. Das Software-Team ist zur Stelle – es besteht aus diversen Spezialisten von zahlreichen internationalen IBM-Laboratorien und natürlich aus Wissenschaftlern der Los Alamos Laboratories. Im Laufe dieses Jahrs wird das System weiter ausgebaut – die Integration der Cell-Technologie soll dann 2008 erfolgen.
TR:Können Sie skizzieren, wie das System funktioniert? Warum soll dieser Rechner eine derartige Rechenleistung besitzen? Und wie soll die Arbeit zwischen den herkömmlichen Opteron-Rechnern und den Cell-Rechnern aufgeteilt werden.
Turek: Das ist alles Teil des Software-Designs. Das ist dazu da, die Anwendung abzufangen und verschiedene Aufgaben an die Opterons oder Cell-Prozessoren zu leiten. Das ist von Anwendung zu Anwendung verschieden.
TR:Die Cell-Prozessoren, die zurzeit erhältlich sind, sind allerdings nicht so gut geeignet für Supercomputing-Anwendungen. Werden Sie eine neue Generation von Cell-Prozessoren verwenden?
Turek: Was Sie gesagt haben, hängt vermutlich damit zusammen, dass der Cell-Prozessor im Moment Fließkomma-Zahlen mit doppelter Genauigkeit nicht so gut verarbeitet. Aber wir betrachten den Markt der Supercomputing-Anwendungen sehr weiträumig. Und es gibt eine Menge Anwendungen, die wir für Supercomputing-Anwendungen halten, die mit Fließkomma-Zahlen einfacher Genauigkeit rechnen: Bei der Exploration von Öl, Anwendungen im Finanzsektor, Streaming von digitalen Medien und so weiter. Das Problem, das Sie erwähnt haben, betrifft also mehr die klassischen Forschungsanwendungen. Für diese Anwendungen wird es eine neue Generation von Cell-Prozessoren geben, die Ende 2007 auf den Markt kommen. Die werden in der Größenordnung von 100 bis 105 Gigaflops Rechenleistung für Fließkomma-Zahlen doppelter Genauigkeit haben – pro Chip. Während die Rechenleistung für Zahlen einfacher Genauigkeit bei ungefähr 250 Gigaflops liegt.
Die jetzt erhältlichen Cell-Chips verwenden wir nur, um das Programmiermodell zu entwickeln. Die Architektur – die Idee, den Cell als eine Art Beschleuniger einzusetzen – erfordert keine besondere Rechenleistung in Gigaflops pro Chip. Das Augenmerk liegt vielmehr darauf, dass die Software-Architektur korrekt funktioniert.
TR: Was für Anwendungen werden auf diesem Rechner laufen?
Turek: Nun, manche der Anwendungen unterliegen natürlich der Geheimhaltung. Aber ich denke, man kann sich darunter Anwendungen vorstellen, bei denen es um fundamentale Berechnungen von Materialeigenschaften geht.
TR: Werden wir zur Supercomputing-Konferenz im nächsten Sommer bereits erste Resultate sehen, oder ist das viel zu früh?
Turek: Lassen Sie mich das ganz deutlich sagen, weil es hier ein gewisses Potenzial für Missverständnisse gibt: Ich denke, es wird sicherlich Benchmark-Ergebnisse für den Opteron-Cluster geben. Aber ich glaube, wir werden im Mai, wenn die Resultate für die neue Top-500-Liste produziert werden, noch nicht genügend Cell-Prozessoren installiert haben, um deren volle Wirkung zu zeigen. Auf der anderen Seite werden wir Resultate für verschieden Arten von Anwendungen veröffentlichen, um deren Machbarkeit zu zeigen. Ich denke also, es wird in den kommenden Monaten eine Menge Informationen dazu geben.
TR: Verstehe. Was einen Beobachter möglicherweise verwirren mag, ist die Tatsache, dass IBM im Supercomputer-Bereich gleich auf zwei Technologien setzt: den Cell-Prozessor und die Blue-Gene-Architektur. Warum machen Sie sich da selbst Konkurrenz?