Prozessorgeflüster

Schneller als gedacht arbeitet der neue Itanium 2. IBM gab auf der ISC 2003 (c't 15/03 S. 54) ein paar weitere Details zu den kommenden Konkurrenten Power5 und Power6 bekannt und AMD verriet auf der gleichen Veranstaltung schon mal vorab ein paar SPEC-Werte der 2-GHz-Opteronen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 6 Min.
Von
  • Andreas Stiller

Hewlett-Packard hats nun doch geschafft (und das kostet mich ein leckeres Weizenbier an HPs Urgestein Manfred Willem): Der neue Itanium 2 6M mit Codenamen Madison ist erstmals in der Integer-Performance schneller als der Pentium 4 und damit der schnellste Prozessor überhaupt. Knapp zwar, aber mit 1322 SPECint_2000base liegt er um etwa 40 Punkte vor dem Pentium 4 mit 3,2 GHz. 6M steht dabei für die Version mit 6 MByte großem L3-Cache (und nicht etwa 6 GByte, die „Millionen“ aufmerksame Leser im letzten Geflüster aufgeschreckt hatten). Im Gleitkommabereich war ohnehin klar, dass er weit vorne liegen und die 2000-Grenze von SPECfp knacken würde, was er mit 2119 - und damit über 30 Prozent mehr als Erzkonkurrent IBM Power4+-1,7 - auch deutlich tat.

Und dabei kam ich mir bei der Wette besonders clever vor, weil ich vorab Werte von den Intel-Büchsen (Tiger-System) gesteckt bekommen hatte, die klar unter denen von HP und vom Pentium 4 lagen. Intel war daher gut beraten, zum Itanium-Launch nur die HP-Ergebnisse vorzuzeigen, die dank der schnellen HP-Chipsätze zx1 und sx1000 und des leistungsfähigen HP-UX-C++-Compilers erzielt wurden. Mit Fortran haperts bei HP offenbar noch, denn für die überwiegend aus Fortran-Programmen bestehende SPECfp-Suite nahm die Firma aus Palo Alto dann doch lieber Linux und Intel-Compiler zu Hilfe.

SGI war allerdings schneller als HP, zumindest was das Einreichen der Itanium-2-Werte bei SPEC anging. Ihre Altix 3000 erreicht 2041 SPECfp und 1077 SPECint, liegt also zum Teil kräftig unter HPs Werten - das sieht nach einem verlorenen Wettkampf aus. Aber SGIs Qualitäten liegen im Multiprozessorbereich, bei der Altix kann nämlich jede CPU ungestört auf ihren eigenen Speicher zugreifen. Beispielsweise bei vier Prozessoren fegt sie den HP-Integrity-Server rx5670 mit 82,2 zu 66,4 SPECfp_rate geradezu weg - sie spielt halt in einer anderen Liga. Die Performance skaliert dann weiter fast linear mit der Anzahl der Prozessoren, und so kommt SGIs 64-fach System auf beachtliche Ergebnisse von über 1000 SPECfp_rate, und das mit der kleinen Itanium-2-Ausführung (1,3 GHz, 3 MByte L3-Cache) - von der großen gabs wohl noch nicht genügend ...

Dumm nur, dass Linux-Schöpfer Torvalds die von SGI eingereichte Linux-SMP-Erweiterung über 16 Knoten hinaus nicht akzeptiert hat (auch andere Vorschläge noch nicht). Für das altrenommierte HP-UX ist das alles hingegen kein Thema.

Ein bisschen überdeckt von dem glanzvollen Itanium-2-Launch blieben die neuen Xeon-MP-Prozessoren, die ebenfalls einen ziemlichen Sprung nach vorne gemacht haben, immerhin von 2 auf 2,8 GHz. Intel hielt sich hier mit Zahlen vornehm zurück, sprach nur vage von mehr als zehn Prozent Performancegewinn. Vielleicht sollten auch zu gute Xeon-Werte das Itanium-2-Wässerchen nicht trüben.

Diese Rolle übernahm schon IBM, die des Itaniums Blütenträume, Spitzenreiter in allen Klassen zu sein, erst mal wieder in der für Server wohl wichtigsten Disziplin platzen ließen, im so genannten Transaction-Wert TPC-C. HP hatte kurz vor dem Launch mit 707 102 tpmC einen Spitzenwert des Superdome mit 64 Prozessoren in der Liga für nichtgeclusterte Systeme gemeldet. Nun verhagelte IBMs Regatta-System dem frisch angetretenen Itanium 2 die Show: mit nur halb so vielen Prozessoren erzielte Big Blue 763 898 tpmC.

Und gleich viermal schneller als der Power4 soll der sich grad warmlaufende Power5 sein - gerechnet „Launch-zu-Launch“, also in Bezug auf den 1-GHz-Power4 vom Oktober 2001. Explizit hat IBMs Prozessorarchitekt David Siegel auf der ISC diese Rechnung auch für SPEC-Werte bestätigt, für kommerzielle Software soll die Performancesteigerung sogar „mindestens vierfach“ sein. Das würde immerhin eine Performance von ungefähr dem Doppelten des aktuellen Power4+ mit 1,7 GHz bedeuten. Mit 1,9 MByte ist auch der L2-Cache des Power5 recht ordentlich, extern stehen dann noch 36 MByte L3 zur Verfügung. Nicht unwesentlich dürfte der integrierte Speichercontroller zu der Performancesteigerung beitragen, dessen Speicherbandbreite laut Siegel doppelt so hoch wie beim Power4 ist. Hinzu kommt Simultaneous Multithreading (SMT), eine Technik, die bei Intel unter dem Namen Hyper-Threading segelt. Als i-Tüpfelchen führt IBM dann noch „Fast Path“ ein, einen so genannten Applikationsbeschleuniger mit Hilfe rekonfigurierbarer Hardware.

Eingeplant ist der Power5 für das erste Halbjahr 2004 mit vermutlich 2 bis 2,5 GHz Takt. Ein Jahr später soll der Power5+ folgen, den vor allem eine Verkleinerung der Strukturgröße auf 90 nm auszeichnet. Und noch ein Jahr später der Power6, mit 65-nm-Strukturen und mit mehreren „Ultrahigh Frequency Cores“. Dieser soll dann abermals viermal schneller sein als der Power5.

Interessant ist ferner, dass Infiniband als Interconnect zwischen Boards und Systemen doch noch zu Ehren kommen soll, sowohl bei IBM als auch bei Intel. Zwischenzeitlich sah es ja so aus, als würde dieser gemeinsame I/O-Standard ins Abseits geraten, aber jetzt sollen Power5 und die nächsten Itanium-Chipsätze Infiniband-Support bieten.

Auch AMD hatte einen bekannten Prozessorarchitekten zur ISC geschickt: Michael Goddard, Mitentwickler des K5. Neben ein paar Allerwelts-Roadmap-Informationen enthielten seine Grafiken ganz nebenbei auch Daten von noch „unbekannten“ Prozessoren, die Opteronen 246 und 846. Das sind die 2-GHz-Versionen für Dual- beziehungsweise 4/8fach-Systeme.

Mit beispielsweise 56,6 SPECfp_rate schlägt sich danach der Opteron 846 im Vierfach-System gar nicht so schlecht gegen den neuen Itanium 2, der in HPs rx5670 mit 66,4 so weit ja nicht voraus ist. Und der 246 zeigt als wohl schnellstes derzeitiges Dual-System mit einer Integerleistung (SPECint_rate) von 30,3, wo es lang geht - zum Vergleich: Apples schnellster PC aller Zeiten, der Dual-G5-Mac, kommt auf 17,2.

Für Anfang August werden die neuen Opteron-Prozessoren erwartet. Und den kleinen Desktop-Bruder Athlon 64 will AMD nun etwas vorziehen und schon zur wegen SARS auf den 22. September verschobenen Computex bringen. (as) (as)