Prozessorgeflüster

IBM rückt mit dem Power4+ auf der Gigahertz-Skala weiter nach oben, AMD überflutet die offizielle SPEC-Benchmark-Site mit einer Fülle von Ergebnissen und Intels Prescott-Prozessor nimmt so langsam Konturen an.

In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Lesezeit: 6 Min.
Von
  • Andreas Stiller

Auf IBMs Website kann man sie schon bestaunen, die diversen neuen pSeries-Systeme mit Power4+-Prozessoren, die sich jetzt bis auf 1,7 GHz hinaufschwingen. Das Spitzenmodell p690 verdrängt dabei in dem für diese Szene so wichtigen Benchmark TPC-C (non-clustered) mit einem Wert von 680 613 den bisherigen Spitzenreiter HP Superdome (658 227) von seinem gerade erst zwei Wochen zuvor eroberten ersten Platz, und das, obwohl der Superdome mit immerhin doppelt so vielen Prozessoren aus der erst für Sommer vorgesehenen nächsten Itanium-2-Generation mit Codenamen Madison bestückt ist. Für HP spricht allerdings das Preis/Leistungsverhältnis, das nach dem TPC-Kostenmodell (inklusive Wartung etc.) mit rund 6,5 Millionen US-Dollar (9,8 $/tmpC) letztendlich um gut 15 Prozent günstiger ist als IBMs „Regatta“.

Auch bei den bei uns so beliebten SPEC-CPU2000-Werten schlägt sich der neue Power4+ gut und übernimmt beim Gleitkommawert der Suite, SPECfp2000, klar die Führung vom Itanium 2. Anders als bei TPC-C ist das aber hier noch der alte McKinley - offizielle Madison-Werte sind noch nicht bekannt, doch soll der Neue laut Intel den Vorgänger um mindestens 50 Prozent übertreffen, so könnte er vielleicht als erster die SPECfp2000-„Grenze“ von 2000 knacken.

Auf der Integer-Seite, beim SPECint2000, müssen sich die beiden teuren Power4- und Itanium-2-Boliden jedoch viel preiswerteren Prozessoren geschlagen geben: dem Desktop-Prozessor Pentium 4 sowie AMDs Opteron - zumindest in der Einzelprozessorwertung. Bei Vierfach-Servern (SPECint2000rate) kann sich der Power4+ im p655-System hingegen ganz knapp vor dem Opteron-System Einux A4800 behaupten.

Für den neuen Pentium 4 mit 200 MHz Systemtakt (FSB800) hat Intel jetzt die offiziellen SPEC-Werte veröffentlicht, die, kaum überraschend, nahezu exakt mit den von uns gemessenen Werten übereinstimmen (unser SPECfp-Wert war sogar minimal besser).

AMD hat jetzt die SPEC-Website [1] mit einer Fülle von Opteron-Werten geradezu geflutet. Rund 40 Einzelergebnisse sind hier für die verschiedenen Prozessoren, Konfigurationen, Betriebssysteme und Compiler aufgelistet. Neben Windows- und Linux-32-Resultaten findet man auch Werte, die unter 64-bittigem Linux gemessen worden sind, und zwar sowohl für 32- als auch für 64-Bit-Code (nur für SPECint). Wie schon unser Opteron-Test ergab, zeigt sich auch hier, dass der 64-Bit-Code (SuSE-gcc3.3) im Schnitt ein wenig schneller performt als sein 32-Bit-Pendant, dass es aber auch Fälle gibt (mcf, parser), die unter 64 Bit wegen vieler Pointer-Zugriffe „leiden“ und daher verlangsamt werden.

SPEC-CPU2000-Ergebnisse

Der mit dem gcc konkurrierende Intel-Compiler demonstriert dabei einmal mehr, was herauskommt, wenn man mit höheren Optimierungsfähigkeiten gesegnet ist: Der damit erzeugte Code lässt nach AMDs Daten sowohl unter Windows als auch unter Linux die gcc-Kollegen (noch) klar hinter sich - egal ob die nun 32- oder 64-bittig kompilieren. Natürlich unterstützt dabei der Intel-Compiler den 64-bittigen AMD64-Modus nicht - noch nicht, denn schließlich geht ja die Saga, Intel wolle AMDs 64-Bit-Erweiterung bald übernehmen, möglicherweise schon bei dem für dieses Jahr geplanten Pentium-4-Nachfolger Prescott. Dass Intel das Recht dazu hat, ist nach dem Patentaustauschabkommen im Vorjahr unstrittig. Auf die diesbezügliche Frage zum geheimnisvollen Projekt „Yamhill“ haben die Intel-Oberen, etwa Chef-Technologe Pat Gelsinger, bislang allerdings immer nur vielsagend gelächelt.

Nun hat aber Chiparchitekt Hans de Vries eine sehr tief gehende Analyse veröffentlicht [2], die auf einer akribischen Auswertung des Prescott-Bildes („Die-Plot“) beruht. Sein Ergebnis: Eine Vorstufe zur AMD64-Erweiterung ist eindeutig im Prescott implementiert („Yamhill is for sure“). Prescott hat zwei Integer-Kerne, die sich laut de Vries zu einem 64-Bit-Betrieb kaskadieren lassen. Die physischen Adresskanäle sind nach seiner Analyse wie beim Opteron 40-bittig (bis 1 Terabyte Adressraum) ausgeführt und für die virtuellen Adressen sind ebenfalls 48 Bit vorgesehen. Aktuelle Canterwood- und Springdale-Boards sind zwar schon für Prescott im mPGA-478-Gehäuse ausgelegt, unterstützen aber nur 32 Adressleitungen (für 4 GByte Adressraum). Mit Hinblick auf FSB1066 wird Prescott auch in einer neuen Bauform erscheinen: im 775-poligen Land Grid Array (LGA). Sein dualtauglicher Xeon-Bruder namens Nocona wird im üblichen Xeon-Gehäuse PGA603 zunächst mit nur FSB533 herauskommen, unterstützt vom schon etwas betagten Plumas-Chipsatz (E7501).

Komplett 64-bittig sind Prescott/Nocona indes noch nicht, die internen Datenpfade sind nach den Erkenntnissen von de Vries noch 32-bittig und auch die zusätzlichen AMD64-Register fehlen. Beides wird aber für den „Yamhill“-Nachfolger im zweiten Halbjahr 2004 erwartet. Auch die Codenamen der Dual- und Multiprozessorbrüder von Yamhill sind derweil bekannt: Jayhawk und Potomac.

Prescott weist darüber hinaus eine Fülle von Verbesserungen auf, die Intel teilweise schon bekannt gegeben hatte: größere Caches, bessere Sprungvorhersage, feinere Trace-Cache-Unterteilung - 4 statt 6 Mikrobefehle (µOPs) pro Eintrag - und mehr Parallelität: der Dispatcher verteilt jetzt pro Takt 4 statt nur 3 µOPs. Und in der Mitte des Chips thront noch etwas Unbekanntes, etwas das Northwood nicht hat - der LaGrande-Prozessor. Der soll sich mit dem so genannten Trusted Mode, mit verriegeltem Speicher und Verschlüsselung beschäftigen (siehe S. 20) - ein 1999 eingereichtes weit reichendes Patent zu dem TPM-Thema ist Intel kürzlich erteilt worden und zwar ausgerechnet am 1. April ... (as)

[1] www.spec.org/cpu2000/results/res2003q2/

[2] www.chip-architect.com/news/2003_04_20_Looking_at_Intels_Prescott_part2.html (as)