Erste SPEC-Effizienzwerte für Shanghai-Opterons

AMD liefert mit Ergebnissen des Standard-Benchmarks SPECpower_ssj2008 erste Belege für die niedrigere Leistungsaufnahme der kommenden 45-Nanometer-Prozessoren.

vorlesen Druckansicht 19 Kommentare lesen
Lesezeit: 5 Min.

Die Vorstellung der Shanghai-Opterons, also Quad-Core-Serverprozessoren aus der Dresdner 45-Nanometer-Fertigung, rückt immer näher: Als möglicher Termin wird über den kommenden Donnerstag spekuliert, an dem die Firma AMD ihren jährlichen Financial Analyst Day veranstaltet und auch über neue Technik und Roadmaps sprechen will.

Nachdem die neuen Shanghai-Opterons bereits bei einigen Online-Händlern aufgetaucht sind und AMD wie im letzten Jahr erneut versprochen hat, dass die Neulinge in vielen heute schon ausgelieferten Mainboards laufen werden, hat AMD nun auch einige Messungen mit dem Servereffizienz-Benchmark SPECPower_ssj2008 veröffentlicht. Bisher war auf der SPEC-Webseite nur ein eher schlechter Wert von 203 ssj_ops/Watt für einen älteren Server mit zwei Dual-Core-Opterons in einem Supermicro-Barebone zu finden; für die aktuelle 65-nm-Generation (Barcelona) der K10-Vierkerne hat AMD – obwohl Mitglied im Benchmark-Gremium – noch keine SPECpower_ssj2008-Werte veröffentlicht. Bisher dominieren auf der SPECPower_ssj2008-Ergebnis-Webseite Xeon-Server, die in speziellen Konfigurationen (nur ein Prozessor, nicht-redundantes Netzteil) mehr als 1100 ssj_ops/Watt liefern.

Server mit zwei Xeon-Prozessoren kommen allerdings höchstens dann über die 1000-Punkte-Effizienzmarke in diesem Server-Side-Java-Benchmark, wenn sie mit den besonders sparsamen und teureren Quad-Core-Prozessoren der Baureihe L5400 bestückt sind. Der (laut Benchmark) effizienteste Server mit zwei "gewöhnlichen" 80-Watt-Xeons ist ein IBM System x3450 mit zwei 2,8-GHz-Xeons (E5462, FSB1600), der es mit vier 4-GByte-FB-DIMMs unter Windows Server 2003 x64 auf 854 ssj_ops/Watt bringt. Die sonstige Ausstattung des 1-HE-Rack-Servers ist weniger praxistauglich, denn er ist nur mit einer einzigen SATA-Platte bestückt, aber immerhin mit einem für solche Maschinen typischen 600-Watt-Netzteil. Die maximale Leistungsaufnahme dieser Konfiguration beträgt übrigens 252 Watt, wobei der Server 323.998 ssj-Operationen pro Sekunde ausführt.

Solchen Werten stellt AMD nun Messungen an Systemen mit zwei der kommenden 2,7-GHz-Vierkerne Opteron 2384 sowie mit Opteron 2380 (2,5 GHz) entgegen. Letzteres liefern im Supermicro-Barebone 2021M-UR+ aber nur 731 ssj_ops/Watt (maximal 269 Watt und 308.089 ssj_ops) und sind damit sowohl weniger leistungsfähig als auch weniger effizient als die 2,8-GHz-Xeons im erwähnten IBM-Server. Anders sieht das aber bei den Opteron-2384-Servern aus, für die AMD den Tyan-Barebone GT24 herangezogen hat: In der sparsamsten Konfiguration sind 860 ssj_ops/Watt möglich, doch dabei hat AMD das serienmäßige 500-Watt-Netzteil gegen ein sparsameres getauscht, das maximal 350 Watt liefert – das ist wohl eher unüblich bei einem Server, der in dieser Konfiguration (mit 4×4 GByte PC2-6400R-Speicher) unter Volllast bereits 264 Watt Leistung aufnimmt. Mit dem 500-Watt-Netzteil kommt das AMD-Testsystem übrigens auf 826 ssj_ops/Watt – auch kein schlechter Wert, aber eben knapp hinter dem bisher (laut SPECPower-Benchmark) effizientesten Intel-System mit ungefähr vergleichbarer Rechenleistung.

Die Leerlauf-Leistungsaufnahme liegt bei dem erwähnten IBM-Server mit zwei Xeons, vier Fully-Buffered-DIMMs sowie einem 600-Watt-Netzteil übrigens bei 130 Watt und damit sogar um 6 Watt niedriger als bei dem Tyan-Barebone mit dem serienmäßigen 500-Watt-Netzteil und DDR2-RDIMMs; das deckt sich nicht ganz mit den Annahmen, die AMD auf der Webseite Platform Power Estimator zugrunde legt.

Mit 338.577 ssj_ops sind die beiden 2,7-GHz-Opterons übrigens um 4,4 Prozent schneller als die beiden 2,8-GHz-Xeons im IBM-Server; AMD setzt aber auch andere Software ein, nämlich bereits Windows Server 2008 und die JRockit-JVM von Oracle. AMD arbeitet bereits an Java-Optimierungen für die AMD64-Serverprozessoren, was auch Benchmark-Ergebnisse zu Gunsten der Opterons verschieben könnte. Bessere Software-Unterstützung kann ein erhebliches Plus bringen: Beim SPEC-CPU2006-Benchmark zeigt Intel beispielsweise, was die neuen Fortran- und C/C++-Compiler in Version 11.0 leisten: Vergleicht man CPU2006-Ergebnisse von Systemen mit je zwei Xeon X5482 (3,2 GHz) unter Suse Linux aus dem Dezember 2007 (Compilerversion 10.1) und dem Oktober 2008, so hat der Gleitkomma-Durchsatz (fp_rate_base_2006) von 79,7 auf 86,4 Punkte um rund 8 Prozent zugelegt und der Ganzzahl-Durchsatz (int_rate_base_2006) sogar um 19 Prozent von 121 auf 144 Punkte.

AMD muss sich mit der Veröffentlichung von Rekordmarken für die neuen Opterons sputen: Noch kann sich AMD nämlich mit den bisherigen Harpertown-Xeons messen. In einigen Monaten will Intel aber die ersten Nehalem-EP-Xeons liefern können, die bei ungefähr ähnlicher Leistungsaufnahme wie die aktuellen Xeons in Benchmarks mit hoch optimiertem Code sehr viel mehr Performance liefern dürften. In ersten Messungen mit den neuen Intel-Compilern erreichte ein einzelner Core i7-965 Extreme Edition bereits 110 Punkte im int_rate_base_2006 und 85,1 Punkte im fp_rate_base_2006. (ciw)