AMDs neuer Opteron "Shanghai" ist da (Update)

AMD startet den Verkauf der ersten Prozessoren in 45-nm-Technik, vorerst für Server. In Benchmarks kann er sich gegen die aktuellen Intel-Serverprozessoren gut in Szene setzen.

In Pocket speichern vorlesen Druckansicht 112 Kommentare lesen
Lesezeit: 7 Min.
Von
  • Andreas Stiller

Minister Wolfgang Tiefensee mit Shanghai-Wafer, links Emilio Ghilardi, General Manager AMD EMEA, rechts Jochen Polster, Vizepräsident Marketing EMEA und Managing Direktor der AMD-GmbH

(Bild: Uli Ries, Intelletech)

Während des heutigen Analystentages in Sunnyvale/Kalifornien bringt AMD früher als ursprünglich geplant den "verbesserten Opteron-Prozessor der dritten Generation", besser bekannt unter dem Codenamen "Shanghai" heraus. In Berlin gab es dazu bereits gestern eine kleine Feier, in der Verkehrsminister Tiefensee als Vertreter der Bundesregierung einmal nicht über Bahn und Bonus reden musste, sondern über die "new Länder" und die Bedeutung von AMD. "Shanghai moves to east Germany", so Tiefensee. Zu der geplanten Umstrukturierung von AMD äußerte er sich jedoch nicht.

Als Launch-Partner zeigten unter anderem IBM, Sun, HP, Dell, Fujitsu Siemens Computers, Transtec, CPI und andere ihre Shanghai-Server, und Großkunde Strato lud in sein Datenzentrum ein, in dem ein Rack voller Dual-Shanghai-Server feierlich eingeschaltet wurde. Strato hat zusammen mit MSI auch neue Opteron-Boards entwickelt, die für Server mit hohen Leerlaufzeiten optimiert sind.

Der 45-nm-Prozess läuft nach AMD-Aussagen sehr gut an.

(Bild: AMD)

Die neuen Opterons sind die ersten AMD-Prozessoren in 45-Nanometer-Technik. Sie sind für Server mit je zwei sowie vier oder acht Prozessorfassungen und mit Taktfrequenzen von 2,3 bis 2,7 GHz erhältlich und besitzen den gleichen Sockel F1207 wie die Vorgänger Barcelona (AMD64/K10) mit vier Kernen und die älteren Dual-Core-Versionen. Die wichtigste Neuerung ist der auf 6 MByte vergrößerte L3-Cache. Bei diesem kann man jetzt auch ähnlich wie beim Itanium 2 (Pellston-Technik) einzelne defekte Cachelines ausblenden. Des Weiteren bietet Shanghai eine verbesserte Energieverwaltung und beschleunigte Virtualisierungsfunktionen. Strato demonstrierte die Leistungsfähigkeit des neuen Prozessors fürs Webhosting. Bei 2,6 GHz Taktfrequenz verbrauchte der Shanghai (Opteron 2382) nur minimal mehr Energie als die spezielle 65-nm-Energiesparversion Opteron 2347 HE mit 1,9 GHz, war aber im HTTP-Durchsatz fast doppelt so schnell.

c't hatte vorab zwei mit Shanghai-Prozessoren bestückte Server mit Boards von Supermicro zum Test bekommen. Während das 4-Prozessor-System völlig ohne Probleme lief, hatte der 2-Prozessor-Vorserienserver aber noch Timing-Probleme mit DDR2-800-Speicher (PC2-6400R). Die Werte der CPU2006-Benchmarksuite basieren daher zum Teil auf weniger Durchläufen als vorgeschrieben und sind als "estimated" gekennzeichnet. c't verwendete für die Benchmarks den neuen Intel-Compiler 11 (derzeit noch als Beta-Version) unter Windows 2008 Server 64 Bit, und zwar mit der kompatiblen Einstellung für SSE3, sodass auf Intel- und AMD-Systemen der gleiche Binärcode läuft – ohne Spezialoptimierungen oder spezielle Bibliotheken. Die Werte liegen somit unter denen auf spec.org.

Unter dieser Prämisse hat der Opteron 2384 mit 2,7 GHz gegenüber dem zum Vergleich herangezogenen Harpertown-Xeon (3,33 GHz, FSB1333) bei SPECint_rate_base2006 mit 109 (est.) zu 104 knapp die Nase vorn, jedenfalls bei 64-bittigem Code. Mit 32-Bit-Code dreht sich das zu Gunsten des Harpertown um (112 : 104). Beim Gleitkomma-Durchsatz, also SPECfp_rate_base2006 (32-bittig) liegt Shanghai klarer vorne: 81,6 zu 65,4. Hier muss man allerdings hinzufügen, dass Intels neuer Core-i7-965-Prozessor (Codename Bloomfield, Nehalem-Generation) diese Werte schon als Einzelprozessor erreicht, aber es sind noch keine Dual-Prozessor-Server damit erhältlich. Der dafür vorgesehene Nehalem-EP (oder Gainestown) wird etwa zum März nächsten Jahres erwartet, man munkelt aber, dass Intel ihn jetzt vielleicht vorziehen wird.

Dem Vierprozessorsystem mit viermal Opteron 8384 (2,7 GHz) stellte c't Intels neuen Hexa-Core-Prozessor Xeon X7460 (Dunnington) gegenüber. Dieser ist bei SPECint_rate_base2006 mit 199 zu 181 etwas schneller. Bei SPECfp_rate_base2006 lieferten sich die beiden ein totes Rennen (129 : 129).

(Update:) Auf spec.org sind bereits erste Shanghai-Ergebnisse im CPU2006 zu finden, etwa 113 int_base_rate_2006 für einen Server mit zwei Opteron 2384 und 202 Punkte für eine Vier-Sockel-Maschine (8384). Im SPECfp_rate_base_2006 kommen diese Systeme auf 105 und 188 Punkte, aber unter 64-Bit-Linux (Suse Linux Enterprise Server, SLES 10 SP1 und Red Hat Enterprise Linux, RHEL 5.2) und mit Compilern von PathScale (3.2) beziehungsweise PGI (7.2). Auch Dell hat schon Ergebnisse mit diesen Shanghais veröffentlicht. Intels zurzeit schnellster Xeon X5492 mit 3,4 GHz und FSB1600 bringt es in Verbindung mit PC2-6400F-Speicher zwar auf 125 SPECint_rate_base2006-Punkte, bringt es aber beim Gleitkomma-Durchsatz unter x64-Linux auch mit den jüngsten 11er-Compilern nur auf 87,2 Punkte – damit kann er nur knapp den schnellsten 65-nm-Opteron 2360 SE (84,7) schlagen. Der neue Opteron 2384 liefert also mit einer um 8 Prozent höheren Taktfrequenz, schnellerem Speicher und verdreifachtem L3-Cache fast 24 Prozent mehr Gleitkomma-Durchsatz als sein Vorgänger und arbeitet dabei auch noch sparsamer.

Beim Java-Business-Benchmark SPECjbb2005 liegt nach Messungen (PDF-Datei) von IBM der Opteron 8384 im LS42-Blade mit 721.843 SPECjbb2005-Business-Operationen um 42 Prozent vor dem Dunnington-System. Und HP hat für den mit acht Shanghai-Prozessoren bestückten DL785 G5 auch schon SAP-Werte veröffentlicht: 7010 SD-Benutzer (1,88s, 35.400 SAPS). In dieser Disziplin liegt der IBM-Server System x3950 mit Intel Xeon X7460 allerdings in Führung: 9200 SD-Benutzer (1,95s, 46.170 SAPS).

Das Shanghai-System mit Registered-DDR2-Speicher ist dafür energiesparender als das Dunnigton-System mit FB-DIMMs (Caneland-Plattform); SPECPower_ssj2008-Ergebnisse liegen derzeit zwar noch nicht vor, aber für das Zweiprozessorsystem hat AMD schon vorab SPECPower_ssj2008-Ergebnisse veröffentlicht. Mit 2149 US-Dollar OEM-Preis ist der Opteron 8384 zudem deutlich günstiger als der Xeon X7460 mit 2729 US-Dollar. MP-Xeons mit Nehalem-Kern (Nehalem-EX) werden nicht vor dem dritten Quartal 2009 erwartet, hier hat AMD also ein relativ großes Zeitfenster, bis die Konkurrenz zurückschlägt.

OEM-Preise des neuen Opteron-Prozessors (Shanghai)
Opteron 2384 (2,7 GHz CPU/2.2 GHz MC) $ 989
Opteron 2382 (2,6 GHz CPU/2.2 GHz MC) $ 873
Opteron 2380 (2,5 GHz CPU/2.0 GHz MC) $ 698
Opteron 2378 (2,4 GHz CPU/2.0 GHz MC) $ 523
Opteron 2376 (2,3 GHz CPU/2.0 GHz MC) $ 377
Opteron 8384 (2,7 GHz CPU/2.2 GHz MC) $ 2149
Opteron 8382 (2,6 GHz CPU/2.2 GHz MC) $ 1865
Opteron 8380 (2,5 GHz CPU/2.0 GHz MC) $ 1514
Opteron 8378 (2,4 GHz CPU/2.0 GHz MC) $ 1165

Maximale Taktfrequenzen für die vier CPU-Kerne und den Speichercontroller (MC) beziehungsweise L3-Cache.

(Update:) Der Mainboard- und Server-Barebone-Hersteller Tyan hat nach eigenen Angaben 24 Produkte im Programm, die die neuen 45-nm-Opterons unterstützen; einige Varianten älterer Boards sind auch mit dem zusätzlichen Spannungswandler zur getrennten Versorgung der CPU-Kerne einerseits und des "Uncore"-Bereichs aus Speichercontroller, L3-Cache und HyperTransport-Interface andererseits bestückt, was AMD als Dual Dynamic Power Management (DDPM) bezeichnet. Laut Tyan ist das Vier-Prozessor-Board Thunder n6650EX (S4992) bereits HyperTransport-3.0-tauglich, die Prozessoren untereinander können also mit cHT 3.0 statt HT 1.1 kommunizieren. Den HT-3.0-tauglichen Serverchipsatz SR5690 will AMD erst im kommenden Jahr vorstellern. (as)