Der Zehnkerner

Größer, schneller und gleichzeitig energiesparender – das sind die Eckdaten von Intels neuem x86-Server-Flaggschiff Westmere-EX. Mit bis zu zehn Kernen, 30 MByte L3-Cache und geschätzten 2,9 Milliarden Transistoren ist er Intels derzeit größter Prozessor.

vorlesen Druckansicht
Lesezeit: 4 Min.
Von
  • Andreas Stiller

Mit den neuen Prozessoren führt Intel auch ein neues Namensschema für die Xeons ein. Die Produktlinie wird mit E3 (Einzelprozessoren, derzeit mit Sandy-Bridge-Kern), E5 (zukünftige Zweisockelversionen, ab Sandy Bridge-EP) und E7 (Westmere-EX und Nachfolger) festgelegt. Die beiden darauffolgenden Zeichen stehen für die Maximalzahl der CPUs im Knoten (1, 2, 4, 8) und für den Sockel-Typen (2, 4, 6, 8). Dann folgt eine zweistellige Kennziffer für den Prozessortypen, gegebenenfalls erweitert um ein L für Energiesparausführungen. Folgeversionen werden unter dem gleichen Namen mit angehängtem v2, v3 … gekennzeichnet.

Das Westmere-EX-Die: oben zweimal drei und unten zweimal zwei Kerne

Westmere-EX löst den Vorgänger Nehalem-EX ab, der acht Kerne und bis zu 24 MByte L3-Cache aufbot. Doch trotz seiner größeren Kernzahl, größerem L3-Cache und bei den Spitzenmodellen auch etwas schnellerem Takt soll er dank der auf 32 nm verkleinerten Strukturen nicht energiehungriger sein als jener. Da er mit LV-DIMMs (1,35 Volt) arbeiten kann, verbraucht das System sogar etwas weniger. Zudem besitzt der Neue auch einen tieferen Schlafmodus (C6) sowie integrierte Power-Gates für „Prozessor Parking“, sodass er im Leerlauf sparsamer ist. Er unterstützt Speichermodule mit bis zu 32 GByte pro DIMM. Ein Vier-Sockel-System kommt damit auf bis zu 2 Terabyte – doppelt so viel wie beim Vorgänger. Die Zuverlässigkeit wird durch eine erweiterte Fehlerkorrektur (Double Device Data Correction) und verbessertes Memory Mirroring erhöht. Gegenüber Nehalem bietet Westmere zudem Erweiterungen im Instruktionssatz für Kryptografie (AES) und Sicherheit (TXT). Die Virtualisierung wurde ebenfalls beschleunigt (Unterstützung des Real Mode für schnelleres Booten und kürzere Latenzzeiten beim Umschalten).

Die Performance-Steigerung des Spitzenmodells Xeon E7-4870 (2,4 GHz, 10 Kerne, 30 Byte L3) gegenĂĽber dem Xeon X7460 (2,26 GHz, 8 Kerne, 24 MByte L3) liegt laut Intel bei typischen Serveranwendungen bei 20 bis 40 Prozent. Damit konnten die Partner Cisco, Dell, Fujitsu, HP, IBM, Oracle und SGI eine FĂĽlle neuer Weltrekorde in den klassischen Benchmark-Disziplinen einfahren. Herausgegriffen seien Werte von 1030 SPEC_int_rate_base2006 (Cisco UCS C460 M2), 724 SPEC_fp _rate_base2006 (Dell PowerEdge R910) und 14 000 SAP-SD-User oder 76 900 SAPS (IBM System x3850 X5).

Erste Tests im c’t-Labor zeigen, dass im Referenzsystem QSSC SR4 von Quanta mit vier Xeon E7-4870, vier Netzteilen und bestückt mit 128 GB Speicher (DDR3-1066 1,35V) im Leerlauf nahezu 100 Watt weniger aufgenommen werden (529 Watt) als in einem ähnlichen Quanta-System mit viermal Xeon 7460 mit drei Netzteilen und 128 GByte DDR3 (1.5 V).

Bei Volllast (SPECjbb2005, ohne Hyper-Threading) kommt das Westmere-EX-System auf 915 Watt, mit Nehalem-EX lag der Wert um 230 W höher. In dieser Disziplin bleibt der Konkurrent Magny-Cours von AMD (Opteron 6174 im Dell R815) aber weiterhin klar in Front mit 385 W (Idle) und 733 W (Volllast). Für die Effizienz (Performance zu Energie) mit dem SPECpower-Benchmark bleibt nach dem c’t-Messszenario mit 8 VMs und Oracle JRockit 27.5.0 der Dell R815 mit 1298 SPECpower_ssj2008 weiterhin vor dem Westmere-EX-System mit 1178 und Nehalem-EX mit 849 Punkten.

Während Linux problemlos mit 80 logischen Kernen umgehen kann, ist der Betrieb mit eingeschaltetem Hyper-Threading unter Windows Server 2008 R2 recht problematisch, da ein Großteil der Software – unter anderem auch SPEC-CPU2006 – nicht mit mehr als 64 Kernen umgehen kann. Ohne Hyper-Threading und mit dem c’t-Szenario (ICC/Fortran V12, 64-Bit-Code, kompatibler Code, keine Spezialbibliotheken) kommt das Westmere-System auf 680 SPECint_rate_base2006, Nehalem-EX (mit HT) auf 606 und Dell R815 mit Magny-Cours auf 516. Ähnlich sehen die Verhältnisse beim Gleitkomma-Benchmark SPECfp_rate_base2006 aus: 505, 475 und 432. Mit ausgenutztem Hyper-Threading könnte das Westmere-EX-System eine etwa 10 bis 15 Prozent höhere Performance erzielen.

(as)