Intels neues Prozessor-Flaggschiff Westmere-EX

Westmere-EX, das sind 10 Kerne und 30 MByte L3-Cache auf einem Chip. Er löst den Nehalem-EX ab, der mit acht Kernen und bis zu 24 MByte L3-Cache bislang Intels x86-Flaggschiff für größere Server darstellte.

In Pocket speichern vorlesen Druckansicht 61 Kommentare lesen
Lesezeit: 7 Min.
Von
  • Andreas Stiller

Mit zehn Kernen, bis zu 30 MByte L3-Cache und geschätzt rund 2,9 Milliarden Transistoren ist Intels neuer Prozessor Westmere-EX hinter Nvidias Fermi der zweitgrößte Chip auf dem Markt. Er löst den Nehalem-EX ab, der mit acht Kernen und bis zu 24 MByte L3-Cache bislang Intels x86-Flaggschiff für größere Server darstellte.

Westmere-EX:20 logische Kerne auf einem Chip

(Bild: Intel)

Mit den neuen Prozessoren führt Intel auch ein neues Namens-Schema für die Xeons ein. Die Produktlinie wird mit E3 (Einzelprozessoren, derzeit mit Sandy-Bridge-Kern), E5 (zukünftige Zweisockelversionen, ab Sandy Bridge EP) und E7 (Westmere EX und Nachfolger) gekennzeichnet. Die beiden darauf folgenden Zeichen bezeichnen die Maximalzahl der CPUs im Knoten (1, 2, 4, 8) und die Bauform der CPU-Fassung (2, 4, 6, 8). Dann folgt eine zweistellige Kennziffer für den Prozessortypen, gegebenenfalls erweitert um ein L für Energiesparausführungen. Folgeversionen werden unter dem gleichen Namen mit angehängtem v2, v3 ... gekennzeichnet.

Trotz der größeren Kernzahl, größeren L3-Cache und bei den Spitzenmodellen etwas schnellerem Takt soll der Westmere-EX dank der auf 32 nm verkleinerten Strukturen nicht mehr verbrauchen als sein Vorgänger: im Gegenteil. Da er mit DDR3L-RAM (1,35 Volt) arbeiten kann, verbraucht das System sogar etwas weniger. Zudem besitzt der Westmere-EX-Prozessor auch einen tieferen Schlafmodus (C6) sowie integrierte Power-Gates für "Processor Parking", so dass er im Leerlauf sparsamer ist. Er unterstützt Speichermodule (LR-DIMMs) mit bis zu 32 GByte Kapazität. Ein Vier-Sockel-System kommt damit auf bis zu 2 Terabyte – doppelt so viel wie beim Vorgänger. Die Zuverlässigkeit wird durch eine erweiterte RAM-Fehlerkorrektur (Double Device Data Correction) und verbessertes Memory Mirroring erhöht. Gegenüber Nehalem bietet Westmere zudem Erweiterungen im Instruktionssatz für Kryptografie (AES) und Sicherheit (TXT). Die Virtualisierung wurde ebenfalls beschleunigt (Unterstützung des Real Mode für schnelleres Booten und kürzere Latenzzeiten beim Umschalten).

Die Performancesteigerung des Vier-Sockel-Spitzenmodells Xeon E7-4870 (2,4 GHz, 10 Kerne, 30 MByte L3) gegenüber dem Xeon X7460 (2,26 GHz, 8 Kerne, 24 MByte L3) liegt laut Intel bei typischen Serveranwendungen bei 20 bis 40 Prozent. Damit konnten die Partner Cisco, Dell, Fujitsu, HP, IBM, Oracle und SGI eine Fülle neuer Weltrekorde in den klassischen Benchmarkdisziplinen einfahren. Herausgegriffen seien Werte von 1030 SPEC_int _rate_base2006 (Cisco UCS C460 M2), 724 SPEC_fp _rate_base2006 (Dell PowerEdge R910) und 14.000 SAP-SD-User (IBM System x3850 X5).

Erste Tests im c't-Labor zeigen, dass das Referenzsystem QSSC SR4 von Quanta mit vier Xeon E7-4870, vier Netzteilen und bestückt mit 128 GByte Speicher (DDR3L-1066) im Leerlauf nahezu 100 Watt weniger aufnimmt (529 Watt) als ein ähnlichen Quanta-System mit viermal Xeon 7460 mit drei Netzteilen und 128 GByte DDR3 (1,5 Volt).

Bei Volllast (unter SPECjbb2005) kommt das Westmere-EX-System auf 915 Watt, mit Nehalem-EX lag der Wert um 230 W höher. In dieser Disziplin bleibt der Konkurrent Magny-Cours von AMD (Opteron 6174 im Dell R815) aber weiterhin klar in Front mit 385 W (Idle) und 733 W (Volllast). Für die Effizienz (Performance zu Energie) mit dem SPECpower-Benchmark bleibt nach dem c't-Messszenario mit 8 VMs und Oracle JRockit 27.5.0 der Dell R815 mit 1298 SPECpower_ssj2008 weiterhin vor dem Westmere-EX-System mit 1178 und Nehalem-EX mit 849 Punkten.

Während Linux problemlos mit 80 logischen Kernen umgehen kann, ist der Betrieb mit eingeschaltetem Hyper-Threading unter Windows Server 2008 R2 recht problematisch, da ein Großteil der Software – unter anderem auch SPEC CPU2006 – mit mehr als 64 Kernen nicht umgehen kann. Ohne Hyper-Threading und mit dem c't-Szenario (ICC/Fortran V12, 64-Bit-Code, kompatibler SSSE3-Code, keine Spezialbibliotheken) kommt das Westmere-System auf 680 SPECint_rate_base2006, Nehalem-EX (mit HT) auf 606 und Dell R815 mit Magny-Cours auf 516. Ähnlich sehen die Verhältnisse beim Gleitkommabenchmark SPECfp_rate_base2006 aus: 505, 475 und 432. Mit ausgenutztem Hyper-Threading könnte das Westmere-EX-System etwa 10 bis 15 Prozent höhere Performance erzielen.

Intel Xeon-Prozessor E7-8800/4800/2800 Produktfamilien
Level <span style="font-family: Arial,Helvetica,Verdana,sans-serif;"></span><div class="einzeiler">Typ</div> Frequenz Cores / Threads L3- Cache QPI Max DDR3 TDP Turbo Preis
Advanced 8870 2,4 GHz 10/20 30 MB 6,4 GT/s 1066 130 W Ja $4616
Advanced 8867L 2,13 GHz 10/20 30 MB 6,4 GT/s 1066 105 W Ja $4061
Advanced 8860 2,26 GHz 10/20 24 MB 6,4 GT/s 1066 130 W Ja $3059
Advanced 8850 2 GHz 10/20 24 MB 6,4 GT/s 1066 130 W Ja $2280
Standard 8837 2,66 GHz 8/8 24 MB 6,4 GT/s 1066 130 W Ja $4172
Standard 8830 2,13 GHz 8/16 24 MB 6,4 GT/s 1066 105 W Ja $2280
Advanced 4870 2,4GHz 10/20 30 MB 6,4 GT/s 1066 130 W Ja $4394
Advanced 4860 2,26 GHz 10/20 24 MB 6,4 GT/s 1066 130 W Ja $3838
Advanced 4850 2 GHz 10/20 24 MB 6,4 GT/s 1066 130 W Ja $2837
Standard 4830 2,13 GHz 8/16 24 MB 6,4 GT/s 1066 105 W Ja $2059
Standard 4820 2 GHz 8/16 18 MB 5,86 GT/s 1066 105 W Ja $1446
Basic 4807 1,86 GHz 6/12 18 MB 4,8 GT/s 800 95 W Nein $890
Advanced 2870 2,4 GHz 10/20 30 MB 6,4 GT/s 1066 130 W Ja $4227
Advanced 2860 2,26 GHz 10/20 24 MB 6,4 GT/s 1066 130 W Ja $3670
Advanced 2850 2 GHz 10/20 24 MB 6,4 GT/s 1066 130 W Ja $2558
Standard 2830 2,13 GHz 8/16 24 MB 6,4 GT/s 1066 105 W Ja $1779
Standard 2820 2 GHz 8/16 18 MB 5,86 GT/s 1066 105 W Ja $1334
Basic 2803 1,73 GHz 6/12 18 MB 4,8 GT/s 800 105 W Nein $774

Gleichzeitig mit der Xeon-Baureihe E7 für große Maschinen erneuert Intel auch das Angebot für günstige, sparsame Server: In der Baureihe Xeon E3 steckt die Sandy-Bridge-Technik von Core i5-2000 oder Core i7-2000, auch die drei Server-Chipsätze C202, C204 und C206 sind enge Verwandte der PC-Chipsätze P67 oder Q67.

Der Xeon E3-1200 startet mit einer Dual- und zehn Quad-Core-Varianten.

(Bild: Intel)

Erstmals macht Intel die in der CPU inegrierte Prozessorgrafik grundsätzlich auch für Server nutzbar: In Verbindung mit dem Chipsatz C206 können die Xeon-E3-Versionen 1275 (3,4 GHz/Hyper-Threading/8 MByte L3-Cache/95 Watt TDP), 1260L (2,4 GHz/HT/8 MByte/45 W), 1245 (3,3 GHz/HT/8 MByte/95 W), 1235 (3,2 GHz/HT/8 MByte/95 W) und 1225 (3,1 GHz/6 MByte/95 W) auch die Anbindung eines Displays übernehmen und bieten Fernwartungsfunktionen inklusive Remote KVM. Die Quad-Core-Versionen ohne Grafik haben – bis auf den zunächst schnellsten E3-1280 mit 3,4 GHz -- eine etwas niedrigere TDP von 80 Watt (1270, 1240, 1230, 1220). Sparsamster Serverprozessor ist der allerdings nur zweikernige Xeon E3-1220L mit 2,2 GHz, für den Intel 20 Watt TDP nennt; bei ihm ist der integrierte Grafikkern deaktiviert, aber er beherrscht sowohl Hyper-Threading als auch Turbo Boost 2.0. Nach den bisher vorliegenden Informationen unterstützen die Xeon-E3-CPUs ebensoviel Speicher wie andere LGA1155-Prozessoren, nämlich 32 GByte in Form von vier ungepufferten 8-GByte-UDIMMs. Diese sind bislang kaum zu beschaffen und sehr teuer, weil sie aus 4-GBit-Chips bestehen müssen, realistisch ist also ein Maximum von 16 GByte Hauptspeicher.

Der Chipsatz-Variante C204 fehlt im Vergleich zum C206 der Grafik-Ausgang; beide binden je acht PCIe-x1-Ports an und enthalten einen Gigabit Ethernet MAC. Von ihren sechs SATA-Ports sind je zwei SATA-6G-tauglich. Beim C202 sind alle sechs Ports auf SATA II beschränkt. Nur der C204 unterstützt das Data Center Management Interface (DCMI) sowie den Power Node Manager.

Kürzlich hatten Intel, Tyan und Dell verschiedene "Micro Server" mit Xeon-E3-Bestückung angekündigt. Die manchmal auch als Single-Socket- oder Uni-Processor-(UP-)Xeons bezeichneten Prozessoren kommen auch in Workstations zum Einsatz, etwa in der Lenovo ThinkStation E30.

Server und Workstations mit den E3-Xeons wird es wohl auch wieder in billigeren Ausführungen mit Core-i- oder künftigen Pentium- oder möglicherweise Celeron-Prozessoren geben. Weil Intel einige Funktionen an bestimmte CPU-Chipsatz-Kombinationen bindet, muss man dann sehr genau auf die Details schauen. Systeme mit den Chipsätzen 3400 oder 3420 für den Xeon-E3-Vorgänger Xeon 3400 beispielsweise gibt es auch mit Celeron G1101, Pentium G6950 oder Core i3-530, deren Speicher-Controller dann auch ECC beherrschen. Anders als ein Xeon 3400 sind damit aber keine Registered DIMMs (RDIMMs) zulässig – und den Einsatz eines Core i7 untersagt Intel.
(as)