Cebit

Intel bringt den Xeon E5 heraus

Mit reichllich Verspätung aber mit Macht kommen nun die Server-Prozessoren Xeon E5 mit Sandy-Bridge-Architektur mit zum Teil mehr als doppelt so hoher Performance wie der Vorgänger Westmere-EP.

In Pocket speichern vorlesen Druckansicht 23 Kommentare lesen
Lesezeit: 4 Min.
Von
  • Andreas Stiller

Den ersten Messetag der CeBIT nutzte Intel für den Stapellauf der lang erwarteten neuen Prozessorfamilie Xeon E5 mit Sandy-Bridge-Architektur. Vorversionen des Prozessors konnten schon im November zur Supercomputer-Konferenz zeigen, was in ihnen steckt, und dank der AVX-Erweiterung mit hohen Linpack-Werten in der Top500-Liste der Supercomputer brillieren.

Ein Zweisockeltestsystem des neuen Spitzenmodells für Server, Xeon E5-2690, mit acht Kernen und 2,9 GHz Nominaltakt – aber faktisch dank Turbo Core 2.0 3,3 GHz – erreichte im c't-Labor im Linpack-Benchmark bis zu 354 GFlops bei 100.000 Gleichungen. Bei kleineren Dimensionen (N=30.000) sind es mit 334 GFlops weit mehr als doppelt so viel, wie beim Vorgängersystem mit Xeon X5680 (Westmere-EP) mit 6 Kernen und 3,3 GHz, das auf 144 GFlops kam. Konkurrent Opteron 6276 (Nominaltakt 2,3 GHz) erreichte bei N=30.000 205 GFlops. Der von AMD als Gegenstück zum Xeon E5 geplante Opteron 6287SE dürfte mit 2,8 GHz Nominaltakt dann etwa 20 Prozent schneller als der Opteron 6276 sein.

Xeon E5-2690 mit zum Teil mehr als der doppelten Performance wie der Vorgänger Xeon X5690

(Bild: Intel)

Auch in den anderen üblichen Benchmarks erzielt der neue Xeon eine zum Teil erhebliche Performancesteigerung gegenüber dem Vorsystem, selbst dann, wenn kein AVX verwendet wird, dank seiner Sandy Bridge-Architektur mit µop-Cache, mehr Buffern, vier Speicherkanälen mit DDR3-1600 und Turbo Core 2.0. Der kann den Takt von 4 Stufen (Bins) à 100 MHz bei Betrieb aller Kerne auf bis zu 9 Bins bei nur einem Kern erhöhen. Und auch das PCIexpress-3.0-Interface trägt bei I/O-intensiven Benchmarks zu einer Performanceerhöhung bei, und zwar auch dann wenn man alte PCIe-2-Karten einsteckt. Im Read/Write-Mix steigt laut Intel bei PCIe-2 gegenüber dem alten Tylersburg-Chipsatz der Durchsatz um 25 Prozent. Ein weiteres Feature namens Data Direct I/O (DDIO) kann zusätzlich insbesondere für 10-GbE- und Infiniband-Karten den Durchsatz erhöhen, da es Pakete, die sich noch im Prozessor-Cache befinden direkt von dort verschickt und nicht, wie bei DMA-Zugriffen bislang üblich, vom Hauptspeicher.

Bei SPEC CPU2006 erreicht das Xeon-E5-2690-System unter RHEL6.2 mit dem c't-Messszenario (64-Bit-Code, keine Spezialbibliotheken, keine huge pages) 602 SPECint_rate_2006base und 484 SPECfp_rate_2006base. Das Opteron-6276-System erreichte in dem gleichen Szenario mit dem hauseigenen Open64-Compiler 408 (int) resp. 304 (fp) Punkte und der Xeon X5680 kommt auf 349 (int) und 246 (fp). In SPECjbb2005 mit IBM J9 obsiegt das E5-System mit 1,41 Mio ssj_ops vor Opteron 6276 (0,88 Mio ssj_ops) und Xeon X5680 (0,67 Mio ssj_ops). Dabei schlägt sich das E5-System auch in der Leistungsaufnahme gut, verbraucht mit zwei Netzteilen, zwei SSDs und 128 GByte DDR3-1600-Standardspeicher nur rund 100 Watt im Leerlauf (Opteron: 140 W, Xeon X5680: 165 W). Damit setzt es im Energieeffizenzbenchmark SPECpower mit 2902 ssj_ops/Watt neue Maßstäbe.

Die Romley-EP-Plattform für zwei Sockel mit zwei QPI-Links zwischen den Prozessoren

(Bild: Intel)

In der Romley-EP-Plattform sind die beiden E5-Prozessoren über zwei QPI-Links miteinander verknüpft. Auf der CeBIT kann man aber auch bereits vereinzelt Viersockelsysteme bewundern (Romley EP 4S), bei denen die Prozessoren der E5-4600-Familie nur über einen QPI-Link verknüpft sind. Daneben plant Intel auch eine etwas abgespeckte E5-2400-Familie mit nur drei Speicherkanälen.

Allerdings hat der E5-Prozessor auch seinen Preis: Mit 2057 US-Dollar (OEM-Preis ab 1000 Stück) ist etwa der E5-2690 über zweieinhalb Mal so teuer wie der Opteron 6276 (788 $).

Mehr zu den neuen Xeon-Prozessorfamilie E5 in c't 7/2012, kommenden Montag am Kiosk.

Xeon-E5-Familie
Xeon Cores| Threads So. Takt [GHz] Turbo- Bins Cache QPI [GT/s] Mem-Takt [MT/s] TDP [W] Preis á 1000 [US-$]
E5-2690 8|16 2 2,9 4...9 20M 8 1600 135 2057
E5-2680 8|16 2 2,7 4...8 20M 8 1600 130 1723
E5-2670 8|16 2 2,6 4...8 20M 8 1600 115 1552
E5-2665 8|16 2 2,4 4...7 20M 8 1600 115 1440
E5-2660 8|16 2 2,2 5...8 20M 8 1600 95 1329
E5-2650 8|16 2 2 4...8 20M 8 600 95 1107
E5-2640 6|12 2 2,5 3...5 15M 7,2 1333 95 885
E5-2630 6|12 2 2,3 3...5 15M 7,2 1333 95 612
E5-2620 6|12 2 2 3...5 15M 7,2 1333 95 406
E5-2609 4|4 2 2,4 10M 6,4 1333 80 294
E5-2603 4|4 2 1,8 10M 6,4 1333 80 198
E5-2687W 8|16 2 3,1 3...7 20M 8 1600 150 1885
E5-2667 6|12 2 2,9 3...6 15M 8 1600 130 1552
E5-2643 4|8 2 3,3 1...2 10M 8 1600 130 885
E5-2637 2|4 2 3 2 5M 8 1333 80 885
E5-2650L 8|16 2 1,8 2...5 20M 8 1333 70 1107
E5-2630L 6|12 2 2 3...5 15M 7,2 1333 60 662
E5-1660 6|12 1 3,3 3...6 15M 1600 130 1080
E5-1650 6|12 1 3,2 3...6 12M 1600 130 583
E5-1620 4|8 1 3,6 1...2 10M 1333 130 294


(as)