Intels Xeon E5: 18 CPU-Kerne und AVX2 für Server

Er wird mancherorts schon sehnsüchtig erwartet, der Xeon E5-2600 v3, auch Haswell-EP genannt. Nun wurde er zu Intels Developer Forum IDF vorgestellt: Der Server-Prozessor bringt viel Neues, aber auch die ein oder andere weniger erwünschte Überraschung.

In Pocket speichern vorlesen Druckansicht 80 Kommentare lesen
Lesezeit: 4 Min.
Von
  • Andreas Stiller

Intels Diane Bryant zeigt den Haswell-EP

Am Vortag der Intel-Entwicklerkonferenz IDF in San Francisco ließ Server-Chefin Diane Bryant den neuen Xeon E5 mit Codename Haswell-EP vom Stapel laufen. Der neue Prozessor besitzt bis zu 18 Kerne und führt die Vektorerweiterung AVX2 sowie DDR4-Speicher in die Welt der Zwei-Sockel-Server ein.

Die High-Performance-Community wartet vor allem auf die FMA-Einheit (Fused Multiply-Add), mit der sich etwa die Matrixmultiplikation erheblich schneller ausführen lässt als beim Ivy-Bridge-Vorgänger zuvor, zumal der höchstens 12 Kerne aufbot. Im Linpack-Benchmark erzielte ein System mit dem neuen Flagschiff Xeon E5-2699 v3 im c’t-Testlabor mit 921 GFlops ziemlich genau das Doppelte des Xeon E5-2697 v2. Ansonsten liegt der Zuwachs zumeist zwischen 25 und 40 Prozent, bei SPEC CPU2006 zum Beispiel im c’t-Szenario bei 33 (int) oder 36 Prozent (fp). Auch in der Energieeffizienz ist der Neue besser, bei SPECPower etwa um 25 Prozent.

Die großen Haswell-EP-Versionen bestehen aus zwei Doppelringbussen an denen die Kerne und L3-Cachesegmente angekoppelt sind. Sie lassen sich auch getrennt als zwei Prozessoren (Cluster on Die betreiben).

Neu ist allerdings, dass der Prozessor automatisch den Takt reduziert, sobald AVX- oder AVX2-Instruktionen ausgeführt werden. Für AVX und Nicht-AVX fährt er komplett andere Turbo-Strategien. Der AVX-Basistakt des Xeon E5-2699 v3 liegt dabei mit 1,9 GHz deutlich unter den 2,3 GHz bei Non-AVX. Der Turbo-Modus 2 ist aber sehr elastisch. Üblicherweise liegt der Takt selbst bei voller Kernauslastung um 500 bis 600 MHz höher als der Basistakt. Im Single-Thread kommt er auf bis zu 3,6 GHz (Non-AVX) beziehungsweise 3,4 GHz (AVX).

Ebenfalls neu ist das Cache Quality of Service Monitoring (CQM). Hiermit können insbesondere Applikationen, die sich in parallel laufenden VMs bezüglich des gemeinsamen L3-Caches schlecht verhalten, an das Betriebssystem oder den Hypervisor verpetzt werden. Diese können dann entsprechende Bestrafungsmaßnahmen einleiten, etwa die Priorität herabsetzen.

Die größeren Versionen des Xeon-E5 ab 10 Kernen aufwärts sind intern in zwei getrennte Ringe aufgeteilt, an denen die Kerne und L3-Segmente sowie QPI- und Home-Agenten (mit den Speicher-Controllern) angeschlossen sind. Die Ringe sind über zwei schnelle, gepufferte Switches verbunden.

Der Prozessor kennt auch eine neue Betriebsart "Cluster on Die", die jeden der beiden Ringe als eigenständige Prozessoren betreibt. Wegen der kürzeren Wege kann NUMA-taugliche Software daraus Profit ziehen. Benchmarks wie SPEC CPU2006 oder SPECPower legen damit um einige Prozent zu. Auch der Bandbreitenbenchmark Stream profitiert davon, Stream-Triad steigt von 108 auf 118 GByte/s. Das ist etwa 20 Prozent mehr, als beim Vorgänger mit DDR3-1866.

Ggenüber dem Zwölfkervorgänger Xeon E5 2697v2 legt der E5 2699 v3 im Schnitt um 25 bis 40 Prozent zu. Wenn Fused Multilpy Add (FMA) eine große Rolle spielt, können es auch 70 Prozent und mehr sein.

Haswell-EP unterstützt bis zu drei DIMMs pro Kanal, aber DDR4-Speicher. Transactional Memory (TSX) ist wie bei der ganzen Haswell-Familie abgeschaltet, da sich da noch ein Timing-Bug gezeigt hat. Entwickler können aber freigeschaltete Versionen bekommen.

Alle großen Server-Hersteller nehmen die Haswell-EP-Premiere zum Anlass, ihrerseits neue Server vorzustellen. Bei Dell ist es die 13. PowerEgde-Generation, HP spricht von ProLiant Gen9, Supermicro von Ultra Servers. Immer häufiger kommen SSDs zum Einsatz, auch in 1,8-Zoll-Bauform sowie in PCIe-Versionen mit NVMe. Noch unklar scheint, ob der Haswell-EP DDR4-Speichermodule mit 8-Gigabit-Chips unterstützt, also LRDIMMs mit bis zu 128 GByte – mit 64-GByte-RDIMMs und -LRDIMMs wächst die RAM-Kapazität nicht über die maximal 1,5 TByte von Ivy Bridge-EP (12 DIMMs/768 GByte pro CPU).

Mehr zum Haswell-EP in der kommenden c't (im Handel ab Samstag, 20.9.2014).

Xeon E5-2600 v3: Intels neue Haswell-EP-Prozessoren
Xeon
(SKU)
OEM-Preis
(US-Dollar)
Kerne/Threads Basis-Takt
(GHz)
L3-Cache
(MByte)
TDP
(W)
E5-2699 v3 4115 18/36 2,30 45 145
E5-2698 v3 3226 16/32 2,30 40 135
E5-2697 v3 2702 14/28 2,60 35 145
E5-2695 v3 2424 14/28 2,30 35 120
E5-2690 v3 2090 12/24 2,60 30 120
E5-2685 v3 2090 12/24 2,60 35 120
E5-2683 v3 1846 14/28 2,00 35 120
E5-2680 v3 1745 12/24 2,50 30 120
E5-2670 v3 1589 12/24 2,30 30 120
E5-2660 v3 1445 10/20 2,60 25 105
E5-2650 v3 1166 10/20 2,30 25 105
E5-2640 v3 939 8/16 2,60 20 90
E5-2630 v3 667 8/16 2,40 20 85
E5-2623 v3 444 4/8 3,00 10 105
E5-2620 v3 417 6/12 2,40 15 85
E5-2609 v3 306 6/6 1,90 15 85
E5-2603 v3 213 6/6 1,60 15 85
E5-2650L v3 1329 12/24 1,80 30 65
E5-2630L v3 612 8/16 1,80 20 55
E5-2687W v3
(Workstation)
2141 10/20 3,10 25 160
E5-2667 v3 2057 8/16 3,20 20 135
E5-2643 v3 1552 6/12 3,40 20 135
E5-2637 v3 996 4/8 3,50 15 135

(as)