Neue Xeon-CPUs mit Nehalem-Kern im SAP-SD-Benchmark

Die Server-Hersteller Fujitsu Siemens Computers und Hewlett-Packard haben erste offizielle Benchmark-Ergebnisse des erst Anfang 2009 erwarteten Xeon X5570 mit Nehalem-Kern veröffentlicht.

In Pocket speichern vorlesen Druckansicht 32 Kommentare lesen
Lesezeit: 5 Min.

Offenbar war es für Intels Geschmack in den letzten Wochen etwas zu still geworden um die kommende Xeon-Prozessorgeneration mit Nehalem-Kernen. Nun sind – höchstwahrscheinlich mit wohlwollender Duldung von Intel – zwei Ergebnisse im SAP-Benchmark SAP SD 2-Tier Internet Configuration aufgetaucht, die den kommenden Xeon X5570 für Server mit zwei Prozessorfassungen in besonders gutem Licht zeigen: Bei 2,93 GHz Taktfrequenz und annähernd vergleichbarer Systemkonfiguration liefern die Neulinge in diesem Benchmark fast die doppelte Performance wie ihre 3,33-GHz-Vorgänger Xeon X5470, nämlich 25.000 SAPS-Punkte statt 12.600 (PDF-Dateien).

Die SAP-SD-Veröffentlichungen bestätigen auch eine Reihe von Spekulationen, etwa die Typenbezeichungen der kommenden Xeons, von denen Intel bisher nur den Codenamen Nehalem-EP verraten hatte. Hewlett-Packard (HP) will die neuen Prozessoren in einen Server namens ProLiant DL380 G6 einbauen, das Gerät von Fujitsu Siemens Computers (FSC) soll Primergy TX300 S5 heißen. Die erwähnten, aktuellen Quad-Core-Xeons aus dem Benchmark stecken bei HP in einem ProLiant DL380 G5; beide Benchmark-Läufe von HP fanden mit SAP ERP 6.0 statt, als Betriebssystem kam jeweils Windows Server 2003 und als Datenbank SQL Server 2005 zum Einsatz. Während im ProLiant DL380 G5 32 GByte Hauptspeicher steckten, waren es beim DL380 G6 48 GByte; die kommenden Nehalem-EP-Server werden statt vier Fully-Buffered-DIMM-Speicherkanälen sechs Kanäle für Registered-DDR3-DIMMs anbinden, nämlich jeweils zwei pro CPU; die Prozessoren kommunizieren dabei via QPI.

SAP SD 2-Tier Internet Configuration
Server Prozessoren Taktfrequenz CPU-Kerne/Threads SAPS
Sun Fire X4600 M2 8× Opteron 8384 2,70 GHz 32 Kerne/32 Threads 39.270
Fujitsu/Sun SPARC Ent. T5440 4× UltraSPARC T2plus 1,40 GHz 32 Kerne/256 Threads 37.650
HP ProLiant DL785 G5 8× Opteron 8384 2,70 GHz 32 Kerne/32 Threads 35.400
IBM System x3950 M2 8× Xeon X7350 2,93 GHz 32 Kerne/32 Threads 33.100
Sun Fire X4600 M2 8× Opteron 8360 SE 2,50 GHz 32 Kerne/32 Threads 29.670
IBM System x3950 M2 4× Xeon X7460 2,66 GHz 24 Kerne/24 Threads 26.550
HP ProLiant DL380 G6 2× Xeon X5570 2,93 GHz 8 Kerne/16 Threads 25.000
FSC Primergy TX300 S5 2× Xeon X5570 2,93 GHz 8 Kerne/16 Threads 23.650
Fujitsu/Sun SPARC Ent. T5240 2× UltraSPARC T2plus 1,40 GHz 16 Kerne/128 Threads 20.900
HP ProLiant DL585 G5 4× Opteron 8360 SE 2,50 GHz 16 Kerne/16 Threads 19.020
HP ProLiant DL385 G5p 2× Opteron 2384 2,70 GHz 8 Kerne/8 Threads 13.780
HP ProLiant DL380 G5 2× Xeon X5470 3,33 GHz 8 Kerne/8 Threads 12.600

Leider hat bisher noch kein Server-Hersteller SAP-SD-2-Tier-Benchmarkwerte für eine Maschine mit vier der neuen 45-nm-Opterons (Opteron 8384) veröffentlicht; die Leistungsdifferenz zwischen den Konfigurationen mit jeweils acht der alten 65-nm-Opterons (Opteron 8360 SE) und acht der AMD-Neulinge beträgt allerdings satte 32 Prozent, sodass ein HP ProLiant DL585 G5 mit acht Opteron 8384 in die Gegend von 25.000 SAPS kommen dürfte – dann wäre ein Server mit vier der neuen Opterons ungefähr ebenso schnell im SAP-SD-2-Tier-Benchmark wie eine Maschine mit zwei Xeon X5570.

Allerdings rücken die Nehalem-Xeons auch den eigenen Verwandten auf die Pelle, nämlich den teuren MP-Xeons mit sechs Kernen (Dunnington), für die Intel eigentlich auch mit ihrer hohen SAP-SD-Performance wirbt. Diese MP-Xeons laufen aber auch in Systemen mit acht oder noch mehr Prozessoren, was bei den Xeons der 5000er-Serie nicht vorgesehen ist; erst in der zweiten Jahreshälfte 2009 will Intel die Nehalem-Architektur (Nehalem-EX, Beckton) auch in der Multiprozessor-(MP-)Xeon-Serie 7000 einsetzen.

Wie der Core i7, in dem die Nehalem-Architektur debütierte, gezeigt hat, bieten die Intel-Neulinge auch deutlich höhere Gleitkomma-Performance als ihre Vorgänger. Einige HPC-Cluster-Ausschreibungen sind deshalb schon zu Gunsten der Nehalem-Xeons entschieden worden, etwa der HLRN-II-Cluster in Berlin und Hannover, das Plejaden-System der NASA und den französischen CEA/GENCI-Cluster von Bull. Eine Veröffentlichung (PDF-Datei) im Rahmen des EU-Projekts PRACE zeigt, dass auch am Forschungszentrum Jülich (in Kooperation mit dem CEA) ein Superrechner aus 3072 Modulen mit je zwei Nehalem-Xeons, also insgesamt 24.576 CPU-Kernen entstehen soll. Und auch am Höchstleistungsrechenzentrum Stuttgart (HLRS) – anscheinend im Rahmen der Teraflop Workbench – soll ein kombinierter Supercomputer entstehen, der aus einem NEC-Vektorrechner SX-9 mit vier bis acht Knoten, also bis zu 128 Kernen und 13 TFlop/s besteht, sowie einem HPC-Cluster aus 64 bis 512 Dual-Xeon-Systemen, die bis zu 50 TFlop/s liefern sollen. Bisher steht bei der Teraflop Workbench ein SX-8-Vektorrechner im Verbund mit einem Linux-Cluster aus 200 älteren Xeon-Maschinen.

Auch das japanische Forschungszentrum Riken hat bei Fujitsu einen Nehalem-Cluster bestellt, er soll aus 1024 Primergy-Servern mit je zwei Nehalem-EP-Prozessoren bestehen und rund 108 TFlop/s liefern – etwas das Neunfache des x86-Teils des Riken Super Combined Cluster System (RCCS), das ebenfalls aus einer Kombination zwischen Parallel- und (NEC-SX-7-)Vektorrechnern besteht. Außerdem setzt das Riken die speziell für die Proteinforschung gemeinsam mit IBM entwickelten Co-Prozessoren namens GRAPE ein, von denen mittlerweile die Generation MDGRAPE-3 aktuell ist, die pro Chip rund 165 GFlop/s liefern soll. (ciw)