Neue Xeon-CPUs mit Nehalem-Kern im SAP-SD-Benchmark
Die Server-Hersteller Fujitsu Siemens Computers und Hewlett-Packard haben erste offizielle Benchmark-Ergebnisse des erst Anfang 2009 erwarteten Xeon X5570 mit Nehalem-Kern veröffentlicht.
Offenbar war es für Intels Geschmack in den letzten Wochen etwas zu still geworden um die kommende Xeon-Prozessorgeneration mit Nehalem-Kernen. Nun sind – höchstwahrscheinlich mit wohlwollender Duldung von Intel – zwei Ergebnisse im SAP-Benchmark SAP SD 2-Tier Internet Configuration aufgetaucht, die den kommenden Xeon X5570 für Server mit zwei Prozessorfassungen in besonders gutem Licht zeigen: Bei 2,93 GHz Taktfrequenz und annähernd vergleichbarer Systemkonfiguration liefern die Neulinge in diesem Benchmark fast die doppelte Performance wie ihre 3,33-GHz-Vorgänger Xeon X5470, nämlich 25.000 SAPS-Punkte statt 12.600 (PDF-Dateien).
Die SAP-SD-Veröffentlichungen bestätigen auch eine Reihe von Spekulationen, etwa die Typenbezeichungen der kommenden Xeons, von denen Intel bisher nur den Codenamen Nehalem-EP verraten hatte. Hewlett-Packard (HP) will die neuen Prozessoren in einen Server namens ProLiant DL380 G6 einbauen, das Gerät von Fujitsu Siemens Computers (FSC) soll Primergy TX300 S5 heißen. Die erwähnten, aktuellen Quad-Core-Xeons aus dem Benchmark stecken bei HP in einem ProLiant DL380 G5; beide Benchmark-Läufe von HP fanden mit SAP ERP 6.0 statt, als Betriebssystem kam jeweils Windows Server 2003 und als Datenbank SQL Server 2005 zum Einsatz. Während im ProLiant DL380 G5 32 GByte Hauptspeicher steckten, waren es beim DL380 G6 48 GByte; die kommenden Nehalem-EP-Server werden statt vier Fully-Buffered-DIMM-Speicherkanälen sechs Kanäle für Registered-DDR3-DIMMs anbinden, nämlich jeweils zwei pro CPU; die Prozessoren kommunizieren dabei via QPI.
SAP SD 2-Tier Internet Configuration | ||||
Server | Prozessoren | Taktfrequenz | CPU-Kerne/Threads | SAPS |
Sun Fire X4600 M2 | 8Ă— Opteron 8384 | 2,70 GHz | 32 Kerne/32 Threads | 39.270 |
Fujitsu/Sun SPARC Ent. T5440 | 4Ă— UltraSPARC T2plus | 1,40 GHz | 32 Kerne/256 Threads | 37.650 |
HP ProLiant DL785 G5 | 8Ă— Opteron 8384 | 2,70 GHz | 32 Kerne/32 Threads | 35.400 |
IBM System x3950 M2 | 8Ă— Xeon X7350 | 2,93 GHz | 32 Kerne/32 Threads | 33.100 |
Sun Fire X4600 M2 | 8Ă— Opteron 8360 SE | 2,50 GHz | 32 Kerne/32 Threads | 29.670 |
IBM System x3950 M2 | 4Ă— Xeon X7460 | 2,66 GHz | 24 Kerne/24 Threads | 26.550 |
HP ProLiant DL380 G6 | 2Ă— Xeon X5570 | 2,93 GHz | 8 Kerne/16 Threads | 25.000 |
FSC Primergy TX300 S5 | 2Ă— Xeon X5570 | 2,93 GHz | 8 Kerne/16 Threads | 23.650 |
Fujitsu/Sun SPARC Ent. T5240 | 2Ă— UltraSPARC T2plus | 1,40 GHz | 16 Kerne/128 Threads | 20.900 |
HP ProLiant DL585 G5 | 4Ă— Opteron 8360 SE | 2,50 GHz | 16 Kerne/16 Threads | 19.020 |
HP ProLiant DL385 G5p | 2Ă— Opteron 2384 | 2,70 GHz | 8 Kerne/8 Threads | 13.780 |
HP ProLiant DL380 G5 | 2Ă— Xeon X5470 | 3,33 GHz | 8 Kerne/8 Threads | 12.600 |
Leider hat bisher noch kein Server-Hersteller SAP-SD-2-Tier-Benchmarkwerte für eine Maschine mit vier der neuen 45-nm-Opterons (Opteron 8384) veröffentlicht; die Leistungsdifferenz zwischen den Konfigurationen mit jeweils acht der alten 65-nm-Opterons (Opteron 8360 SE) und acht der AMD-Neulinge beträgt allerdings satte 32 Prozent, sodass ein HP ProLiant DL585 G5 mit acht Opteron 8384 in die Gegend von 25.000 SAPS kommen dürfte – dann wäre ein Server mit vier der neuen Opterons ungefähr ebenso schnell im SAP-SD-2-Tier-Benchmark wie eine Maschine mit zwei Xeon X5570.
Allerdings rücken die Nehalem-Xeons auch den eigenen Verwandten auf die Pelle, nämlich den teuren MP-Xeons mit sechs Kernen (Dunnington), für die Intel eigentlich auch mit ihrer hohen SAP-SD-Performance wirbt. Diese MP-Xeons laufen aber auch in Systemen mit acht oder noch mehr Prozessoren, was bei den Xeons der 5000er-Serie nicht vorgesehen ist; erst in der zweiten Jahreshälfte 2009 will Intel die Nehalem-Architektur (Nehalem-EX, Beckton) auch in der Multiprozessor-(MP-)Xeon-Serie 7000 einsetzen.
Wie der Core i7, in dem die Nehalem-Architektur debütierte, gezeigt hat, bieten die Intel-Neulinge auch deutlich höhere Gleitkomma-Performance als ihre Vorgänger. Einige HPC-Cluster-Ausschreibungen sind deshalb schon zu Gunsten der Nehalem-Xeons entschieden worden, etwa der HLRN-II-Cluster in Berlin und Hannover, das Plejaden-System der NASA und den französischen CEA/GENCI-Cluster von Bull. Eine Veröffentlichung (PDF-Datei) im Rahmen des EU-Projekts PRACE zeigt, dass auch am Forschungszentrum Jülich (in Kooperation mit dem CEA) ein Superrechner aus 3072 Modulen mit je zwei Nehalem-Xeons, also insgesamt 24.576 CPU-Kernen entstehen soll. Und auch am Höchstleistungsrechenzentrum Stuttgart (HLRS) – anscheinend im Rahmen der Teraflop Workbench – soll ein kombinierter Supercomputer entstehen, der aus einem NEC-Vektorrechner SX-9 mit vier bis acht Knoten, also bis zu 128 Kernen und 13 TFlop/s besteht, sowie einem HPC-Cluster aus 64 bis 512 Dual-Xeon-Systemen, die bis zu 50 TFlop/s liefern sollen. Bisher steht bei der Teraflop Workbench ein SX-8-Vektorrechner im Verbund mit einem Linux-Cluster aus 200 älteren Xeon-Maschinen.
Auch das japanische Forschungszentrum Riken hat bei Fujitsu einen Nehalem-Cluster bestellt, er soll aus 1024 Primergy-Servern mit je zwei Nehalem-EP-Prozessoren bestehen und rund 108 TFlop/s liefern – etwas das Neunfache des x86-Teils des Riken Super Combined Cluster System (RCCS), das ebenfalls aus einer Kombination zwischen Parallel- und (NEC-SX-7-)Vektorrechnern besteht. Außerdem setzt das Riken die speziell für die Proteinforschung gemeinsam mit IBM entwickelten Co-Prozessoren namens GRAPE ein, von denen mittlerweile die Generation MDGRAPE-3 aktuell ist, die pro Chip rund 165 GFlop/s liefern soll. (ciw)