Tandem-Teams

Die 64-Bit-Serverprozessoren von AMD treten jetzt mit 2,4 GHz gegen Intels Xeons an.

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
Lesezeit: 5 Min.

Das ewige Wettrennen geht in eine weitere Runde, diesmal in den Workstation- und Server-Disziplinen. AMD drängt mit voller Opteron-Wucht in den lukrativen Markt der Dual-Systeme, den zurzeit Intels Xeons dominieren. Gute Benchmark-Ergebnisse und günstige Preise haben den Opterons viel Aufmerksamkeit beschert - genug jedenfalls, um Intel zur Ankündigung AMD64-kompatibler Prozessoren zu bewegen.

Auch die bisherigen Xeons hat Intel besser gegen die Konkurrenz gewappnet. Der ursprünglich nur für die teuren Multiprozessor-(MP-)Xeons entwickelte Gallatin-Kern ist seit einiger Zeit auch für die Dual-Prozessor-(DP-)Xeons verfügbar und beschert diesen zusätzlich zu 512 KByte L2-Cache noch 1 oder 2 MByte L3-Pufferspeicher. Ein DP-Xeon mit 3,20 GHz und 2 MByte L3-Cache kostet rund 1200 Euro. Der Opteron 250 (2,4 GHz, 1 MByte L2-Cache) ist im deutschen Einzelhandel noch nicht zu haben, dürfte aber mindestens 150 Euro preiswerter werden (OEM-Listenpreis 851 US-Dollar). Für Single- sowie Vier- bis Achtfach-Systeme sind Opteron 150 und 850 gedacht.

In diesem Test vergleichen wir den AMD Opteron 250 mit dem Intel Xeon 3,20 GHz mit 2 MByte L3. Um auch Grafik-Benchmarks durchführen zu können, haben wir jeweils zwei CPU-Tandems auf Workstation-Boards mit AGP-Slots getestet. AMD empfiehlt das Tyan Thunder K8W (S2885, etwa 480 Euro), die Xeons steckten auf dem fast gleich teuren SE7505VB2 von Intel (Test in c't 18/03). Für zwei Gigabyte Speicher aus 512-MByte-Registered-DIMMs muss man zurzeit etwa 640 Euro anlegen; einen nennenswerten Preisunterschied zwischen den PC2100R-Riegeln der Xeons und den PC3200R-Modulen für die Opterons gibt es dabei nicht. Wir haben Mushkin-DIMMs verwendet, die besonders kurze Latenzzeiten aufweisen (bei 200 MHz als PC3200: 2,0-3-2, bei 133 MHz als PC2100: 2,0-2-2), aber wegen ihrer TSOP-Chips nicht dem JEDEC-Standard entsprechen.

Workstations mit einer Ausstattung, die ungefähr den Testkonfigurationen entspricht, dürften mindestens 4000 Euro kosten. Für eine Profi-Grafikkarte und ein SCSI-Subsystem kommen leicht noch 2000 Euro dazu. Der Spaß ist nicht nur teuer, sondern auch laut: Die maximale Abwärmeproduktion dieser Rechner erreicht etwa 300 Watt und führt deshalb zu erheblichen Ventilatorgeräuschen (siehe dazu auch Seite 81).

Solcher Aufwand lohnt sich nur für kräftige Rechenpower, und davon bieten beide Zwillingspärchen genug. In den meisten Benchmarks liegen ihre Leistungen eng beieinander, ein Blick auf die Details zeigt aber zum Teil extreme Unterschiede. Ein Beispiel dafür sind die Ergebnisse im CPU2000-Benchmark der SPEC [1|#literatur], durchgeführt unter Windows XP (32 Bit): Die Gesamtergebnisse für Fest- (INT) und Gleitkomma-Aufgaben (FP) differieren jeweils nur um ein halbes Prozent. Doch in Einzelaufgaben (weitere Messungen unter [1|#literatur]) betragen die Unterschiede zwischen den Prozessoren bis zu 33 Prozent. Noch krasser sind die Differenzen bei den Rate-Wertungen, die die Kooperation von CPUs in Multiprozessorsystemen (Skalierung) messen: Hierbei liegen die Opterons vor allem in der Gleitkomma-Disziplin weit vorne (31 Prozent), in Einzelwertungen gibt es sogar Unterschiede von bis zu 112 Prozent (beim Swim.171). Messungen auf [1|#literatur] mit 64-Bit-Linux und dem Compiler GCC 3.3 zeigen, dass das Opteron-Team dann beim CFP2000-Rate-Wert noch zulegt, im CINT2000 Rate aber etwas abfällt.

Die sehr guten CPU2000-Rate-Werte sind wahrscheinlich auf die NUMA-Architektur von AMD64 zurückzuführen: Jeder Prozessor ist unmittelbar an schnelles RAM angebunden und kommuniziert per Hypertransport (6,4 GByte/s) mit seinem CPU-Partner. Intels Xeon-Tandems dagegen müssen sämtliche Zugriffe über einen gemeinsamen FSB533 (4,3 GByte/s) abwickeln. Bald kommen allerdings die Xeons mit FSB800 und DDR2-Speicher - es bleibt also spannend.

Leistungsdaten unter Linux und Windows XP Professional.

Für Server mit vier und mehr Prozessoren plant Intel aber zunächst keine FSB-Beschleunigung, und auch bei diesen Rechnern glänzt die AMD64-Architektur: Für den ProLiant DL585 meldet HP einen Wert von 770 Usern im SAP-SD-Benchmark; der Quad-Xeon-Server IBM x365 reiht sich mit MP-Xeons mit jeweils 3 GHz und 4 MByte L3-Cache um 6,5 Prozent dahinter ein (720 User). Suns Dual-Opteron-System V20z bringt es mit zwei Opteron 248 auf 410 User, fast gleichauf (408) liegt ein HP ProLiant BL20p mit 3,2-GHz-Xeons (mit 2 MByte L3).

Nach wie vor bringen Hypertransport und AMD64 auf der einen Seite und Hyper-Threading und hohe Taktfrequenz auf der anderen Seite keine so eindeutigen Vorteile, dass man eine der beiden Prozessorarchitekturen zum allgemein besseren Produkt küren könnte. Vielleicht fehlen auch nur die passenden Benchmarks? Wer vor einer Kaufentscheidung steht, muss jedenfalls ganz genau hinsehen. Vor allem bei Profi-Servern, wo man aus Gründen der Betriebs- und Netzwerksicherheit sowie wegen des Administrationsaufwands nicht ständig neue, optimiert kompilierte Software einsetzen wird, kommt man wohl nur mit Leistungsmessungen mit den konkret vorgesehenen Programmen weiter. (ciw)

[1] Offizielle Ergebnisse des SPEC CPU2000: www.spec.org/cpu2000/results/ (ciw)