AMD stellt die ersten Vierkern-Opterons vor

Endlich erscheinen die ersten AMD-Serverprozessoren der neuen Barcelona-/K10-Generation.

In Pocket speichern vorlesen Druckansicht 364 Kommentare lesen
Lesezeit: 10 Min.

Barcelona-Die
Ein "Die-Shot" des Barcelona

Die Aufholjagd beginnt: In neuen Opterons für Server und Workstations mit zwei CPU-Fassungen (Opteron 23xx) sowie für Server mit vier und mehr "Sockeln" (Opteron 83xx) debütiert nach mehr als sechs Monaten Verzögerung der neue Quad-Core-Prozessor Barcelona alias K10 oder auch K8L. AMD hat bisher zur Performance der ursprünglich unter dem Codenamen Deerhound entwickelten Prozessoren nur Andeutungen verbreitet; hochgerechnete Leistungsdaten, die im April kurzzeitig auf der AMD-Webseite erschienen waren und Barcelona-Versionen mit 2,6 GHz Taktfrequenz mit einem Xeon X5355 (2,66 GHz) verglichen, hatten für Diskussionsstoff gesorgt – insbesondere nachdem AMD die Erwartungen dämpfen musste und klarstellte, zunächst nur Barcelona-Versionen mit maximal 2 GHz Taktfrequenz ausliefern zu können.

Nun ist es aber soweit: Auf mehreren weltweiten Veranstaltungen – jene für die EMEA-Region findet selbstverständlich in Barcelona statt – gibt AMD den Startschuss für die neuen Vierkerne, die das zurzeit defizitär arbeitende Unternehmen wieder in die Gewinnzone führen sollen. Dank wesentlich höherer Rechenleistung und Effizienz sollen sie Intels Xeon-Prozessoren überflügeln und höhere Verkaufspreise erzielen als ihre Vorgänger, denn die Verluste von AMD rühren – außer von den Belastungen durch die ATI-Übernahme – vor allem von den drastisch gefallenen CPU-Preisen her. Seit Intels Prozessoren mit Core-Mikroarchitektur die im Vergleich zu den alten Pentium-4/D-"Netburst"-Chips attraktiven AMD64-CPUs in puncto Performance überrundet haben, konnte AMD seine Marktanteile nur mit Preissenkungen stabilisieren. Zwischenzeitlich ging sogar der Vertriebschef über Bord (er ist übrigens bei Freescale gelandet, während sein Ex-Chef Hector Ruiz von der ehemaligen Freescale-Mutter Motorola kam).

Barcelona legt in Form von vier Modellvarianten für Dual-Socket-Server zu 1000-Stück-OEM-Listenpreisen zwischen 209 und 389 US-Dollar los, die 83xx-Versionen für Multiprozessormaschinen kosten erheblich mehr. Die zunächst schnellsten Prozessoren mit Standard-Leistungsprofil (95 Watt TDP) erreichen wie angekündigt höchstens 2,0 GHz Taktfrequenz, zudem kommen High-Efficiency-(HE-)Prozessoren mit 68 Watt TDP und bis zu 1,9 GHz. Letztere sind vor allem für Knotenrechner in HPC-Clustern attraktiv sowie für dicht gepackte Blade-Server und große Rechenzentren. Damit bedient AMD also zunächst Marktbereiche mit hohem Stückzahlwachstum und Kunden wie Sun (Constellation, Ranger/TACC) oder Cray (XT4), die große Superrechnerprojekte bestücken wollen. Vor dem Jahresende sollen aber noch schnellere Opteron-Vierkerne erscheinen; zu den konkreten Taktfrequenzen schweigt AMD bisher allerdings.

ProzessorKerne/
L2-/L3-Cache
Takt-
frequenz
Leistungs-
aufnahme
(TDP)
Preis
[US-Dollar]
Opteron 8300 (Fassung LGA1207+, AMD-V, 3 kohärente HT-1.0-Links)
Opteron 8350  4 / 4×512 KByte / 2 MByte 2,0 GHz 95 Watt 1019 
Opteron 8347  4 / 4×512 KByte / 2 MByte 1,9 GHz 95 Watt 786 
Opteron 8347 HE  4 / 4×512 KByte / 2 MByte 1,9 GHz 68 Watt 873 
Opteron 8346 HE  4 / 4×512 KByte / 2 MByte 1,8 GHz 68 Watt 698 
Opteron 2300 (Fassung LGA1207+, AMD-V, 1 kohärenter, 2 nicht-kohärente HT-1.0-Links)
Opteron 2350  4 / 4×512 KByte / 2 MByte 2,0 GHz 95 Watt 389 
Opteron 2347  4 / 4×512 KByte / 2 MByte 1,9 GHz 95 Watt 316 
Opteron 2347 HE  4 / 4×512 KByte / 2 MByte 1,9 GHz 68 Watt 377 
Opteron 2346 HE  4 / 4×512 KByte / 2 MByte 1,8 GHz 68 Watt 255 
Opteron 2344 HE  4 / 4×512 KByte / 2 MByte 1,7 GHz 68 Watt 209 

Die Gretchenfrage lautet, wie viel Performance die neuen Vierkerne im Vergleich zu ihren Dual-Core-Vorgängern und im Vergleich zu Intels Xeon-5300-Prozessoren für 2-Sockel-Server sowie den nagelneuen Tigerton-MP-Xeons (7300) liefern. Für erste Tests stellte AMD der c't-Redaktion für wenige Tage ein Vorserienmodell des Tyan-Rackserver-Barebones GT24 zur Verfügung. Darin steckten zwei Opteron 2350 (eigentlich Opteron 8350, die hier aber nur als Paar liefen) auf einem von Tyan noch nicht eingeführten Mainboard (S3993) mit Broadcom/ServerWorks-Chipsatz HT-2100 und 16 GByte PC2-5300R-Speicher (DDR2-667, ECC/Registered).

Tyan GT24
Server-Barebone GT24 von Tyan

Die AMD-Prozessoren hatten noch ein Vorserien-Stepping, auch das Mainboard war nicht mit finalem BIOS ausgestattet. Die Benchmark-Suite SPEC CPU2006 lief trotzdem problemlos, wenn auch nicht unter dem eigentlich vorbereiteten Red Hat Enterprise Linux 5 (RHEL5), sondern nur unter Suse Linux Enterprise Server 10.2 (SLES10). Die Messungen erfolgten mit reinem 64-Bit-Code, den die Compiler-Suites der Portland Group (PGI 7.10e mit NUMA- und SSE4a-Unterstützung für die neuen Opterons) und von Intel (C/C++- und Fortran-Compiler Version 10.023) erzeugten. Anders als bei vielen Veröffentlichungen auf der SPEC-CPU2006-Webseite haben wir auf SmartHeap-Bibliotheken zur Optimierung der Speicherverwaltung verzichtet und auch die Ganzzahl-Benchmarks mit 64-Bit-Code ausgeführt – besonders die Intel-Prozessoren absolvieren die Integer-Benchmarks mit hoch optimiertem 32-Bit-Code auch unter 64-Bit-Betriebssystemen deutlich schneller. Unsere Ergebnisse liegen deshalb im Ganzzahlbereich viel niedriger als andere, sind aber nach unserer Einschätzung näher an der Realität – wiewohl die CPU2006-Benchmarks ohnehin eher das theoretische CPU-Potenzial ausloten und nur eingeschränkt zeigen, wie schnell die Prozessoren "gewöhnliche", weniger optimierte Standardapplikationen in der Praxis verarbeiten. Für weitergehende Tests als die jeweils rund 36 Stunden laufende SPEC-CPU2006-Suite reichte die Zeit allerdings nicht, die Barcelona-Vorserienmuster mussten weiter.

ProzessorenKerneTakt-SPEC CPU2006 (Base)
 im SystemfrequenzEinzelkernDurchsatz
   int_2006fp_2006int_rate_2006fp_rate_2006
2 × Opteron 2350 2×4 2,0 GHz 10,2 11,6 70,2 68,3 
2 × Opteron 2222 2×2 3,0 GHz 12,8 13,9 50,0 50,2 
2 × Opteron 2212 2×2 2,0 GHz (9,8(10,4(37,9(38,6
2 × Xeon X5365 2×4 3,0 GHz 15,7 
(18,9)
15,8 72,5 
(98,9)
61,9 
Messungen mit 64-Bit-Code unter 64-Bit-Linux, Compiler: PGI 7.10e (AMD), Intel 10.023, ohne SmartHeap
Werte in Klammern von www.spec.org, für Xeon mit hoch optimiertem 32-Bit-Code und SmartHeap-Libraries

Opteron 8350
Opteron 8350 in LGA1207+-Fassung

Wie unsere Ergebnisse zeigen, können die einzelnen Barcelona-Kerne bei 2 GHz Taktfrequenz ihre K8-Vorgänger mit 3 GHz (als Opteron 2224 SE sogar mit 3,2 GHz lieferbar) nicht übertrumpfen, im Vergleich zu einem ebenfalls mit 2,0 GHz arbeitenden Opteron-2212-Kern ist die Performance nur moderat gestiegen. Die einzelnen Kerne liegen auch weit hinter jenen des ebenfalls mit 3 GHz laufenden Xeon X5365.

Ganz anders sieht das beim Durchsatz (Rate-Werte der CPU2006) aus: Die neuen Quad-Cores skalieren sehr gut, vor allem deutlich besser als die Xeons. Dadurch überholen schon die ersten 2-GHz-Barcelonas beim Gleitkomma-Durchsatz die aktuell schnellsten Xeons. Intel plant allerdings sehr bald den Umstieg auf 45-Nanometer-Xeons (Harpertown), die möglicherweise höhere Taktfrequenzen erreichen, und will auch einen neuen Chipsatz (Seaburg, Stoakley-Plattform) liefern, der FSB1600 unterstützt und wie der 7300 und der 5000X ein Snoop-Filter enthält. Beide Maßnahmen können die Skalierung der Xeons verbessern. In der Integer-Disziplin liegen allerdings schon die aktuellen Xeons vor den Barcelona-Opterons, selbst mit dem weniger stark optimierten "c't-Code".

Der Vergleich der elektrischen Leistungsaufnahme ist nur mit Einschränkungen möglich, weil die Testsysteme mit unterschiedlichen Netzteilen und Komponenten bestückt waren; zudem funktionierte PowerNow! beim AMD-System nicht. Unter Volllast jedenfalls schluckte das Opteron-2350-Tandem mit acht 2-GByte-RDIMMs 376 Watt, das Xeon-X5365-System mit 12 FB-DIMMs brachte es auf 466 Watt – pro FB-DIMM rechnet man mit 4 bis 6 Watt mehr Leistungsaufnahme, sodass die Differenz von 90 Watt ungefähr zur Hälfte zu Lasten des Speichers geht. Bezogen auf den Gleitkommadurchsatz liegt die Energieeffizienz der neuen Opteron-Tandems in diesem Vergleich jedenfalls deutlich höher als jene der Xeons; würde man hingegen Stromsparversionen der Xeons sowie weniger FB-DIMMs einsetzen und die Energieffizienz im Ganzzahldurchsatz vergleichen, könnte das Rennen anders ausgehen. Zudem plant Intel mit San Clemente einen Chipsatz, der ebenfalls mit den sparsameren DDR2-RDIMMs auskommt, aber wegen seiner lediglich zwei (statt vier) Speicherkanäle wohl weniger leistungsstark sein wird.

Nach diesen Ergebnissen liefern die neuen Vierkern-Opterons – wie von AMD versprochen – deutlich mehr Durchsatz als ihre Doppelkern-Vorgänger; sofern die versprochene "nahtlose Aufrüstung" klappt, kann also ein Umstieg auf die neuen Prozessoren schon jetzt attraktiv sein. Im Vergleich zu den Xeons profilieren sich die Barcelonas vor allem für den Einsatz in HPC-Clustern. Bei Standard-Servern, deren Leistung eher vom Integer-Durchsatz der Prozessoren abhängt, dürften die Xeons harte Konkurrenten bleiben.

Die einzelnen Barcelona-Kerne werden erst dann konkurrenzfähig, wenn ihre Taktfrequenz deutlich steigt. Die ersten Barcelona-Vierkerne überholen ihre mit viel höherer Taktfrequenz laufenden Vorgänger und die Xeons nur beim Durchsatz, also wegen ihrer guten Skalierung; das erklärt, weshalb AMD so auf dem Begriff der "nativen Vierkerne" herumreitet. Weil beide Hersteller für die nahe Zukunft schnellere Prozessoren versprechen, bleibt das Rennen zwischen AMD und Intel sehr spannend. Für die bald erwarteten Desktop-PC-Vierkerne (einen Phenom X4 hatte AMD auf der Games Convention mit 3 GHz laufen lassen, Intel den Yorkfield mit 3,33 GHz schon auf dem IDF in Peking gezeigt) haben die ersten Barcelona-Messungen aber nur eingeschränkte Aussagekraft.

Weitere Benchmarks, Informationen und eine detaillierte Vorstellung der Barcelona-Architektur bringt c't in Ausgabe 20/07 (ab dem 17. September im Handel).

Siehe dazu auch:

(ciw)