AMDs Serverprozessoren mit Bulldozer-Architektur legen los
Während AMDs Desktop-Prozessoren mit Bulldozer-Architektur nicht so überzeugen konnten, sieht das bei den Server-Prozessoren weitaus besser aus.
Nach den FX-Desktop-Prozessoren hat AMD nun auch die Serverprozessoren mit Bulldozer-Architektur herausgebracht. Das Flaggschiff Interlagos (Opteron 6200) besteht wie Vorgänger Magny-Cours gleich aus zwei Dice, ein jedes mit vier Modulen oder acht Kernen. So bietet ein Zweisockelsystem dann 32 Kerne und passt in die alte Magny-Cours-Infrastruktur. Eine Besonderheit des neuen AMD-Prozessors ist, dass er mit der von Intel entwickelten AVX-Erweiterung aufwartet, bevor Intel selbst mit den passenden, damit bestückten Prozessoren (Sandy Bridge EP) offiziell herauskommt. Darüber hinaus bieten die Bulldozer-Prozessoren zusätzliche eigene Erweiterungen an, wobei insbesondere die Fused-Multiply-Add-Befehle mit vier Operanden (FMA4) herausragen.
In einem Zweisockelsystem von Supermicro (815-7) erreichte im c't-Labor die Matrix-Multiplikation (DGEMM) mit FMA4 in der Bibliothek ACML 5.0.0 auf zwei Mal Opteron 6276 (2,3 GHz) 222 GFlops und der Linpack 205 GFlops, beide bei Matrixgrößen von 30.000. AMD schaffte mit mehr Speicher und größeren Matrizen sogar 239 GFlops. Intels aktuelle Zweisockelserver mit Westmere-EP (Xeon 5680, 6 physische Kerne, 3,33 GHz) kommt mit der aktuellen Mathebibliothek MKL auf 144 GFlops. Auch bei SPECInt_rate2006_base und SPECfp_rate2006_base, gemessen nach dem c't-Messszenario (64-Bit-Code, keine Smartheap-Spezialbibliothek, keine großen Speicherseiten), konnte der AMD-Prozessor die Westmere-Konkurrenz um 20 bis 30 Prozent abhängen: unter Linux (Betaversion von Red Hat Enterprise Linux 6.2 mit eingespieltem L1-Alias-Patch) mit dem neuen AMD-Compiler open64 4.2.5.2 contra Intel Composer2011SP1 (Icc/Fortran 12.1) steht es im Integervergleich 454 zu 349 und bei Gleitkomma 337 zu 246.
Die Energieaufnahme des Interlagos ist zudem unter Linpack-Vollast um 60 Watt geringer als die der Intel-CPUs. Mit 502 MFlops/Watt gegenüber 311 MFlops/Watt spricht dann die Linpack-Effizienz für sich. Dank C6-Schlafzustands kann sich das Interlagos-System auch im SPECPower-Benchmark (mit IBM J9-VM unter Windows) deutlich mit 1736 zu 1203 ssj_ops/Watt an die Spitze setzen.
Anders als die Desktop-Version, die überwiegend Enttäuschung hervorrief, vermochte sich also der Serverprozessor mit Bulldozer-Architektur mit den in der Serverwelt typischen Workloads gegenüber Intels Westmere-Generation gut in Szene zu setzen, was Performance, Energieeffizienz oder Preis angeht. Wenn Intel allerdings den Sandy Bridge EP mit acht Kernen, vier Speicherkanälen und AVX-Unterstützung vom Stapel lässt, werden die Karten wieder neu gemischt.
Opteron-Versionen (Preise) | ||||||
Prozessor | Kerne | Kerntakt | L3-Cache | ACP | TDP | Preis |
6204 | 4 | 3,3 GHz | 16 MByte | 80 W | 115 W | 455 US-$ |
6212 | 8 | 2,6 GHz | 16 MByte | 80 W | 115 W | 266 US-$ |
6220 | 8 | 3,0 GHz | 16 MByte | 80 W | 115 W | 523 US-$ |
6234 | 12 | 2,4 GHz | 16 MByte | 80 W | 115 W | 377 US-$ |
6238 | 12 | 2,6 GHz | 16 MByte | 80 W | 115 W | 455 US-$ |
6262HE | 16 | 1,6 GHz | 16 MByte | 65 W | 85 W | 523 US-$ |
6272 | 16 | 2,1 GHz | 16 MByte | 80 W | 115 W | 523 US-$ |
6274 | 16 | 2,2 GHz | 16 MByte | 80 W | 115 W | 639 US-$ |
6276 | 16 | 2,3 GHz | 16 MByte | 80 W | 115 W | 788 US-$ |
6282SE | 16 | 2,6 GHz | 16 MByte | 105 W | 140 W | 1019 US-$ |
4226 | 6 | 2,7 GHz | 8 MByte | 75 W | 95 W | 125 US-$ |
4228HE | 6 | 2,8 GHz | 8 MByte | 50 W | 65 W | 255 US-$ |
4234 | 6 | 3,1 GHz | 8 MByte | 75 W | 95 W | 174 US-$ |
4238 | 6 | 3,3 GHz | 8 MByte | 75 W | 95 W | 255 US-$ |
4256EE | 8 | 1,6 GHz | 8 MByte | 32 W | 35 W | 377 US-$ |
4274HE | 8 | 2,5 GHz | 8 MByte | 50 W | 65 W | 377 US-$ |
4280 | 8 | 2,8 GHz | 8 MByte | 75 W | 95 W | 255 US-$ |
4284 | 8 | 3,0 GHz | 8 MByte | 75 W | 95 W | 316 US-$ |
(as)