ProzessorgeflĂĽster

Lang, lang ist’s her: In den frühen neunziger Jahren dominierten mal Suns SPARC-Prozessoren im großen Umfang nicht nur den Server-, sondern auch den Supercomputermarkt. Im Lauf der Zeit verblasste das Licht der Sonne allerdings ein wenig - doch nun dreht die ursprünglich mal als Ableger der Stanford University gegründete Firma wieder voll auf, unter anderem mit dem weltschnellsten Mikroprozessor UltraSPARC T2.

vorlesen Druckansicht
Lesezeit: 9 Min.
Von
  • Andreas Stiller
Inhaltsverzeichnis

Sun-Kunde Thinking Machines konnte im Frühjahr 1993 in der ersten Top500-Liste der Supercomputer alle ersten vier Plätze belegen sowie jede Menge weitere Systeme in der Liste platzieren. Ihre Connection Machine CM-5, bestückt mit bis zu 1024 SuperSPARC-I-Prozessoren (32 MHz), verwies NEC und Cray locker auf die Plätze. Doch Thinking Machines wurde kurze Zeit später insolvent (Chapter 11) und musste sich aufteilen. Sun übernahm den größten Teil und stieg damit ins High-Performance-Computing-Geschäft (HPC) ein. So erfolgreich war man indes nicht, es wurde stattdessen immer ruhiger um die SPARCs. Übrig blieben in der letzten Top500-Liste gerade mal drei Systeme, und die nicht mal mit Suns, sondern mit Fujitsus SPARC-Version.

In ihrer Einzelperformance (pro Prozessor) lagen die SPARCs ohnehin immer nur im Mittelfeld. Das änderte sich selbst dann nicht, als Sun mit dem Ultra SPARC IV als zweiter großer Hersteller nach IBM die Dual-Core-Arena betrat. Als im März 2005 der Prozessor (mit 1,35 GHz) in die SPEC-Charts kam, schaffte er es trotz seiner zwei Kerne weder in Integer noch Gleitkomma, die damals noch einkernigen Xeons, Opterons und Itaniums zu überholen (bezogen auf SPEC2000rate für eine CPU, also pro Sockel), und IBMs Power 5 mit damals 1,66 GHz Takt lag gut um Faktor zwei voraus.

All das ist jetzt Geschichte, denn nun hat Sun mit dem UltraSPARC T2 (Codename Niagara2) wieder ein ganz heißes selbstgestricktes Eisen im solaren Feuer, das zumindest als Einzelchip in der Multithreaded-Welt alle anderen in die Finsternis schickt - wobei man Intels „geschummelten“ Quad-Core mit zwei Dice in einem Gehäuse ruhig mit hinzurechnen darf.

Mit 78,3 SPECint_rate_base2006 und 62,3 SPECfp_rate_base2006 setzt Sun nun neue Maßstäbe für einen einzelnen Chip - also 60- bis 80-mal schneller als ein betagter UltraSPARC II aus dem Jahre 1997, das Referenznormal der SPEC-CPU2006-Suite. Intels Xeon dürfte diese Werte auch in der neuen 3-GHz-Fassung X5365 kaum überbieten können. Der lief jetzt offiziell vom Stapel, wiewohl es beim Mac 3-GHz-Xeons schon länger gibt, aber bislang nicht mit dem neuen G0-Step, der nur halb so viel im Idle-Modus verbrauchen soll wie sein Vorgänger.

Für den X5365 liegen derzeit nur SPECint_rate2006-Werte für Zwei-Sockel-Systeme vor (98,9 Punkte), so muss man den älteren Xeon X5355 mit 2,66 GHz heranziehen. Dieser schafft allein mit seinen vier Kernen 52,0 SPECint_rate_base2006 beziehungsweise 36,2 SPECfp_rate_base2006 - da reicht auch ein um 13 Prozent höherer Takt bei weitem nicht hin, um an die T2-Werte heranzukommen. Und auch IBMs Power6 muss sich in der Single-Chip-Disziplin mit 53,2 beziehungsweise 51,5 SPEC-CPU-Punkten klar geschlagen geben.

Der Power6 arbeitet zwar mit 4,7 GHz Takt, besitzt aber eben nur zwei Kerne. Acht Kerne ackern hingegen im T2 mit bis zu 1,4 GHz Takt, ein jeder kann per SMT (Simultaneous Multithreading) acht Threads gleichzeitig verarbeiten, doppelt so viele wie sein Vorgänger T1. Um das zu erreichen, hat Sun die Zahl der internen Instruktions-Pipelines verdoppelt, sodass das Design jetzt zwei Instruktionen pro Takt verarbeiten kann. Und der gemeinsame L2-Cache, der mit acht Bänken am internen Crossbar-Switch hängt, wurde um ein Drittel vergrößert.

Insgesamt kommt der T2-Prozessor also auf 64 Threads. Er ist ersichtlich auf Aufgaben mit vielen, vielen Threads zugeschnitten, so wie es bei Web- und vielen anderen Servern die Regel ist. Und üblich ist bei vielen davon heutzutage auch eine Verschlüsselung - just dafür hat der T2 ein weiteres Zückerli (freie Übersetzung von „Zero Cost Goodie“) parat: eine integrierte Security Processing Unit (SPU) pro Kern, die parallel zu den anderen Pipelines arbeitet. Sie beherrscht alle gängigen Verschlüsselungstechniken und bietet auch einen Hardware-Zufallsgenerator zur Schlüsselerzeugung. Gut um Faktor zehn schneller als die in Software ver- und entschlüsselnde Prozessorkonkurrenz soll die Crypto Engine sein.

Für einen Webserver auch nicht zu verachten sind die beiden integrierten 10-Gigabit-Ethernet-Controller, die zusammen mit einem optimierten „multithreaded“ TCP-Stack für hohen Durchsatz sorgen. Und wie beim T1 sind vier Speichercontroller mit an Bord. Um hier die Zahl der nötigen Anschlüsse klein zu halten, wechselte Sun aber von DDR2 auf das etwas stromhungrigere FBDIMM. Die vier Zweikanal-FBDIMM-Ports sollen mit 42 GByte/s lesen und mit 21 GByte/s schreiben können, und das gleichzeitig. Daneben bietet der Prozessor außerdem noch einen PCIe-Controller, gedacht vor allem für Festplatten und andere Peripherie. Mit seinen acht Lanes ist der allerdings nicht übermäßig üppig ausgelegt.

Schließlich gibt es noch einen weiteren, ganz wichtigen Unterschied zum T1. Während bei jenem nur eine einzige FPU für alle Kerne zur Verfügung stand, besitzt nun jeder der acht Kerne seine eigene. Das führte zu einem dramatischen Anstieg der Gleitkommaleistung und zu dem hervorragenden SPECfp-Wert. Web- und viele Applikationsserver brauchen Gleitkommaleistung allerdings eher selten - möglicherweise bahnt sich hier aber eine weitere Offensive im High Performance Computing (HPC) an. Dass Sun auf diesem Gebiet wieder massiv an Land gewinnen will, hat Sun-Mitgründer und -Chefarchitekt Andreas von Bechtolsheim auf der letzten Supercomputer-Konferenz in Dresden kompromisslos verkündet.

Was nur noch fehlt, sind multiprozessortaugliche T2s. Doch auch darauf soll man nicht mehr lange warten. Unter dem Codenamen „Victoria Falls“ sind entsprechend umgebaute T2-Designs in Arbeit, die in der ersten Hälfte des nächsten Jahres, zunächst als Zweisockel-Version, herauskommen sollen.

Bechtolsheim hat ja mal zielsicher Google mit einer Anschubfinanzierung auf den Weg gebracht - und Google schaut sich die Prozessoren inzwischen sehr genau an, darunter sicherlich auch Nicht-x86-Designs wie den T2. Bei einem Verbrauch von 95 Watt (typisch) und 123 Watt (maximal) samt Speichercontroller und 10 Gigabit Ethernet schlägt die T2-Effizienz die versammelte Intel-, AMD- und IBM-Konkurrenz um Längen. Da verwundert es nicht, dass Sun nun kräftig auf der Ökowelle reitet und beispielsweise hier in Deutschland mit der Sun EcoTour 2007 eine Fahrradrundreise unterstützt, die das Umweltbewusstsein fördern und auf Ökologie in der IT aufmerksam machen soll.

Zudem schmeichelt man sich bei der wichtigen Open-Source-Gemeinde ein. Wie auch beim T1 wird der T2 als „OpenSPARC“ nicht nur wunderschön detailliert beschrieben, sondern Sun will das komplette Hardware-Design per Verilog-RTL allgemein zugänglich machen. Zunächst ist der Zugang noch auf Entwickler unter NDA beschränkt, doch bald schon soll sich jeder (na ja, man sollte sich schon mit Verilog auskennen) das Design anschauen und unter GPL herunterladen können. Da kann man bei Intel und AMD nur von träumen - IBM hat eine ähnliche Offenheit immerhin beim Cell vorgesehen.

T2-Systeme werden in etwa einem Monat erwartet - T2-Blades beispielsweise, die zudem gut in Suns Constellation-Konzept passen. Das zielt zunächst allerdings primär auf Opteron ab, und zwar auf den in Kürze erwarteten Quad-Core Barcelona. Mit über 12 000 Stück soll der gigantische Texas-Ranger in Austin im Oktober 2007 ausgestattet werden und, so ist jedenfalls der Plan, mit seinen 0,5 PetaFlop/s Rechenleistung die kommende Top500-Liste im November anführen.

Im HPC-Bereich sind manchmal auch Single-Thread-Qualitäten gefordert - das ist aber nichts für den „leichtkernigen“ T2. Hierfür hat Sun daher etwas anderes in der Queue, und zwar ein multiskalares Schwergewicht namens Rock. Prototypen des mit 16 Kernen arbeitenden Chips booten bereits Solaris. Ziel ist es, in der zweiten Jahreshälfte 2008 den Prozessor mit einer um Faktor 16 höheren Performance herauszubringen, als sie die aktuelle UltraSPARC-IV+-Plattform bietet.

Der muss sich dann aber unter anderem mit Intels Schwergewicht Itanium-Tukwila (mit nur vier Kernen) messen, der für den gleichen Zeitraum geplant ist. Jetzt kommt erst mal der Itanium-Montvale heraus - ein sehr halbherziges Update des aktuellen Itanium-Montecito. Das ist entgegen der ursprünglichen Ankündigung überhaupt kein neuer Prozessor in 65-nm-Technik geworden, sondern nur ein neues Stepping, mit gerade mal 66 MHz höherem Takt und FSB667 statt FSB533. Intel - so Business-Chef Pat Gelsinger auf einem Server-Workshop in Oregon - habe alle Entwicklerkapazität in den Tukwila gesteckt und keine Mühe mehr auf die ollen Itanium-Kamellen verschwendet, die noch sein Vorgänger Fister angeschoben hatte. Okay - so hat er es nicht gesagt, aber wohl gemeint. (as) (as)