Prozessorgeflüster

Während Supercomputer die 100-TeraFlop/s-Marke überschreiten, freut sich Intel-Gründer Gordon Moore über die Ehrung seines Lebenswerks. Damit das Moore’sche Gesetz auch in den kommenden 50 Jahren gültig bleibt, ziehen seine Nachfolger vorsorglich neue Multicore-Prozessoren aus der Tasche.

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
Lesezeit: 7 Min.
Von
  • Oliver Lau
Inhaltsverzeichnis

Der IBM-Gründer Thomas Watson schätzte den Weltbedarf an Computern auf etwa fünf Stück. Das war 1943 - und noch weit entfernt von den gemütlichen 50 Hz Taktrate eines 1952er Supercomputers Zuse Z5, dessen bis zu 50 Gleitkommaoperationen pro Sekunde nur noch eingefleischte Computerhistoriker hinterm Ofen hervorlocken. Aktuelle Supercomputer bringen es auf die 2,7-billionenfache Leistung, etwa der neue von IBM gebaute BlueGene/L der US-amerikanischen Atomsicherheitsbehörde NNSA, der in den Lawrence Livermore National Laboratories einen neuen Linpack-Geschwindigkeitsrekord von 135 TeraFlop/s (Rmax) aufstellte - und damit erstmals die Marke von 100 TeraFlop/s durchbrach. Das bedeutet Platz 1 auf der aktuellen Top-500-Liste der Supercomputer [1], die zuletzt im November vergangenen Jahres angepasst wurde, als der kleinere Bruder des BlueGene/L aus IBMs Hauptquartier in Rochester den bisherigen Spitzenreiter vom Thron stieß: Die 5000 NEC-SX6-Vektorprozessoren des japanischen Earth Simulator mussten sich den gut 70 TeraFlop/s aus den 32 768 PowerPC-440-CPUs des IBM-Rechners geschlagen geben.

Immerhin zwei Jahre führte der Earth Simulator mit 36 TeraFlop/s die Liste an. Noch auf Platz 2 liegt derzeit der nach dem im Februar 2003 verunglückten Spaceshuttle Columbia benannte SGI-Altix-Supercomputer der NASA, dessen 10 240 Itanium-2-Prozessoren auf eine Linpack-Leistung von knapp 52 TeraFlop/s kommen. Damit der BlueGene/L nicht so schnell überholt wird, ist bereits eine Verdopplung der Rechenleistung auf geschätzte 270 TeraFlop/s geplant: In der ersten Jahreshälfte will die NNSA die nächsten 32 der bislang 64 Racks in Betrieb nehmen und somit die Zahl aktiver Prozessoren auf 131 072 verdoppeln. IBM nennt sogar eine theoretische Spitzenleistung von 360 TeraFlop/s. Die Ingenieure arbeiten hart daran, damit das Moore’sche Gesetz seine Gültigkeit behält.

Die New Yorker Marconi-Society hatte im März den mittlerweile 75-jährigen Intel-Gründer Gordon Moore für sein Lebenswerk geehrt - und damit auch für die gut 40 Jahre alte Prognose, dass sich die Transistorzahl pro Chip jährlich verdoppeln würde, was im Wesentlichen nichts anderes meint, als dass sich mit ihr auch die Rechenleistung verdoppelt. Später korrigierte Moore die Vorhersage auf alle 24 Monate - was aber nichts daran änderte, dass das Moore’sche Gesetz zu einer sich selbst erfüllenden Prophezeiung wurde.

Damit das so bleibt, ruft Intel 2005 zum Jahr der Doppelkerne aus - und die werden nicht wie IBMs Power5-Prozessoren bevorzugt für High-End-Workstations und -Server vorgesehen, sondern auch auf den PC-Massenmarkt ausgerichtet sein, zum Beispiel in Gestalt des Intel Pentium 4 Extreme Edition 840XE mit Hyper-Threading und des günstigeren Pentium D ohne HT, die beide im zweiten Quartal auf den Markt kommen sollen (siehe S. 18). Deren Prescott-Cores warten mit der AMD64-kompatiblen Befehlssatzerweiterung EM64T auf. Das deutet an, was den PC-User im laufenden Jahr noch so erwarten wird: Preissenkungen sowieso, gerüchtehalber spätestens im August, wenn die im Februar vorgestellte Pentium-600er-Serie mit auf zwei MByte verdoppelten L2-Cache die Pentium 500er vom Markt schieben. Aber vor allem ein immer lauter werdender Abgesang auf die 32-Bit-Technik, denn die 600er sind ebenfalls mit EM64T ausgestattet. Im zweiten Quartal wird wohl ein auf 3,8 GHz getakteter Pentium 4 670 das 600er-Spektrum nach oben erweitern. Etwa zur gleichen Zeit dürfen sich Sparfüchse über einen Celeron mit EM64T freuen. Dass Konkurrent AMD nachzieht und die eigene Low-Cost-Baureihe Sempron mit der 64-Bit-Befehlssatzerweiterung aufrüstet, liegt im Rahmen des Möglichen: Auf der CeBIT waren schon Mainboards zu sehen, die mit Sockel-939-Semprons zurechtkommen. Ursprünglich war der Sockel 939 nur für den Athlon 64 mit Newcastle- oder Winchester-Kern sowie die teureren FX-Typen vorgesehen.

Nicht „low cost“, dafür aber „low power“ ist der neue Opteron 248 HE mit 2,2 GHz, den AMD zum Server Blade Summit vorgestellt hat. Die maximale Leistungsaufnahme des in 90-nm-Technik gefertigten Chips soll bei 55 Watt liegen, also genauso viel wie beim auf 2 GHz getakteten Vorgänger 246 HE, allerdings nimmt er 30 Watt weniger als der normale Opteron 248 auf und noch mal 10 Watt weniger als der zurzeit schnellste Dual-Opteron 252 mit 2,6 GHz. Eine Optimized Power Management (OPM) genannte Stromsparfunktion soll die Leistungsaufnahme aller kommenden Opterons auch im unbelasteten Zustand senken - Boards dafür fehlen aber noch. Bislang kommen bei AMD-CPUs ähnliche Spar- und Kühlhalte-Techniken nur in Notebooks unter dem Namen PowerNow! und bei Athlon-64-gestützten Desktop-Rechnern als Cool’n’Quiet zum Einsatz.

Als leistungsstarken, aber auch stromhungrigen 64-Bit-Server-Prozessor hat Intel wie angekündigt zwei neue Xeon MP (Potomac) mit jeweils 8 MByte L3-Cache vorgestellt: einen mit 3 GHz und einen mit 3,33 GHz. Ein Xeon MP 2,83 GHz mit 4 MByte L3-Cache und die „Value MP Platform“ mit dem 3,66- und 3,16-GHz-Xeon (jeweils 1 MByte L2-Cache) runden die Produktlinie nach unten ab. Alle Prozessoren laufen mit dem neuen E8500-Chipsatz (Twincastle) mit Quad-Channel DDR2-400 (40 Bit physikalische Adressierung, 64 GByte maximaler Speicherausbau), PCI Express (14 GByte/s Spitzendurchsatz) und so genannten „Enhanced RAS Features“, also Funktionen, um Zuverlässigkeit und Verfügbarkeit zu steigern (Reliability, Availability, Serviceability). Dazu gehören beispielsweise Hot-Plug-Fähigkeit, ECC- und Chipkill-Speicherschutz, die redundante Auslegung von Baugruppen oder Fernwartungs- und Diagnosemöglichkeiten. Die beiden voneinander unabhängigen Frontside-Busse sind mit 667 MHz getaktet und sollen mit einem kumulierten theoretischen Durchsatz von 10,6 GByte/s um den Faktor drei schneller sein als die bisherige Xeon-Plattform.

Getreu dem jüngst wieder eingeführten Plattform-Konzept bekommt die Technik-Melange einen eigenen Namen: Truland heißt sie und soll sich in Bälde als Einstiegssystem in Gestalt eines Vier-Wege-Servers materialisieren. Ein solcher Rechner würde sich dem Betriebssystem als Maschine mit acht CPUs zu erkennen geben, weil die neuen Xeons mit Hyper-Threading arbeiten. Außerdem soll die Truland-Plattform für Intels Virtualisierungstechnik Vanderpool und kommende Multicore-Prozessoren vorbereitet sein. Für Numbercruncher halten die neuen Xeons den Gleitkommabeschleuniger SSE3 bereit. Sicherheitsfans bekommen das Execute Disable Bit, das Speicheradressen als „nicht ausführbar“ markiert und damit die Auswirkungen von Angriffen etwa über Buffer-Overflows minimieren soll - also Transistoren für etwas, damit der Rechner von heute ungestört das tun kann, wofür er vorgesehen ist. Oder um es mit den Worten von Gordon Moore auszudrücken, auch wenn er sie in einem anderen Zusammenhang verloren hat: „Wir haben 50 wunderbare Jahre erlebt. Die kommenden 50 werden nicht so leicht sein.“

[1] Aktuelle Top-500-Liste der Supercomputer (ola)