Prozessorgeflüster

Wenn zwei sich streiten, freut sich bekanntlich der Dritte: Während sich ARM und Atom Schlammschlachten liefern, konnte sich MIPS geruhsam weiterentwickeln. Und die Abkürzung MIPS spielt in anderer Bedeutung auch bei der Chipherstellung eine wichtige Rolle.

In Pocket speichern vorlesen Druckansicht 6 Kommentare lesen
Lesezeit: 7 Min.
Von
  • Andreas Stiller

Heimlich, still und leise hat MIPS im Embedded-Bereich den einen oder anderen Markt für sich erobert: DVD-Recorder, Settop-Boxen, Kabel-Modems … Nun macht das kleine kalifornische Prozessorhaus auch mal wieder etwas geräuschvoller auf sich aufmerksam und zwar mit dem Quad-Core MK1074 (siehe Seite 29). Mit Android als Betriebssystem bietet sich neben Linux und Windows CE (BSP 6.04) zudem eine attraktive Alternative an, insbesondere für die im aktuellen Brennpunkt stehenden kleineren Gerätchen. Erste Settop-Boxen mit Android und mit Prozessoren des MIPS-Lizenznehmers Sigma Designs sind bereits auf dem Markt und Smartphones stehen ebenfalls auf dem Programm. So entwickelt ein Forscherteam der University of California in San Diego unter dem Namen Greendroid ein besonders energiesparendes Design rund um einen MIPS-Kern. Und wer weiß, vielleicht wird Microsoft später auch Windows Phone 7 für MIPS herausbringen. Die Redmonder pflegen jedenfalls eine sehr lange Kooperation mit MIPS. In den 90er Jahren, als dieses zu SGI gehörte, gab es ja sogar Windows NT 3.1 bis 4.0 für die einst von „RISC-Papst“ und Stanford-Präsident John Hennessy konzipierte MIPS-Architektur. Der inzwischen legendäre MIPS-Prozessor R4000 ging dabei als erster 64-Bitter in die Mikroprozessorgeschichte ein, knapp ein Jahr vor Digitals Alpha und lange vor UltraSPARC, PA-RISC-2.0, POWER2, Itanium, PowerPC oder AMD64.

Den Aufstieg auf 64 Bit hat ARM für die kommenden Designs am oberen Ende des Leistungsspektrums noch vor sich, auch wenn die neuen Erweiterungen für ARMv7-A neben den Virtualisierungsmöglichkeiten nun eine „Large Physical Address Extension“ auf 40 Bit vorsehen. Diese ist mit zwei Adressfenstern zwar etwas ausgefeilter als das inzwischen obsolete PAE der x86-Prozessoren, kann aber mit echtem 64-Bit-Betrieb nicht wirklich mithalten. Eine Roadmap hin zu 64 Bit hat ARM derweil noch nicht herausgebracht, aber immerhin auf der „Linley Tech Processor Conference“ Simultaneous Multithreading (SMT) angekündigt, allerdings noch nicht für den nächsten Cortex-A15 „Eagle“. Für MIPS indes ist SMT schon ein alter Hut und man ist hier dank MIPS64 gut gewappnet, wenn die nächsten Tablet-PC-Generationen so langsam über die 4-GByte-Speichergrenze vordringen oder die Chips verstärkt im Servermarkt eine Rolle spielen wollen.

Der chinesische Loongson 3A und seine Nachfolger schicken sich an, die Szene aufzumischen.

Daneben will MIPS auch wieder ganz oben bei den Supercomputern Land gewinnen und zwar mit dem Loongson (Codename Godson) des chinesischen Institute of Computing Technology (ICT) in Schanghai. Anfangs gab es mit dem ICT noch ein paar Animositäten wegen der MIPS-Lizenzen, seit Sommer 2009 sind diese aber durch eine weitreichende Architekturlizenz vom Tisch. Und nun profitiert MIPS erheblich davon, dass sich viele Firmen und Ingenieurbüros im Lande verstärkt an der „chinesischen“ Architektur orientieren.

Hergestellt wird Loongson von STMicroelectronics. Die europäische Firma vermarktet den Loongson 2F auch selbst als STLS2F01: ein Single-Core mit vierfacher Superskalarität, mit 900 MHz Takt und 4 Watt TDP. Der neuere Loongson 3A mit vier 1-GHz-Kernen (GS464), zwei DDR2/3-Speicherkanälen sowie zwei HyperTransport-1.0-Controllern und mit 16 GFlops bei 15 Watt ist ebenfalls bereits in Produktion und wird vom chinesischen Systemhersteller Dawning in Blade-Servern angeboten. Im November könnte sich der mit vielleicht 80 000 Loongson-Prozessoren bestückte Dawning 5000L in die kommenden Top500-Liste der Supercomputer als nächstes Petaflops-System ganz oben eintragen.

Auf der Hotchips-Konferenz im August stellte Professor Weiwu Hu aber bereits den nächsten Kern GS464V vor, der vor allem mit seinen beiden 256 Bit breiten Vektoreinheiten à la Intel-AVX auftrumpft. Anders als bei Intels nächster Prozessorgeneration Sandy Bridge unterstützt er sehr intensiv „Fused Multiply Add“ und kommt dann in den beiden Einheiten auf acht paralle FMA-Instruktionen für doppeltgenaue Gleitkommawerte. Der Kern soll im nächsten Jahr im Achtkern-Chip Loongson 3B debütieren, der damit bei nur 1 GHz Takt und 40 Watt auf theoretisch 128 GFlops kommt. Praktisch, so Weiwu Hu, erreichte man davon bei der Matrixmultiplikation 93 Prozent, also knapp 120 GFlops und mithin 3 GFlops/Watt. Die Performance entspricht etwa der DGEMM-Leistung von zwei aktuellen Intel-Xeon-X5680-Prozessoren (Westmere-EP) mit insgesamt 12 Kernen und 3,33 GHz Takt, die aber mit 260 Watt TDP über sechsmal so viel Energie hinauspusten.

Eine weitere Besonderheit des Chips ist die Fähigkeit zur schnellen Emulation von x86-Code. ICT hat dafür spezielle Hardware und Instruktionen vorgesehen, um zusammen mit dem Softwareemulator QEMU für sehr effiziente Ausführung von x86-Software zu sorgen. Wenn das so gut funktioniert wie versprochen, hätten die Loongson-Rechner gleich eine Flut von Software zur Verfügung.

Der Achtkerner Loongson 3B ist ebenfalls noch für den betagten 65-nm-Prozess von STM ausgelegt, dann aber, so Weiwu Hu, wolle man 2012 mit dem 16-Kerner Loongson 3C Anschluss an den internationalen Standard bekommen und gleich auf 28 nm aufschließen. Den Herstellungspartner verriet er noch nicht. TSMC in Taiwan liegt nahe, aber auch Globalfoundries käme in Frage, ist die Firma doch ebenso wie TSMC Vertragspartner von STM.

Passenderweise hält Globalfoundries jetzt Mitte Oktober die „Global Technology Conference“ GTC2010 in Taiwan und Schanghai ab. Themenschwerpunkte: 28-nm-HKMG-Technologie und Roadmap zu 22/20 nm. Zusammen mit AMD und STMicroelectronics will Globalfoundries dort auch die Vorteile von „Gate-First“- gegenüber der „Gate-Last“-Technik von Intel und der von First zu Last konvertierten Schmiede TSMC herausputzen. Über Vor- und Nachteile der Reihenfolge im Prozess toben seit geraumer Zeit erregte Debatten. Platziert man erst das Gate (MIPS, das steht hier für Metal Inserted Poly-Silicon) – so wie es IBM, Infineon, Globalfoundries, Renesas und Samsung vorsehen –, kann man die anderen Elektroden Source und Drain einfach, genau und platzsparend positionieren. Allerdings muss das Gate dann die später kommenden Hochtemperaturschritte durchleben, womit Metall-Gates einige Schwierigkeiten haben. Intel und TSMC setzen lieber auf das Gate-Last-Verfahren (RMG, Replacement Metal Gate), das zwar weit komplexer ist und mehr Platz benötigt, aber die empfindlichen Gates erst nach der Hochtemperaturphase aufbringt. Unlängst hat ein Analyst der Barclays-Bank für erhebliches Aufsehen gesorgt, als er von Problemen mit thermischen Instabilitäten und Verschiebungen der Transistor-Schwellenspannungen beim Gate-First-Verfahren beim 32- und 28-nm-HKMG-Prozess berichtete. Das wurde natürlich umgehend von Globalfoundries und Samsung dementiert. (as)