Prozessorgeflüster

3D ist in, in Kinos, Fernsehern und zunehmend auch in Chips. Derzeit gibts 3D-Image-Sensoren, bald auch 3D-Stacks bei Speicher und Prozessoren. Und AMD-Prozessoren bekommen neue Namen: Sempron, Athlon und Phenom sterben aus.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 6 Min.
Von
  • Andreas Stiller

Feinfühlig überspielte IBM-Chef Palmisano den Patzer der Bundeskanzlerin, die auf ihrem CeBIT-Rundgang bei der Präsentation von IBMs 3D-Prototyp-Chip fragte: „Den haben Sie von Intel übernommen?“ Seine Antwort „Unsere sind besser“ ging im allgemeinen Gelächter fast unter.

Bundeskanzlerin Merkel und IBM-Chef Palmisano freuen sich über den 3D-Chip: „Haben Sie den von Intel?“

(Bild: Deutsche Messe AG)

Ganz so falsch lag Frau Dr. Merkel – deren Doktortitel übrigens auch nach intensivster Prüfung ohne Fehl und Tadel ist – mit ihrer Anmerkung indes nicht, denn Intel und die anderen Mitbewerber der Szene arbeiten schon geraumer Zeit daran, die dritte Dimension bei den Chips zu erobern. Erstes Ziel ist es, Speicher direkt unter oder über die CPU zu platzieren, so etwa bei Intels Teraflops Research Chips. Der ist aber nur ein Testchip – IBM will hingegen den für 2013 geplanten Power8-Prozessor (in 28 oder 22 nm) in 3D-Stack-Technik ausführen, mit einem direkt angekoppelten Speicher und zusätzlich wahrscheinlich einer Lage kleiner spezialisierter Rechenkerne, jeweils angepasst an den Einsatzzweck. Hier könnten dann auch die Nachfahren der Synergistic Processing Units des Cell-Prozessors auftauchen – die 3D-Stacks bieten ja viel Spielraum für Modularität. Geplant sind später bis zu 100 000 Verbindungen pro mm2 in Silizium (TSV: Through-Silicon Via).

Möglicherweise überrascht uns Intel mit dem ebenfalls für 2013 geplanten Haswell-Prozessor auch bereits mit 3D-Technik, etwa mit einem „gestackten“ großen L3-Cache. Intern trägt der Prozessor jedenfalls schon die 3 im Namen: H3. Auch auf der Roadmap von Globalfoundries dominieren die 3D-Stack-Techniken. Derzeit hat man 3D-CMOS–Image-Sensoren (3D CIS) oder sogenannte System-in-Packages mit Analog-, HF- und Powerkomponenten (3D RF-SIP) im Angebot. Ab etwa 2013 sollen die 3D-IC-Packages für Prozessoren und ähnliche Chips folgen, mit Analog- und HF-Technik, DRAM, Prozessorkernen und auch mit Micro-Electro-Mechanical Systems (MEMS). Ob die 3D-Technik dann für AMD oder für andere Auftraggeber vorgesehen ist – AMD trägt aktuell nur noch zu 30 Prozent zum Globalfoundries-Umsatz bei –, wird man sehen.

Hauptproblem bei den 3D-ICs ist die Kühlung. IBM forscht hierbei zusammen mit der École Polytechnique Federale in Lausanne und der ETH Zürich im Rahmen des CMOSAIC-Projektes. Die Wissenschaftler zeigten nun erste Testchips, bei denen man das Kühlwasser durch kleine Kapillarröhrchen von nur 50 Mikron Durchmesser durch den Chip pressen kann. Es wird aber noch einige Jahre dauern, bis diese Technik produktionstauglich ist.

Die Infrastruktur drum herum, also die Wasserkühlung auf dem Board, erprobt man mit entsprechend designten Blades für den Supercomputer Aquasar an der ETH Zürich. Anders als beim sehr teuren Supercomputer Blue Waters mit seinen wassergekühlten Speicherriegeln hat man hier ein Konzept entwickelt, nebst Prozessoren, Chipsätzen und Spannungsreglern handelsübliche DIMMs in die Wasserkühlung einzubinden.

Dieses Verfahren ist schon ausgereift und wird zurzeit auf die iDataPlex-Server übertragen. Denn diese sollen ab Ende dieses Jahres, bestückt mit Intels nächster Xeon-Generation Sandy Bridge-EP, den SuperMUC am Leibnizrechenzentrum(LRZ) in Garching bei München zu Höchstleistung antreiben.

Auf der ISC im Juni 2012, so hofft IBMs verantwortlicher SuperMUC-Architekt Klaus Gottschalk, soll der heißwassergekühlte Rechner mit 3 Petaflops theoretischer Rechenleistung ganz vorne in die Top500-Liste der Supercomputer einziehen. Wie man hört, will LRZ-Direktoriumsleiter Prof. Bode die bisherigen energieschluckenden Itanium-Dinosaurier aber schon vorher in den Ruhestand schicken und durch weit effizientere Intel-Westmere-Systeme ersetzen.

Möglicherweise sind AMDs Bulldozer-Chips aber noch effizienter. Auf der CeBIT erfuhr man bei AMD schon die überaus schlichten offiziellen Namen der geplanten neuen AMD-Generationen. Die Bulldozer-Familie wird mit FX beginnen, etwa FX8000 für die 8-Kern-Version. Wie es ausschaut, bleibt es beim Erscheinungstermin Ende Juni als Schnittmenge von zweitem Quartal und Frühsommer. Erste Bulldozer-taugliche Mainboards mit der noch leeren AM3+-Fassung konnte man auf der CeBIT bereits bewundern.

Marketing-Direktor John Fruehe erklärte uns per E-Mail auch die etwas unklare „90-Prozent“-Performance-Aussage, die Michael Gordon auf der ISSCC gemacht hatte.

Setzt man die Performance eines einzelnen Threads auf dem Bulldozer auf 100 Prozent, so sollen im Schnitt zwei Integer-Threads (vermutlich SPECint_rate2006) im gleichen Modul auf 180 Prozent Durchsatz kommen. Das ist nur wenig schlechter, als wenn man zwei völlig getrennte Integer-Kerne mit eigenen Frontends hätte, wo maximal 200 Prozent drin wären. Verteilt man die beiden Threads auf zwei Bulldozer-Module, so liegt der Durchsatz auch mit 195 Prozent nahe dem Maximalwert. Beim Gleitkomma-Benchmark müssen sich indes zwei Threads in einem Modul eine FPU teilen. Dabei profitieren sie ähnlich wie bei Hyper-Threading von der besseren Ausnutzung der Funktionseinheiten, sodass hier der Durchsatz auf 120 Prozent steigt.

Einen direkten Vergleich zum K10-Vorgänger kann man mit diesen Skalierungszahlen also nicht anstellen, aber – so Fruehe – der soll dank Turbo Core auch gut für den Bulldozer aussehen, zumal jener auch weitere Optimierungen besitzt, etwa die Makroop-Fusion, so wie Nehalem und Sandy-Bridge auch.

Mehr Infos

Auch das noch

Intel hat es mit einigen Winkelzügen nun geschafft, ein uraltes Trivial-Patent beim deutschen Patentamt über den gemeinsamen Zugriff von CPU und Grafikchip auf den Hauptspeicher durchzudrücken (DE19681745 B4). Wer weiß, welche Intention heute dahintersteckt. Dumm nur, dass wir schon vor Intels PCT-Anmeldung 1996 in c’t 2/1996 über die entsprechende UMA-Technik des SiS-Chipsatzes 551x berichtet hatten, damit müsste dieses Patent eigentlich hinfällig sein …

Die bereits verfügbaren Zacate- und Ontario-APUs werden nun ebenfalls in das schlichte Ein-Buchstaben-Namensschema mit „E“ und „C“ gepresst und für Embedded „G“. Beim Fusion-Prozessor mit integrierter Llano-Grafik, der unter Axxx ins Rennen gehen wird, sprach AMDs Marketingchefin Leslie Sobon auf der CeBIT vom Stapellauf im dritten Quartal, im Internet wird der amerikanische Unabhängigkeitstag, der 4. Juli, hoch gehandelt. Hinter den Kulissen ließ AMD einen Llano-Prototyp mit 1,8 GHz gegen einen Sandy Bridge Core i7-2630QM (2 GHz) in ein paar ausgewählten Benchmarks antreten – beide in Notebooks mit überklebten Herstellerlogos. Bei einem CPU-Benchmark war Llano nur knapp unterlegen, dominierte aber glasklar beim Grafik-Benchmark Furmark – zumeist um Faktor zwei und mehr. Zudem war auch die Grafikqualität – gemessen mit 3DCenter Filter Tester – besser und der Energieverbrauch geringer. Eigene Benchmarks durfte man natürlich noch nicht fahren. (as)