Prozessorgeflüster

Während eine überraschende Rücktrittswelle CDU-Politiker aus ihren Amtssesseln spült, ölige Wellen an die Strände des Golfs von Mexiko schlagen und deutsche Schlagerfans in La-Ola-Laune feiern, traf Taipei eine Tablet-Welle. Intel kündigt derweil für 2012 Prozessoren mit mehr als 50 Kernen an.

05.06.2010, 00:00 Uhr

Lesezeit: 5 Min.

c't Magazin

Von

Andreas Stiller

Nein, die heftigen Erschütterungen, welche der Detektor GEO600 des hannoverschen Albert-Einstein-Instituts für Gravitationsphysik am letzten Maiwochenende verzeichnete, stammten nicht von fernen Supernovae – sondern von den Zigtausenden trampelnder Fans der Eurovision-Song-Contest-Gewinnerin Lena vor dem Neuen Rathaus. Auf diese Grand-Prix-Schockwellen wartete man Jahrzehnte, auf die Gravitationswellen hingegen nun schon nahezu ein Jahrhundert lang. Aufspüren in den Detektordaten soll sie der Supercomputer Atlas mit Hilfe der inzwischen über 250 000 Teilnehmer am Internet-Projekt Einstein@home. Auf der aktuellen Top500-Liste (siehe Seite 18 in c't 13/2010) ist Atlas mit 32,5 TFlops zwar auf Platz 255 zurückgefallen – aber nur, weil man den inzwischen erheblich aufgerüsteten Rechner noch nicht „linpacken“ konnte. Außerdem zählen ja die etwa 300 TFlops Durchschnittsleistung von Einstein@home nicht mit.

Ein paar Internet-Projekte sind indes noch mächtiger, allen voran Folding@home. Mehr als 6 PFlops Durchschnittsleistung liefern die Teilnehmer inzwischen, überwiegend getragen von AMD- und Nvidia-Grafikkarten sowie Playstation-3-Cells. Allerdings handelt es sich hierbei um Gleitkommaberechnungen mit einfacher Genauigkeit. Zudem mussten die für Folding@home zuständigen Wissenschaftler einige mitunter fragwürdige Klimmzüge vornehmen, um GPU-Flops in x86-Flops umzurechnen. Bei Matrixoperationen oder dem Linpack-Benchmark wäre so etwas nicht nötig, aber Folding@home verwendet komplexere Operationen wie Potenzierung oder Logarithmus. In einfacher Genauigkeit erledigen aktuelle GPUs solche Rechnungen rasant, aber in doppelter Genauigkeit liefern sie nur einen Bruchteil ihres theoretischen Potenzials.

Auf der neuen Top500-Liste stehen drei GPU-beschleunigte Supercomputer. Zwei davon verwenden Nvidias neue Tesla-Karte C2050 mit Fermi-Chip, der dritte die ältere Zwei-GPU-Karte AMD Radeon HD 4870 X2. Mit etwas Mühe kann man aus den Ergebnissen die vermutlichen CPU-Anteile herausrechnen, was dann grob einen Vergleich der Tesla C2050 mit der Radeon HD 4870 X2 zulässt: rund 160 zu 140 TFlops pro Karte beim hoch optimierten Linpack-Benchmark in doppelter Genauigkeit. Das sind nur rund 30 Prozent der theoretischen Spitzenleistungen.

Son of Larrabee: Der Applikationsbeschleuniger Knights Ferry ist mit den Aubrey-Isle-Chips von den gezeigten Wafern bestückt.

Intel will die AMD- und Nvidia-Grafikchips beim High-Performance Computing (HPC) mit Larrabee schlagen – aber unter neuem Namen. Server-Chef Kirk Skaugen erläuterte auf der Supercomputer-Konferenz ISC’10, der Ex-Larrabee segle jetzt unter der Flagge der „Many Integrated Core“-Architektur, kurz MIC. Als Entwicklermuster kommt die 32-Nanometer-Ausführung Aubrey Isle mit 32 Kernen, 8 MByte gemeinsamem Cache und 1,2 GHz Taktfrequenz. Dank vierfachem Hyper-Threading verarbeitet ein Chip 128 Threads quasi-parallel. Skaugen zeigte nicht nur Wafer mit Aubrey-Inseln, sondern auch die Coprozessorkarte Knights Ferry, die Intel bereits an ausgewählte Entwickler ausliefert – etwa ans CERN. Erste Benchmark-Ergebnisse gab es auch – allerdings nur in einfacher Genauigkeit. Für den wesentlichen Teil des Linpack-Benchmarks, LU, trieb Skaugen den Wert effektvoll auf 517 GFlops hoch, die GPU-Konkurrenz soll hier 360 GFlops schaffen. So irgendwann 2011, 2012 ist ein 22-nm-MIC-Serienprodukt namens Knights Corner mit über 50 Kernen geplant.

Am Forschungszentrum Jülich und gemeinsam mit der Middleware-Firma Partec hat Intel ein ExaCluster-Laboratorium gegründet, um Clustertechniken bis hin zu Exascale-Systemen zu entwickeln. Bull baut den Supercomputer TERA 100 mit 18 000 Nehalem-EX-Prozessoren, der über 1 Petaflops leisten soll. HP will bis Oktober zusammen mit dem Tokio Institute of Technology den Tsubame 2.0 mit richtig fetten Knoten bestücken: Je zwei Westmere-Xeons plus drei Nvidia Tesla C2050. Die 1400 Nodes sollen zusammen auf theoretisch 2,4 Petaflops kommen, im Linpack hofft man auf 1,5 Petaflops.

Tablet-Welle

Auf der Computermesse Computex in Taipei türmte sich Anfang Juni die vom iPad-Start ausgelöste Tablet-Monsterwelle auf. Schon am Computex-Vortag legten Asus (Eee Pad, Eee Tablet) und MSI (WindPad 100 mit Intel Atom, 110 mit Nvidia Tegra 2) los, VIA zeigte chinesische Billig-Tablets mit Android 1.6 und dem eher lahmen ARM-SoC der Tochterfirma Wondermedia. Amtek hat Tablets mit Freescale/ARM-CPU, Nvidia Tegra 2, Atom und CULV-Celeron ausgetüftelt. Das Schüler-Laptop-Projekt OLPC will seinen ersten Tablet nicht erst 2012 mit dem XO-3 herausbringen, sondern bereits Anfang 2011 mit dem Marvell-Referenzdesign Moby starten, in dem ein 1-GHz-ARM steckt. Qualcomm hat derweil den ersten Dual-Core-Snapdragon angekündigt, Intel kontert mit der Moorestown-Variante Oak Trail speziell für Tablets – ab 2011. Zuvor kommen noch DDR3- und Dual-Core-Atoms.

Viele ARM-Tablets setzen auf Android, doch vermutlich wird erst Android 3 Entwickler in die Lage versetzen, vernünftig für größere als Smartphone-Displays zu programmieren. Nvidia-Chef Jen-Hsun Huang erwartet jedenfalls den breiteren Tablet-Einsatz seines Tegra 2 unter Android 3 – leider hat er nicht verraten, ob sich Letzteres hinter dem Ende 2010 erwarteten „Gingerbread“-Android verbirgt oder ob man noch länger warten muss.

Ebenfalls auf der Computex zu sehen waren die Intel-Chipsätze P67 und H67 (Cougar Point) für LGA1155-Mainboards – mit ihren Exponaten bestätigten Asrock, Biostar und andere Firmen unsere Spekulationen aus dem letzten Heft: Kein integrierter USB-3.0-Adapter, aber PCI Express 2.0 – und allmählich heißt es: PCI ade. (as)