Hot Chips: Drachen-CPU die Dritte

Die dritte Generation des chinesischen Godson-Prozessors soll x86-Code ausführen können.

In Pocket speichern vorlesen Druckansicht 50 Kommentare lesen
Lesezeit: 4 Min.
Von
  • Benjamin Benz

Das Computertechnik-Institut (ICT) der chinesischen Akademie der Wissenschaften plant, der dritten Generation der Godson-CPUs den x86-Befehlssatz nahezubringen. Dennoch wird der Chip auch weiterhin intern mit einem MIPS64-Befehlssatz arbeiten. Allerdings soll er selbst die x86-Binaries übersetzen und dann ausführen – zehnmal schneller als eine Emulation in Software. Das wurde auf der 20. Hot-Chips-Konferenz bekannt.

Hot Chips: Drachen-CPU die Dritte (6 Bilder)

Godson-Roadmap: Schon dieses Jahr lernt Godson HyperTransport 1.0.

Bisherige Godson-CPUs

Ebenfalls neu für Godson ist ein heterogenes Multi-Core-Design: Der Chip besteht aus einzelnen Nodes. Jeder Node hat wiederum vier Cores, vier L2-Cache-Blöcke (wie groß ist noch unklar) und einen 8x8-Crossbar-Switch. Je vier Verbindungen gehen zu den Cores und zum Cache. Die restlichen acht stehen zur Verbindung mit anderen Nodes zur Verfügung. Dabei wollen die Forscher die Nodes in einem Mesh anordnen, sodass es für jede Himmelsrichtung zwei Links gibt. Außerhalb des Node-Meshs kümmern sich DMA-Controller um die Anbindung von PCIe und HyperTransport. Dabei wird es wohl erst nur bei nicht kohärentem HT 1.0 bleiben. Die DMA-Controller beherrschen aber auch noch ein paar Tricks wie Prefetch und Matrix-Transponieren. Die Speicher-Controller hängen über weitere Switches an den Caches der einzelnen Nodes. Ein Directory-basiertes Kohärenzprotokoll sichert die Daten in den Caches ab. Diese lassen sich aber auch umkonfigurieren und dann als interner RAM nutzen. Damit kann Godson auch als Stream-Prozessor arbeiten.

Bemerkenswert ist auch, dass es zwei verschiedene Core-Typen gibt. Der General Purpose Core (GS464) entspricht weitgehend dem in aktuellen Godson-2-Chips. Er hat 2 × 64 KByte L1-Cache und setzt auf eine vierstufige superskalare Out-of-Order-Pipeline. Allerdings kommen zu den MIPS64-Instruktionen mehr als 200 neue, um effizient x86-Code ausführen zu können. Die zusätzlichen Instruktionen vergrößern das Die um rund vier Prozent.

In Zukunft soll ein Godson-3-Chip aus vielen Nodes zu je vier Cores bestehen.

Für bestimmte Aufgaben wie LINPACK, Signalverarbeitung und wissenschaftliche Berechnungen gibt es noch Multiple Purpose Cores (GStera). Diese bestehen aus 8 bis 16 Multiply-Accumulate-Einheiten (MAC), einem riesigen Register-File und einer AXI-Schnittstelle. AXI ist in der AMBA-3-Spezifikation von ARM beschrieben. Ein Node aus Multiple Purpose Cores soll bis zu 16 GFLOPS liefern – viermal so viel wie eine aus General Purpose Cores.

Erst 2009 soll ein erster Testchip mit den Multi Purpose Cores kommen.

Godson-3 soll in einem 65-nm-Prozess bei ST Micro hergestellt werden. Noch in diesem Jahr wollen die Forscher einen ersten Testchip produzieren, der aus nur einem Node mit vier GS464-Kernen bestehen soll. Geplant sind eine Taktfrequenz von 1 GHz und 10 Watt TDP. 2009 kommt dann ein Chip mit zwei Nodes, dessen zweiter Node vier Multi-Purpose-Kerne enthält. Die TDP steigt dann auf 20 Watt. Wann tatsächlich ein zweidimensionales Mesh in Silizium gegossen wird, ist noch unklar.

Godson-2G soll einen eigenen Grafikkern mitbringen.

Der ICT-Sprecher stellte klar, dass die Entwicklung eines eigenen Prozessors für China von strategischem Interesse ist und dass man vorhat, den Vorsprung von Intel und Co. Schritt für Schritt aufzuholen. Bislang habe jede Godson-Generation die Performance verdreifacht und so die Lücke zu Intel-Chips verkleinert. Derzeit am Markt ist der Godson-2F, der einen integrierten Speicher-Controller besitzt. Noch diesen Monat soll das Tape-Out für Godson-2G beginnen. Im ersten Halbjahr 2009 steht Godson-2H an, der einen Grafikkern integriert hat und ohne Southbridge auskommt. An der Godson-Hardware arbeiten rund 200 Entwickler, dazu kommen weitere für Compiler, Software und Co.

zum Thema Godson siehe auch:

Zur Hot-Chips siehe auch:

(bbe)