Fall Processor Forum: Energie sparen mit TeraOps-Chips

Bis zu 320 32-Bit-Kerne integriert die junge Chip-Schmiede Ambric in einen Prozessor, der so über eine Billion Operationen pro Sekunde (1,08 TeraOps) ausführen soll.

In Pocket speichern vorlesen Druckansicht 18 Kommentare lesen
Lesezeit: 3 Min.
Von
  • Erich Bonnert

Nicht weniger als 96 Prozessorkerne platziert die junge Chip-Schmiede Ambric auf den Prozessoren der Am2000-Familie; beim Topmodell Am2045 arbeiten sogar 320 32-Bit-Kerne parallel. Damit soll der Prozessor über eine Billion Operationen pro Sekunde (1,08 TeraOps) ausführen. Jeder Kern ist lokal mit Registern, minimalem Speicher und den benachbarten Logikeinheiten verbunden. Global ist der Chip vollkommen asynchron, die Prozessoren können individuell von 1 bis 333 MHz getaktet werden.

Jeder Ambric-Grundbaustein besteht aus zwei Register-Logik-Paaren (RU-CU), gruppiert zu Quad-Arrays. [Klicken für vergrößerte Ansicht]

Ausgangspunkt dieses Chipentwurfs war für Ambric ein eigenes, hierarchisches und objektorientiertes Programmiermodell. Die Programme bestehen dabei aus Objekten, die gleichzeitig auf einer Matrix von Prozessoren und Speichern laufen. Danach gingen die Hardware-Architekten an die Arbeit und setzten die Programmumgebung in Schaltkreise um. Objekte tauschen Daten und Steuerinformationen durch ein Geflecht von Ambric-Kanälen aus. In einer ausgeklügelten Hierarchie werden primitive Objekte zu zusammenhängenden Konstrukten kombiniert, die auf benachbarten Prozessoren laufen und über die Kanäle kommunizieren. Die Kanäle sind miteinander verkettete Ambric-Register: jeweils ein Datenwort breit, mit unidirektionalen Punkt-zu-Punkt-Verbindungen. Latenzzeit, Geschwindigkeit, Flächen- und Stromverbrauch entsprechen dabei jeweils einem gewöhnlichen Register. Kein Signal dauert länger als einen Zyklus.

"Die Entwicklungszeit für Ambric-Anwendungen ist mit diesem Programmiermodell drastisch einfacher und kürzer als etwa eine VLIW-Programmierung oder die Kodierung von DSPs und FPGAs," behauptet Chefingenieur Michael Butts. Ambric stützt sich auf die integrierte Programmierumgebung Eclipse. Dabei gehe die Leistungsskalierung weit über derzeitige oder angekündigte Multicore-Prozessoren hinaus. Der Verzicht auf Synchronisierung über weite Distanzen soll zudem erheblich Energie sparen. Als Anwendungsbereiche kann sich Butts beispielsweise die Kodierung und Dekodierung von hochauflösenden Videoströmen vorstellen. Den Stromverbrauch gab der Entwicklungschef allerdings nicht an.

Derzeit testet Ambric die Prozessoren noch auf Simulatoren. Erste Testmuster sollen ab Anfang 2007 bereitstehen. Die Fertigung ist zunächst in einem 130-nm-Prozess geplant. Die Top-Ausführung Am2045 mit 360 Prozessorkernen und 4,6 MBit verteiltem SRAM-Speicher benötigt dabei 117 Millionen Transistoren in einem BGA-868-Gehäuse. Die Chips sollen ab 99 US-Dollar zu haben sein. Nächster Schritt ist der Übergang auf eine 90-nm-Fertigung, mit der Ambric bis zu 70 Logikkerne integrieren und den Takt auf 450 MHz steigern will. Das Start-up aus Oregon hat kürzlich Wagniskapital von 11 Millionen Dollar erhalten.

Zum Fall Microprocessor Forum 2006 siehe auch:

(Erich Bonnert) / (thl)