Rekonfigurierbarer Cell-Konkurrent

Der US-amerikanische RĂĽstungskonzern Raytheon entwickelt mit MONARCH einen Mehrkernprozessor, der sich an unterschiedliche Aufgabenstellungen anpassen kann.

In Pocket speichern vorlesen Druckansicht 40 Kommentare lesen
Lesezeit: 3 Min.

Die Zielstellung der vom US-Verteidigungsministerium geförderten MONARCH-Entwicklung ist ein hoch effizienter und gleichzeitig extrem leistungsfähiger Prozessor zur Verarbeitung von "Sensordaten", vor allem für Radarsysteme. In Kooperation mit der Universität von Südkalifornien, dem Georgia Institute of Technology, IBM und der auch an Cell-Systemen beteiligten Firma Mercury Research hat der US-Rüstungskonzern Raytheon den MONARCH nun fertig gestellt. Dessen Morphable Networked Micro-Architecture lässt sich an unterschiedliche Aufgabenstellungen anpassen, außerdem lassen sich mehrere der von IBM in einem 90-Nanometer-Prozess gefertigten Chips direkt zusammenschalten.

Bei der Verarbeitung von Radardaten gibt es laut Raytheon zwei extreme Anforderungen: Einerseits geht es um die Verarbeitung sehr großer Datenmengen, und andererseits ist hoher Durchsatz bei der Aufarbeitung der Signale nötig. MONARCH soll die beiden Anforderungen dadurch gleichzeitig lösen, dass sich seine sechs RISC-Kerne untereinander, mit 12 integrierten Arithmetik-Coprozessoren und mit 31 schnellen Zwischenspeichern variabel verschalten lassen. Die 12 Arithmetik-Einheiten enthalten insgesamt 96 Addierer (für ganze und Gleitkomma-Zahlen) sowie 96 Multiplizierer, die 31 Zwischenspeicher jeweils 128 KByte Dual-Port-RAM und 8 Adressgeneratoren. Jedem der RISC-Kerne stehen 2 MByte Embedded DRAM (eDRAM) zur Verfügung, 72 DMA-Einheiten kümmern sich um Speicherzugriffe. Intern kommunizieren die Rechenwerke und Kerne über einen 40-GBit/s-Ring, der externen Kommunikation dienen 17 spezielle Ports und zwei RapidIO-Schnittstellen. So lassen sich MONARCH-Module mit vier Chips zusammenbauen, die wiederum zu acht in einem gemeinsamen Gehäuse arbeiten können.

Weil ein MONARCH-Chip bei 333 MHz Taktfrequenz bis zu 64 GFlop/s liefert, erreicht ein Quad-Modul rund 256 GFlop/s und acht davon über 2 TFlop/s. Der MONARCH soll je nach Konfiguration und Codeoptimierung zwischen 3 und 6 GFlop/s pro Watt bringen, also deutlich mehr als ein aktueller Cell B. E. (2,2 GFlop/s/W). Vergleich man komplette Systeme mit MONARCH- oder Cell-B.E.-Bestückung, kommt Raytheon auf 1,25 bis 3 GFlop/s/Watt gegen etwa 1 GFlop/s/Watt.

Im Laborversuch rechnet ein MONARCH angeblich rund zehnmal so schnell wie ein Quad-Core Xeon von Intel. Das ist ein weiteres Beispiel dafür, wie wenig theoretische Angaben über die Verarbeitungsleistung von Prozessoren für konkrete Rechenaufgaben aussagen, denn laut Intel erreicht ein Dual-Core Xeon bei 3 GHz rund 24 GFlop/s pro Kern, wenn seine SSE-Einheiten Single-Precision-Gleitkommazahlen verarbeiten. In Double Precision sollen es noch 12 GFlop/s sein, wovon der Double-Precision-FP-Benchmark Linpack kaum mehr als die Hälfte nutzen kann. Kommerziell verfügbare FPGA-Coprozessor-Karten sollen es zurzeit auf 80 GFlop/s bringen, als Rechenbeschleuniger umgenutzte Grafikkarten auf 375 GFlop/s und darüber. (ciw)