Suns Server on a Chip startet mit Rekordwerten

Suns T2 (Codename Niagara II) empfiehlt sich mit Spitzenwerten bei den den SPEC-CPU-Benchmarks bei vergleichsweise geringem Energieverbrauch

In Pocket speichern vorlesen Druckansicht 78 Kommentare lesen
Lesezeit: 4 Min.
Von
  • Andreas Stiller

Mit 78,3 SPECint_rate_base2006 und (in letzter Sekunde noch nachgebessert) 62,3 SPECfp_rate_base2006 kann Sun nun mit dem schnellsten aktuellen Single-Chip-Mikroprozessor aufwarten. Mit seinen acht Kernen – ein jeder im Unterschied zum T1-Vorgänger zweifach skalar und mit eigener FPU versehen – lässt der T2 (Codename Niagara II) die versammelte Multicore-Konkurrenz von IBM (Power6 mit 4,7 GHz: 53,2 SPECint_rate_base2006 und 51,5 SPECfp_rate_base2006 sowie Intel Xeon 5355 mit 2,66 GHz: (50,5 SPECint_rate_base2006 und 36,2 SPECfp_rate_base2006) klar hinter sich – wenn man sich dabei auf einen Sockel beschränkt und Single-Thread-Qualitäten außer acht lässt. Doch Single-Threads sind bei Web- und anderen Servern ohnehin ohne jegliche Bedeutung.

Noch besser sieht die Bilanz für den T2 aus, wenn man den Energieverbrauch mit einbezieht. Mit nominal 95 Watt hält sich der von Texas Instruments in 65-nm-Technik gefertigte Octo-Core Chip bei 1,4 GHz Takt gut im Rahmen, wobei bei ihm vier Speicher-Controller, zwei 10-Gb-Ethernet-Controller und PCI-Expess (8 Lanes) als im Chip integrierte Peripherie schon mitgegeben sind. Im Unterschied zu seinem T1-Vorgänger verwendet der T2 allerdings wie auch Intel die etwas stromhungrigeren FB-DIMMs. Anders hätte man vier Dual-Channel-Speicherkanäle gar nicht anschließen können (DDR2/3 benötigt weit mehr Pins als FB-DIMM, auch so besitzt der T2 schon ein BGA mit 1831 Anschlüssen). Die Speicherbandbreite aller vier Kanäle liegt bei über 60 GByte/s.

Statt mit vier Threads wie beim T1 arbeitet der T2 nun parallel mit acht Threads, die er feinkörnig verwaltet. So kommt der Chip insgesamt auf 64 parallele Threads. Alle Kerne und der L2-Cache sind über einen Crossbar-Switch miteinander verbunden. Der gemeinsame L2-Cache von 4 MByte teilt sich dabei auf 8 Bänke auf. Dadurch kommen sich die Kerne nicht ins Gehege, solange sie auf unterschiedliche Cache-Bänke zugreifen. Sorgfältige Programmierung und ein feinkörniges Numa-Konzept können hierbei sehr hilfreich sein.

Ein weiteres Goody, das den Prozessor für Webserver prädestiniert, ist die Hardware-Krypto-Engine für jeden seiner Cores, die alle gängigen Verschlüsselungsalgorithmen beherrscht. Ein Zufallsgenerator für Schlüsselgenerierung ist ebenfalls dabei, der auch nützlich für schnelle Monte-Carlo-Algorithmen sein könnte. Konkrete Benchmarkergebnisse für die Verschlüsselung liegen noch nicht vor, Sun gibt jedoch an, dass sie typischerweise etwa zehnmal schneller sein soll als bei konkurrierenden Prozessoren (ohne Hardwarebeschleunigung) und im Vergleich mit Einsteckkarten soll die T2-Verschlüsselung bis zu 17 Mal schneller sein.

Mit seinen acht Dual-Precision-FPUs, die parallel zum Integer-Kern und der Krypto-Engine arbeiten, kann Suns T2 nun auch wieder den High-Performance-Bereich (HPC) mit einem eigenen SPARC-Design adressieren. Hier war in letzter Zeit nur noch Fujitsus SPARC64-VI zu finden, der aber vier Chips mit acht Kernen benötigt, um den T2 in SPECfp_rate_base2006 überbieten zu können. Bislang kann der T2 allerdings nur allein auf einem Board ackern, aber die MP-Version (Codename Victoria Falls) ist in Arbeit; sie soll im nächsten Jahr zunächst als Dual-Socket-Version herauskommen. Den kompletten Core will Sun als OpenSPARC T2 wie auch schon beim T1 detailliert dokumentieren und unter NDA für "eine limitierte Anzahl von Hardware-Designern und Tool-Entwicklern" die Files für Verilog RTL unter GPL herausbringen (wobei die GPL auf HDL-Software nicht wirklich zugeschnitten ist).

Erste T2-Systeme (darunter 1HU-Blade-Systeme) werden in etwa einem Monat erwartet. Im Rahmen der Sun Microelectronics Group will Sun auch OEM-Kunden versorgen, die Systeme unter eigenem Label herausbringen wollen. (as)