Hot Chips: Oracles erster Server-Prozessor
Oracle trumpft beim SPARC T5 mit 16 Kernen und bis zu 8 Sockeln auf.
- Benjamin Benz
Die mit Sun übernommene Prozessorabteilung von Oracle präsentierte auf der Hot Chips ihr neues Flaggschiff SPARC T5. Dieser Riesenchip bringt auf einem Die 16 CPU-Kerne, 8 MByte L3-Cache, 8 DDR3-Controller, 16 PCIe 3.0 Lanes und ein gewaltiges Interconnect-System mit. Damit kann jeder Chip zu sieben weiteren Kontakt aufnehmen. Das bedeutet, dass in einem 8-Sockel-Server jeder Prozessor ohne Umweg (1 Hop) direkt mit jedem anderen kommunizieren kann. Ist eine Verbindung trotz ihrer 28 GByte/s (14 Lanes) doch mal ausgelastet, können die CPUs weitere Prozessoren als Relaisstationen einbinden. Das kostet zwar Latenz, steigert aber die Bandbreite. In Servern mit zwei oder vier Sockeln verbinden jeweils vier respektive zwei Interconnects die einzelnen Knoten. Wird ihre Bandbreite nicht ausgeschöpft, gehen einzelne Interconnects schlafen.
Die einzelnen S3-Kerne sind im Wesentlichen auf 28-nm-Strukturen verkleinerte Versionen der Kerne des SPARC T4 (40 nm). Sie takten mit bis zu 3,6 GHz, können zum Stromsparen aber auch langsamer laufen. Sie arbeiten out-of-order und verwenden eine 16-stufige Pipeline. Jeder Kern kann seine Ressourcen und Rechenwerke dynamisch auf 1 bis 8 sogenannte Strands (Threads) verteilen. Zudem gibt es jeweils noch einen Coprozessor für Crypto-Algorithmen und die Generierung von Zufallszahlen. Dass dieser direkt im Kern sitzt, ist laut Oracle insbesondere für die Live-Migration von virtuellen Maschinen hilfreich.
Besonders stolz ist Oracle auf ein neues Snooping- und Transaction-Protokoll, bei dem Anfragen gleichzeitig an die DRAM-Controller und entfernte Knoten geht und so die Latenz um bis zu 31 Prozent senkt. Insgesamt ist die verfügbare Bandbreite beeindruckend: So schaffen die Verbindungen zum Arbeitsspeicher mehr als 1 TByte/s, über das Kohärenznetzwerk sind es noch 840 GByte/s und per PCIe 3.0 256 GByte/s. Dank diverser Optimierungen des Prozessors für die hauseigene Software geht Oracle von einer nahezu perfekten Skalierung der Performance von ein bis acht Sockeln aus, selbst dann, wenn bei OLTP-Operationen Kommunikation zwischen den Knoten nötig ist. (bbe)