IFA

IDF 2015: Intel enthüllt (ein wenig) die Skylake-Architektur

Am ersten IDF-Tag wollte Intel die Skylake-Architektur vorstellen. Beim eigentlichen Kern hielt sich die Auskunftsfreude aber in Grenzen.

In Pocket speichern vorlesen Druckansicht 38 Kommentare lesen
IDF Intels Skylake-Architektur
Lesezeit: 5 Min.
Von
  • Andreas Stiller

Auf dem IDF bietet Intel zwar insgesamt neun Tracks rund um Skylake – aber richtig vollständig ist der Launch damit immer noch nicht. Erst zur IFA in Berlin soll der endgültig vollzogen werden, mit allen Versionen, Preisen und weiteren Details. Aber die Architektur gab Intel zumindest ein wenig preis, wenn auch nicht in dem gewohnten Umfang – etwa wie damals, als Intel den Haswell-Prozessor vorstellte. Da bekam man vom Kern zumindest ein weitgehend komplettes Blockschaltbild geliefert, mit allen Funktionseinheiten, Bussen, Puffern und so weiter. Beim Skylake ist Intel davon recht weit entfernt, das veröffentlichte Blockschaltbild hätte so auch vom Sandy Bridge oder andern Core-Prozessoren stammen können.Es gibt auch mehr Funktionseinheiten, wie viele oder gar welche, das verriet Intel nicht.

Bei den Kernen hat Intel primär an Details geschraubt: Die Out-of-Order-Fenster sind größer, der Scheduler kann mehr Einträge gleichzeitig bearbeiten und die Allocation Queue ist auch gewachsen.

Ein paar Infos bekamen die IDF-Teilnehmer aber drum herum geliefert, etwa über die erweiterten Ressourcen. So wurde das Out-of-Order-Fenster weiter vergrößert, nun können bis zu 224 Befehle gleichzeitig in Bearbeitung sein, gegenüber 192 beim Haswell. Insbesondere die Zahl der Scheduler-Einträge und die Größe der Allocation Queue wurde deutlich vergrößert.

Erstmals, so machte Intel klar, gebe es beim Core unterschiedliche Optimierungspfade zwischen der Client- und der Serverversion. Über Letztere wollte Intel aber noch kein Wort verlieren. Fest steht, dass nur die Serverversionen AVX512 besitzen werden. Die Clients erfreuen sich aber auch diverser Erweiterungen des Befehlssatzes, insbesondere Sicherheitsfunktionen wie Memory Protection (MPX) und Software Guard Extensions (SGX). Zudem gibt es neue Cache-Management-Befehle, um etwa bei den Iris-Pro-Typen mit eDRAM dafür zu sorgen, dass Daten nur im eDRAM, nicht aber in den tieferliegenden Caches gespeichert werden. Das eDRAM liegt jetzt als "Memory Side Cache" weiter außen direkt am Memory-Controller, ist daher automatisch für CPU und andere per DMA zugreifende Hardware immer voll kohärent. Das eDRAM selbst ist ansonsten gegenüber Haswell unverändert, neben 128 MByte werden beim Skylake aber auch 64 MByte angeboten.

Die Caches und TLBs sehen auf dem ersten Blick ebenfalls genauso aus wie beim Broadwell, es gibt aber feine Unterschiede. So ist der L2-Cache nur noch vierfach statt achtfach assoziativ. Das spart beim Client Energie und beim Server wird der L2-Cache dann, wie hinter den Kulissen zu hören war, deutlich größer sein und höhere Assoziativitäten besitzen.

Das "Blockschaltbild" des Kerns, so sieht aber jeder Core-Prozessor seit Sandy Bridge aus.

(Bild: Intel)

Inverses Hyper-Threading, wie hier aufgrund von merkwürdigen Messergebnissen spekuliert wurde, unterstützt der Skylake indes nicht. Für die zuweilen erhebliche Beschleunigung von Single-Thread-Anwendungen sind andere Verbesserungen verantwortlich, vor allem beim L3-Cache und bei dem fabric zwischen L2 und L3. Cache-Misses in diesen Caches werden vermutlich dank breiterer Pfade doppelt so schnell abgearbeitet. Auch die mitunter sehr langen Wartezeiten durch Page-Misses im TLB wurden deutlich verkürzt, der Prefetch verbessert, die Puffer vergrößert.

Von den Pipelines her ist Skylake weiterhin vierfach skalar. Aus der Reservation Station können wie beim Vorgänger bis zu sechs Mikroops pro Takt an die (vermutlich bis zu 8) Ports verschickt werden.

An der Energieeffizienz haben die Entwickler aus Haifa besonders viel geschraubt. So wird bei kürzerer Nichtverwendung nun unter anderem auch die AVX2-Unit abgeschaltet. Die alten vom Betriebssystem verwalteten P-States haben jetzt ausgedient. Zumindest braucht Skylake sie nicht mehr, sondern kann weitaus schneller mithilfe autonomer Algorithmen in Hardware sowohl für CPU als auch für die Prozessorgrafik den jeweils optimalen Takt bestimmen. Speedshift hat Intel diese Technik getauft. Das Betriebssystem muss dabei aber mitspielen, bisher ist nur Windows 10 dazu in der Lage. Vorgesehen ist hier auch ein "fast burst response", um bei Benutzereingaben oder anderen Interrupts kurzfristig richtig Zunder zu geben.

Die Ressourcen wurden zum Teil deutlich aufgestockt. Insgesamt können jetzt bis zu 224 Befehle gleichzeitig in Arbeit sein.

(Bild: Intel)

Richtig Zunder ist auch für die Overclocker drin, die erstmals auch für Notebooks übertaktbare K-Versionen angeboten bekommen. "Skylake was designed for Overclocking", heißt es bei Intel sogar. In der Tat bietet der Prozessor zahlreiche Stellschrauben fürs Tuning. Der Rekord bei Kühlung mit flüssigem Stickstoff liegt bislang bei 6,8 GHz.

In den Skylake ist auch ein weiterer Prozessor eingezogen, ein Signal-Prozessor (ISP) für die Bearbeitung der Signale von bis zu vier Kameras (zwei gleichzeitig). Viele Verbesserungen betreffen auch die Prozessorgrafik und die Quick-Sync-Einheit. So hat Intels Skylake zwar volle HEVC-Beschleunigung, aber nur Direct3D 11.2. (as)