IDF: Core i7 mit 8 MByte L3-Cache, QPI und bis zu 24 GByte DDR3-1066-Speicher

In zahlreichen technischen Vorträgen hat Intel weitere Details zu den innerhalb des nächsten Vierteljahres erwarteten Nehalem-Prozessoren für Desktop-Rechner verkündet.

In Pocket speichern vorlesen Druckansicht 60 Kommentare lesen
Lesezeit: 7 Min.

Ausgerechnet die Taktfrequenzen wurden noch nicht verraten – man munkelt allerdings von 2,66, 2,93 und 3,20 GHz –, doch sonst gab es auf dem IDF zahlreiche Detail-Infos zu den kommenden Core-i7-Prozessoren mit Nehalem-Architektur für Highend-Desktop-Rechner, die Intel noch rechtzeitig zum Weihnachtsgeschäft in die Läden bugsieren will.

Die ehemals Bloomfield genannten Prozessoren brauchen neue Mainboards mit dem Chipsatz X58 (Tylersburg-36S) und einer LGA1366-Prozessorfassung sowie dazu passende Kühler, die einen anderen Befestigungs-Lochabstand nutzen als die heutigen LGA775-Ausführungen. Die Mainboards können bis zu vier Grafikkarten aufnehmen, die sie dann über PCIe-Switches mit jeweils 8 PCIe-2.0-Lanes anbinden; für zwei Karten stehen direkt jeweils volle 16 Lanes bereit, einige Mainboards können mit dem Nvidia-Zusatzchip auch SLI unterstützen.

Die neuen 45-nm-Prozessoren sind Intels erste mit vier Kernen auf einem einzigen Die, gleichzeitig unterstützt jeder Kern Hyper-Threading, der Windows-Task-Manager meldet also 8 logische Prozessoren. Pro Kern stehen je 32 KByte L1-Cache für Daten und Befehle bereit und außerdem ein mit 256 KByte im Vergleich zu den aktuellen Core 2 Duos (6 MByte gemeinsam für je zwei Kerne) sehr kleiner L2-Cache. Zum Vergleich: AMD bietet bei den Phenoms 512 KByte pro Kern. Der L3-Cache des Core i7, den alle Kerne gemeinsam nutzen, fasst 8 MByte; der Shared L3-Cache der AMD-K10-65-nm-Generation ist 2 MByte groß.

Ebenfalls ähnlich wie bei den AMD-Vierkernen sind nun ein Speichercontroller und ein QuickPath-Interconnect-(QPI-)Anschluss integriert. Der Core i7 steuert drei DDR3-Speicherkanäle mit jeweils ein oder zwei ungepufferten Modulen an und soll bis zu 533 MHz erreichen, das entspricht DDR3-1066 (PC3-8500) und einer maximalen Datentransferrate von insgesamt 25,6 GByte/s. Weil der Core i7 nur UDIMMs verträgt, aber auch die allmählich erscheinenden 2-GBit-Chips, lassen sich Module mit jeweils maximal 4 GByte Speicherkapazität einbauen, insgesamt sind also bis zu 24 GByte RAM möglich – mit den bisher besser lieferbaren 1-GBit-Chips sind es zunächst maximal 12 GByte. DDR2-Unterstützung fehlt.

Intel nennt für den Core i7 explizit DDR3-1066 und spricht nur bei den Speichermodulen für die Server-Version Nelahem-EP von DDR3-1333 (PC3-10600, 667 MHz); es wird allerdings spekuliert, dass auch die (3,2-GHz-)Extreme-Variante des Core i7 DDR3-1333 ansteuert. Bei Nehalem-EP-Servern mit zwei Prozessoren sollen mit insgesamt 18 Spezial-DIMMs übrigens bis zu 144 GByte möglich sein.

Das QPI-Interface belegt 84 Leitungen und ähnelt auch sonst stark einem 16x16-HyperTransport-Link: Pro Übertragungsrichtung stehen 16 differenzielle Lanes für Nutzdaten bereit, also gehen pro Transferschritt 2 Byte auf die Reise. Zwei weitere Lanes sind für Steuersignale vorgesehen und noch zwei für CRC-Prüfbits. Pro Richtung läuft noch ein differenzielles Taktfrequenzsignal mit, das ergibt insgesamt 21 Signaladerpaare pro Richtung. Intel nennt für QPI "bis zu 6,4 Gigatransfers/s", der Takt läuft mit halber Rate, was für DDR-Übertragung mit 3,2 GHz Basisfrequenz spricht – exakt das gleiche wie bei HT 3.1, und auch exakt die gleiche maximale Datentransferrate von 12,8 GByte/s pro Richtung.

Der X58-Chipsatz nutzt als Southbridge weiterhin den I/O Controller Hub ICH10 der aktuellen Chipsatzfamilie 4.

Mit SSE4.2 führt Intel mit der Nehalem-Prozessorgeneration einige neue Befehle ein und will auch sonst einiges am Kern optimiert haben; grundsätzlich sind die einzelnen Kerne aber wohl recht eng mit der aktuellen Core-2-"Penryn"-Generation verwandt. Welche Applikationen vom schnelleren Speicherinterface profitieren, lässt sich nur grob abschätzen, es dürften aber vor allem Gleitkomma-intensive Berechnungen sein. Ganzzahl-Verarbeitung nutzte bisher stark die großen und schnellen L2-Caches der Core-Prozessoren – ein Performance-Vergleich wird also spannend. Recht wahrscheinlich ist, dass vor allem typische Server-Anwendungen, die mit sehr vielen Threads arbeiten, auf Prozessoren der Nehalem-Generation deutlich schneller laufen.

Zur Beschleunigung von Applikationen, die nur wenige Threads starten, kann der Core i7 per Turbo Mode einzelne seiner Kerne höher takten als die vorgesehene Nominalfrequenz, falls andere Kerne nichts zu tun haben und der Prozessor nicht zu heiß ist – bisher nannte Intel das Feature Dynamic Acceleration und nutze es nur bei Notebook-Prozessoren. Hier bringt es wenig beziehungsweise nur selten etwas, unter anderem weil Windows Vista Single-Thread-Tasks immer wieder anderen Kernen zuteilt und weil der Frequenz-Aufschlag nur eine Multiplikatorstufe beträgt. Einige Intel-Grafiken suggerieren, dass der Aufschlag beim Core i7 höher ausfallen könnte. Microsoft hatte vor der Einführung von Windows Vista auch angekündigt, dass per ACPI 3.0 eine verbesserte Steuerung von Multi-Core-Prozessoren möglich werden solle.

Hat ein Kern überhaupt nichts zu tun, kann ihn der Prozessor (im ACPI-C6-Modus) über Schalttransistoren angeblich fast völlig von der Stromversorgung trennen, um Leckströme zu vermeiden. Dadurch sollen Nehalem-Systeme auch bei Teillast effizienter arbeiten.

Nehalem-Prozessoren (und Chipsätze) für "gewöhnliche" Desktop-Rechner, Notebooks und größere Server sollen erst ab etwa Mitte 2009 erscheinen.

Zum IDF Fall 2008 siehe auch:

(ciw)