SC12: Intel bringt Coprozessor Xeon Phi offiziell heraus
Auf der Supercomputer-Konferenz SC12 stellte Intel mit der Xeon Phi 5110P die lang erwartete erste Beschleunigerkarte für High Performance Computing vor.
Mit der Beschleunigerkarte Xeon Phi 5110P will Intel der auf diesem Gebiet führenden Firma Nvidia Konkurrenz machen. Nvidia seinerseits kontert Intels Einstieg in den Beschleunigermarkt mit dem Kepler K20 und K20x.
Lange hat es gedauert und zuerst wollte Intel eigentlich mit dem Larrabee-Prozessor den Grafikmarkt aufmischen, hat das aber aufgegeben und sich auf High Performance Computing konzentriert. Mit 62 Prozessoren ist das Die des Xeon Phi bestückt, die aber bei den jeweiligen Versionen nicht alle freigeschaltet sind. Die Rechenkerne arbeiten im Prinzip mit alter Pentium-Architektur, aber erweitert um 64 Bit, vierfach Hyper-Threading, ausgefeiltem Powermanagement und 512 KByte L2-Cache, der via Ringbus mit den anderen L2-Caches und den Speichercontrollern korrespondiert. Insbesondere aber ist an jedem Pentium-Kern eine 512 Bit breite Vektoreinheit angeschlossen, die achtfach parallel für doppelt genaue Berechnungen arbeitet. Das Interface nach außen ist noch das PCIe der zweiten Generation und noch nicht PCIe-3.0, wie es die aktuellen Xeon-E5-Prozessoren anbieten.
In den Systemen der aktuellen Top-500-Liste kamen noch verschiedene Prototypen mit bis zu 61 Kernen, 1,1 GHz Takt und schnelleren Speichertransfers zum Einsatz. Auf den Markt soll nun zunächst die Version Xeon Phi 5110P kommen mit 60 freigeschalteten Kernen, 1,053 GHz Takt, 30 MByte L2-Cache, 8 GByte DDR5 und 320 MByte/s Speicherbandbreite. Die passiv gekühlte Karte zeichnet sich insbesondere durch eine vergleichsweise niedrige TDP von 225 Watt aus, genau die gleiche TDP, wie sie die Tesla K20 aufweist. Auch die theoretische Spitzenleistung liegt mit 1,011 TFlops fast genau auf dem gleichen Wert.
Den Linpack-Wert gibt Intel derweil nur für eine schnellere Prototypkarte an (SE10P), die ohne Einberechnung der Hauptprozessoren auf 803 GFlops kommt, mit Xeon Phi 5110P kann man den Wert auf rund 756 GFlops abschätzen. Gemeinsam mit den beiden Xeon-E5-Prozessoren kommen so etwa in den beiden mit Xeon Phi 5110P bestückten NASA-Systemen Discovery 891 und Maia 832 GFlops/Knoten zusammen. Zum Vergleich: Die Kepler-K20x-Karte im Supercomputer Titan, bei der nur ein einziger Bulldozer-Prozessor pro Knoten mithilft, erreicht 941GFlops/Knoten. Doppelt genaue Berechnung bei DGEMM gibt Intel mit 883 GFlops an (SE10P), Nvidia hat für die K20X 1220 GFlops bei DGEMM spezifiziert. Bei einfacher Genauigkeit (SGEMM) steigt für Xeon Phi der Wert auf 1,86 TFlops, bei K20X auf 2,9 TFlops.
Die Xeon Phi 5110P wird jetzt an OEM-Partner ausgeliefert und soll ab dem 28. Januar 2013 für 2649 US-Dollar in den Handel kommen. Später im ersten Halbjahr 2013 soll dann eine Version unter dem Namen Xeon Phi 3100 für unter 2000 US-Dollar herauskommen, mit nur 57 freigeschalteten Kernen, 6 GByte DDR5, 240 GByte/s Speicherbandbreite und höherer TDP von 300 Watt, sowohl aktiv wie passiv gekühlt.
Xeon-Phi-Versionen | ||||||
Bezeichnung |
DP-Spitzen-performance (GFlops) |
Kerne |
Takt (GHz) |
Speicher Kapazität/ Bandbreite GB /GB/s |
Board TDP (W) |
Preis (US-Dollar) |
5110P | 1011 | 60 | 1053 | 8/320 | 225 | 2649 |
3100 (P,A) | > 1000 | 57 | nicht spez. | 6/240 | 300 | <2000 |
SE10P/X | 1073 | 61 | 1100 | 8/352 |
300 |
- (Prototyp) |
(as)