Bit-Rauschen: AMD ist effizienter als … AMD

Bei Intel läuft es immer noch nicht rund, AMD übertrifft sich selbst und Graphcore hat die zweite Generation seiner KI-Chips fertig.

In Pocket speichern vorlesen Druckansicht 10 Kommentare lesen
Bit-Rauschen: AMD ist effizienter als … AMD
Lesezeit: 5 Min.
Inhaltsverzeichnis

Endlose Verzögerungen bei der ambitionierten Chipfertigung mit 10 Nanometer schmalen Strukturen haben Intel ein ums andere Mal Spott und Häme eingebracht – insbesondere, nachdem Konkurrent AMD mit der Chipschmiede TSMC seit mehr als einem Jahr bereits 7-Nanometer-Silizium in großen Mengen liefert. Allein, der Profitabilität von Intel hat das bisher nicht geschadet, ein Rekordquartal nach dem anderen vermeldete der Hersteller.

Doch an der Börse nimmt man die Verzögerungen sehr wohl zur Kenntnis und die Finanzauguren, die einiges aus den Prozessor-Innereien herauslesen wollen, sind inzwischen zu dem Schluss gekommen, dass die Grafikchip-Firma Nvidia vielleicht mehr Potenzial als Intel haben könnte. Zumindest lässt sich das aus der Marktkapitalisierung, also dem Börsenwert der Firmen, herausdeuten. Dort hatte Intel (222 Milliarden Euro) zuletzt arg mit Nvidia (219 Mrd. Euro) um den Titel des (US-)Chip-Konzerns mit dem höchsten Börsenwert zu kämpfen und ist zeitweise sogar ins Hintertreffen geraten.

Deutlich über beiden thront jedoch die taiwanische Schmiede TSMC mit umgerechnet circa 306 Mrd. Euro Börsenwert und natürlich auch das fantastillionenschwere Apple (real ca. 1,48 Billionen Euro), deren selbstentwickelte Chips trotz kommender Umstellung der Macs auf die ARM-Architektur nur einen Bruchteil des Geschäfts ausmachen.

Vor sechs Jahren steckte sich AMD das Ziel, bis 2020 die damals miserable Energieeffizienz seiner Notebook-Prozessoren um Faktor 25 zu steigern und nannte das 25x20-Initiative (gesprochen 25-by-20). Mit der Veröffentlichung des Ryzen 7 4800H habe man dieses Ziel deutlich (um mehr als ein Viertel) übertroffen, feierte sich AMD nun selbst.

Immerhin, der 4800H erreicht im zugrunde gelegten 50:50-Mix aus Cinebench R15 und 3DMark 11 Performance bei gleichem Leistungsbudget von 35 Watt die fünffache Leistung des AMD FX-7600P aus dem Jahr 2014, der als Basis für die Messung dient. Um die Energieeffizienz zu bestimmen, verrechnet AMD sehr kreativ die Performance unter getrennter CPU- und Grafiklast mit dem typischen Jahresstromverbrauch nach Maßgabe des Energy-Star-Konsortiums. Der wird allerdings anteilig im ausgeschalteten, Schlaf-, Short-Idle- sowie Long-Idle-Modus, aber nicht unter Last gemessen und beträgt beim 4800H nur noch ein Sechstel (16 Prozent) der Messbasis. Immerhin.

Nach dem Gemunkel im Bit-Rauschen der Ausgabe 12/2020 bestätigte Intel nun wohl eher unabsichtlich, dass für die kommenden Alder-Lake-S-Prozessoren wieder einmal eine neue Fassung fällig wird. Jedenfalls war ein Entwickler-Dokument für das nötige „Gen5 VR Test Tool“ eindeutig mit LGA1700 und ADL-S – Alder Lake S also – beschriftet. Der Rocket-Lake-Nachfolger soll demnach nominell 500 Extra-Kontakte im Vergleich zur aktuellen LGA1200-Plattform haben, die für Comet Lake und wohl auch noch für Rocket Lake genügt. Für den (vielleicht) ersten mit 10-Nanometer-Strukturen massengefertigten Intel-Desktop-Prozessor steht dann auch USB 4 und eventuell auch schon schneller DDR5-RAM auf dem Plan, dessen Spezifikation jüngst von der JEDEC verabschiedet wurde.

Kaum auf dem Markt, wird Nvidias Ampere A100-Allzweckbeschleuniger bereits von spezialisierten KI-Chips ins Visier genommen. Die britische Firma Graphcore, unter der Technik-Ägide des Icera- und STMicro-Urgesteins Simon Knowles, entwickelt bereits die zweite Generation seiner Colossus-Chips. Der Mk2 GC200 ist mit 59 Milliarden Transistoren auf 823 Quadratmillimetern Fläche etwas komplexer, aber etwas kleiner als Nvidias A100 (54 Mrd., 826 mm2) – kein Wunder bei 900 MByte extradichtem SRAM als lokalem Zwischenspeicher. Und er ist rein auf KI-Anwendungen ausgelegt.

Graphcore will mit den 1472 „Intelligent Processing Unit“-Kernen (im Grunde massiv-parallele FP32-FMACs) 62,5 TFlops FP32- und 250 Tops INT8-Performance erreichen und damit achtmal so schnell sein wie die Chips der ersten Generation. Vier der IPUs kommen als MC2000 – gebaut von Dell EMC – auf ein 1HE-Rackeinschub und das gesamte System soll bis zu 64.000 Chips skalieren. Microsoft ist mit der Azure-Cloud einer der namhaften Graphcore-Partner.

Mit vier Graphcore Colossus Mk2 GC200 soll das MC2000-Racksystem bereits 1 PetaOps (nicht Flops) KI-Performance, also INT8-Durchsatz, erreichen.

(Bild: Graphcore)

Nach Pong (siehe Bit-Rauschen: Tiger-Lake-Ausblick) gab es Neues vom Taskmgr-Hexer Max Holt: Der erste Level des Shooters Doom aus dem Jahre 1993 war in den Auslastungs-Blautönen der 1792 Prozessorkerne (inklusive Hyper-Threading) eines 32-Sockel-Xeon-Systems zu sehen. Als nächstes möchte Holt wohl die Frage „Will it run Crysis?“ beantworten – ob das bei so wenigen „Pixeln“ auch einen hohen Wiedererkennungswert hat?

Dieser Artikel stammt aus c't 17/2020.

(csp)