zurück zum Artikel

Hot-Chips: Details zum 64-Bit-Tegra

Benjamin Benz

Das ARM-Projekt Denver ist zwar noch nicht fertig, doch Nvidia verrÀt schon einmal optimistische Performance-SchÀtzungen.

Zuversichtlich aber nicht ganz fair: Nvidia vergleicht den fĂŒr Tablets oder grĂ¶ĂŸere GerĂ€te gedachten Tegra K1-64 mit Handy-Chips.

Zuversichtlich aber nicht ganz fair: Nvidia vergleicht den fĂŒr Tablets oder grĂ¶ĂŸere GerĂ€te gedachten Tegra K1-64 mit Handy-Chips.

Informationen zum Projekt Denver – der 64-Bit-ARM-Eigenentwicklung – verteilt Nvidia seit mehr als einem Jahr nur hĂ€ppchenweise. Auf der Hot-Chips-Konferenz gab es diesmal ein paar Details zur Architektur. So sollen die beiden Denver-Kerne im kommenden Tegra K1-64 den ARMv8-Befehlssatz nutzen, 7-fach-skalar arbeiten, 2,5 GHz Taktfrequenz erreichen und grĂ¶ĂŸere Caches haben als ihre von ARM in Lizenz genommenen 32-Bit-VorgĂ€nger (ARMv7). Etwas verwirrend ist, dass Nvidia den Tegra K1 [1] in zwei Varianten [2] plant: Der neue mit zwei Denver-Cores (K1-64) und die bereits verfĂŒgbaren alias K1-32 mit vier Cortex-A15-Kernen (32 Bit). Letztere hat im c't-Test alle bisherigen ARM-Rekorde gebrochen [3].

GegenĂŒber dem Cortex-A15 hat Nvidia die L1-Caches erheblich von je 32 KByte fĂŒr Instruktionen und Daten erheblich auf nun 128 respektive 64 KByte vergrĂ¶ĂŸert. Die NEON-Einheit ist nun 128 Bit breit. Außerdem betonte Nvidia die VorzĂŒge von Dynamic Code Optimization, bei der der Code zur Laufzeit einmal durch einen Optimierer geschleust wird. Der "optimized Microcode" landet in einem Cache und steht dort fĂŒr weitere LĂ€ufe bereit. Der Optimierer versucht unter anderem Schleifen aufzulösen, Register umzubenennen, Load- und Store-Befehle umzusortieren sowie redundante Berechnungen zu unterbinden. Unterm Strich soll Denver nun bis zu sieben Instruktionen pro Zyklus schaffen – mehr als doppelt so viel wie der Cortex-A15.

Der Denver-Core soll nun bis zu sieben Instruktionen pro Taktzyklus abarbeiten.

Der Denver-Core soll nun bis zu sieben Instruktionen pro Taktzyklus abarbeiten.

Einen Vergleich mit ARMs 64-bittigem Cortex-A57 zog Nvidia nicht, wohl aber mit Intels Ultrabook-Celeron, Qualcomms Krait-400 und Apples A7. Bis auf die Gleitkommaoperationen aus der Specfp 2000 und Memcpy siegt der Tegra K1 in allen von Nvidia ausgewĂ€hlten Disziplinen. Insbesondere der A7 soll zum Teil weit zurĂŒck liegen. Viele RĂŒckschlĂŒsse lassen die Zahlen jedoch noch nicht zu, denn im direkten Vergleich wird ein Handy-Chip immer einem fĂŒr Tablets unterlegen sein, weil letzterer ein grĂ¶ĂŸeres Strombudget hat. (bbe [4])


URL dieses Artikels:
https://www.heise.de/-2290893

Links in diesem Artikel:
[1] https://www.heise.de/news/Entwickler-Kit-mit-Nvidia-SoC-Tegra-K1-erhaeltlich-2154937.html
[2] https://www.heise.de/news/Nvidia-praesentiert-Mobilprozessor-Tegra-K1-192-Kepler-Kerne-auf-zwei-Varianten-2075405.html
[3] http://www.heise.de/ct/heft/2014-18-Test-Entwicklungskit-mit-Tegra-K1-2283669.html
[4] mailto:bbe@ct.de