Llano-Nachfolger: Trinity-Grafikkern bis zu 50 Prozent schneller
Der integrierte Grafikchip des Llano-Nachfolgechips Trinity setzt auf eine effiziente VLIW4-Architektur und dĂĽrfte bis zu 50 Prozent schneller sein.
AMD will beim Grafikkern des Llano-Nachfolgeprozessors "Trinity " nicht mehr auf die bei den derzeitigen APUs eingesetzte Evergreen-Architektur zurĂĽckgreifen. Dies wurde im Rahmen des Fusion Developer Summits in Bellevue (US-Bundesstaat Washington) bekannt.
Die integrierten Grafikchips bauen also auf der mit den Cayman-GPUs der HD-6900-Serie eingeführten Shader-Organisation auf. Bei ihr bestehen die einzelnen Rechengruppen aus vier Shader-Kernen, die alle über denselben Funktionsumfang verfügen (VLIW4). Die derzeitige Evergreen-Architektur der Llano-GPUs setzt auf Rechengruppen von 5 Shader-Kernen, von denen allerdings nur ein (größerer) Kern transzendente Berechnungen, etwa Sinus und Cosinus, beherrscht. Ist diese Shader-Einheit ausgelastet, liegen die anderen quasi brach. AMDs VLIW4-Architektur bringt überdies eine einfachere Thread-Zuweisung und Registerverwaltung mit und ermöglicht es deshalb, die integrierten Grafikchips besser auszulasten – außerdem lässt sich zusätzlich kostbarer Platz sparen.
Wie viele Shader-Kerne die in Trinity-Prozessoren integrierten Grafikchips besitzen, ist allerdings noch nicht klar. In den aktuellen Llano-GPUs arbeiten bis zu 400, aufgrund der umgekrempelten Shader-Organisation dürften in den Trinity-GPUs wohl bis zu 512 Shader-Kerne Platz finden. Dies entspräche 8 SIMD-Einheiten mit jeweils 16 Vierergruppen von Rechenkernen. Zieht man schließlich noch die höhere Effizienz hinzu und eine eventuell etwas höhere Taktfrequenz, könnte Trinitys Grafikkern also durchaus rund 50 Prozent schneller sein als der jetzige Spitzenreiter mit 400 Kernen.
Dazu passen die Ausführungen von AMDs Vice President Rick Bergman, der auf der Fusion-Konferenz erklärte, dass die Trinity-Kombiprozessoren an sich um 50 Prozent schneller seien als die neuen Llano-Chips. Der Großteil der theoretischen GFlops-Rechenleistung wird allerdings von den GPU-Kernen "getragen". Beispielsweise erreicht eine 2,5 GHz schnelle Llano-CPU nur 80 GFlops (Single Precision/SP), die 400 Shader-Kerne der zugehörigen Llano-GPU 355 GFlops.
Die im 32-Nanometer-Verfahren gefertigten Trinitys sollen 2012 auf den Markt kommen. Der CPU-Teil soll dann bereits aus Bulldozer-Modulen bestehen und nicht mehr aus den eigentlich veralteten K8/K10-Kernen. (mfi)