AMD veröffentlicht Programmierer-Hinweise für K10-Prozessoren
Die kommende AMD-Prozessorgeneration K10 bringt neue Funktionen, die sich erst mit optimiertem Code voll ausreizen lassen.
Im "Software Optimization Guide for AMD Family 10h Processors" (PDF-Dokument mit 2,8 MByte hier) erklärt AMD Programmierern die Neuerungen der Mitte des Jahres mit den Barcelona-Opterons debütierenden K10-Prozessoren.
Der Leitfaden richtet sich an Code- und Compiler-Entwickler, die die K10-Architektur voll ausreizen wollen. Nebenbei erklärt AMD auch viele der kommenden Optimierungen erstmals im Detail. Besonders interessant ist eine Tabelle der Key Optimizations auf Seite 22 (Kapitel 1.5.1) des Dokuments, in der AMD die Rangfolge der Optimierungen auflistet – um die erstgenannten sollten sich Programmierer also auch als Erstes kümmern. Außerdem gibt es auf Seite 234 ein K10-Blockdiagramm.
Rangfolge der K10-Optimierungen laut AMD
Rang | Optimierung |
---|---|
1 | Load-Execute Instructions for Floating-Point or Integer Operands |
2 | Write-Combining |
3 | Branches That Depend on Random Data |
4 | Loop Unrolling |
5 | Pointer Arithmetic in Loops |
6 | Explicit Load Instructions |
7 | Reuse of Dead Registers |
8 | ccNUMA Optimizations |
9 | Multithreading |
10 | Prefetch and Streaming Instructions |
11 | Memory and String Routines |
12 | Loop Iteration Boundaries |
13 | Floating-Point Scalar Conversions |