AMD knackt die TeraFLOPS-Grenze
Der PCIe-Applikationsbeschleuniger FireStream 9250 soll bei einer Leistungsaufnahme von 150 Watt eine (Single-Precision-)Performance von 1 TeraFLOPS erreichen.
Der Chiphersteller AMD kündigt im Vorfeld der ab dem morgigen Dienstag in Dresden stattfindenden International Supercomputing Conference (ISC) seinen neuen Applikationsbeschleuniger FireStream 9250 an. Er soll bei einfacher Rechengenauigkeit (Single Precision, 32 Bit) die TeraFLOPS-Barriere durchbrechen.
Die PCI Express-Karte nimmt nach Angaben von AMD weniger als 150 Watt Leistung auf und belegt daher keinen zusätzlichen PCIe-Steckplatz für den Kühler. Bei der werbewirksamen Kennzahl Performance pro Watt erreicht der FireStream 9250 nach diesen AMD-Angaben eine Effizienz von 8 GFLOPS pro Watt. Allerdings gilt der Wert nur für einfache Rechengenauigkeit (SP), bei Double Precision (64 Bit) erreicht der Nachfolger der FireStream 9170 mit zirka 200 GFLOPS nur ein Fünftel der Performance.
Zum Vergleich: Die 128-Bit-SSE-Einheiten eines Core 2 Quad oder Quad-Core Xeons liefern bei 3 GHz Taktfrequenz insgesamt 96 GFLOPS (8 Ops pro Taktzyklus und CPU-Kern) bei einfacher und 48 GFLOPS (je 2 Fmul + 2 Fadd) bei doppelter Genauigkeit; die nominelle Thermal Design Power (TDP) von zwei solchen Quad-Core-Xeons, die gemeinsam eine theoretisch maximale DP-Performance von 96 GFLOPS liefern, beträgt insgesamt (2 × 80 =) 160 Watt. Für die Cell-Variante PowerXCell 8i (Cell eDP) nennt IBM übrigens 107 GFLOPS DP-Performance bei 3,2 GHz Taktfrequenz.
Hinter dem FireStream 9250 verbirgt sich vermutlich die neue GPU RV770, die auch auf den kommenden Grafikkarten der Radeon-4800er-Serie verwendet wird. Technische Angaben zu Taktfrequenzen und Anzahl der Shader-ALUs veröffentlichte AMD noch nicht. Lediglich die Größe des Speichers steht mit 1 GByte GDDR3-RAM fest.
Die potenziellen Anwendungsbereiche der General-Purpose-GPU (GPGPU) liegen im HPC-Bereich bei Finanzanalysen, seismischen Berechnungen oder der Bildverarbeitung. Dafür legt AMD das Stream SDK bei, mit dem sich eigene Anwendungen für den Coprozessor entwickeln lassen. Der Chiphersteller verfolgt dabei nach eigenen Angaben einen offenen Ansatz und bietet zum Beispiel das Brook+-Frontend als Open Source an. Zudem gab AMD bekannt, in der Khronos Group mitzuarbeiten, die derzeit die quelloffene GPGPU-Programmiersprache OpenCL entwickelt. Apple plant, OpenCL in sein zukünftiges Betriebssystem OS X 10.6 zu integrieren. Auf der Nvidia-Konferenz Nvision 08 will Microsoft erste Details über Compute Shaders in DirectX 11 veröffentlichen.
Der FireStream 9250 soll im dritten Quartal dieses Jahres für 999 US-Dollar in den Handel kommen. Nvidia bietet mit der Tesla-Reihe ebenfalls einen Applikationsbeschleuniger an, Intel plant im nächsten Jahr mit dem Multi-Core-x86-Grafikprozessor Larrabee auch in diesen Markt einzusteigen. (chh)