Nvidia-Grafikchips mit Lebensdauerproblemen (Update)

Nachdem Nvidia angekündigt hat, Reklamationskosten von bis zu 200 Millionen US-Dollar zu befürchten, rätseln vor allem Besitzer von Notebooks, welche Geräte betroffen sein könnten.

In Pocket speichern vorlesen Druckansicht 238 Kommentare lesen
Lesezeit: 6 Min.

Seit Nvidia am vergangenen Mittwoch nach Börsenschluss angekündigt hat, außer geringerem Quartalsumsatz auch Reklamationskosten in Höhe von bis zu 200 Millionen US-Dollar zu befürchten, ist nicht nur der Kurs der Aktie des Grafikchip-Spezialisten um 30 Prozent in die Tiefe gerauscht. Es fragen sich seither auch viele Besitzer von PCs und Notebooks mit Nvidia-Grafikchips, ob auch ihr Gerät womöglich früher als erwartet ausfallen wird.

Nvidia hat bisher nicht öffentlich die Produkte benannt, die betroffen sind. Nvidia-CEO Jen-Hsung Huang deutet in der Investorenmitteilung vom 2. Juli lediglich an, dass nicht etwa die eigentlichen Grafik-Siliziumchips für die Ausfälle verantwortlich seien, sondern Probleme mit der Chip-Gehäusetechnik. Anscheinend können häufige Temperaturwechsel in diesem Bereich zu Ausfällen führen – und offenbar sind vorwiegend Notebooks betroffen, die Huang explizit erwähnt. Laut Huang will man bereits aus den Fehlern gelernt und in Zusammenarbeit mit den eigentlichen Chip-Fertigern (etwa TSMC) und anderen Zulieferern die Materialkombination der aktuellen Grafikprozessoren verbessert haben. Außerdem will die Firma Nvidia gemeinsam mit ihren OEM-Partnern "System Management Software" entwickeln, die das "Thermal Management" der GPUs verbessert.

Der für gewöhnlich gut informierte US-Journalist Charlie Demerjian schreibt im britischen Inquirer unter Berufung auf anonyme Quellen, dass alle Nvidia-GPUs auf Basis der Chips mit den Codenamen G84 und G86 von dem Problem betroffen seien. Unter den Mobil-Grafikchips wären das etwa die DirectX-10-GPUs GeForce 8600M GT/GS und GeForce 8400M GT/GS/G. Laut Demerjian sollen auch Desktop-PC- und Workstation-Grafikkarten mit GPUs der GeForce-8-Serie, also etwa GeForce 8600 GTS/GT, GeForce 8500 GT und ältere Versionen des GeForce 8400 GS sowie Quadro FX 1700 potenziell betroffen sein. Weil diese Grafikprozessoren aber auf Grafikkarten mit viel kräftigeren Kühlern sitzen und weil die bei Desktop-PC-Produkten weniger aggressive Energieverwaltung deutlich geringere Temperaturwechsel verursacht, ist das Ausfallrisiko angeblich viel kleiner als bei den Mobil-Grafikchips. Bisher sind anscheinend keine erhöhten Ausfallraten bei Desktop-PC- und Workstation-Karten bekannt geworden; es spricht also einiges dafür, dass gehäufte Ausfälle nur bei manchen Notebook-Versionen auftreten. Da Nvidia aber den Schaden auf 150 bis 200 Millionen US-Dollar schätzt, scheinen recht viele dieser Geräte verkauft worden zu sein.

Bisher ist keine Rückruf-Aktion eines Notebook-Herstellers bekannt geworden; es gibt aber durchaus Foren-Einträge, die auf gehäufte Ausfälle bei manchen Notebooks hindeuten, etwa beim Dell XPS M1330 in der Version mit GeForce M 8400 GS (hier weitere). Für dieses Notebook hat Dell vor wenigen Tagen ein BIOS-Update veröffentlicht, das ein "Enhancement for Thermal Control" bringen soll. Ähnliches gilt für BIOS-Updates, die HP für einige Pavilion- und Compaq-Presario-Notebooks bereitstellt. Dort ist zu lesen, dass man Produkte der möglicherweise betroffenen Baureihen ruhig weiternutzen soll, wenn keine Störungen auftreten.

(Update:) Nicht nur in den USA, wo die Garantiefrist oft lediglich ein Jahr ab Kaufdatum beträgt, bietet HP für die möglicherweise betroffenen Produkte einen erweiterten Reparaturservice an, sondern auch für die EMEA-Region.

Im vergangenen Jahr war übrigens etwa auch die Xbox 360 von erhöhten Ausfallraten betroffen, die auf Qualitätsprobleme beim Grafikchip zurückzuführen waren.

Die Gehäusetechnik aktueller CPUs und GPUs

(Bild: Intel)

(Update:) Offenbar stellt die hohe Leistungsaufnahme von Grafikchips, die mittlerweile oft jene der Hauptprozessoren übertrifft, schwierige Anforderungen an die Geräteentwickler. Wegen der hohen Signalfrequenzen und Kontaktzahlen sowie der extremen Stromgradienten sitzen aktuelle CPUs und GPUs typischerweise in beziehungsweise "auf" Flip-Chip-Ball-Grid-Array-(FC-BGA-)Gehäusen. Das eigentliche Silizium-Die trägt dabei auf seiner "aktiven" Seite (also der Fläche, auf der auch die Schaltung eingearbeitet wurde) mehrere hundert Kontaktflächen. Es wird kopfüber auf einen so genannten Die-Carrier gelötet; diese mehrlagige Platine ist auf der Unterseite mit den Kontakten bestückt, mit denen der fertige Chip schließlich mit der Platine verbunden wird, also etwa ein Pin Grid Array (PGA, Kontaktpins), ein Land Grid Array (LGA, Kontaktflächen) oder wiederum ein Ball Grid Array (BGA, Lotkugeln zum festen Einlöten). Die zahlreichen Lotkugeln zwischen Die und Die Carrier müssen sehr gleichmäßig schmelzen und sich zuverlässig mit den Kontaktflächen verbinden. Ein gängiges Verfahren für diese Fügetechnik nennt sich kurz C4, das steht für Controlled Collapsed Chip Connect.

Durch die trotz sorgfältiger Materialauswahl unterschiedlichen thermischen Ausdehnungskoeffizienten und Temperaturen des Siliziums und des Die Carriers entstehen bei Temperaturveränderungen des Chips enorme Spannungskräfte, die vor allem die Lotkugeln belasten und zu Haarrissen führen können. Um dieses Risiko zu mindern, wird nach dem C4-Prozess ein sogenanntes Underfill aus ausgetüftelten Epoxidharzen zwischen Die und Die Carrier eingebracht, wobei die Kapillarkräfte in den winzigen Zwischenräumen zwischen den Lotkugeln helfen. Die Auswirkungen des durch Temperaturwechsel verursachten "Thermal Stress" auf die elektrischen Kontakte und den Chip beeinflusst aber auch der "Die Load" wesentlich, also die Kraft, mit der etwa ein Kühler den Chip auf seine Unterlage presst. Bei Prozessoren mit hoher Leistungsaufnahme muss also auch die mechanische Konstruktion des Kühlers in die Auslegung der Chip-Gehäusetechnik mit einbezogen werden. Das wurde beispielsweise vor einigen Jahren beim Intel Pentium 4 mit seiner für damalige Verhältnisse hohen Leistungsaufnahme deutlich: Intel hatte vorgeschrieben, dass die Halterung des Kühlers eine so hohe Spannkraft aufbauen sollte, dass sich die Platine der Mainboards durchbog.

Die Gehäusetechnik ist ein ganz entscheidender, aber wenig prominenter Aspekt moderner Hochleistungs-Halbleiterbauelemente; die Firma Intel hat dazu einige Papiere veröffentlicht. Um IC-Packaging-Verfahren gibt es immer wieder Patentstreitigkeiten. (ciw)