Der Chip ohne Fehler

Prozessoren neigen dazu, falsch zu rechnen, wenn sie durch zu hohe Temperaturen, zu hohe Taktfrequenzen oder elektrische Fluktuationen überlastet werden. Ein Forschungsprojekt bei Intel will daraus nun einen Vorteil machen.

In Pocket speichern vorlesen Druckansicht 6 Kommentare lesen
Lesezeit: 4 Min.

Prozessoren neigen dazu, falsch zu rechnen, wenn sie durch zu hohe Temperaturen, zu hohe Taktfrequenzen oder elektrische Fluktuationen überlastet werden. Ein Forschungsprojekt bei Intel will daraus nun einen Vorteil machen.

Sein Name klingt schon ziemlich robust: "Palisades" – zu Deutsch: "Abwehrzaun". Der Prototyp-Chip, den Intel-Forscher um Projektleiter Jim Tschanz am "Circuits Lab" des IT-Riesen im US-Bundesstaat Oregon entwickelt haben, soll auch besonders wehrhaft sein: Während sich aktuelle Technik durchaus verrechnen kann, wenn sie es mit massiven Störungen zu tun bekommt, kann dieser Halbleiter diese erkennen und sogar für sich nutzen. "Resilient Processor Design" nennt sich die Idee, eine Chip-Technik also, die "nachgeben" kann, wenn sie Probleme bei der eigenen Arbeit detektiert.

"Palisades erkennt Fehler und korrigiert sie dynamisch während der Ausführung von Code", erklärt Tschanz. Dabei arbeitet das System zudem frequenzunabhängig: Wenn es notwendig ist, auf niedrigeren Gigahertz zu werkeln, wird einfach in einem breiten Spektrum heruntergeschaltet, das deutlich über das hinausgeht, was heutige Prozessoren im Stromsparmodus beherrschen. "Man kann sich das als extremes Übertakten vorstellen. Mit dem Unterschied, dass dieser Prozessor eben auch dann keine Fehler produziert." Stattdessen korrigiere Palisades das Problem dann einfach – "und zwar dem Nutzer gegenüber transparent".

Damit das funktioniert, besitzt der Prototyp-Chip in das Silizium gegossene Fehlerkorrekturmechanismen. Diese dienen dazu, Timing-Probleme "on the fly" zu korrigieren, wie sie nicht nur durch zu hohe Frequenzen, sondern auch durch Überhitzung und Fluktuationen bei der Stromversorgung vorkommen können. Dazu befinden sich Zusatztransistoren auf dem Prozessor, die beispielsweise die Signallaufzeiten messen. Stimmen diese nicht, lässt sich feststellen, dass wohl ein Problem aufgetreten ist. "Selbst wenn der Chip altert, lassen sich dadurch vorkommende Fehler erkennen." Eine eigens entwickelte Recovery-Technik sorgt dann dafür, dass eine Instruktion so lange wiederholt wird, bis das Ergebnis wieder stimmt, gleichzeitig wird die Frequenz heruntergeschraubt.

Was zunächst danach klingt, als würde es den Prozessor ausbremsen, sorgt im Endergebnis dafür, dass er entweder mit im Durchschnitt höherer Taktrate laufen kann oder aber stromsparender ans Werk geht – die rein elektrische Korrektur frisst wenig Zeit. Im Labor ließen sich so bei typischen Anwendungen im Vergleich zu normalen Chips denn auch Leistungsverbesserungen zwischen 12 und 50 Prozent erzielen. Auf der Stromsparseite sind bei gleicher Rechenpower wiederum bis zu 22 Prozent weniger Energieverbrauch drin, sagt Tschanz. Der Kunde kann sich also aussuchen, was ihm wichtiger ist.

Noch ist Palisades ein reines Labormodell, das an einem Laptop hängt und allein für harte Rechenarbeit indirekt angesteuert wird – ein Betriebssystem ließe sich darauf noch nicht installieren. Im Versuch ist der Prototyp-Chip jedoch jetzt schon beeindruckend: Bei einem Bildverarbeitungstest treten beispielsweise durchschnittlich mehrere Millionen Fehler pro Sekunde auf, die dynamisch ausgeglichen werden. Davon bekommt der Nutzer nichts mit: Die Aufgabe wird trotzdem ohne Makel erledigt. Wird die Resiliency-Funktion abgedreht, häufen sich dagegen sofort die Fehler, was zeigt, dass ein normaler Prozessor bei dieser Frequenz nicht mehr korrekt arbeiten könnte.

Bei Intel glaubt man, dass man die dynamische Anpassung an Fehler in die gesamte Produktpalette einbauen könnte – vom einfachen Netbook-Prozessor bis zum High-End-Server-Chip. Der Prototyp basiert derzeit auf einer Standard-RISC-Plattform. Teile der bei Palisades verwendeten Technik werden bereits in den aktuellen Core-i5- und i7-Plattformen eingesetzt, die über einen sogenannten "Turboboost" verfügen. Dabei lassen sich kurzfristig über 600 MHz herausholen, weil der Chip seine Taktfrequenz je nach nutzbarer Wattzahl und Umgebungstemperatur dynamisch anpasst. (bsc)