Arbeitsspeicher mit Fehlerschutz: So funktioniert ECC-Speicher

ECC erkennt und korrigiert die häufigsten Datenfehler im RAM und in Pufferspeichern (Caches) von Prozessoren. Wie ECC ­funktioniert und was es bringt.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 8 Kommentare lesen
Lesezeit: 27 Min.
Inhaltsverzeichnis

Arbeitsspeicher mit Fehlerschutz durch Error Correction Code (ECC) ist ein typisches Merkmal von Servern und Workstations, um sie zuverlässiger zu machen. Gewöhnliche PCs, Notebooks und günstige NAS verzichten hingegen auf ECC-RAM, stürzen aber im Allgemeinen trotzdem nicht ständig wegen RAM-Fehlern ab. Da stellt sich die Frage, was die Technik leistet und bei welchen Anwendungen sie Vorteile verspricht. Zudem arbeitet der ECC-Fehlerschutz nicht bei allen Systemen gleich: Für Grafikkarten und Embedded Systems gibt es spezielle ECC-Konzepte, und die kommende Arbeitsspeichergeneration DDR5 bringt auch bei ECC Veränderungen. Wer sich von ECC-RAM ein zuverlässigeres System erhofft, muss deshalb genauer hinschauen.

ECC erkennt und korrigiert die mit Abstand häufigsten RAM-Fehler: nämlich alle, die jeweils ein einzelnes Bit betreffen. Gängige ECC-Implementierungen erkennen zudem sämtliche Fehler, die zwei Bits gleichzeitig betreffen, können von diesen aber nur manche korrigieren. Sind mehr als zwei Bits von Fehlern betroffen, kann ECC das nur selten erkennen. Die weit verbreiteten ECC-Verfahren heißen deshalb Single Error Correction, Double Error Detection, kurz SECDED. Manche Serverprozessoren beherrschen aufwendigere RAM-Korrekturverfahren wie Chipkill, dazu unten mehr.

Mehr über Arbeitsspeicher

Abgesehen von der Erkennung und Korrektur der Fehler protokollieren viele ECC-taugliche Computer sie auch. Daraus ergibt sich überhaupt erst die Möglichkeit, sie zu analysieren. Umgekehrt ausgedrückt: Bei PCs und Notebooks ohne ECC-RAM lässt sich nur indirekt aus Abstürzen oder Rechenfehlern auf Bitfehler schließen.