Software-Verjüngung gegen System-Crashs
IBM gibt jetzt ein Tool heraus, das mögliche System-Instabilitäten oder Crashs im Voraus erkennen und durch einen geordneten Neustart des Systems umgehen kann.
IBM gibt jetzt als Bestandteil des IBM Directors den xSeries-Servern ein Tool mit auf den Weg, das mögliche System-Instabilitäten oder Crashs im Voraus erkennen und durch einen sicheren, geordneten Neustart des Systems umgehen kann. Bereits auf der LinuxWorld 2000 hatte IBM angekündigt, dieses Tool herauszubringen, nun kommt es aber zunächst für Windows NT/2000. Doch die Linux-Version soll nach Aussagen von Dr. Tom Bradicich – Direktor für Computer Architektur und Technologie für IBMs "Lowcost-Server" – in Kürze folgen.
Bei der Vorhersagekunst des Tools handelt es sich nicht um Magie – die ist derzeit softwaremäßig erst unvollkommen erschlossen – sondern um ein "proaktives" Fehlermanagement, das mit Hilfe von KI-Methoden Systemressourcen kontrolliert, Checkpoints setzt, Task-Verhalten beobachtet sowie in bestimmten Intervallen und in kritischen Situationen einen Systemneustart verordnet.
Die Erfahrung, die dem Tool zu Grunde liegt: Software altert (Software aging). Jeder PC-Besitzer kennt das Problem, dass beispielsweise Windows-Installationen im Laufe der Zeit immer "unbrauchbarer" werden, sodass irgendwann eine Neuinstallation nötig wird. Dass auch normale Applikationen im Betrieb "altern", wurde unter anderem an Netscape nachgewiesen. Wissenschaftler machen sich schon viele Jahre Gedanken zu dem Thema "selbstheilende Software" und Softwareverjüngung (Rejuvenation), neuerdings mit Modellen mit Hilfe von Fluid Stochastic Petri Nets (FSPN).
Schon 1986 schrieb J.Gray darüber, warum Computer abstürzen und was man dagegen tun kann: Why do Computers Stop and What Can be Done About it? (Proc. of 5th Symposium on Reliability in Distributed Software and Database Systems, S. 3-12, Januar 1986). Eine Maßnahme der Betriebssystems-Verjüngung ist beispielsweise das regelmäßige Aufräumen der Speicherverwaltung (Garbage Collection) und das periodische Reinitialisieren aller Systemtabellen. Nicht beendete Threads, dauerhaft blockierte Datei-Handles und anderer Ressourcenprobleme sammeln sich im Laufe der Zeit auf langlaufenden Servern an und führen ohne Verjüngungsmaßnahmen irgendwann zum Kollaps. Die Grafik von IBM (siehe Bild) zeigt, wie regelmäßige Verjüngung die Systemverfügbarkeit erhöht. Mehr Information zu dem Thema "Modeling and Analysis of Software Aging and Rejuvenation" können Interessierte einem Aufsatz von Wissenschaftlern der Universität Duke, Durham, entnehmen, mit denen IBM zusammenarbeitet. (as)