Operations heute und morgen, Teil 4: Hochverfügbarkeit

Seite 4: Fazit

Inhaltsverzeichnis

Heutige Systemlandschaften sind in der Regel komplex, verteilt und hochgradig vernetzt. Außerdem werden sie immer häufiger auf Cloud-artigen Infrastrukturen betrieben. Es ist nicht mehr hinreichend zu versuchen, gemäß dem traditionellen Stabilitätsansatz die Eintrittswahrscheinlichkeit von Fehlern zu minimieren. Stattdessen müssen Fehler als unvermeidbar und unvorhersehbar akzeptiert und toleriert werden. Der Kern von Fehlertoleranz ist die Isolation der einzelnen Bausteine mit dem Ziel, kaskadierende Fehler zu vermeiden. Redundanz ist ein mächtiges Muster, das einem hilft, mit allen möglichen Arten erkannter Fehler umzugehen. Wie erwähnt, gibt es jedoch weitere Muster im Kontext der Fehlertoleranz, Hochverfügbarkeit auszubauen.

Am wichtigsten sind vielleicht folgende Botschaften:

  • Hochverfügbarkeit ist nicht mehr nur Aufgabe des Betriebs, sondern bereits bei der Entwicklung mit in die Anwendungen einzubauen – ein Grund mehr für DevOps, da dafür die Feedbackschleifen benötigt werden.
  • Hochverfügbarkeit und Zuverlässigkeit sind verschiedene Dinge mit unterschiedlichen Zielsetzungen, und es erfordert andere Maßnahmen, entweder die MTTF zu maximieren oder die MTTR zu minimieren. Die Wahl hängt sowohl vom Einsatzgebiet der Software als auch der wirtschaftlichen Bewertung ab.

Abschließend sei noch erwähnt, das in der letzten Zeit häufig der Begriff Resilience synonym zur Fehlertoleranz genannt wird. Fehlertoleranz ist Resilience, aber Letzteres ist mehr als Fehlertoleranz. Es umfasst viele weitere Prinzipien wie Transparenz und Autonomie im Rahmen des Software-Designs, die helfen, Anwendungen robust und hochverfügbar zu gestalten.

Ansgar Fitz
ist als Senior IT Consultant bei der codecentric AG tätig. Mit den Schwerpunkten agile Softwarentwicklung und Resilience Software Design ist er immer auf der Suche nach neuen Konzepten für den IT-Betrieb.

  1. Andrew Tanenbaum, Marten van Steen; Distributed Systems – Principles and Paradigms; Prentice Hall, 2nd Edition, 2006
  2. Robert S. Hanmer; Patterns for Fault Tolerant Software; Wiley 2007
  3. BSI-Kompendium Hochverfügbarkeit

(ane)