Was die Voraussetzungen für den Kaltstart eines Rechenzentrums sind

Für den RZ-Neustart nach einem Totalausfall muss die Infrastruktur auf den Ernstfall vorbereitet werden. Dabei hilft das Site Reliability Engineering.

Artikel verschenken

23.03.2026, 07:00 Uhr

Lesezeit: 26 Min.

iX Magazin

Von

Frank Benke

Was die Voraussetzungen für den Kaltstart eines Rechenzentrums sind
- Was ist mit Restore?
Site Reliability Engineering
Nicht weniger als ein Paradigmenwechsel
Konfigurationen im Klartext sichern
Basis der Automatisierung
Mehrere Zonen vorsehen
Logische Trennung auch beim Backup
Fazit

Artikel in iX 4/2026 lesen

Was wäre wenn? Diese Frage steht am Beginn jedes Business-Continuity-Plans, in dem sich dann unterschiedlichste Methoden der Wiederherstellung um die erdachten Szenarien gruppieren. Hochverfügbarkeit, Backup und Restore haben Hochkonjunktur, garniert mit immer neuen Features, genauso wie immer komplexere IT-Landschaften, deren Resilienz bestenfalls sporadisch getestet wird. Verletzung von Clusterkriterien, explodierende Laufzeiten oder übersehene Abhängigkeiten haben viele Wiederherstellungen in Albträume verwandelt.

Was wäre aber, wenn das in dieser Form nicht mehr interessiert? Wenn die IT-Umgebung so resilient wäre, dass sie in kurzer Zeit wieder auf der grünen Wiese herzustellen wäre? Und sich die klassische Wiederherstellung auf die kritischen Daten konzentrieren könnte? Denn das Zeitalter der Cloud ist geprägt durch die IT-Automatisierung. Auch wenn sie zuweilen weder bewusst noch gezielt eingesetzt wird, ist sie doch integraler Bestandteil vieler populärer Produkte. Zeit, die Automatisierung auch für die Wiederherstellung der IT zu nutzen. Dieser Artikel wird sich auf die strukturellen und organisatorischen Aspekte einer solchen Kaltstartfähigkeit konzentrieren. Ein Implementierungsbeispiel mit Werkzeugen und Methoden liefern die Artikel „Kaltstart eines Rechenzentrums: Die Vorarbeiten“ und „Kaltstart eines Rechenzentrums: Die Umsetzung in der Praxis“.

Wird die Unternehmens-IT durch einen Cyberangriff lahmgelegt, gilt es, den Betrieb schnellstmöglich mit unkorrumpierten Daten und Systemen wieder anzufahren.
Klassische Backup- und Recovery-Methoden eignen sich nicht, ein RZ nach einem Totalausfall schnell wieder hochzubringen.
Für ein schnelles Anfahren des RZ haben Hyperscaler längst das Site Reliability Engineering ersonnen, das das IT-Service-Management um die Automatisierung und die Einführung von Error Budgets erweitert.
Das Site Reliability Engineering ersetzt operative Prozesse durch technische Implementierungen und bewirkt damit einen Paradigmenwechsel.
Wichtige Bausteine des Site Reliability Engineering sind nach vorn verlagerte systemgestützte Dokumentationen, Standardisierungen, logische Trennungen und Zonenkonzepte.

Frank Benke ist Leiter der operativen IT in der HAHN Automation Group und verantwortlich für den Betrieb einer globalen Infrastruktur in neun Ländern.

Das derzeit vielleicht am häufigsten beschworene Bedrohungsszenario ist der erfolgreiche Ransomwareangriff. Das Besondere an ihm ist der umfassende Verlust der Vertrauenswürdigkeit der kompromittierten Umgebung. Sehr viele andere Szenarien aus dem Business-Continuity-Management lassen sich mit einem Bruchteil der Maßnahmen aus dem Szenario Ransomware behandeln, mit Ausnahme des Verlusts von Hardware.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Brennende E-Autos: So löscht die Feuerwehr wirklich

Ein Feuerwehrmann erklärt im Video, warum E-Autos anders, aber nicht gefährlicher brennen als Verbrenner und wie die Profis sie wirklich löschen.

Warum die Zukunft der deutschen Autos in China liegt

China ist der größte Automarkt der Welt. Um als deutscher Autobauer Erfolg zu haben, muss man Modelle schneller entwickeln und Software-Kompetenz aufbauen.

Kassettenspieler-Kaufberatung: Das richtige Gerät für das Tape-Comeback

Nach dem Vinyl-Revival erleben auch Audiokassetten eine Wiedergeburt. Wir klären, was es beim Kauf eines Kassettenspielers zu beachten gibt.

Jack Nicholson außer sich: Einer flog über das Kuckucksnest im 4K-Heimkinotest

Wer ist hier verrückt? Die restaurierte UHD rollt das Anstaltsdrama gegenüber der lange vergriffenen Blu-ray Disc und dem Stream endlich neu in 4K auf.

Famos fensterln: So behalten Sie im macOS-Fensterdschungel den Überblick

Der Mac bietet zahlreiche Bordmittel wie Mission Control, Spaces, Vollbild und Stage Manager, um Fenster zu verwalten. Wir zeigen, wie man sie sinnvoll nutzt.

(XXL-)Speicher für Balkonkraftwerke im Test

Balkonkraftwerke mit Speicher versprechen einen automatischen Ausgleich des Stromverbrauchs. Vier Systeme müssen beweisen, was davon im Alltag übrig bleibt.