Wie Rechenzentren sich auf Brown- und Blackouts vorbereiten

Die Relevanz von Rechenzentren wird besonders bei Problemen mit der Energieversorgung deutlich, die laut Kritikern derzeit noch nicht klar geregelt ist.

In Pocket speichern vorlesen Druckansicht 68 Kommentare lesen
Energy,Crisis.,Hand,In,Complete,Darkness,Holding,A,Phone,To

Notfall im Rechenzentrum

(Bild: vchal/Shutterstock.com)

Lesezeit: 8 Min.
Inhaltsverzeichnis

Wie wichtig die Verfügbarkeit von Rechenzentren ist, wird vor allem in Katastrophen- und Krisenfällen deutlich. Rechenzentren sind die Herzen des Internets und damit der modernen Gesellschaft; fallen sie aus, steht das Leben an vielen Stellen still. Aufgrund der Energieknappheit und der neuen geopolitischen Lage steht die Verfügbarkeit unserer Telekommunikationsinfrastruktur jetzt im Fokus.

Die Ausfallsicherheit von Rechenzentren ist laut der German Datacenter Association "von entscheidender Bedeutung – ob nun eine Energiemangellage vorliegt oder nicht". Grundsätzlich werden Rechenzentren mit Systemen zur unterbrechungsfreien, batteriebetriebenen Stromversorgung (USV) gesichert. Typischerweise mit Dieselkraftstoff betriebene Netzersatzanlagen (NEA) sollen die Versorgung mit Energie im Falle eines längeren Stromausfalls sicherstellen.

Von der Bundesnetzagentur für Rechenzentren empfohlene Notfallpläne sehen üblicherweise autarken Betrieb über 48 Stunden vor, viele Betreiber erweitern das jedoch auf bis zu 72 oder 100 Stunden. Entsprechend der maximalen Ausfallzeiten verfügen Rechenzentrumsbetreiber über Lieferverträge für Diesel oder schließen Nachtankungsverträge ab.

"Weiterhin praktizieren viele Rechenzentrenbetreiber regional übergeordnete Redundanz der Daten durch die Nutzung von Verfügbarkeitszonen: Zum Schutz der Daten hat sich die zusätzliche Speicherung der Informationen an einem entfernten Drittstandort etabliert", führt die German Datacenter Association aus. In der Regel ist von den nach der europäischen Norm DIN EN 50600 als kritische Infrastrukturen klassifizierten (Kritis) Diensten zu erwarten, dass sie auch in einem entsprechenden Kritis-zertifizierten Rechenzentrum mit den höchsten Verfügbarkeitsklassen laufen.

Verfügbarkeitsklasse Tier 1 Tier 2 Tier 3 Tier 4
Verfügbarkeit 99,671 % 99,749 % 99,982 % 99,995 %
Maximale jährliche Ausfallzeit 28,8 Stunden 22 Stunden 1,6 Stunden 25,3 Minuten
Versorgungswege einfach ausgelegt einfach ausgelegt 1 x aktiv, 1 x passiv zwei aktive
Komponenten 1 N+1 N+1 2 x (N+1)

Die USV übernimmt die Stromversorgung, bis die durch Verbrennungsmotoren angetriebenen redundanten Notstromaggregate anspringen. In der Regel springen die NEA innerhalb von 30 bis 40 Sekunden ein, jedoch reichen die Batteriekapazitäten beispielsweise beim Hosting-Provider Hetzner bis zu 15 Minuten. Für jede der "30 Rechenzentrumseinheiten an den Standorten in Nürnberg, Falkenstein und Helsinki [...] sind rund 30.000 Liter Treibstoff bevorratet", sagt Hetzner-Pressesprecher Christian Fitz. Das reiche laut aus, um den Normalbetrieb der Rechenzentren mit über 350.000 Servern drei bis vier Tage lang aufrechtzuerhalten. "Da sich die Tanks im laufenden Betrieb befüllen lassen, ist eine zeitlich unbegrenzte Stromversorgung möglich", meint Fitz.

Das Twin Datacenter des Rechenzentrumsbetreibers Akquinet könne sich "im Normalfall mindestens 72 Stunden selbst versorgen". Sind die Tanks – wie momentan aufgrund der Energiekrise – vollgetankt, könnten "noch einige Tage mehr überbrückt werden". Die Generatoren verbrennen 440 Liter Diesel pro Stunde. Akquinet hat mit Lieferanten vertraglich geregelt, dass das Datacenter nach spätestens 24 Stunden mit neuem Kraftstoff beliefert wird.

Die Bundesnetzagentur empfiehlt Rechenzentrumsbetreibern, die über sensible Kunden verfügen oder kritische Prozesse aufrechterhalten müssen, eine entsprechende Vorbereitung "für eine temporäre Unterbrechung der Versorgung mit Elektrizität", etwa durch Notstromaggregate oder Notfallpläne. Zwar gibt es Krisenpläne und Vorsorgemaßnahmen, dennoch besteht laut Bundesnetzagentur "zwischen Netzbetreibern, Verbänden und Behörden Konsens darüber, dass die Resilienz der Telekommunikationsnetze in Bezug auf diverse Bedrohungsszenarien und die aktuelle geopolitische Lage weiter gestärkt werden sollte".

Derzeit gibt es keine gesetzlichen Regelungen zur Notfallversorgung von Rechenzentren. Zwischen verschiedenen Kundengruppen könne allerdings gemäß der Bundesnetzagentur "analog des im Energiesicherungsgesetz vorgesehenen Maßstabs des lebenswichtigen Bedarfs" differenziert werden. Dabei sei zu berücksichtigen, welche Maßnahmen in einer konkreten Situation getroffen werden können, um eine Strommangellage "schnell, zuverlässig und für alle Betroffene auf schonende Weise" zu beenden.

Erst kürzlich haben die drei IT-Verbände eco, Bitkom und German Datacenter Association in einem Positionspapier gefordert, dass bei Versorgungsengpässen "systemrelevante IT-Infrastrukturen, die essenziell für die Funktionsfähigkeit unserer modernen Gesellschaft, Wirtschaft und des Staats sind, stärker berücksichtigt werden". Bisher ist laut eco-Geschäftsführer Alexander Rabe auch nicht geklärt, "ob Rechenzentren ihre Notstromaggregate im Falle länger andauernder Brownouts oder Blackouts länger laufen lassen dürfen, als gesetzlich erlaubt ist". Daher fordert Rabe, dass die Bundesnetzagentur zeitnah mit den Rechenzentrenbetreibern und Kommunen weitere Richtlinien für entsprechende Notfälle vereinbart.

In Abstimmung mit dem Bundesministerium für Digitales und Verkehr hatte die Bundesnetzagentur im August 2022 ein Strategiepapier zur Resilienz der Telekommunikationsnetze veröffentlicht. Darin werden auch die Auswirkungen eines flächendeckenden Stromausfalls thematisiert. Die Bundesnetzagentur empfiehlt einen "resilienten und nachhaltigen Ausbau der digitalen Infrastruktur", aber unter anderem auch die Festlegung rechtlicher Grundlagen. "So müssen geforderte und festgelegte technische und organisatorische Maßnahmen im Rahmen der Verhältnismäßigkeit entsprechend den Bedürfnissen und der Größe der jeweiligen Unternehmen angepasst sein". Klar sei dabei, dass nicht jedes Unternehmen jede Maßnahme gleichermaßen umsetzen könne. Ein Ziel des Strategiepapiers sei außerdem, "die Umsetzbarkeit der dargestellten Maßnahmen zu eruieren und die Verantwortlichkeiten zu bestimmen".

"Bei vielen Kommunen und Landkreisen gibt es derzeit noch keine klaren Regelungen, welches Rechenzentrum bei einer Strommangellage zu welchem Zeitpunkt nicht mehr mit Strom beliefert wird. Das erschwert Entscheidungen, weil die Kriterien wie die Größe des Rechenzentrums nicht zwingend ein Kriterium für die Systemrelevanz ist. So kann es laut eco-Verband dazu kommen, dass kleinere Rechenzentren formal zwar nicht als kritische Infrastruktur (Kritis) gelten, wegen ihrer Kunden aber dennoch systemrelevant sind.

Sollte es zu einem Einsatz der Notstromaggregate kommen, ist deren Einsatz für die meisten Rechenzentren begrenzt, teilweise auf nur 20-50 Betriebsstunden im Jahr. Dieses Limit wäre bei einer akuten, längerfristigen Strommangellage natürlich schnell erreicht. Die unter dem Dach des eco-Verbands der Internetwirtschaft gegründete Allianz zur Stärkung digitaler Infrastrukturen schlägt vor, Kontaktpunkte einzurichten, damit sich Kommunen und Unternehmen abstimmen, wer bei einer Mangellage mit Lastabwurf weiter versorgt wird. Wichtig dabei sei die Kommunikation mit örtlichen Behörden. Davon erhofft sich der eco-Verband, dass Maßnahmen gezielter getroffen werden können, etwa welche Teile der Infrastruktur weniger systemrelevant sind und zuerst keinen Strom mehr erhalten. Bisher gibt es in den meisten Bundesländern keine einheitlichen Regelungen dazu.

Sind Rechenzentren nicht mehr über Telekommunikationsnetze erreichbar, helfen die besten Vorkehrungen der Betreiber nichts. Entsprechend wichtig ist es, die Kommunikationsinfrastruktur aufrechtzuerhalten. Eine Störung oder ein Ausfall der Stromversorgung trifft die Funktionstüchtigkeit der Telekommunikationsnetze in der Regel sofort. In solchen Fällen sind Telekommunikationsdienste lediglich eingeschränkt oder gar nicht nutzbar – Notrufe teilweise nicht mehr möglich. Auch Warnmeldungen per Cell Broadcast funktionieren nur, wenn das Mobilfunknetz noch arbeitet. Schon in den ersten Stunden darf man erwarten, dass Mobilfunk- und Festnetze nur noch schlecht funktionieren – fest installierte Notstromgeräte sind derzeit nicht flächendeckend installiert. Fällt der Strom länger großflächig aus, stellen auch die Netze den Dienst ganz ein. Daher will die Bundesnetzagentur "bundesweit einheitliche Regelungen zur Notstromversorgung von Telekommunikationsnetzen etablieren".

Dass es tatsächlich zu einem Blackout kommt, hält Manuel Atug von der AG KRITIS für sehr unwahrscheinlich. Zunächst müssen große Energieabnehmer wie Aluminiumfabriken ihren Bedarf kurzfristig zurückfahren. Dieser sogenannte Lastabwurf ist mit solchen Großabnehmern auch vertraglich geregelt, also eine Pflicht. Anschließend wäre konzeptionell vorgesehen, dass regional abwechselnd kontrolliert der Strom abgeschaltet wird. Dies werde laut Atug aber vorher mit den Bürgerinnen und Bürgern kommuniziert. Deutlich risikoreicher sind unvorhergesehene Ereignisse: Besondere Naturereignisse, die möglicherweise zu einer zerstörten Infrastruktur oder überhitzten Klimaanlagen führen, stellen eine besondere Gefahr für Rechenzentren dar.

Noch in diesem Jahr will die Bundesregierung die Eckpunkte für ein Kritis-Dachgesetz verabschieden. Darin sollen Betreiber kritischer Infrastrukturen zu einem Risiko- und Krisenmanagement verpflichtet werden, Resilienzpläne erstellen sowie geeignete "technische und organisatorische Maßnahmen" ergreifen. Was genau damit gemeint ist, ist noch unklar. Dabei soll die Aufsicht über die jeweiligen Kritis-Sektoren den Bundesbehörden wie der Bundesnetzagentur und dem Bundesamt für Sicherheit in der Informationstechnik (BSI) obliegen. Wie genau das BSI und das Bundesamt für Bevölkerungsschutz und Katastrophenhilfe (BBK) zusammenarbeiten werden und ob das BBK für die Aufgaben gewappnet ist, bleibt ebenfalls unklar.

Update

Ergänzt, dass die Eckpunkte für ein Kritis-Dachgesetz verabschiedet werden sollen.

(mack)