Amazon Incident Manager: Mit AWS den Notfall planen

Für AWS führt Amazon ein neues Admin-Tool ein: Mit dem Incident Manager lassen sich IT-Vorfälle planen und aufarbeiten.

In Pocket speichern vorlesen Druckansicht
Blaulicht, Polizei
Lesezeit: 2 Min.

Als Incident Manager bezeichnet Amazon sein neues Administrationswerkzeug für seine AWS-Cloud. Es ist Teil des Systems Manager und soll Verantwortlichen sowohl beim Beheben von, als auch Vorbereiten auf IT-Notfälle helfen. Er soll sich für Ausfälle von Infrastrukturdiensten und von Applikationen eignen.

Zentrale Komponente sind die Response Plans, also Reaktionspläne. Sie fassen zusammen, wen man im Notfall kontaktiert, was diese Personen zu tun haben – auf Basis eines vorab abgefassten Handbuchs – und wie sie miteinander kommunizieren sollen. Personen und ihre Daten – zum Beispiel Telefonnummern und E-Mail-Adressen – lassen sich in den Kontakten und Escalation Plans, also Esaklierungsplänen zusammenfassen. Bei ersteren handelt es sich um die primären Ansprechpartner, letztere können bei Bedarf hinzugezogen werden.

Ein Beispiel-Dashboard, in dem der Incident Manager Ereignisse des Vorfalls zusammenfasst.

(Bild: Amazon Web Services, Inc.)

Ein Notfall lässt sich manuell oder automatisch auslösen, letzteres geschieht per AWS CloudWatch oder EventBridge. Anschließend erstellt der Incident Manager ein Dashboard, in dem die Administratoren den Vorfall überblicken können. Hier finden sich unter anderem Metriken aus CloudWatch, eine Zeitleiste des Notfalls und der getroffenen Maßnahmen – manuelle wie automatische –, das geplante Vorgehen laut Response Plan und der gegenwärtige Status in diesem. Außerdem fasst das Dashboard alle Kontakte und passende OpsItems aus dem Systems Manager zusammen.

Ist ein Vorfall behoben, kann der Incident Manager eine abschließende Analyse anfertigen. Administratoren können hierfür eine AWS-Vorlage heranziehen oder eine eigene erstellen. Aus der Basis dieser Auswertung soll sich das Vorgehen beurteilen lassen, damit Verantwortliche für künftige Vorfälle das geplante Vorgehen verbessern können. Details zum Incident Manager finden sich im AWS-Blog. Zum Start ist der Dienst in Europa in den Regionen Irland, Frankfurt und Stockholm verfügbar.

Siehe dazu auch:

(fo)