Netflix gibt Helfer-Tool für die Störfallbehandlung als Open Source frei
Bei Dispatch ist der Name Programm. Das Netflix-Werkzeug kümmert sich um die Abfertigung und das Erledigen auftretender Störungen und Sicherheitsvorfälle.
Netflix kündigt an, Dispatch – ein Krisenmanagement-Orchestrierungs-Framework – als Open Source frei zur Verfügung zu stellen. Was genau sich hinter Dispatch verbirgt, erläutert Netflix mit dem Hinweis, das Werkzeug erledige für den Anwender ad-hoc all die Dinge, die im Zusammenhang mit Incident Management anfallen, sowie eine Reihe weiterer Dinge, die ebenfalls erledigt werden sollten, für die aber keine Zeit war.
Vereinfachtes Incident Management
Das Krisenmanagement ist ein komplexer vielstufiger Prozess, für dessen Bearbeitung in vielen Unternehmen bereits eine Reihe etablierter Werkzeuge im Einsatz sind – darunter beispielsweise Slack, Jira und GSuite. Mit Dispatch verfolgten die Netflix-Verantwortlichen allerdings nicht das Ziel, noch ein weiteres neues Tool zu bauen, das in Konkurrenz zu den vorhandenen tritt, sondern sie strebten nach eigener Aussage vor vorne herein eine möglichst tiefe Integration in die bestehenden Incident-Management-Prozesse an.
Dispatch behandelt dazu die wichtigsten Bereiche des Krisenmanagements vom eigentlichen Vorfall samt der damit verbundenen Daten und Metadaten über die verantwortlichen Bearbeiter und deren Kommunikation bis hin zu den Tools für die Bewältigung der Probleme und die anschließende Analyse zur Vorbereitung beziehungsweise Vermeidung vergleichbarer Vorfälle. Auf den typischerweise per automatisiertem Alarm oder eine Benachrichtigung gemeldeten Vorfall folgen in der Regel eine ganze Reihe von Aufgaben, die von Personen abgearbeitet werden müssen und die häufig mit wechselndem Kontext verbunden sind – dadurch ergibt sich eine hohe Komplexität, die die Problemlösung behindern kann.
Dispatch bindet vorhandene Tools ein
An diesem Punkt greift Dispatch als Krisenmanagement-Orchestrierungs-Framework unterstützend ein. Neben einer gemeinsamen API für Nutzer und Tools zentralisiert Dispatch auch sämtliche mit den Incidents in Verbindung stehenden Daten auf Basis einer einheitlichen Kommunikation und nimmt den verantwortlichen Bearbeitern das Daten-Management ab. Je nach Typ, Priorität und Beschreibung des Vorfalls bindet Dispatch automatisch die zuständigen Bearbeiter ein und verfolgt die Abfertigung. Gegebenenfalls stößt Dispatch auch ins Stocken geratene Prozesse neu an.
Dabei greift Dispatch direkt auf Tools wie Slack (für das Metadatenmanagement) und Google Doc/Google Drive (für das eigentliche Datenmanagement) zurück. Auch Werkzeuge wie Jira, PagerDuty oder VictorOps lassen sich einbinden – über Plug-ins können Dispatch-Anwender außerdem noch weitere gängige Tools nutzen. Dispatch selbst baut auf Python 3.8 mit FastAPI, VueJS UI und Postgres auf. Bei Netflix dient das Framework primär zur Behandlung von Sicherheitsvorfällen, lässt sich aber generell für jede Art des Incident Management einsetzen.
Weitere Informationen zu Dispatch hält Netflix in seinem Technology Blog, im GitHub Repository sowie in der zugehörigen Dokumentation parat. Wer Dispatch ausprobieren möchte, findet auf GitHub offizielle Bootstraps für Docker. (map)