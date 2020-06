Gremlin, Betreiber einer Chaos-as-a-Service-Plattform, hat sein Angebot um einen Status Check erweitert. Mit der Zustandsprüfung können Nutzer der Plattform offenbar die Stabilität ihres Systems überprüfen, bevor sie ein Chaos-Engineering-Szenario in die Tat umsetzen. Im Falle eines instabilen Systems soll das Prüfwerkzeug den experimentellen Code noch vor dem Start blockieren. Stößt die Prüfung auf keine Störungen, erhält das Szenario laut Release Notes grünes Licht und darf loslegen.

Bereits in der Vergangenheit hatte Gremlin von sich reden gemacht durch Failure as a Service für geplante (simulierte!) Attacken auf Container-Infrastrukturen im kontrollierten Raum. Zielgruppe waren damals wie auch jetzt offenbar DevOps-Teams, die sich für Fehlerszenarien im täglichen Betrieb wappnen möchten.

Systemcheck für experimentellen Code

Der Status Check soll Entwicklern von experimentellem Code eine zusätzliche Sicherheitsschicht bieten, um regelmäßige Durchführung und Automatisierung der Abläufe bei Chaos-Szenarien zu ermöglichen. Durch das neue Sicherheitstool sollen die Experimente abgesichert im Hintergrund laufen, während die Entwickler sich parallel anderen Aufgaben widmen können. Mit den Status Checks sei es möglich, den "Gesundheitszustand" der verwendeten Infrastruktur vor und nach dem Einsatz zu überprüfen – auch um sicherzustellen, dass Entwickler und Administratoren kein höheres Fehlerniveau in ein bereits labiles System einführen.

Konfiguration der Chaos-as-a-Service-Plattform mit dem neuen Status Check (Bild: Gremlin.com)

Chaosszenario mit Sicherheitsgurten

Im Menübereich können Nutzer ihr Szenario und die gewünschte Vorabprüfung offenbar detailliert konfigurieren, indem sie neben Angriffsszenarien nun auch das neue Feature hinzufügen können. Das neue Feature bietet in einem Drop-down-Menü drei Schnittstellen zur Auswahl, nämlich die von Datadog, New Relic und PagerDuty. Im nächsten Schritt lassen sich verschiedene Angriffsformen und optional weitere Statusprüfungen konfigurieren. Abschließend legen sie einen Zeitpunkt für die Durchführung ihres Szenarios fest (einmalig oder regelmäßig) und können die Durchführung per Knopfdruck anstoßen.

Auf der Seite des Anbieters finden Chaos-Ingenieure eine Dokumentation mit Fallbeispielen und einen Leitfaden für die ersten Schritte bei Chaos- beziehungsweise Failure as a Service. Weitere Details zum aktuellen Release lassen sich dem Blogeintrag von Gremlin entnehmen.

(sih)