Wer im Kontext moderner, skalierbarer Umgebungen mit dem Thema Monitoring zu tun hat, hat sich in den vergangenen Jahren eher mit Diensten wie InfluxDB, Prometheus und Grafana beschäftigt. Für die konventionellen Monitoring-Monolithen wie Nagios oder Zabbix ist das ein Problem: nicht nur, dass ihnen ein Teil des Monitoring-Kuchens entgeht.

Mindestens so sehr stört sie, dass ihre Kernprodukte als alt, träge und einfach nicht mehr zeitgemäß gelten. Zabbix will mit der frisch veröffentlichten Version 6.0 seiner Software den Beweis antreten, dass sie auch für moderne, dynamische Umgebungen das Rückgrat in Sachen Monitoring sein kann. Über Zabbix-Admins ergießt sich ein echtes Füllhorn an Neuerungen.

Hochverfügbarkeit ohne Bastelei

Zu den größten Kritikpunkten bei Zabbix zählte stets, dass es keine einfache Möglichkeit bot, mehrere Zabbix-Instanzen in einem Hochverfügbarkeitssetup zu betreiben. Diesen Missstand beseitigt die neue Version: Entsprechend konfiguriert machen die Zabbix-Instanzen sich ihre HA-Einstellungen miteinander aus und funktionieren im Anschluss wie ein typischer HA-Cluster. Der Skalierbarkeit in die Breite nutzt das jedoch nicht: Weiterhin kann aus einem Verbund von Zabbix-Instanzen nur eine die aktive Rolle einnehmen. Fällt diese aus, tritt jedoch eine andere Instanz nahtlos an ihre Stelle.

Zabbix unterstützt bereits seit einigen Versionen die Überwachung der sogenannten Services. Dabei handelt es sich nicht etwa um einzelne Dienste auf einzelnen Systemen, sondern eher um logische Dienste. In einem typischen Loadbalancer-Setup ist es etwa nicht notwendig, den Admin um 3 Uhr in der Nacht aus dem Bett zu klingeln, weil ein Backend des Loadbalancers den Geist aufgegeben hat; der (logische) Dienst "Website" wäre in diesem Beispiel ja weiterhin verfügbar. Bis dato richteten Admins Services in Zabbix ein, indem sie ihnen eine Vielzahl von "Child Processes" anhängten, für die einzelne Parameter konfigurierbar waren. Das ändert sich in Zabbix 6.0, denn nun geschieht die Zusammenfassung zu Services auf Grundlage von Tags. Läuft ein Monitoring-Check, der zu einem solchen Service gehört, in Probleme, propagiert Zabbix letztere bis zum Service hin, wo dann die Entscheidung über eine eventuelle Alarmierung fällt. Das vereinfacht vorrangig die Konfiguration, weil sich pro Dienst Tags definieren lassen, die dann auf der Zabbix-Ebene nach entsprechender Konfiguration ohne weiteres Zutun zum Teil des Services werden.

Verbessert haben die Entwickler zudem die Anzeige von Problemen für einen Service in der Zabbix-Weboberfläche. Hier existiert nun das Feld "Root Cause Analysis", das dem Admin schnell verrät, wieso ein Dienst gerade ein Problem hat. Neu ist obendrein die Option, eine definierte Zielgruppe nicht nur bei Alarmen für einen Service per Notification automatisch zu benachrichtigen, sondern das auch bei anderen Statusänderungen des Services zu tun. Insgesamt hat der Service-Layer von Zabbix in der Version 6.0 also eine ganze Reihe von Änderungen erfahren – wer viel auf Services setzt, profitiert vom Update mithin besonders.

Das GeoMap-Widget, das in Zabbix 6.0 Einzug in die Software hält, zeigt die geografische Position von Hosts an.

Auf der Jagd nach Prometheus & Co.

Auch an anderer Stelle machen die Zabbix-Entwickler offensichtlich, dass man sich der Konkurrenz von Prometheus & Co. – also den Zeitreihendatenbanken – nicht kampflos ergeben möchte. Praktisch lässt sie sich ja mittlerweile sogar nutzen, um Metrikdaten direkt aus Zabbix aufzuzeichnen. Woran es bisher eindeutig hakte, war allerdings eine Option, Zeitreihendaten grafisch aufzubereiten und per Query-Sprache abzufragen. Zabbix 5.4 hatte hier bereits eine Menge von Funktionen nachgeliefert und Version 6.0 aktualisiert viele seiner Makros, um diese Daten leichter nutzbar zu machen.

Überhaupt zeigt sich die 6.0 an vielen Stellen angriffsfreudig im Hinblick auf die Konkurrenz: Für die Auswertung von Prometheus-Daten, die sich ebenfalls in Zabbix ablegen lassen, stehen etliche neue Funktionen zur Verfügung. Dazu gehört sogar ein Feature, das bei Prometheus selbst aktuell nur mit viel Bastelei zu haben ist, nämlich die Anomalie-Erkennung auf Grundlager spezieller Algorithmen.

Diese ermitteln aus den eingehenden Daten Schwellenwerte für Abweichungen von den Normwerten, um besonders drastische Ausreißer zu erkennen. So kann Zabbix 6.0 Alarm schlagen, wenn die Daten für einzelne Metriken vom durchschnittlichen Langzeitwert in spezifischer Weise abweichen – etwa wenn der Z-Wert, der die Abweichung von der Norm angibt, außerhalb des 66., 97. oder 99,7. Perzentils der Abweichungen vom Durchschnittswert liegt. Solche Abweichungen deuten oft auf stille Angriffe im Hintergrund hin, ein Blick des Admins kann also nicht schaden.

Viele Verbesserungen im Detail

Darüber hinaus bringt Zabbix 6.0 viele kleine Verbesserungen. Das Web-UI bietet nun etwa ein Geo-Location-Plugin für die von Zabbix überwachten Hosts. Ferner unterstützt die Version 6.0 Regular Expressions auf Basis der PCRE2-Definition. Für moderne Software wie Kubernetes gibt es eine Reihe zusätzlicher Templates, die verschiedene Checks enthalten. Auch für diverse Hardware, allen voran Geräten von MikroTik, bietet Zabbix 6.0 deutlich bessere Unterstützung.

Eine ausführliche Zusammenfassung aller Änderungen in Zabbix 6.0 bieten die Entwickler in den Release Notes. Die Software steht wie üblich auf der Website von Zabbix zum Download bereit. Das freie Projekt steht unter der Open-Source-Lizenz GPLv2.

