Azure: Ubuntu-VMs durch systemd-Update lahmlegt, Kubernetes-Services gestört

Ein Bug im aktualisierten systemd-Paket führte in Ubuntu-VMs mit Version 18.04 zu einem DNS-Fehler. Das störte auch große Teile von Azures Kubernetes-Diensten.

Lesezeit: 2 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 50 Beiträge

(Bild: heise online)

Von
  • Philipp Steevens

Ein aktuelles systemd-Update erzeugt auf virtuellen Maschinen mit Ubuntu Bionic Beaver (Version 18.04) einen Fehler beim Auflösen von DNS-Anfragen. Version 237-3ubuntu10.54 von systemd enthält einen Bug, der zum Abbruch von Netzwerkverbindungen führt. Das automatische Aufspielen des Updates auf VMs in Azure führte zu diversen Ausfällen. Insbesondere der Azure Kubernetes Service (AKS) ist global stark betroffen. Die Teams von Ubuntu und Azure arbeiten am Beheben des Fehlers und seiner Auswirkungen. Das Problem ist auf Ubuntu 18.04 beschränkt.

Das Canonical / Ubuntu-Team nennt auf Launchpad zwei mögliche Workarounds. Entweder starten betroffene Nutzer ihre Instanzen neu, oder geben udevadm trigger -cadd -yeth0 && systemctl restart systemd-networkd als root ein. Als Ausgangspunkt identifizierten die Entwickler open-vm-tools, aus dem der udevadm trigger kommt. Durch die Art wie der driver-Match in Azure für das Netzwerken eingerichtet ist, geht das Schlüssel-Wert-Paar verloren, wenn man den udevadm trigger ausführt. Das führt zum Verlust der DNS-Informationen beim Server.

Das Ausfallen der Netzwerkverbindung von Ubuntu-VMs mit Bionic Beaver führt in Azure global noch immer zu Problemen mit Kubernetes und Containern. Die Abbildung zeigt die in Europa betroffenen Regionen.

(Bild: Microsoft)

Bei Microsoft arbeitet das Team von Azure daran, den Kubernetes Service wiederherzustellen. Eine automatische Wiederherstellung konnte einen Großteil der Cluster reparieren, einzelne Knoten widersetzen sich laut Azure-Angaben jedoch weiterhin. Bis zum Finden einer Problemlösung hat, ist das systemd-Update auf Azure ausgesetzt. Nach Angaben des Ubuntu-Teams ist der Fehler vor zwei Jahren als Bug 1902960 schon einmal aufgetreten.

Die aktuelle Lage bei Azure findet sich auf der Statusseite, der Bericht von Ubuntu auf Launchpad.

Update/Korrektur: Im Einstiegstext stand ursprünglich "ein Bug in einer neuen systemd-Version" Es handelt sich aber um einen Bug im systemd-Paket von Canonical. Der Einstieg wurde entsprechend angepasst. Dank an Thorsten Leemhuis. (ulw) (pst)