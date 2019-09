Der Mitte September erwartete Kernel kann die Reaktionsfreude einzelner Programme verbessern. Die Entwickler legen ein Feature älterer AMD-CPUs weitgehend lahm.

Das in der Nacht auf Montag, den 16. September erwartete Linux 5.3 bringt eine Vielzahl von Verbesserungen an der Infrastruktur des Kernels und der Unterstützung für Prozessor. Die wichtigsten im Kurzüberblick, bevor es in die Details geht:

Die neue "Zeitreisen"-Funktion kann automatisierte Tests beschleunigen.

Admins oder Entwickler können einzelne Programme jetzt speziell auszeichnen, um ihre Reaktionsfreude zu steigern oder die Leistungsaufnahme im Zaum zu halten.

Um Plattenplatz zu sparen, dürfen jetzt die Firmware-Dateien gepackt vorliegen, die viele Treiber bei der Hardware-Initialiserung brauchen.

Durch Aufnahme einer kleinen Änderung hat Linus Torvalds signalisiert, in nächster Zeit die im Realtime-Zweig (RT-Tree) entwickelten Änderungen aufnehmen zu wollen, die Linux zu Echtzeitfähigkeiten verhelfen.

Weil es bei älteren AMD-CPUs ein bekanntes Problem bei der Zufallszahlenanforderung per RDRAND() gibt, versteckt der Kernel fortan die Verfügbarkeit dieser x86-Instruktion.

Beim Schreiben von Programmen für die BPF Virtual Machine des Kernels können Entwickler jetzt Schleifen verwenden, wie man es aus anderen Programmiersprachen kennt.

Der neue Kernel unterstützt eine Handvoll Features, die Intel in jüngst vorgestellte oder bald erwartete Prozessoren einbaut.

Linux läuft jetzt auch auf der x86-Prozessorarchitektur der chinesischen Firma Zhaoxin.

Linux jetzt mit "Zeitreisen"-Funktion

User Mode Linux (UML), mit dem Linux als regulärer Prozess unter einem anderen Linux laufen kann, bietet jetzt eine "Zeitreisen"-Funktion – allerdings keine echte, denn durch den neuen "Time Travel Mode" kann die Uhr in einer UML-Umgebungen nur langsamer oder schneller als in Wirklichkeit laufen. Das Feature stammt von einem Entwickler, der damit Tests von Zeitüberschreitungen zügiger durchführen möchte. Die automatischen Tests für die Access-Point-Software Hostap wissen den Time Travel Mode bereits zu nutzen (1, 2, 3).



Speicherplatz durch Packen sparen

Distributoren und Nutzer können Firmwaredateien jetzt per xz -C crc32 komprimieren, denn Linux 5.3 kann so gepackte Dateien beim Laden selbst entpacken. Damit lässt sich der Speicherplatz für die Firmware reduzieren, ohne die viele Treiber die jeweilige Hardware nicht initialisieren können. Durch das Packen konnte der zuständige Entwickler den für Firmware-Dateien benötigten Speicherplatz auf seinem System von 419 auf 130 MByte reduzieren.

Prozesse schneller oder effizienter abarbeiten

Über das "Scheduler Utilization Clamping" (Uclamp) können Admins oder Entwickler jetzt einzelne Programme speziell auszeichnen, um deren Reaktionsfreude zu steigern oder die Leistungsaufnahme im Zaum zu halten. Letztlich kann man über die neue Funktion einen Prozess, der den Hauptprozessor wenig belastet, so kennzeichnen, als würde er die CPU stärker fordern. Dadurch steigt die Chance, dass der Scheduler den Prozess an einen schnellen Prozessorkern schickt In anderen Fällen kann es den Kernel auch dazu bewegen, die Taktfrequenz des zuständigen CPU-Cores zeitnah zu steigern. Der Prozess erledigt die Arbeit dann zackiger, wodurch sich das System schneller und interaktiver anfühlt. Google denkt offenbar darüber nach, die Funktion bei Android einzusetzen.

Weniger wichtige, aber CPU-hungrige Prozesse lassen sich via Uclamp auch so kennzeichnen, als würden sie den Prozessor weniger nutzen, als sie es tatsächlich tun. Dadurch versucht der Kernel die Arbeit dann mit einem Prozessorkern auszuführen, der generell besonders sparsam arbeitet; alternativ kann er sich auch entscheiden, den Prozessor vom schnellsten in einen möglichst effizienten Betriebsmodus zu schalten.

Über normale Prioritäten lässt sich Vergleichbares oft nicht erreichen: Diese wirken sich nur bedingt auf die Wahl von Prozessorkern und deren Betriebszustand aus, denn dabei spielen andere Faktoren eine größere Rolle. Vor allem vom Kernel per Load Tracking erfasste Daten, durch die er weiß, wie lange und stark ein Prozess die CPU typischerweise nutzt. Durch sie führt der Kernel einfache und typischerweise nur kurz laufende Prozesse eher mit langsameren CPU-Kernen aus, obwohl es für das Interaktivitätsgefühl besser wäre, wenn er sie einem schnelleren Kern zuteilen würde.

Einstellbar sind die Clamping-Werte über den Syscall sched_setattr(). Patches, um die Werte auch bei Control Groups (Cgroups) festlegen zu können, sind noch in Arbeit. Weitere Details zum Ganzen liefern die Kommentare einiger Uclamp-Patches (1, 2, 3, 4, 6, 7, 8, 9, 10) sowie der ein Jahr alte LWN.net-Artikel "Scheduler utilization clamping".

Finetuning für mehr Perfomance

Gerade Systeme mit vielen Prozessorkernen sollen von einigen Änderungen profitieren, die Performance und Fairness der an vielen Stellen des Kernels genutzten Reader Writer Semaphores (rwsem) erheblich verbessern (u. a. 1, 2, 3, 4, 5, 6, 6). Laut den Commit-Kommentaren legen einige Benchmarks, mit denen der Entwickler gezielt die Vorteile der Patches zeigen will, durch die Umbauten um eine Größenordnung zu; einzelne Tests sogar um zwei.

Linux unterstützt jetzt auch die mit PCIe 5.0 definierte Übertragungsgeschwindigkeit mit 32 GT/s.

Zufallszahlengenerator-Probleme bei AMD

Linux versteckt den Zufallszahlengenerator älterer AMD-Prozessoren, denn auf einzelnen Boards arbeitet er nach den Suspend fehlerhaft. (Bild: git.kernel.org – c49a0a80137c

Bei AMD-CPUs der älteren Familien 15h (Bulldozer) und 16h (Jaguar) versteckt Linux in /proc/cpuinfo nun die Unterstützung für die x86-Instruktion RDRAND(), über die Programme Zufallszahlen anfordern können. Viele Programme nutzen den Zufallszahlenzahlengenerator dadurch nicht mehr, obwohl sie es prinzipiell könnten. Mit der Zufallszahlen-Problematik der Ryzen-3000-CPUs, die jüngst Aufmerksamkeit erregte, hat das Ganze indes so gut wie nichts zu tun.

AMDs Kernel-Entwickler haben sich zu dieser Maßnahme entschlossen, weil der Random Number Generator (RNG) bei einer Reihe von Boards für 15h- und 16h-CPUs keine Zufallsdaten mehr liefert, nachdem das System aus dem Bereitschaftsmodus (Suspend) aufwacht. Das liegt nicht an den CPUs, sondern an Fehlern in den BIOSen, was unter anderem zu einem Problem mit Systemd geführt hat. Linux kann das Fehlverhalten allerdings nicht beim Booten erkennen; AMDs Kernel-Entwickler haben sich daher entschlossen, die Verfügbarkeit von RDRAND() auch bei korrekt arbeitenden Systemen zu verstecken. Dies lässt sich aber über den neuen Parameter rdrand=force unterbinden.

Linux soll endlich Echtzeitfähigkeiten erhalten

Die bislang extern im "RT-Tree" gepflegten Änderungen, die aus Linux einen Realtime-Kernel machen, sollen bald in den offiziellen Kernel einfließen. Das gilt mit Linux 5.3 als sicher, nachdem Entwickler vor knapp 15 Jahren erste Patches mit diesem Ziel veröffentlicht haben. Damals mussten sie noch Spott von Linus Torvalds ertragen, denn es erschien unstemmbar viel Aufwand, Echtzeitfähigkeiten sauber in Linux einzubauen; daher war immer unklar, ob je alle Realtime-Patches in den offiziellen Kernel umziehen würden.

Die Entwickler ließen sich davon nicht beirren lassen und schufen mit dem RT-Tree schon bald einen Linux-basierten Realtime-Kernel, der Anklang bei Unternehmen fand. Diese setzen ihn etwa bei Robotern oder der Maschinensteuerung ein: Echtzeitfähigkeiten sind dort gefragt, um bestimmte Aufgaben immer in einer vorher festgelegten Zeitspanne auszuführen – also auch, wenn irgendetwas anderes das System gerade immens fordert. Dazu braucht es unter anderem Reaktionszeiten im unteren Millisekundenbereich, die Linux durch die RT-Patches garantierten kann.

Viele Verbesserungen, die für den RT-Tree entstanden, zogen über die Jahre bereits in den offiziellen Kernel um, weil sie Linux auch für andere Einsatzgebiete attraktiver machten. Unter die Änderungen waren immer mal wieder auch größere Umbauten, die Torvalds erst strikt und lautstark abgelehnt hatte, wenig später dann aber doch ohne Murren akzeptierte. Der RT-Tree enthält dadurch heute gar nicht mehr besonders viele Patches, dafür aber einige kontroverse – teilweise, weil sie zentrale und daher kritische Infrastruktur des Linux-Kernels betreffen, bei der die Entwickler besondere Vorsicht walten lassen.

Patch der Realtime-Entwickler hat vorerst nur Signalwirkung

Die neue Option zum Bau eines Realtime-Kernels zeigt sich bislang noch nicht, denn sie soll vor allem eines haben: Signalwirkung. (Bild: c't/Thorsten Leemhuis)

Für Linux 5.3 hat Linus Torvalds eine Änderung in den offiziellen Kernel integriert, die seit den Anfangstagen im RT-Zweigs stecken und ihn quasi definiert: Den kleinen, aber zentralen Patch, der die Konfigurationsoption CONFIG_PREEMPT_RT nachrüstet – also die Einstellmöglichkeit, um beim Kernel-Bau festlegen zu können, ob das resultierende Kernel-Image denn Realtime-Fähigkeiten bieten soll. Diese Option für einen "Fully Preemptible Kernel (Real-Time/RT)" zeigt sich aber vorerst nicht, denn dazu müssen noch weitere Änderungen aus dem RT-Tree folgen. Die Aufnahme richtet sich nämlich vor allem an Kernel-Entwickler, denen die Änderung signalisieren soll: Sperrt euch nicht grundlos gegen die Aufnahme der verbliebenen RT-Patches, denn Linus Torvalds steht dieser Tage voll hinter der Idee, Realtime-Support in den offiziellen Linux-Kernel einzubauen.

Wie schnell das jetzt gelingt, bleibt abzuwarten. Im Herbst 2018 hatten die RT-Entwickler noch verkündet, alle wesentliche Änderungen im Jahr 2019 in den offiziellen Linux-Kernel zu überführen. Mittlerweile wirkt dieses Ziel äußerst ambitioniert und scheint kaum noch zu schaffen.

Für Heimnutzer und Server-Admins ist die Echtzeitfähigkeit von Linux indes nur bedingt relevant: Für Realtime-Support ausgelegte Kernel-Images reagieren zwar zackiger, schneiden aber genau wegen der größeren Reaktionsfreude oft schlechter in Durchsatztests ab. Bei Debian, Fedora, Ubuntu & Co. werden sich Realtime-Funktionen daher wohl nur in optionalen Kernel-Images finden, nicht aber in den standardmäßig verwendeten.

Endlich ordentliche Schleifen bei der BPF-Programmierung

Beim Schreiben von Programmen für die BPF Virtual Machine des Kernels können Entwickler jetzt Schleifen ganz normal verwenden, wie man es aus anderen Programmiersprache kennt. Bislang ließen sie sich allenfalls nutzen, wenn der Compiler die Schleifen per #pragma unroll zuerst aufgelöst hat. Das war nötig, denn der BPF Verifier hat Loops bislang abgewiesen; damit schützte er Linux vor böswilliger Software, die den Prozessor mit Endlosschleifen vereinnahmt und den Kernel so aus dem Tritt bringt.

Diese Gefahr unterbindet die BPF-Prüfschicht jetzt, indem sie den Ablauf von Schleifen komplett simuliert. Dafür müssen die Schleifen allerdings endlich sein und sie dürfen das Programm nicht so stark aufblähen, dass es mehr als die maximal erlaubten Instruktionen ausführen würde. Dies und einige andere für "Bounded Loops" entstandenen Detailverbesserungen erleichtern das Schreiben von BPF-Programmen, die in einigen Bereichen immer populärer werden -- etwa zur besonders effizienten Handhabung von Netzwerkpaketen per XDP (eXpress Data Path) oder Tracing- und Performance-Analysen mit BCC oder Bpftrace.

Support für neue Prozessorfunktionen von Intel

Dank Support für die Intel Speed Select Technology (ISST) können Admins das Stromsparverhalten einiger moderner Xeon-Prozessoren in Zukunft besser an die jeweiligen Gegebenheiten und Bedürfnisse anpassen.

Linux unterstützt die jüngst definierten x86-Instruktionen UMONITOR, UMWAIT und TPAUSE, die Intel bald in Server-Prozessoren unterstützen will (1, 2, 3, 4, 5). Programme können mit ihnen kurzzeitig warten, belasten dabei die CPU aber nicht mit unnützer Arbeit, wie es die bislang in solchen Situationen oft verwendeten Busy Loops tun. Details dazu liefert der LWN.net-Artikel "Short waits with umwait"

Ab Linux 5.3 handhabt der Kernel die Multi-Die Topology einiger High-End-CPUs von Intel besser. Das ist für bestmögliche Geschwindigkeit wichtig, damit der Kernel Prozesse und die von ihnen verwendenden Arbeitsspeicherbereiche möglichst nahe beieinander hält.

x86-CPUs von Zhaoxin & CPU-Frequenz-Treiber für den Raspi

Neu dabei ist auch der Support für die x86-Prozessorarchitektur der chinesischen Firma Zhaoxin, die das Design der früher von VIA produzierter x86-Prozessoren wie C3, C7 und Nano weiterentwickelt.

Durch einen Cpufreq-Treiber für den Raspberry Pi kann Linux jetzt die Firmware bitten, den Prozessor des populären Einplatinencomputers mit einer bestimmten Frequenz zu betreiben. Die Firmware, die ohne den Treiber autark entscheidet, kann sich allerdings über den Wunsch hinwegsetzen.

Linux 5.3 bringt Code zum Betrieb unter der Virtualisierungslösung ACRN mit. Dabei handelt es sich um einen Hypervisor, der vor allem für den Echtzeiteinsatz und sicherheitskritische Systeme gedacht ist. Er wird in einem Projekt vorangetrieben, dem die Linux Foundation hilft.

Der Mainline-Kernel unterstützt nun auch das mit i.MX8MQ-Prozessor ausgestattete Board, das Purism mit dem Entwicklerkit für seine Linux-Smartphones Librem5 vertreibt. Das ist aber nur eine von über ein Dutzend mit ARM- oder ARM64-Prozessor ausgestatteten Platinen, die Linux fortan anzusprechen weiß; die anderen nennt ein Git-Merge-Kommentar, der auch darauf hinweist, dass viele Boards die bei Linux 5.2 dazugestoßenen Treiber für Mail-GPUs von ARM jetzt automatisch laden.