Buchbesprechung: MLOps – Kernkonzepte im Überblick

Das Buch zeigt, wie sich ML-Modelle in die Praxis überführen und mithilfe von MLOps-Strategien kontinuierlich weiter verbessern und langfristig warten lassen.

Lesezeit: 5 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen
Buchbesprechung: MLOps – Kernkonzepte im Überblick

(Bild: Montri Thipsorn/Shutterstock.com)

Von
  • Tam Hanna

Mark Treveil und das Dataiku-Team
MLOps – Kernkonzepte im Überblick
Machine-Learning-Prozesse im Unternehmen nachhaltig automatisieren und skalieren
O'Reilly, August 2021
204 Seiten, ab 27,99 € (Buch, eBook)
ISBN: 978-3-96009-172-1

Machine Learning ist im Gartner-Hypecycle mittlerweile auf dem Plateau of Productivity angekommen: Das bedeutet im Jargon der Marktforscher, dass ML-basierte Prozesse inzwischen in zahlreichen Unternehmen "Werte schaffen", also konkret zum Geschäftserfolg beitragen. Damit einhergehen jedoch steigende Ansprüche an das Management der Prozesse – wildes Drauflosprogrammieren ist nicht mehr angesagt, wenn Kosten verursachende Probleme entstehen.

Die noch junge Disziplin MLOps ist eine neue Art des DevOps-Denkprozesses, die sich ausschließlich um die Arbeit mit Modellen und Systemen der künstlichen Intelligenz kümmert. Das nun bei O’Reilly erschienene Buch "MLOps – Kernkonzepte im Überblick" grenzt den Begriff von ModelOps und AIOps ab. Eine Autorengruppe rund um Mark Treveil und das Dataiku-Team tritt in dem von Marcus Fraaß ins Deutsche übersetzten Werk an, diese neue Wissenschaftsdisziplin en Detail zu erklären.

Wie im Fall von Cross-Plattform-Frameworks und anderen vergleichbaren Herausforderungen in der IT gilt auch bei MLOps ein entscheidender Grundsatz: Domänenverständnis ist beim Bewältigen der vorliegenden Aufgaben unbedingt erforderlich. Die Autoren starten ihre Überlegungen deshalb mit der konkreten Positionierung eines MLOps-Prozesses in der IT- und Geschäftsprozesslandschaft eines Unternehmens, um anschließend die verantwortlichen Stakeholder und die von ihnen zu bearbeitenden Komponenten eines MLOps-Prozesses zu benennen.

Da sich "MLOps – Kernkonzepte im Überblick" nicht als KI- respektive ML-Tutorium versteht, orientieren sich sämtliche Erklärungen viel mehr am verwaltungstechnischen "Wie". Schon im ersten Abschnitt fällt auf, dass das Autorenkollektiv seine Ausführungen konsequent mit anonymisierten Beispielen aus realen ML-Deployments beziehungsweise MLOps-Prozessen garniert.

DevOps-Prozesse gehen meist mit dem Verwalten des Lebenszyklus der von ihnen betreuten Softwarekomponenten einher. Der zweite Teil des Buchs beleuchtet daher den Entstehungs- und Betriebsprozess eines ML-Systems im Ganzen. Auch hier liegt der inhaltliche Fokus wieder stärker auf den rechtlichen Aspekten und der Projektumsetzung als auf der Programmierung.

Besonders lobenswert ist die Tatsache, dass sich das Autorenteam auch dem immer wichtiger werdenden Thema fairer und inklusiver Künstlicher Intelligenz widmet. Denn wer heutzutage ein KI-System einsetzt, muss damit rechnen, dass dessen Ergebnisse auch auf ihre Political Correctness hin beurteilt werden.

(Bild: O'Reilly)

Darüber hinaus sprechen die Autoren technische Probleme an, die im alltäglichen Betrieb eines ML-Modells auftreten. Das betrifft beispielsweise die permanente Überwachung der Modell-Performance: Ein ML-Modell muss sich stets auf variable Eingabedaten einstellen, die entweder aus einer Veränderung der realen Situation resultieren oder auch auf gezielte Angriffe zurückgehen können. In jedem Fall können diese Änderungen Schwankungen bei der Performance des Modells verursachen, die sich nur durch Überwachungs- und Sicherheitsprozesse erkennen und gegebenenfalls beheben lassen.

Fast schon beiläufig stellen die Autoren dabei auch Überlegungen dazu an, wie sich der Datenaustausch zwischen den von Data Scientists neu entwickelten Prototypen und den bereits in der Praxis genutzten stabilen ML-Modellen bewerkstelligen lässt.

Die Zusammenarbeit mit dem ML-Beratungsunternehmen Dataiku ermöglichte Treveil das Einbinden praktischer Beispiele, die nur in Bezug auf Firmennamen, Länder und Kundendaten anonymisiert wurden. Der dritte und letzte Teil des Werks präsentiert daher konkrete MLOps-Anwendungen in verschiedenen Industrien. Neben dem Analysieren und Vorhersagen der Ausfallrate von Verbraucherkrediten finden sich auch Überlegungen zur Prognose von Lasten im Stromversorgungssystem und dem Erzeugen von Empfehlungen für Marketingsysteme. Wie schon in den vorangehenden Kapiteln fokussiert sich das Buch auch bei diesen Beispielen auf das Tooling und die zur Anwendung der ML-Modelle verwendeten Prozesse.

Dem O’Reilly-Verlag ist die Übersetzung des vorliegenden Werks aus dem Englischen offenbar gut gelungen, denn der Text wirkt wie aus einem Guss und liest sich flüssig. "MLOps – Kernkonzepte im Überblick" liefert eine leicht verständliche Einführung, die das holistische Problem von MLOps umfassend beleuchtet. Dabei fokussieren sich die Autoren allerdings mehr auf MLOps als Prozess – weniger auf damit verbundene Entwicklungsverfahren. Wer eine Einführung in die Programmierung, verschiedene Modelltypen und ihr Training erwartet, sollte zu anderen Büchern greifen. Wer jedoch sein ML-Modell formalisiert in den produktiven Einsatz überführen möchte, findet wertvolle Hilfestellung, durch die sich das Buch in der Praxis schnell bezahlt machen könnte.

Tam Hanna
befasst sich seit dem Jahr 2004 mit Handcomputern und Elektronik. Derzeit liegt sein Fokus auf interdisziplinären Anwendungen von Informationstechnologie.

[Anmerkung d. Red.: O’Reilly, in Deutschland vertreten durch den dpunkt.verlag, als Herausgeber des Buchs ist Teil der Heise Gruppe]

(map)