Die freie Python-Library für Machine-Learning-Anwendungen scikit-learn ist in Version 1.0 erschienen. Der Sprung auf die erste Hauptversion soll laut dem Entwicklungsteam signalisieren, dass die Python-Bibliothek bereits seit geraumer Zeit stabil ist. Darüber hinaus gibt es im Vergleich zu den bisherigen Releases bis scikit-learn 0.24 keine großen Umbrüche oder Inkompatibilitäten.

Einer der wenigen Breaking Changes betrifft positionsgebundene Parameter, die ab sofort nicht mehr erlaubt sind. Sie gelten seit Version 0.23 als überholt (deprecated), sodass der Wegfall dem regulären Rhythmus entspricht, nachdem die Library Deprecations im übernächsten Release entfernt.

Viele Library-Funktionen haben zahlreiche Parameter, und im Interesse der Les- und Wartbarkeit setzt scikit-learn nun ausschließlich auf benannte Argumente wie loss="squared_error" oder max_iter=100 . Positionsparameter führen ab dem aktuellen Release zu einem TypeError . Wenige Ausnahmen gelten unter anderem für die Funktion zur Hauptkomponentenanalyse (englisch Principal Component Analysis, PCA), die mit genau einem Parameter für die Komponenten weiterhin ohne Namen als PCA(10) erlaubt ist. Das Hinzufügen eines Booleschen Werts für den zweiten Parameter copy führt jedoch zu einer Fehlermeldung.

Bei den Neuzugängen ist unter anderem der QuantileRegressor für die Quantilregression nennenswert, einem Regressionsmodell zur Vorhersage eines Schwellenwerts. Ebenfalls neu ist der SplineTransformer , der eine Spline-Basisfunktion eines bestimmten Grades mit einer festgelegten Anzahl von Knoten erstellt.

Im Zusammenspiel mit der Library pandas kann scikit-learn nun die Feature-Namen der Dataframes über das Attribut feature_names_in_ abrufen, wie in folgendem Listing aus dem Beitrag zur Veröffentlichung von scikit-learn 1.0: