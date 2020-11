ML mit Python in PostgreSQL Elefant trifft Schlange Marc Fiedler, Markus Herrmann Machine Learning muss nicht in eigens dafür aufgebauten Um­gebungen stattfinden. Sind die Kosten dafür zu hoch oder ist das Auslagern der Daten nicht erlaubt, ist der Einsatz von ML-Funktionen in der Datenbank selbst eine sinnvolle Option.

iX-tract Daten in Unternehmen liegen häufig in gewachsenen relatio­nalen Datenbank­systemen vor.

Wer moderne Machine-Learning-Verfahren auf solche Daten anwenden will, benötigt meist eine separate Analyseumgebung und damit verbundenen Datentransfer.

Eine günstige Alternative stellt das freie Datenbanksystem PostgreSQL in Verbindung mit in Python geschriebenen ML-Funktionen dar.

Moderne Applikationen integrieren zunehmend Machine-Learning-­Verfahren (ML), um Entscheidungen zu erleichtern und manuelle Prozesse zu automatisieren. Beispielsweise erhalten Besucher von Webseiten individuelle Vorschläge zum Kaufverhalten oder Alexa, Siri und Co. fungieren als virtuelle Assistenten.

Grundlage vieler dieser Verfahren sind statistische Modelle, die Situationen und Zusammenhänge beschreiben oder Vorhersagen für zukünftige Situationen treffen. Häufig wendet man sie bei der Analyse großer Datenmengen an (Big Data). In diesem Umfeld sind in den letzten Jahren Analyse-Frameworks entstanden, die es ermöglichen, verschiedene Datenquellen zu integrieren und mit ML-Funktionen zu analysieren. Ein prominenter Vertreter dieser Anwendungen ist Apache Spark [1].