Datenbanksystem PostgreSQL: Machine-Learning-Funktionen per Python nutzen

Mit Python lassen sich Machine-Learning-Funktionen auf das freie Datenbanksystem PostgreSQL anwenden.

Lesezeit: 7 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen
Von
  • Marc Fiedler
  • Markus Herrmann
Inhaltsverzeichnis

Moderne Applikationen integrieren zunehmend Machine-Learning-Verfahren (ML), um Entscheidungen zu erleichtern und manuelle Prozesse zu automatisieren. Beispielsweise erhalten Besucher von Webseiten individuelle Vorschläge zum Kaufverhalten oder Alexa, Siri und Co. fungieren als virtuelle Assistenten.

Grundlage vieler dieser Verfahren sind statistische Modelle, die Situationen und Zusammenhänge beschreiben oder Vorhersagen für zukünftige Situationen treffen. Häufig wendet man sie bei der Analyse großer Datenmengen an (Big Data). In diesem Umfeld sind in den letzten Jahren Analyse-Frameworks entstanden, die es ermöglichen, verschiedene Datenquellen zu integrieren und mit ML-Funktionen zu analysieren. Ein prominenter Vertreter dieser Anwendungen ist Apache Spark .

Liegen die Daten nicht in Data Warehouses oder analytischen Datenbanken, erfordert ihre Bereitstellung den Transfer in eine separate Analyseumgebung, in der Modellierung und Berechnung stattfinden. Dieser Vorgang heißt "Extract –Transform – Load" (ETL).

Immer mehr Wissen. Das digitale Abo für IT und Technik.

  • Zugriff auf alle Inhalte von heise+
  • exklusive Tests, Ratgeber & Hintergründe: unabhängig, kritisch fundiert
  • c't, iX, Technology Review, Mac & i, Make, c't Fotografie direkt im Browser lesen
  • einmal anmelden – auf allen Geräten lesen - monatlich kündbar
  • erster Monat gratis, danach monatlich 9,95 €
  • Wöchentlicher Newsletter mit persönlichen Leseempfehlungen des Chefredakteurs
GRATIS-Monat beginnen Jetzt GRATIS-Monat beginnen Mehr Informationen zu heise+