Apache Spark skaliert komplexe Datenanalysen und Machine-Learning-Anwendungen, die einen einzelnen Rechner überfordern, über einen Rechencluster. Die Software hat sich als Standardwerkzeug bei der Analyse großer Datenmengen etabliert. Über die PySpark-API lässt sich die Spark Engine aus Python-Programmen heraus ansprechen.

In dem zweitägigen Onlinekurs Big-Data-Analyse mit PySpark erhalten Sie in vielen Praxisübungen eine gründliche Einführung in das Spark-Framework. Sie lernen dabei, produktiv nutzbare, skalierbare Python-Anwendungen auf Grundlage von Spark zu entwickeln. Dabei lernen Sie Spark SQL zur Arbeit mit tabellarischen Daten, die Spark-Streaming-API, GraphX für Graphenberechnungen sowie Spark ML für maschinelles Lernen kennen.

Der Onlinekurs findet vom 29. bis 30. März 2021 mit der Online-Schulungsplattform BigBlueButton statt, sodass Sie bequem vom eigenen Schreibtisch aus teilnehmen können. Der Kurs ist auf maximal 15 Personen beschränkt; das garantiert eine intensive Betreuung und einen intensiven Austausch zwischen dem Referenten und den Teilnehmenden. Bei Buchung bis zum 28.2. winken 10% Frühbucherrabatt.

Der Informatiker Dr. Christian Staudt ist erfahrener Data Scientist mit den Schwerpunkten Data Mining, Big Data, Machine Learning und KI. Teilnehmer sollten sichere Python-Grundkenntnisse und erste Erfahrungen mit Big-Data-Anwendungen mitbringen.

