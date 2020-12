Apache Spark skaliert komplexe Datenanalysen und Machine-Learning-Anwendungen, die einen einzelnen Rechner überfordern, über einen Rechencluster. Die Software hat sich als Standardwerkzeug bei der Analyse großer Datenmengen etabliert. Über die PySpark-API lässt sich die Spark Engine aus Python-Programmen heraus ansprechen.

In dem zweitägigen Onlinekurs Big-Data-Analyse mit PySpark erhalten Sie in vielen Praxisübungen eine gründliche Einführung in das Spark-Framework. Sie lernen dabei, produktiv nutzbare, skalierbare Python-Anwendungen auf Grundlage von Spark zu entwickeln. Dabei lernen Sie Spark SQL zur Arbeit mit tabellarischen Daten, die Spark-Streaming-API, GraphX für Graphenberechnungen sowie Spark ML für maschinelles Lernen kennen.

Der Onlinekurs findet vom 25. bis 26. Januar 2021 mit der Online-Schulungsplattform BigBlueButton statt, sodass Sie bequem vom eigenen Schreibtisch aus teilnehmen können. Der Kurs ist auf 15 Personen beschränkt, sodass eine intensive Betreuung und der Austausch zwischen dem Referenten und den Teilnehmenden sichergestellt sind.

Der Referent Dr. Christian Staudt ist Freelance Data Scientist mit den Schwerpunkten Data Mining, Big Data, Machine Learning und KI. Teilnehmer sollten sichere Python-Grundkenntnisse und erste Erfahrungen mit Big Data-Anwendungen mitbringen. Bei Buchung bis zum 27.12. erhalten Sie 10 Prozent Frühbucherrabatt.

Weitere Informationen und Anmeldung:

(odi)