heise-Angebot

Online-Workshop: Skalierbare Big-Data- und ML-Analysen mit Python und Spark

Data Scientists lernen in diesem Kurs, skalierbare Python-Programme für Big-Data-Analysen und ML-Anwendungen auf Basis von Apache Spark zu entwickeln.

12.01.2021, 08:45 Uhr

Lesezeit: 1 Min.

iX Magazin

Von

Dr. Oliver Diedrich

Apache Spark skaliert komplexe Datenanalysen und Machine-Learning-Anwendungen, die einen einzelnen Rechner überfordern, über einen Rechencluster. Die Software hat sich als Standardwerkzeug bei der Analyse großer Datenmengen etabliert. Über die PySpark-API lässt sich die Spark Engine aus Python-Programmen heraus ansprechen.

In dem zweitägigen Onlinekurs Big-Data-Analyse mit PySpark erhalten Sie in vielen Praxisübungen eine gründliche Einführung in das Spark-Framework. Sie lernen dabei, produktiv nutzbare, skalierbare Python-Anwendungen auf Grundlage von Spark zu entwickeln. Dabei lernen Sie Spark SQL zur Arbeit mit tabellarischen Daten, die Spark-Streaming-API, GraphX für Graphenberechnungen sowie Spark ML für maschinelles Lernen kennen.

Der Onlinekurs findet vom 25. bis 26. Januar 2021 mit der Online-Schulungsplattform BigBlueButton statt, sodass Sie bequem vom eigenen Schreibtisch aus teilnehmen können. Der Kurs ist auf maximal 15 Personen beschränkt; das garantiert eine intensive Betreuung und einen intensiven Austausch zwischen dem Referenten und den Teilnehmenden.

Der Informatiker Dr. Christian Staudt ist Freelance Data Scientist mit den Schwerpunkten Data Mining, Big Data, Machine Learning und KI. Teilnehmer sollten sichere Python-Grundkenntnisse und erste Erfahrungen mit Big-Data-Anwendungen mitbringen.

Weitere Informationen und Anmeldung: