Schulungsübersicht
Einführung
- Überblick über Spark und Hadoop Funktionen und Architektur
- Verstehen von Big Data
- Python Grundlagen der Programmierung
Erste Schritte
- Einrichten von Python, Spark und Hadoop
- Verstehen der Datenstrukturen in Python
- Verstehen der PySpark API
- Verstehen von HDFS und MapReduce
Integrieren von Spark und Hadoop mit Python
- Implementierung von Spark RDD in Python
- Datenverarbeitung mit MapReduce
- Erstellen von verteilten Datensätzen in HDFS
Machine Learning mit Spark MLlib
Verarbeitung von Big Data mit Spark Streaming
Arbeiten mit Recommender Systems
Arbeiten mit Kafka, Sqoop, Kafka und Flume
Apache Mahout mit Spark und Hadoop
Fehlersuche
Zusammenfassung und nächste Schritte
Voraussetzungen
- Erfahrung mit Spark und Hadoop
- Python Programmiererfahrung
Zielgruppe
- Datenwissenschaftler
- Entwickler
Erfahrungsberichte (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Kurs - Python, Spark, and Hadoop for Big Data
The live examples