Programa do Curso
Introdução
- Visão geral das características e da arquitetura do Spark e Hadoop
- Compreender os grandes volumes de dados
- Python noções básicas de programação
Primeiros passos
- Configurar o Python, o Spark e o Hadoop
- Compreender as estruturas de dados em Python
- Compreender a API PySpark
- Compreender o HDFS e o MapReduce
Integrando Spark e Hadoop com Python
- Implementar o Spark RDD em Python
- Processar dados usando MapReduce
- Criando conjuntos de dados distribuídos no HDFS
Machine Learning com Spark MLlib
Processando Big Data com Spark Streaming
Trabalhar com sistemas de recomendação
Trabalhar com Kafka, Sqoop, Kafka e Flume
Apache Mahout com Spark e Hadoop
Solução de problemas
Resumo e próximos passos
Requisitos
- Experiência com Spark e Hadoop
- Python experiência em programação
Público
- Cientistas de dados
- Programadores
Declaração de Clientes (3)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
I liked that it managed to lay the foundations of the topic and go to some quite advanced exercises. Also provided easy ways to write/test the code.
Ionut Goga - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
The live examples