Programa do Curso
Introdução ao Google Colab e ao Apache Spark
- Descrição geral do Google Colab
- Introdução ao Apache Spark
- Configurar o Spark no Google Colab
Processamento de dados com Apache Spark
- Trabalhar com RDDs e DataFrames
- Carregamento e processamento de grandes conjuntos de dados
- Usando o Spark SQL para consultar dados estruturados
Análise avançada com o Spark
- Aprendizagem automática com o Spark MLlib
- Realização de análises de dados em tempo real
- Computação distribuída com o Spark
Visualização e Collaboration em Google Colab
- Integração do Colab com bibliotecas de visualização populares
- Fluxos de trabalho colaborativos com notebooks do Colab
- Partilhar e exportar resultados
Otimizar Big Data Fluxos de trabalho
- Ajustar o Spark para desempenho
- Otimizar a utilização da memória e do armazenamento
- Escalonamento de fluxos de trabalho para grandes conjuntos de dados
Big Data na nuvem
- Integrar o Google Colab com ferramentas baseadas na nuvem
- Utilizar o armazenamento na nuvem para grandes dados
- Trabalhar com o Spark em ambientes de nuvem distribuídos
Estudos de caso e melhores práticas
- Revisão de aplicações de grandes volumes de dados do mundo real
- Estudos de casos utilizando o Apache Spark e o Colab
- Práticas recomendadas para análise de big data
Resumo e próximos passos
Requisitos
- Conhecimento básico dos conceitos de ciência de dados
- Familiaridade com Apache Spark
- Python competências de programação
Público-alvo
- Cientistas de dados
- Engenheiros de dados
- Investigadores que trabalham com grandes volumes de dados
Declaração de Clientes (5)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Curso - ArcGIS Fundamentals
Exercício de laboratório
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Curso - Automated Monitoring with Zabbix
Máquina Traduzida
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Curso - QGIS for Geographic Information System
Gostei do estilo do Pablo, do facto de ter abordado muitos assuntos, desde a conceção de relatórios, personalização com html até à implementação de algoritmos ML simples. Good equilíbrio informação teórica / exercícios. O Pablo cobriu realmente todos os tópicos que me interessavam e deu respostas completas às minhas perguntas.
Cristian Tudose - SC Automobile Dacia SA
Curso - Advanced Data Analysis with TIBCO Spotfire
Máquina Traduzida
Actual application of spotfire and all basic functions.