Programa do Curso

Introdução ao Google Colab e ao Apache Spark

  • Descrição geral do Google Colab
  • Introdução ao Apache Spark
  • Configurar o Spark no Google Colab

Processamento de dados com Apache Spark

  • Trabalhar com RDDs e DataFrames
  • Carregamento e processamento de grandes conjuntos de dados
  • Usando o Spark SQL para consultar dados estruturados

Análise avançada com o Spark

  • Aprendizagem automática com o Spark MLlib
  • Realização de análises de dados em tempo real
  • Computação distribuída com o Spark

Visualização e Collaboration em Google Colab

  • Integração do Colab com bibliotecas de visualização populares
  • Fluxos de trabalho colaborativos com notebooks do Colab
  • Partilhar e exportar resultados

Otimizar Big Data Fluxos de trabalho

  • Ajustar o Spark para desempenho
  • Otimizar a utilização da memória e do armazenamento
  • Escalonamento de fluxos de trabalho para grandes conjuntos de dados

Big Data na nuvem

  • Integrar o Google Colab com ferramentas baseadas na nuvem
  • Utilizar o armazenamento na nuvem para grandes dados
  • Trabalhar com o Spark em ambientes de nuvem distribuídos

Estudos de caso e melhores práticas

  • Revisão de aplicações de grandes volumes de dados do mundo real
  • Estudos de casos utilizando o Apache Spark e o Colab
  • Práticas recomendadas para análise de big data

Resumo e próximos passos

Requisitos

  • Conhecimento básico dos conceitos de ciência de dados
  • Familiaridade com Apache Spark
  • Python competências de programação

Público-alvo

  • Cientistas de dados
  • Engenheiros de dados
  • Investigadores que trabalham com grandes volumes de dados
 14 Horas

Número de participantes


Preço por Participante

Declaração de Clientes (5)

Próximas Formações Provisórias

Categorias Relacionadas