Programa do Curso

Introdução

  • Visão geral de Databricks e Apache Spark
  • Compreender a arquitetura Databricks

Primeiros passos

  • Configurar o ambiente
  • Instalação e configuração de Databricks
  • Navegar na interface de utilizador de Databricks
  • Criar um espaço de trabalho Databricks

Trabalhar com dados em Databricks

  • Ligar a uma fonte de dados Apache Spark
  • Compreender as colunas e os tipos de dados básicos
  • Gerir o sistema de ficheiros nos Notebooks

Gerir tarefas e clusters

  • Criar e configurar clusters
  • Criando trabalhos usando o Notebook
  • Executar tarefas
  • Visualizar trabalhos e detalhes de trabalhos

Usando o Delta Lake em Databricks

  • Carregando dados no Lago Delta
  • Gerir dados no Delta Lake

Protegendo Databricks

  • Gerir a segurança Databricks
  • Gerir a cópia de segurança e a recuperação

Resolução de problemas

Resumo e próximos passos

Requisitos

  • Conhecimentos básicos de análise de dados
  • Conhecimentos de Apache Spark

Público

  • Engenheiros de dados
  • Cientistas de dados
  • Programadores
 14 Horas

Número de participantes


Preço por Participante

Próximas Formações Provisórias

Categorias Relacionadas