Programa do Curso
Introdução
- O processo Data Science
- Funções e responsabilidades de um cientista de dados
Preparar o ambiente de desenvolvimento
- Bibliotecas, estruturas, linguagens e ferramentas
- Desenvolvimento local
- Desenvolvimento colaborativo baseado na Web
Recolha de dados
- Diferentes tipos de dados
- Estruturados
- Bases de dados locais
- Conectores Database
- Formatos comuns: xlxs, XML, Json, csv, ...
- Não estruturado
- Cliques, censores, smartphones
- APIs
- Internet of Things (IoT)
- Documentos, imagens, vídeos, sons
- Estruturados
- Estudo de caso: Recolha contínua de grandes quantidades de dados não estruturados
Armazenamento de dados
- Bases de dados relacionais
- Bases de dados não relacionais
- Hadoop: Sistema de ficheiros distribuído (HDFS)
- Spark: Conjunto de dados distribuído resiliente (RDD)
- Armazenamento em nuvem
Preparação de dados
- Ingestão, seleção, limpeza e transformação
- Garantir a qualidade dos dados - correção, significado e segurança
- Relatórios de exceção
Languages utilizados para preparação, processamento e análise
- Linguagem R
- Introdução ao R
- Manipulação de dados, cálculo e visualização de gráficos
- Python
- Introdução à Python
- Manipulação, processamento, limpeza e processamento de dados
Análise de dados
- Análise exploratória
- Estatísticas básicas
- Esboço de visualizações
- Compreender os dados
- Causalidade
- Caraterísticas e transformações
- Machine Learning
- Supervisionado vs não supervisionado
- Quando utilizar que modelo
- Natural Language Processing (NLP)
Data Visualization
- Melhores práticas
- Selecionar o gráfico certo para os dados certos
- Paletes de cores
- Passar ao nível seguinte
- Painéis de controlo
- Visualizações interactivas
- Contar histórias com dados
Resumo e conclusão
Requisitos
- Uma compreensão geral dos conceitos de bases de dados
- Um conhecimento básico de estatística
Declaração de Clientes (4)
Hands-on examples allowed us to get an actual feel for how the program works. Good explanations and integration of theoretical concepts and how they relate to practical applications.
Ian - Archeoworks Inc.
Curso - ArcGIS Fundamentals
Exercício de laboratório
Tse Kiat - ST Engineering Training & Simulation Systems Pte. Ltd.
Curso - Automated Monitoring with Zabbix
Máquina Traduzida
All the topics which he covered including examples. And also explained how they are helpful in our daily job.
madduri madduri - Boskalis Singapore Pte Ltd
Curso - QGIS for Geographic Information System
The thing I liked the most about the training was the organization and the location