Programa do Curso

  1. Machine Learning introdução
    • Tipos de aprendizagem automática - aprendizagem supervisionada e não supervisionada
    • Da aprendizagem estatística à aprendizagem automática
    • O fluxo de trabalho Data Mining:
      • Business compreensão
      • Compreensão dos dados
      • Preparação dos dados
      • Modelação
      • Avaliação
      • Implementação
    • Algoritmos de aprendizagem automática
    • Seleção do algoritmo adequado ao problema
    • Sobreajustamento e compromisso entre a polarização e a variância na aprendizagem automática
  2. Bibliotecas de aprendizagem automática e linguagens de programação
    • Porquê utilizar uma linguagem de programação
    • Escolher entre R e Python
    • Python curso intensivo
    • Recursos Python
    • Python Bibliotecas para aprendizagem automática
    • Notebooks Jupyter e codificação interactiva
  3. Teste de algoritmos de ML
    • Generalização e sobreajuste
    • Evitar o sobreajuste
      • Método Holdout
      • Validação cruzada
      • Bootstrapping
    • Avaliação de previsões numéricas
      • Medidas de exatidão: ME, MSE, RMSE, MAPE
      • Estabilidade dos parâmetros e das previsões
    • Avaliação de algoritmos de classificação
      • Exatidão e seus problemas
      • A matriz de confusão
      • Problema das classes desequilibradas
    • Visualização do desempenho do modelo
      • Curva de lucro
      • Curva ROC
      • Curva de elevação
    • Seleção de modelos
    • Afinação de modelos - estratégias de pesquisa em grelha
    • Exemplos em Python
  4. Preparação de dados
    • Importação e armazenamento de dados
    • Compreender os dados - explorações básicas
    • Manipulações de dados com a biblioteca pandas
    • Transformações de dados - manipulação de dados
    • Análise exploratória
    • Observações em falta - deteção e soluções
    • Outliers - deteção e estratégias
    • Padronização, normalização, binarização
    • Recodificação de dados qualitativos
    • Exemplos em Python
  5. Classificação
    • Classificação binária vs multiclasse
    • Classificação através de funções matemáticas
      • Funções discriminantes lineares
      • Funções discriminantes quadráticas
    • Regressão logística e abordagem probabilística
    • k-vizinhos mais próximos
    • Naïve Bayes
    • Árvores de decisão
      • CART
      • Ensacamento
      • Random Forests
      • Boosting
      • Xgboost
    • Máquinas de vectores de suporte e kernels
      • Classificador de margem máxima
      • Máquina de vectores de suporte
    • Aprendizagem em conjunto
    • Exemplos em Python
  6. Regressão e previsão numérica
    • Estimação por mínimos quadrados
    • Técnicas de seleção de variáveis
    • Regularização e estabilidade - L1, L2
    • Não linearidades e mínimos quadrados generalizados
    • Regressão polinomial
    • Splines de regressão
    • Árvores de regressão
    • Exemplos em Python
  7. Aprendizagem não supervisionada
    • Agrupamento
      • Agrupamento baseado em centróides - k-means, k-medoids, PAM, CLARA
      • Agrupamento hierárquico - Diana, Agnes
      • Agrupamento baseado em modelos - EM
      • Mapas auto-organizáveis
      • Avaliação e análise de clusters
    • Redução da dimensionalidade
      • Análise de componentes principais e análise fatorial
      • Decomposição de valores singulares
    • Escalonamento multidimensional
    • Exemplos em Python
  8. Extração de texto
    • Pré-processamento de dados
    • O modelo de saco de palavras
    • Estratificação e lematização
    • Análise de frequências de palavras
    • Análise de sentimentos
    • Criação de nuvens de palavras
    • Exemplos em Python
  9. Motores de recomendação e filtragem colaborativa
    • Dados de recomendação
    • Filtragem colaborativa baseada no utilizador
    • Filtragem colaborativa baseada no item
    • Exemplos em Python
  10. Extração de padrões de associação
    • Algoritmo de conjuntos de itens frequentes
    • Análise do cabaz de compras
    • Exemplos em Python
  11. Análise de valores extremos
    • Análise de valores extremos
    • Deteção de valores extremos baseada na distância
    • Métodos baseados na densidade
    • Deteção de outliers em alta dimensão
    • Exemplos em Python
  12. Machine Learning estudo de caso
    • Business compreensão do problema
    • Pré-processamento de dados
    • Seleção e afinação do algoritmo
    • Avaliação dos resultados
    • Implementação

Requisitos

Conhecimento e sensibilização para os Machine Learning fundamentos

 21 Horas

Número de participantes


Preço por Participante

Declaração de Clientes (3)

Próximas Formações Provisórias

Categorias Relacionadas