Programa do Curso
- Machine Learning introdução
- Tipos de aprendizagem automática - aprendizagem supervisionada e não supervisionada
- Da aprendizagem estatística à aprendizagem automática
- O fluxo de trabalho Data Mining:
- Business compreensão
- Compreensão dos dados
- Preparação dos dados
- Modelação
- Avaliação
- Implementação
- Algoritmos de aprendizagem automática
- Seleção do algoritmo adequado ao problema
- Sobreajustamento e compromisso entre a polarização e a variância na aprendizagem automática
- Bibliotecas de aprendizagem automática e linguagens de programação
- Porquê utilizar uma linguagem de programação
- Escolher entre R e Python
- Python curso intensivo
- Recursos Python
- Python Bibliotecas para aprendizagem automática
- Notebooks Jupyter e codificação interactiva
- Teste de algoritmos de ML
- Generalização e sobreajuste
- Evitar o sobreajuste
- Método Holdout
- Validação cruzada
- Bootstrapping
- Avaliação de previsões numéricas
- Medidas de exatidão: ME, MSE, RMSE, MAPE
- Estabilidade dos parâmetros e das previsões
- Avaliação de algoritmos de classificação
- Exatidão e seus problemas
- A matriz de confusão
- Problema das classes desequilibradas
- Visualização do desempenho do modelo
- Curva de lucro
- Curva ROC
- Curva de elevação
- Seleção de modelos
- Afinação de modelos - estratégias de pesquisa em grelha
- Exemplos em Python
- Preparação de dados
- Importação e armazenamento de dados
- Compreender os dados - explorações básicas
- Manipulações de dados com a biblioteca pandas
- Transformações de dados - manipulação de dados
- Análise exploratória
- Observações em falta - deteção e soluções
- Outliers - deteção e estratégias
- Padronização, normalização, binarização
- Recodificação de dados qualitativos
- Exemplos em Python
- Classificação
- Classificação binária vs multiclasse
- Classificação através de funções matemáticas
- Funções discriminantes lineares
- Funções discriminantes quadráticas
- Regressão logística e abordagem probabilística
- k-vizinhos mais próximos
- Naïve Bayes
- Árvores de decisão
- CART
- Ensacamento
- Random Forests
- Boosting
- Xgboost
- Máquinas de vectores de suporte e kernels
- Classificador de margem máxima
- Máquina de vectores de suporte
- Aprendizagem em conjunto
- Exemplos em Python
- Regressão e previsão numérica
- Estimação por mínimos quadrados
- Técnicas de seleção de variáveis
- Regularização e estabilidade - L1, L2
- Não linearidades e mínimos quadrados generalizados
- Regressão polinomial
- Splines de regressão
- Árvores de regressão
- Exemplos em Python
- Aprendizagem não supervisionada
- Agrupamento
- Agrupamento baseado em centróides - k-means, k-medoids, PAM, CLARA
- Agrupamento hierárquico - Diana, Agnes
- Agrupamento baseado em modelos - EM
- Mapas auto-organizáveis
- Avaliação e análise de clusters
- Redução da dimensionalidade
- Análise de componentes principais e análise fatorial
- Decomposição de valores singulares
- Escalonamento multidimensional
- Exemplos em Python
- Agrupamento
- Extração de texto
- Pré-processamento de dados
- O modelo de saco de palavras
- Estratificação e lematização
- Análise de frequências de palavras
- Análise de sentimentos
- Criação de nuvens de palavras
- Exemplos em Python
- Motores de recomendação e filtragem colaborativa
- Dados de recomendação
- Filtragem colaborativa baseada no utilizador
- Filtragem colaborativa baseada no item
- Exemplos em Python
- Extração de padrões de associação
- Algoritmo de conjuntos de itens frequentes
- Análise do cabaz de compras
- Exemplos em Python
- Análise de valores extremos
- Análise de valores extremos
- Deteção de valores extremos baseada na distância
- Métodos baseados na densidade
- Deteção de outliers em alta dimensão
- Exemplos em Python
- Machine Learning estudo de caso
- Business compreensão do problema
- Pré-processamento de dados
- Seleção e afinação do algoritmo
- Avaliação dos resultados
- Implementação
Requisitos
Conhecimento e sensibilização para os Machine Learning fundamentos
Declaração de Clientes (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Curso - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Curso - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback