Programa do Curso

Introdução a Reinforcement Learning

  • Panorâmica da aprendizagem por reforço e das suas aplicações
  • Diferenças entre aprendizagem supervisionada, não supervisionada e por reforço
  • Conceitos-chave: agente, ambiente, recompensas e política

Processos de decisão de Markov (MDPs)

  • Compreender os estados, as acções, as recompensas e as transições de estado
  • Funções de valor e a equação de Bellman
  • Programação dinâmica para resolver MDPs

Principais algoritmos de RL

  • Métodos tabulares: Q-Learning e SARSA
  • Métodos baseados em políticas: Algoritmo REINFORCE
  • Quadros de crítica de actores e suas aplicações

Profundo Reinforcement Learning

  • Introdução às redes Q profundas (DQN)
  • Repetição de experiências e redes-alvo
  • Gradientes de política e métodos avançados de RL profunda

Estruturas e ferramentas de RL

  • Introdução ao OpenAI Gym e outros ambientes de RL
  • Utilização de PyTorch ou TensorFlow para desenvolvimento de modelos de RL
  • Treino, teste e avaliação comparativa de agentes de RL

Desafios na RL

  • Equilíbrio entre exploração e aproveitamento no treino
  • Lidar com recompensas esparsas e problemas de atribuição de créditos
  • [Desafios computacionais e de mobilidade na RL

Actividades práticas Activities

  • Implementação dos algoritmos Q-Learning e SARSA de raiz
  • Treinar um agente baseado em DQN para jogar um jogo simples em OpenAI Gym
  • Ajuste fino dos modelos de RL para melhorar o desempenho em ambientes personalizados

Resumo e próximos passos

Requisitos

  • Forte compreensão dos princípios e algoritmos de aprendizagem automática
  • Proficiência em programação Python
  • Familiaridade com redes neurais e estruturas de aprendizagem profunda

Público-alvo

  • Engenheiros de aprendizagem automática
  • Especialistas em IA
 14 Horas

Número de participantes


Preço por Participante

Próximas Formações Provisórias

Categorias Relacionadas