Programa do Curso

Introdução a Reinforcement Learning

  • O que é a aprendizagem por reforço?
  • Conceitos-chave: agente, ambiente, estados, acções e recompensas
  • Desafios da aprendizagem por reforço

Exploração e aproveitamento

  • Equilíbrio entre exploração e aproveitamento em modelos de RL
  • Estratégias de exploração: epsilon-greedy, softmax, e mais

Q-Learning e redes Q profundas (DQNs)

  • Introdução ao Q-learning
  • Implementação de DQNs usando TensorFlow
  • Otimização do Q-learning com repetição de experiências e redes alvo

Métodos baseados em políticas

  • Algoritmos de gradiente de política
  • Algoritmo REINFORCE e sua implementação
  • Métodos de crítica de actores

Trabalhar com o OpenAI Gym

  • Configurar ambientes no OpenAI Gym
  • Simulação de agentes em ambientes dinâmicos
  • Avaliação do desempenho do agente

Técnicas Reinforcement Learning avançadas

  • Aprendizagem por reforço multiagente
  • Gradiente de política determinística profunda (DDPG)
  • Otimização da política proximal (PPO)

Implementação de modelos Reinforcement Learning

  • Aplicações do mundo real da aprendizagem por reforço
  • Integração de modelos RL em ambientes de produção

Resumo e próximos passos

Requisitos

  • Experiência com programação Python
  • Conhecimento básico dos conceitos de aprendizagem profunda e de aprendizagem automática
  • Conhecimento de algoritmos e conceitos matemáticos utilizados na aprendizagem por reforço

Público-alvo

  • Cientistas de dados
  • Profissionais de aprendizagem automática
  • Investigadores de IA
 28 Horas

Número de participantes


Preço por Participante

Declaração de Clientes (4)

Próximas Formações Provisórias

Categorias Relacionadas