Programa do Curso

Introdução à DeepSeek LLM Fine-Tuning

  • Panorâmica dos modelos DeepSeek, por exemplo, DeepSeek-R1 e DeepSeek-V3
  • Compreensão da necessidade de afinação de LLMs
  • Comparação entre afinação fina e engenharia rápida

Preparar o conjunto de dados para Fine-Tuning

  • Curadoria de conjuntos de dados específicos de um domínio
  • Técnicas de pré-processamento e limpeza de dados
  • Tokenização e formatação do conjunto de dados para DeepSeek LLM

Configurar o ambiente Fine-Tuning

  • Configurar a aceleração GPU e TPU
  • Configuração de Hugging Face Transformadores com DeepSeek LLM
  • Compreender os hiperparâmetros para ajuste fino

Fine-Tuning DeepSeek LLM

  • Implementar o ajuste fino supervisionado
  • Usando LoRA (Low-Rank Adaptation) e PEFT (Parameter-Efficient Fine-Tuning)
  • Executar o ajuste fino distribuído para conjuntos de dados de grande escala

Avaliação e otimização de modelos ajustados

  • Avaliar o desempenho do modelo com métricas de avaliação
  • Lidar com o sobreajuste e o subajuste
  • Otimização da velocidade de inferência e da eficiência do modelo

Implantação de modelos DeepSeek ajustados

  • Empacotamento de modelos para implantação de API
  • Integração de modelos ajustados em aplicações
  • Escalonamento de implantações com computação em nuvem e de borda

Aplicações e Use Cases do mundo real

  • LLMs ajustados para finanças, saúde e suporte ao cliente
  • Estudos de casos de aplicações industriais
  • Considerações éticas em modelos de IA de domínios específicos

Resumo e próximos passos

Requisitos

  • Experiência com estruturas de aprendizagem automática e aprendizagem profunda
  • Familiaridade com transformadores e modelos de linguagem de grande dimensão (LLM)
  • Compreensão das técnicas de pré-processamento de dados e treinamento de modelos

Público-alvo

  • Pesquisadores de IA explorando o ajuste fino do LLM
  • Engenheiros de aprendizagem automática que desenvolvem modelos de IA personalizados
  • Programadores avançados que implementam soluções baseadas em IA
 21 Horas

Número de participantes


Preço por Participante

Próximas Formações Provisórias

Categorias Relacionadas