Obrigado por enviar sua consulta! Um dos membros da nossa equipe entrará em contato com você em breve.
Obrigado por enviar sua reserva! Um dos membros da nossa equipe entrará em contato com você em breve.
Programa do Curso
Introdução à DeepSeek LLM Fine-Tuning
- Panorâmica dos modelos DeepSeek, por exemplo, DeepSeek-R1 e DeepSeek-V3
- Compreensão da necessidade de afinação de LLMs
- Comparação entre afinação fina e engenharia rápida
Preparar o conjunto de dados para Fine-Tuning
- Curadoria de conjuntos de dados específicos de um domínio
- Técnicas de pré-processamento e limpeza de dados
- Tokenização e formatação do conjunto de dados para DeepSeek LLM
Configurar o ambiente Fine-Tuning
- Configurar a aceleração GPU e TPU
- Configuração de Hugging Face Transformadores com DeepSeek LLM
- Compreender os hiperparâmetros para ajuste fino
Fine-Tuning DeepSeek LLM
- Implementar o ajuste fino supervisionado
- Usando LoRA (Low-Rank Adaptation) e PEFT (Parameter-Efficient Fine-Tuning)
- Executar o ajuste fino distribuído para conjuntos de dados de grande escala
Avaliação e otimização de modelos ajustados
- Avaliar o desempenho do modelo com métricas de avaliação
- Lidar com o sobreajuste e o subajuste
- Otimização da velocidade de inferência e da eficiência do modelo
Implantação de modelos DeepSeek ajustados
- Empacotamento de modelos para implantação de API
- Integração de modelos ajustados em aplicações
- Escalonamento de implantações com computação em nuvem e de borda
Aplicações e Use Cases do mundo real
- LLMs ajustados para finanças, saúde e suporte ao cliente
- Estudos de casos de aplicações industriais
- Considerações éticas em modelos de IA de domínios específicos
Resumo e próximos passos
Requisitos
- Experiência com estruturas de aprendizagem automática e aprendizagem profunda
- Familiaridade com transformadores e modelos de linguagem de grande dimensão (LLM)
- Compreensão das técnicas de pré-processamento de dados e treinamento de modelos
Público-alvo
- Pesquisadores de IA explorando o ajuste fino do LLM
- Engenheiros de aprendizagem automática que desenvolvem modelos de IA personalizados
- Programadores avançados que implementam soluções baseadas em IA
21 Horas