Guia Completo de Engenharia de IA em Um Só Lugar¶
O AI Engineering Guidebook surge como referência única para engenheiros que atuam com sistemas de IA em produção, reunindo tópicos que antes estavam espalhados em diversas fontes. O material cobre todo o ciclo de vida de um projeto de IA, desde a teoria dos modelos até a implementação e monitoramento em ambiente real.
Fundamentos de LLMs¶
Esta parte aborda a arquitetura subjacente aos grandes modelos de linguagem.
- Transformer e MoE (Mixture of Experts) como blocos de construção básicos.
- Processos de pre-training, instruction tuning, RLHF e GRPO.
- Mecânica de next-token prediction e como ela influencia o comportamento do modelo.
Observacao
Compreender esses fundamentos é essencial antes de partir para técnicas de adaptação ou uso avançado.
Decodificação e Prompting¶
Foca nos métodos que controlam a geração de texto a partir do modelo.
- Parâmetros de amostragem: temperature, top-p, top-k.
- Estratégias de raciocínio: Chain of Thought, Tree of Thoughts, ARQ.
- Algoritmos de busca: Beam Search, Contrastive Search, SLED.
Dica
Ajustar temperatura e top-p costuma ter maior impacto na criatividade do que mudar a arquitetura do modelo.
Fine-tuning (PEFT)¶
Detalha as técnicas de adaptação eficiente de modelos pré‑treinados.
- Métodos de baixa-rank: LoRA, QLoRA, DoRA, VeRA, Delta-LoRA.
- Padrões de model distillation para reduzir tamanho e custo.
- Orientações sobre quando escolher fine‑tuning em vez de prompting avançado.
Atencao
Fine‑tuning inadequado pode levar ao esquecimento catastrófico; prefira PEFT quando os recursos forem limitados.
Arquiteturas RAG¶
Explora métodos de recuperação aumentada para melhorar a factualidade das respostas.
- Abordagens básicas: HyDE, Corrective RAG, Graph RAG.
- Versões adaptativas: Adaptive RAG, REFRAG.
- Técnicas de otimização: Cache-Augmented Generation.
Sistemas Agêntes¶
Descreve como criar agentes que raciocinam e utilizam ferramentas externos.
- Padrão ReAct em profundidade.
- Protocol
Ferramentas e Tecnologias¶
- [[vLLM]]
- [[DeepEval]]
- [[Opik]]
Nota pessoal
https://x.com/i/status/2055352541286707662