Ir para o conteúdo

Guia Completo de Engenharia de IA em Um Só Lugar

O AI Engineering Guidebook surge como referência única para engenheiros que atuam com sistemas de IA em produção, reunindo tópicos que antes estavam espalhados em diversas fontes. O material cobre todo o ciclo de vida de um projeto de IA, desde a teoria dos modelos até a implementação e monitoramento em ambiente real.

Fundamentos de LLMs

Esta parte aborda a arquitetura subjacente aos grandes modelos de linguagem.
- Transformer e MoE (Mixture of Experts) como blocos de construção básicos.
- Processos de pre-training, instruction tuning, RLHF e GRPO.
- Mecânica de next-token prediction e como ela influencia o comportamento do modelo.

Observacao

Compreender esses fundamentos é essencial antes de partir para técnicas de adaptação ou uso avançado.

Decodificação e Prompting

Foca nos métodos que controlam a geração de texto a partir do modelo.
- Parâmetros de amostragem: temperature, top-p, top-k.
- Estratégias de raciocínio: Chain of Thought, Tree of Thoughts, ARQ.
- Algoritmos de busca: Beam Search, Contrastive Search, SLED.

Dica

Ajustar temperatura e top-p costuma ter maior impacto na criatividade do que mudar a arquitetura do modelo.

Fine-tuning (PEFT)

Detalha as técnicas de adaptação eficiente de modelos pré‑treinados.
- Métodos de baixa-rank: LoRA, QLoRA, DoRA, VeRA, Delta-LoRA.
- Padrões de model distillation para reduzir tamanho e custo.
- Orientações sobre quando escolher fine‑tuning em vez de prompting avançado.

Atencao

Fine‑tuning inadequado pode levar ao esquecimento catastrófico; prefira PEFT quando os recursos forem limitados.

Arquiteturas RAG

Explora métodos de recuperação aumentada para melhorar a factualidade das respostas.
- Abordagens básicas: HyDE, Corrective RAG, Graph RAG.
- Versões adaptativas: Adaptive RAG, REFRAG.
- Técnicas de otimização: Cache-Augmented Generation.

Sistemas Agêntes

Descreve como criar agentes que raciocinam e utilizam ferramentas externos.
- Padrão ReAct em profundidade.
- Protocol

Ferramentas e Tecnologias

  • [[vLLM]]
  • [[DeepEval]]
  • [[Opik]]

Nota pessoal

https://x.com/i/status/2055352541286707662

Tags

engenharia-de-ia #llm #agentes #rag #deploy