PaperOrchestra: Sistema Multi‑agente para Papers¶
O avanço recente em inteligência artificial aplicada à pesquisa acadêmica deu origem a ferramentas capazes de auxiliar na elaboração de artigos científicos. Nesse contexto, o Google revelou o PaperOrchestra, um framework de múltiplos agentes projetado para escrever papers do zero, superando abordagens anteriores em métricas de qualidade e eficiência.
Visão geral do PaperOrchestra¶
O PaperOrchestra propõe resolver o gargalo que limitava sistemas de geração automática de textos acadêmicos: a escolha correta de referências e sua justificativa. Em vez de tratar a escrita como um único bloco de geração de linguagem, o sistema distribui a tarefa entre cinco agentes especializados, cada um responsável por uma etapa distinta do processo.
Arquitetura e agentes¶
O pipeline consiste de cinco agentes que atuam sequencialmente:
- Outline + estratégia de busca – define a estrutura do paper e planeja quais tópicos precisam de fundamentação bibliográfica.
- Busca papers reais, verifica no Semantic Scholar, registra citações – consulta o banco de dados Semantic Scholar, recupera artigos relevantes e armazena as referências em formato padronizado.
- Gera figuras e diagramas – produz visualizações auxiliares com base nos dados coletados ou em descrições fornecidas pelos agentes anteriores.
- Escreve manuscrito com citações verificadas – redige o texto inserindo as citações validadas, garantindo consistência entre conteúdo e bibliografia.
- Simula peer review, le feedback, revisa – imita o processo de revisão por pares, apontando possíveis melhorias e aplicando revisões automáticas antes da saída final.
Essa divisão permite que o gargalo de referência seja tratado por um sub‑agente dedicado, o que, segundo o autor, foi o fator chave para fechar a lacuna de qualidade em relação aos métodos anteriores.
Resultados e comparação¶
Experimentos realizados no conferência CVPR mostraram que o PaperOrchestra atingiu uma taxa de aceitação de 84%, enquanto revisores humanos alcançaram 86%. A diferença de apenas dois pontos percentuais indica que o desempenho do sistema está muito próximo do nível humano. Além disso, o pipeline completo é executado em aproximadamente 40 minutos, demandando entre 60 e 70 chamadas a modelos de linguagem grandes (LLM).
Observação
A métrica de qualidade geral utilizada no post compara o PaperOrchestra ao AI Scientist‑v2, mostrando uma melhoria relativa de 39‑86%.
Dica
Para pesquisadores interessados em replicar ou adaptar o método, a integração com APIs de busca acadêmica como a do Semantic Scholar é um ponto de partida essencial.
Atencao
Os números apresentados são baseados em um conjunto de experimentos específicos; a generalização para outras áreas ou conferências pode variar.
Pontos-chave¶
- O PaperOrchestra é um sistema multi‑agente que divide a escrita de papers em cinco etapas especializadas.
- Supera o AI Scientist‑v2 em 39‑86% de qualidade geral, aproximando‑se do desempenho humano em conferências como o CVPR.
- O pipeline inclui busca e validação de referências via Semantic Scholar, geração de figuras e simulação de peer review.
- Execução completa leva cerca de 40 minutos, com 60‑70 chamadas a LLM.
- A principal inovação foi tratar a seleção e justificação de referências como um sub‑agente dedicado, resolvendo o gargalo anterior.
Ferramentas e Tecnologias¶
- [[PaperOrchestra]]
- [[AI Scientist-v2]]
- [[Semantic Scholar]]
Nota pessoal
https://x.com/i/status/2042616007487795542