PaperOrchestra: Sistema Multi‑agente para Papers¶

O avanço recente em inteligência artificial aplicada à pesquisa acadêmica deu origem a ferramentas capazes de auxiliar na elaboração de artigos científicos. Nesse contexto, o Google revelou o PaperOrchestra, um framework de múltiplos agentes projetado para escrever papers do zero, superando abordagens anteriores em métricas de qualidade e eficiência.

Visão geral do PaperOrchestra¶

O PaperOrchestra propõe resolver o gargalo que limitava sistemas de geração automática de textos acadêmicos: a escolha correta de referências e sua justificativa. Em vez de tratar a escrita como um único bloco de geração de linguagem, o sistema distribui a tarefa entre cinco agentes especializados, cada um responsável por uma etapa distinta do processo.

Arquitetura e agentes¶

O pipeline consiste de cinco agentes que atuam sequencialmente:

Outline + estratégia de busca – define a estrutura do paper e planeja quais tópicos precisam de fundamentação bibliográfica.
Busca papers reais, verifica no Semantic Scholar, registra citações – consulta o banco de dados Semantic Scholar, recupera artigos relevantes e armazena as referências em formato padronizado.
Gera figuras e diagramas – produz visualizações auxiliares com base nos dados coletados ou em descrições fornecidas pelos agentes anteriores.
Escreve manuscrito com citações verificadas – redige o texto inserindo as citações validadas, garantindo consistência entre conteúdo e bibliografia.
Simula peer review, le feedback, revisa – imita o processo de revisão por pares, apontando possíveis melhorias e aplicando revisões automáticas antes da saída final.

Essa divisão permite que o gargalo de referência seja tratado por um sub‑agente dedicado, o que, segundo o autor, foi o fator chave para fechar a lacuna de qualidade em relação aos métodos anteriores.

Resultados e comparação¶

Experimentos realizados no conferência CVPR mostraram que o PaperOrchestra atingiu uma taxa de aceitação de 84%, enquanto revisores humanos alcançaram 86%. A diferença de apenas dois pontos percentuais indica que o desempenho do sistema está muito próximo do nível humano. Além disso, o pipeline completo é executado em aproximadamente 40 minutos, demandando entre 60 e 70 chamadas a modelos de linguagem grandes (LLM).

Observação

A métrica de qualidade geral utilizada no post compara o PaperOrchestra ao AI Scientist‑v2, mostrando uma melhoria relativa de 39‑86%.

Dica

Para pesquisadores interessados em replicar ou adaptar o método, a integração com APIs de busca acadêmica como a do Semantic Scholar é um ponto de partida essencial.

Atencao

Os números apresentados são baseados em um conjunto de experimentos específicos; a generalização para outras áreas ou conferências pode variar.

Pontos-chave¶

O PaperOrchestra é um sistema multi‑agente que divide a escrita de papers em cinco etapas especializadas.
Supera o AI Scientist‑v2 em 39‑86% de qualidade geral, aproximando‑se do desempenho humano em conferências como o CVPR.
O pipeline inclui busca e validação de referências via Semantic Scholar, geração de figuras e simulação de peer review.
Execução completa leva cerca de 40 minutos, com 60‑70 chamadas a LLM.
A principal inovação foi tratar a seleção e justificação de referências como um sub‑agente dedicado, resolvendo o gargalo anterior.

Ferramentas e Tecnologias¶

[[PaperOrchestra]]
[[AI Scientist-v2]]
[[Semantic Scholar]]

Nota pessoal

https://x.com/i/status/2042616007487795542

Links¶

Post original

Tags¶

multi-agente #escrita-científica #revisão-por-pares #LLM #Semantic-Scholar¶