Avatares falantes em tempo real a partir de foto¶
O tweet de Tom Dörr chama atenção para uma solução que combina imagem e áudio para criar avatares que falam em tempo real. O recurso é disponibilizado através do repositório público ai-av no GitHub, permitindo que qualquer pessoa examine o código e reproduza a demonstração.
Descrição do projeto¶
O repositório ai-av fornece a implementação necessária para transformar uma foto estática e um clip de voz em um avatar animado que sincroniza os movimentos labiais com o áudio fornecido. Essa abordagem reduz a necessidade de modelos 3D complexos ou de gravações pré‑produzidas, focando em uma pipeline simples de entrada (foto + voz) e saída (vídeo do avatar falante).
Informações do post
O tweet foi publicado em 28/05/2026 às 12:31 PM e já possui 4 736 visualizações.
Principais características¶
- Entrada: foto estática + áudio de voz
- Saída: vídeo do avatar falante em tempo real
- Código aberto disponível no GitHub
Como acessar¶
O link compartilhado no tweet direciona diretamente para o repositório ai-av no GitHub, onde é possível clonar o projeto e explorar a demonstração fornecida pelos autores.
Pontos-chave¶
- O projeto permite
Ferramentas e Tecnologias¶
- [[GitHub]]
Nota pessoal
https://x.com/i/status/2059975916273426918