Avatares falantes em tempo real a partir de foto¶

O tweet de Tom Dörr chama atenção para uma solução que combina imagem e áudio para criar avatares que falam em tempo real. O recurso é disponibilizado através do repositório público ai-av no GitHub, permitindo que qualquer pessoa examine o código e reproduza a demonstração.

Descrição do projeto¶

O repositório ai-av fornece a implementação necessária para transformar uma foto estática e um clip de voz em um avatar animado que sincroniza os movimentos labiais com o áudio fornecido. Essa abordagem reduz a necessidade de modelos 3D complexos ou de gravações pré‑produzidas, focando em uma pipeline simples de entrada (foto + voz) e saída (vídeo do avatar falante).

Informações do post

O tweet foi publicado em 28/05/2026 às 12:31 PM e já possui 4 736 visualizações.

Principais características¶

Entrada: foto estática + áudio de voz
Saída: vídeo do avatar falante em tempo real
Código aberto disponível no GitHub

Como acessar¶

O link compartilhado no tweet direciona diretamente para o repositório ai-av no GitHub, onde é possível clonar o projeto e explorar a demonstração fornecida pelos autores.

Pontos-chave¶

O projeto permite

Ferramentas e Tecnologias¶

[[GitHub]]

Nota pessoal

https://x.com/i/status/2059975916273426918

Links¶

Post original

Tags¶

avatares #tempo-real #síntese-de-voz¶