Voicebox – Estúdio de Voz IA Open Source¶
Voicebox é um estúdio de voz IA de código aberto que funciona localmente na sua máquina, eliminando a dependência de serviços externos para clonagem, síntese e ditado de fala.
Sobre o Voicebox¶
O projeto se descreve como uma alternativa open‑source aos serviços ElevenLabs e WisprFlow, reunindo em um único aplicativo as funcionalidades de clonagem de voz a partir de poucos segundos de áudio, geração de fala em 23 idiomas usando sete mecanismos diferentes de TTS e ditado global com atalho de teclado. Ele também permite atribuir uma voz personalizada a agentes de IA que suportam o padrão MCP, fornecendo controle total sobre o pipeline de entrada e saída de voz.
Observação
Como o Voicebox roda inteiramente localmente, nenhum dado de áudio deixa o seu dispositivo, garantindo privacidade total para projetos sensíveis.
Principais recursos¶
- Clonagem de voz: gere uma nova voz a partir de um pequeno trecho de áudio.
- Síntese multilíngue: suporte a 23 línguas distribuídas entre sete engines de TTS.
- Ditado global: atalho de teclado que envia fala para qualquer campo de texto ativo.
- Voz para agentes MCP: escolha uma voz personalizada para IA compatível com o protocolo MCP.
- Interface amigável: tela com capturas de tela disponíveis no site oficial e na página de releases.
Dica
Experimente o atalho de ditado global para tomar notas rapidamente enquanto trabalha em outros aplicativos.
Como acessar e usar¶
O Voicebox pode ser obtido diretamente na página de releases do repositório GitHub, onde há binários para download. A documentação oficial está disponível em https://docs.voicebox.sh/ e inclui instruções de instalação, uso da API e solução de problemas comuns. O site principal https://voicebox.sh/ oferece um vídeo demonstrativo e links para todas as seções do projeto.
Atenção
Embora o software seja gratuito e open‑source, verifique a licença no repositório para entender os termos de uso e redistribuição.
Pontos-chave¶
- Voicebox é um estúdio de voz IA local-first e open‑source.
- Permite clonagem de voz, síntese em 23 idiomas e ditado global.
- Oferece voz personalizada para agentes de IA compatíveis com MCP.
- Alternativa gratuita aos serviços pagos ElevenLabs e WisprFlow.
- Totalmente executado na máquina do usuário, garantindo privacidade dos dados de áudio.
Nota pessoal
https://github.com/jamiepine/voicebox