Ir para o conteúdo

Voicebox – Estúdio de Voz IA Open Source

Voicebox é um estúdio de voz IA de código aberto que funciona localmente na sua máquina, eliminando a dependência de serviços externos para clonagem, síntese e ditado de fala.

Sobre o Voicebox

O projeto se descreve como uma alternativa open‑source aos serviços ElevenLabs e WisprFlow, reunindo em um único aplicativo as funcionalidades de clonagem de voz a partir de poucos segundos de áudio, geração de fala em 23 idiomas usando sete mecanismos diferentes de TTS e ditado global com atalho de teclado. Ele também permite atribuir uma voz personalizada a agentes de IA que suportam o padrão MCP, fornecendo controle total sobre o pipeline de entrada e saída de voz.

Observação

Como o Voicebox roda inteiramente localmente, nenhum dado de áudio deixa o seu dispositivo, garantindo privacidade total para projetos sensíveis.

Principais recursos

  • Clonagem de voz: gere uma nova voz a partir de um pequeno trecho de áudio.
  • Síntese multilíngue: suporte a 23 línguas distribuídas entre sete engines de TTS.
  • Ditado global: atalho de teclado que envia fala para qualquer campo de texto ativo.
  • Voz para agentes MCP: escolha uma voz personalizada para IA compatível com o protocolo MCP.
  • Interface amigável: tela com capturas de tela disponíveis no site oficial e na página de releases.

Dica

Experimente o atalho de ditado global para tomar notas rapidamente enquanto trabalha em outros aplicativos.

Como acessar e usar

O Voicebox pode ser obtido diretamente na página de releases do repositório GitHub, onde há binários para download. A documentação oficial está disponível em https://docs.voicebox.sh/ e inclui instruções de instalação, uso da API e solução de problemas comuns. O site principal https://voicebox.sh/ oferece um vídeo demonstrativo e links para todas as seções do projeto.

Atenção

Embora o software seja gratuito e open‑source, verifique a licença no repositório para entender os termos de uso e redistribuição.

Pontos-chave

  • Voicebox é um estúdio de voz IA local-first e open‑source.
  • Permite clonagem de voz, síntese em 23 idiomas e ditado global.
  • Oferece voz personalizada para agentes de IA compatíveis com MCP.
  • Alternativa gratuita aos serviços pagos ElevenLabs e WisprFlow.
  • Totalmente executado na máquina do usuário, garantindo privacidade dos dados de áudio.

Nota pessoal

https://github.com/jamiepine/voicebox

Tags

voz #clonagem-de-voz #texto-para-fala #ditado