Microsoft libera IA de voz open source gratuita¶
O tweet de Tim Jayas anunciou que a Microsoft tornou público e gratuito seu modelo de IA de voz mais avançado, que anteriormente possuía marca d'água para evitar usos indevidos. Essa liberação permite que desenvolvedores e entusiastas acessem tecnologia de clonagem de voz sem custo, gerando até 90 minutos de áudio a partir de poucos segundos de amostra.
Visão geral¶
O modelo de IA de voz da Microsoft foi liberado como open source, removendo qualquer restrição de licenciamento e marca d'água de segurança. Ele está disponível para download e uso imediato por qualquer pessoa interessada em experimentar síntese de fala de alta fidelidade.
Observação
A ferramenta permite clonar qualquer voz a partir de apenas 10 segundos de áudio.
Principais características¶
- Clonagem de voz a partir de 10 s de áudio
- Geração de até 90 min de áudio
- Suporte a 50+ idiomas
- Streaming em tempo real
- Execução local 100 % open source
Dica
Com suporte a mais de 50 idiomas, é possível gerar áudio em diversas línguas sem troca de modelo.
Como funciona¶
O usuário fornece um curta amostra de voz (10 segundos) e o modelo produz
Ferramentas e Tecnologias¶
- [[Microsoft]]
- [[VALL-E]]
Nota pessoal
https://x.com/i/status/2048090441367875766