Microsoft libera IA de voz open source gratuita¶

O tweet de Tim Jayas anunciou que a Microsoft tornou público e gratuito seu modelo de IA de voz mais avançado, que anteriormente possuía marca d'água para evitar usos indevidos. Essa liberação permite que desenvolvedores e entusiastas acessem tecnologia de clonagem de voz sem custo, gerando até 90 minutos de áudio a partir de poucos segundos de amostra.

Visão geral¶

O modelo de IA de voz da Microsoft foi liberado como open source, removendo qualquer restrição de licenciamento e marca d'água de segurança. Ele está disponível para download e uso imediato por qualquer pessoa interessada em experimentar síntese de fala de alta fidelidade.

Observação

A ferramenta permite clonar qualquer voz a partir de apenas 10 segundos de áudio.

Principais características¶

Clonagem de voz a partir de 10 s de áudio
Geração de até 90 min de áudio
Suporte a 50+ idiomas
Streaming em tempo real
Execução local 100 % open source

Dica

Com suporte a mais de 50 idiomas, é possível gerar áudio em diversas línguas sem troca de modelo.

Como funciona¶

O usuário fornece um curta amostra de voz (10 segundos) e o modelo produz

Ferramentas e Tecnologias¶

[[Microsoft]]
[[VALL-E]]

Nota pessoal

https://x.com/i/status/2048090441367875766

Links¶

Post original

Tags¶

clonagem-voz #IA-de-voz #código-aberto #Microsoft #VALL-E¶