Ir para o conteúdo

Microsoft libera IA de voz open source gratuita

O tweet de Tim Jayas anunciou que a Microsoft tornou público e gratuito seu modelo de IA de voz mais avançado, que anteriormente possuía marca d'água para evitar usos indevidos. Essa liberação permite que desenvolvedores e entusiastas acessem tecnologia de clonagem de voz sem custo, gerando até 90 minutos de áudio a partir de poucos segundos de amostra.

Visão geral

O modelo de IA de voz da Microsoft foi liberado como open source, removendo qualquer restrição de licenciamento e marca d'água de segurança. Ele está disponível para download e uso imediato por qualquer pessoa interessada em experimentar síntese de fala de alta fidelidade.

Observação

A ferramenta permite clonar qualquer voz a partir de apenas 10 segundos de áudio.

Principais características

  • Clonagem de voz a partir de 10 s de áudio
  • Geração de até 90 min de áudio
  • Suporte a 50+ idiomas
  • Streaming em tempo real
  • Execução local 100 % open source

Dica

Com suporte a mais de 50 idiomas, é possível gerar áudio em diversas línguas sem troca de modelo.

Como funciona

O usuário fornece um curta amostra de voz (10 segundos) e o modelo produz

Ferramentas e Tecnologias

  • [[Microsoft]]
  • [[VALL-E]]

Nota pessoal

https://x.com/i/status/2048090441367875766

Tags

clonagem-voz #IA-de-voz #código-aberto #Microsoft #VALL-E