Audiblez: ferramenta livre para EPUB → áudio¶
O Audiblez surge como uma alternativa totalmente independente aos serviços comerciais de audiobooks, permitindo que usuários trasformem seus ebooks em obras auditivas sem custo recorrente ou restrições de licenciamento. Tudo ocorre localmente, preservando a privacidade e dando controle total sobre o processo de conversão.
Como funciona¶
O fluxo básico do Audiblez é simples: o usuário arrasta um arquivo EPUB para a aplicação, que então utiliza o modelo Kokoro-82M para gerar narração em áudio. O resultado é salvo como um arquivo .m4b, padrão reconhecido por players de audiobook.
Características principais¶
- Interface gráfica para fácil uso
- Suporte a CUDA para aceleração em GPUs NVIDIA
- Múltiplos idiomas e seleção de voz
- Conversão EPUB → .m4b sem dependência de nuvem
- Geração totalmente local, garantindo privacidade
Requisitos e desempenho¶
| Plataforma | Tempo aproximado para converter Animal Farm | Observação |
|---|---|---|
| Google Colab (GPU T4) | ~5 minutos | Aproveita aceleração CUDA |
| MacBook Pro M2 (CPU) | ~1 hora | Execução somente na CPU |
| Qualquer CPU moderna | Variável | Depende do número de núcleos e frequência |
Instalação e uso¶
O Audiblez é distribuído como pacote Python e pode ser instalado com o gerenciador pip:
Após a instalação, basta executar o comando fornecido pela ferramenta (conforme descrito na postagem) para iniciar a conversão do ebook desejado.
Observacao
O desempenho varia conforme o hardware; GPUs com suporte a CUDA reduzem significativamente o tempo de processamento.
Dica
Para melhor qualidade de áudio, experimente diferentes vozes disponíveis no modelo Kokoro-82M antes de finalizar a conversão.
Atencao
Embora o Audiblez seja livre e local, certifique-se de que os arquivos EPUB utilizados estejam em conformidade com as leis de direitos autorais de sua região.
Pontos-chave¶
- Audiblez converte EPUB para audiobook .m4b localmente, sem assinatura ou créditos.
- Utiliza o modelo TTS Kokoro-82M (82M parâmetros) para narração natural.
- Funciona em CPUs comuns e é acelerado por GPUs NVIDIA via CUDA.
- Oferece interface gráfica, múltiplos idiomas e seleção de voz.
- Todo o processo ocorre na máquina do usuário, garantindo privacidade e controle total.
Ferramentas e Tecnologias¶
- [[Audiblez]]
- [[Google Colab]]
- [[VLC]]
- [[Apple Books]]
- [[pip]]
- [[Python]]
Nota pessoal
https://x.com/i/status/2056245925434253450