Ir para o conteúdo

Insanely Fast Whisper: Transcrição GPU em 98 segundos

O tweet de Maliha Tasnim destaca um projeto chamado Insanely Fast Whisper, que consegue transcrever 2,5 horas de áudio em apenas 98 segundos usando exclusivamente a GPU local. A implementação é 100% open source e não depende de APIs, nuvem ou assinaturas.

Observação

O projeto é disponibilizado como código aberto, permitindo que qualquer pessoa o inspeccione, modifique e redistribua livremente.

Como funciona

O Insanely Fast Whisper executa o modelo Whisper da OpenAI diretamente na GPU do usuário, aproveitando o processamento paralelo para reduzir o tempo de transcrição de horas para menos de dois minutos.

Características principais

  • Transcrição de 2,5 horas de áudio em 98 segundos
  • 100% open source
  • Execução exclusivamente na GPU local
  • Não requer chaves de API, serviços em nuvem ou assinaturas
  • Uso simples: soltar o arquivo de áudio e executar um único comando fornecido pelo projeto

Como usar

Para utilizar o Insanely Fast Whisper, basta colocar o arquivo de áudio no diretório de trabalho e rodar o único comando indicado na documentação do projeto. Não é necessário criar conta, inserir chaves de acesso ou configurar serviços externos.

Dica

Verifique se sua GPU possui memória suficiente para carregar o modelo Whisper antes de iniciar a transcrição.

Atenção

O desempenho depende da disponibilidade e da compatibilidade da GPU; drivers desatualizados podem causar falhas ou queda de desempenho.

Pontos-chave

  • Transcrição acelerada: 2,5h de áudio em 98 s
  • Solução totalmente open source e offline
  • Execução exclusiva na GPU local, sem APIs ou nuvem
  • Uso simplificado com um único comando
  • Necessita de GPU compatível e drivers atualizados

Ferramentas e Tecnologias

  • [[Whisper]]
  • [[Insanely Fast Whisper]]

Nota pessoal

https://x.com/i/status/2047902276560560410

Tags

transcrição #whisper #código-aberto #gpu