O Reino da Computação

Blog pessoal do Renato Monteiro Batista, Engenheiro de Computação, um espaço para conversas digitais sobre tecnologia, hacking, segurança da informação, inteligência artificial e outros temas do universo da computação.

View on GitHub
5 June 2024

Como converter gratuitamente audio em texto usando inteligência artificial

by Renato Monteiro Batista

Instalando a extensão colaboratory no Google Drive

Esse método utiliza uma extensão que deve ser instalada no seu Google drive, logo será necessário uma conta google.

Acesse o google drive, na página inicial escolha Novo - Mais - Conectar mais apps.

Pesquise Colaboratory e instale-a no seu google drive.

Essa etapa só precisa ser realizada na primeira vez que for acessar.

Convertendo um audio para texto usando o Colaboratory

Na página inicial do Google Drive, clique em Novo - Mais - Google Colaboratory.

Acesse o menu Ambiente de execução - Alterar tipo de ambiente de execução.

Selecione: Python 3 e T4 GPU. Em seguida clique Salvar.

Insira o seguinte comando no trecho de código:

!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg

Clique no botão de play para executar e aguarde a conclusão.

Realize o upload do arquivo de áudio para o Google Colaboratory clicando no ícone de pasta ao lado esquerdo da tela. Use um nome de arquivo simplificado sem caracteres especiais ou espaços em branco.

Em seguida, insira o seguinte trecho de código:

!whisper "arquivo.mp3" --model medium

Lembre-se de substituir o nome do arquivo.mp3 pelo nome do arquivo de áudio que você fez o upload.

Clique no botão de play para executar e aguarde a conclusão.

Veja também

tags: google - drive - inteligencia-artificial - convertsao - audio - texto