
AssemblyAI é seriamente impressionante. Antes de encontrá-lo, experimentei o Google Cloud, Whisper e algumas ferramentas de código aberto para diarização. Eu até tentei o Read.ai, mas, honestamente, nenhum deles me deu os resultados que eu estava procurando.
Então, vi alguém mencionar o AssemblyAI no Reddit e decidi tentar. Estou tão feliz por ter feito isso — a transcrição e diarização deles estão em outro nível. Quase nunca preciso editar as transcrições, o que é raro com esse tipo de ferramenta.
O preço é super razoável pelo que você recebe, e a API é realmente flexível. Consegui criar meus próprios fluxos de trabalho para transcrever reuniões, entrevistas e vídeos sem qualquer problema. Eu uso praticamente todos os dias para transcrever reuniões que gravo no meu computador e salvo tudo em formato Markdown.
Se você está procurando um serviço de transcrição sólido e confiável que simplesmente funciona, não posso recomendar o AssemblyAI o suficiente. Análise coletada por e hospedada no G2.com.
Não é que eu não goste, mas acho que há uma barreira alta para os não-técnicos acessarem o serviço. Eu sei que eles têm um playground, mas ainda é assustador para as pessoas que querem usar o serviço, mas veem isso. Alguns amigos que veem meu fluxo de trabalho querem imitar, mas param quando veem a interface da API. A documentação é muito bem detalhada, mas ainda existem barreiras para a adoção em certos segmentos de clientes.
Outra coisa que eu gostaria seria armazenar o cluster de vozes que são gravadas e gostaria que o modelo as nomeasse automaticamente. Acho que isso seria muito complicado e provavelmente há preocupações de privacidade envolvidas. Mas seria uma abordagem de qualidade de vida. Mas acho que isso é uma necessidade de nicho em vez de algo que a base de clientes estaria interessada. Análise coletada por e hospedada no G2.com.






