Introducing G2.ai, the future of software buying.Try now
Speechmatics
Patrocinado
Speechmatics
Visitar Site
Imagem do Avatar do Produto
Kaldi ASR

Por Slashdot Media

Reivindicar Perfil

Reivindique o perfil da sua empresa na G2

Este perfil não está ativo há mais de um ano.
Se você trabalha na Kaldi ASR, pode reivindicá-lo novamente para manter as informações da sua empresa atualizadas e aproveitar ao máximo sua presença na G2.

    Uma vez aprovado, você pode:

  • Atualizar os detalhes da sua empresa e produto

  • Aumentar a visibilidade da sua marca na G2, pesquisa e LLMs

  • Acessar insights sobre visitantes e concorrentes

  • Responder a avaliações de clientes

  • Verificaremos seu e-mail de trabalho antes de conceder acesso.

Reivindicar
4.1 de 5 estrelas

Como você classificaria sua experiência com Kaldi ASR?

Speechmatics
Patrocinado
Speechmatics
Visitar Site
Já se passaram dois meses desde que este perfil recebeu uma nova avaliação
Deixe uma Avaliação

Avaliações e Detalhes do Produto Kaldi ASR

Imagem do Avatar do Produto

Já usou Kaldi ASR antes?

Responda a algumas perguntas para ajudar a comunidade Kaldi ASR

Avaliações Kaldi ASR (21)

Ver Avaliações em Vídeo do 1
Avaliações

Avaliações Kaldi ASR (21)

Ver Avaliações em Vídeo do 1
4.1
avaliações 21

Pesquisar avaliações
Filtrar Avaliações
Limpar Resultados
As avaliações da G2 são autênticas e verificadas.
Nagendra K.
NK
Senior Engineer - Data Scientist
Empresa (> 1000 emp.)
"Verificação de Locutor usando o Kaldi Toolkit"
O que você mais gosta Kaldi ASR?

É um kit de ferramentas de código aberto e muito bem mantido pelo grupo central do laboratório de reconhecimento de fala da Universidade Johns Hopkins. Podemos extrair várias características de ponta, como i-vector e x-vector, que podem ser usadas para várias tarefas relacionadas à fala. Para tarefas relacionadas à fala, podemos alcançar o resultado de ponta. Análise coletada por e hospedada no G2.com.

O que você não gosta Kaldi ASR?

A instalação do Kaldi com suporte a GPU é um pesadelo para mim. Análise coletada por e hospedada no G2.com.

Usuário Verificado em Tecnologia da Informação e Serviços
UT
Pequena Empresa (50 ou menos emp.)
"A versão atual do Kaldi não é intuitiva ou amigável para o usuário."
O que você mais gosta Kaldi ASR?

As vantagens do Kaldi são que, uma vez que você o conhece profundamente após muita experiência, as possibilidades de personalizar modelos acústicos se tornam bastante infinitas. A comunidade de usuários do Kaldi é bastante vasta, interativa, e é provável que alguém já tenha tido o mesmo problema que você, se você souber o que procurar. Existem muitas ferramentas úteis na pasta utils/, embora todas precisem de personalização minuciosa para uso adequado na construção de modelos, já que o processo é inerentemente orientado por dados. Kaldi realmente parece um quebra-cabeça enorme, e montá-lo é bastante gratificante de uma maneira estranha e masoquista. É ótimo que, por ser baseado na comunidade, existam muitas receitas pré-existentes que são facilmente personalizáveis para vários casos de uso e que você possa contribuir com sua própria receita. Meu próprio santo graal ao qual sempre volto é o tutorial de Eleanor Chodroff para construir modelos acústicos Kaldi, pois descreve a estrutura de dados específica necessária para o processo. Análise coletada por e hospedada no G2.com.

O que você não gosta Kaldi ASR?

Bem. Há muitas questões que devo abordar em relação ao Kaldi. Estas são apenas algumas das coisas que todos sabem e aceitaram, mas a verdade é que atualmente o Kaldi não é amigável ou intuitivo para o usuário. Embora existam muitas receitas, elas são praticamente inúteis porque todas precisam ser completamente personalizadas, já que o objetivo de criar um modelo ASR personalizado é que ele seja totalmente orientado por dados. Não há explicações sobre o que são as muitas utilidades ou por que devem ocorrer em determinada ordem. A única maneira de aprender a usar o Kaldi é através de tentativa e erro. Se você tentar fazer perguntas a Dan Povey no fórum, receberá uma resposta passivo-agressiva disfarçada de conselho, dizendo para mudar de carreira e parar de trabalhar com reconhecimento de fala. Todo o framework é tão não intuitivo que não faz sentido. Literalmente qualquer interface de usuário ou instruções mais abrangentes e diretas seriam ótimas.

O que também me irrita é que existem tantos sistemas fantásticos de representação de linguagem com os quais se pode fazer um ótimo LM, mas como o Kaldi só funciona com o formato ARPA, isso impede qualquer grande progresso na qualidade do ASR em relação aos LMs.

Outra coisa é que se você cometer um erro, praticamente tem que começar tudo de novo.

Especialmente porque o Kaldi é tão orientado por dados, é particularmente difícil automatizar processos de construção de AM, o que é prejudicial para o crescimento da empresa se o Kaldi for a principal ferramenta utilizada lá. Análise coletada por e hospedada no G2.com.

Nadeem P.
NP
Machine Learning Engineer
Médio Porte (51-1000 emp.)
"Kaldi é uma ferramenta amigável, que nos dá a liberdade de explorar coisas como reconhecimento de fala."
O que você mais gosta Kaldi ASR?

Criação de Modelo de Linguagem e criação de FST. Análise coletada por e hospedada no G2.com.

O que você não gosta Kaldi ASR?

A geração de léxicos requer a ajuda de linguistas se os dados de léxicos de código aberto não estiverem disponíveis. Análise coletada por e hospedada no G2.com.

Ayush J.
AJ
Software developer
Pequena Empresa (50 ou menos emp.)
"Eu tenho uma ótima experiência usando o kit de ferramentas kaldi."
O que você mais gosta Kaldi ASR?

Velocidade, precisão. Isso torna o trabalho mais simples. A velocidade foi ótima. Toda a documentação estava lá. Não há outra ferramenta como o kaldi para implementar a conversão de fala para texto. Análise coletada por e hospedada no G2.com.

O que você não gosta Kaldi ASR?

Compatibilidade do sistema operacional. Enfrentei um problema com o sistema operacional Windows. Kaldi era mais rápido no Linux, mas foi difícil de implementar no Windows. Análise coletada por e hospedada no G2.com.

Usuário Verificado em Educação Primária/Secundária
UE
Pequena Empresa (50 ou menos emp.)
"Kaldi - uma ferramenta para ASR personalizado e sincronizado no tempo"
O que você mais gosta Kaldi ASR?

Ele possui fst para LM, o que o torna uma solução muito flexível e personalizável para o domínio de aplicação alvo. Ele também gera os carimbos de tempo dos fonemas na saída ctm, o que o torna uma solução ideal para sincronização de tempo e calibração de pontuação de confiança. Análise coletada por e hospedada no G2.com.

O que você não gosta Kaldi ASR?

É necessário muitos e muitos recursos de memória para carregar os modelos acústicos volumosos e os gráficos LM. Análise coletada por e hospedada no G2.com.

Usuário Verificado em Tecnologia da Informação e Serviços
UT
Pequena Empresa (50 ou menos emp.)
"kaldi é uma ferramenta muito bem pensada e escrita"
O que você mais gosta Kaldi ASR?

receitas, estabilidade e facilidade de uso,

Pessoas muito inteligentes e espertas trabalharam nisso.

Kaldi é um excelente kit de ferramentas que continua a liderar a pesquisa em tecnologias de ASR. Análise coletada por e hospedada no G2.com.

O que você não gosta Kaldi ASR?

O código base está em C++. Nos dias de hoje, se estivesse em Python, seria muito mais facilmente acessível a um público mais amplo. Análise coletada por e hospedada no G2.com.

Usuário Verificado em Hospital e Cuidados de Saúde
CH
Pequena Empresa (50 ou menos emp.)
"Kaldi é uma ferramenta útil para reconhecimento de fala."
O que você mais gosta Kaldi ASR?

É muito conveniente e útil converter arquivos de áudio em arquivos estruturados. Pode ser usado em muitas linguagens de programação, incluindo Python e C++. Seu processo automático ajuda a economizar tempo. Análise coletada por e hospedada no G2.com.

O que você não gosta Kaldi ASR?

O manual do Kaldi não é claro o suficiente e às vezes você precisa pesquisar no Google e verificar para entender totalmente o significado de alguns parâmetros. Análise coletada por e hospedada no G2.com.

Usuário Verificado em Educação Superior
UE
Médio Porte (51-1000 emp.)
"Muito útil, mas limitado para casos de uso"
O que você mais gosta Kaldi ASR?

A ferramenta Kaldi é muito rápida e fácil de manusear. Análise coletada por e hospedada no G2.com.

O que você não gosta Kaldi ASR?

No início, é difícil aprender. Se você estiver aprendendo sozinho, então parece difícil usá-lo. Análise coletada por e hospedada no G2.com.

Usuário Verificado em Software de Computador
AS
Pequena Empresa (50 ou menos emp.)
"Kaldi é um software muito bom tanto para iniciantes quanto para pesquisas avançadas de fala."
O que você mais gosta Kaldi ASR?

As características. Como múltiplos algoritmos para extração de características. Suporte para muitas arquiteturas neurais. Análise coletada por e hospedada no G2.com.

O que você não gosta Kaldi ASR?

A menos que sejamos mestres em C++, é bastante difícil invadir o código-fonte. Análise coletada por e hospedada no G2.com.

Usuário Verificado em Software de Computador
US
Pequena Empresa (50 ou menos emp.)
"útil para todos os pesquisadores de fala"
O que você mais gosta Kaldi ASR?

acesso fácil a script de amostra para construir modelos baseados em fala. Análise coletada por e hospedada no G2.com.

O que você não gosta Kaldi ASR?

Ele não consegue lidar com modelos de arquitetura de ponta a ponta. Deve-se prever provisões para isso. Análise coletada por e hospedada no G2.com.

Preços

Detalhes de preços para este produto não estão disponíveis no momento. Visite o site do fornecedor para saber mais.

Comparativos Kaldi ASR
Imagem do Avatar do Produto
OpenAI Whisper
Comparar Agora
Imagem do Avatar do Produto
HTK (Hidden Markov Model Toolkit)
Comparar Agora
Imagem do Avatar do Produto
Google Cloud Speech-to-Text
Comparar Agora
Imagem do Avatar do Produto
Kaldi ASR
Ver Alternativas