Introducing G2.ai, the future of software buying.Try now
Speechmatics
Patrocinado
Speechmatics
Visitar sitio web
Imagen del Avatar del Producto
Kaldi ASR

Por Slashdot Media

Reclamar Perfil

Reclama el perfil de tu empresa en G2

Este perfil no ha estado activo por más de un año.
Si trabajas en Kaldi ASR, puedes reclamarlo nuevamente para mantener la información de tu empresa actualizada y aprovechar al máximo tu presencia en G2.

    Una vez aprobado, puedes:

  • Actualizar los detalles de tu empresa y producto

  • Aumentar la visibilidad de tu marca en G2, búsqueda y LLMs

  • Acceder a información sobre visitantes y competidores

  • Responder a reseñas de clientes

  • Verificaremos tu correo electrónico de trabajo antes de otorgar acceso.

4.1 de 5 estrellas

¿Cómo calificarías tu experiencia con Kaldi ASR?

Speechmatics
Patrocinado
Speechmatics
Visitar sitio web
Han pasado dos meses desde que este perfil recibió una nueva reseña
Deja una reseña

Kaldi ASR Reseñas y Detalles del Producto

Imagen del Avatar del Producto

¿Has utilizado Kaldi ASR antes?

Responde algunas preguntas para ayudar a la comunidad de Kaldi ASR

Reseñas de Kaldi ASR (21)

Ver reseñas en video de 1
Reseñas

Reseñas de Kaldi ASR (21)

Ver reseñas en video de 1
4.1
Reseñas de 21

Buscar reseñas
Filtrar Reseñas
Borrar resultados
Las reseñas de G2 son auténticas y verificadas.
Nagendra K.
NK
Senior Engineer - Data Scientist
Empresa (> 1000 empleados)
"Verificación de hablantes utilizando el conjunto de herramientas Kaldi."
¿Qué es lo que más te gusta de Kaldi ASR?

Es un conjunto de herramientas de código abierto y muy bien mantenido por el grupo central del laboratorio de reconocimiento de voz de la Universidad Johns Hopkins. Podemos extraer varias características de última generación, como i-vector y x-vector, que se pueden utilizar para diversas tareas relacionadas con el habla. Para tareas relacionadas con el habla, podemos lograr resultados de última generación. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de Kaldi ASR?

La instalación de Kaldi con soporte para GPU es una pesadilla para mí. Reseña recopilada por y alojada en G2.com.

Usuario verificado en Tecnología de la información y servicios
UT
Pequeña Empresa (50 o menos empleados)
"La versión actual de Kaldi no es intuitiva ni fácil de usar."
¿Qué es lo que más te gusta de Kaldi ASR?

Las ventajas de Kaldi son que, una vez que lo conoces muy profundamente después de mucha experiencia, las posibilidades se vuelven bastante infinitas para personalizar modelos acústicos. La comunidad de usuarios de Kaldi es bastante amplia e interactiva, y es probable que alguien haya tenido el mismo problema que tú si solo sabes qué buscar. Hay muchas herramientas útiles en la carpeta utils/, aunque todas necesitan una personalización exhaustiva para un uso adecuado en la construcción de modelos, ya que el proceso es inherentemente impulsado por los datos. Kaldi se siente como un rompecabezas enorme, y armarlo es bastante gratificante de una manera extraña y masoquista. Es genial que, al ser basado en la comunidad, haya muchas recetas preexistentes que son fácilmente personalizables para varios casos de uso y que puedas contribuir con tu propia receta. Mi propio santo grial al que siempre vuelvo es el tutorial de Eleanor Chodroff para construir modelos acústicos de Kaldi, ya que describe la estructura de datos particular requerida para el proceso. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de Kaldi ASR?

Bueno. Hay muchos problemas que debo abordar en relación con Kaldi. Esto es solo algunas de esas cosas que todos saben y han aceptado, pero la conclusión es que actualmente Kaldi no es fácil de usar ni intuitivo. Aunque hay muchas recetas, todas son casi inútiles porque todas necesitan ser personalizadas a fondo, ya que el objetivo de crear un modelo ASR personalizado es que esté completamente basado en datos. No hay explicaciones sobre qué son las muchas utilidades o por qué deben ocurrir en qué orden. La única manera de aprender a usar Kaldi es a través de un exhaustivo ensayo y error. Si intentas hacerle preguntas a Dan Povey en el foro, recibirás una respuesta pasivo-agresiva disfrazada de consejo diciéndote que cambies de carrera y dejes de hacer reconocimiento de voz. Todo el marco es tan poco intuitivo que no tiene sentido. Literalmente, cualquier interfaz de usuario o alguna instrucción más comprensiva y directa sería genial.

Lo que también me molesta es que hay tantos sistemas de representación del lenguaje fantásticos con los que se puede hacer un gran LM, pero dado que Kaldi solo funciona con el formato ARPA, no permite ningún gran progreso en la calidad del ASR en lo que respecta a los LMs.

Otra cosa es que si cometes un error, prácticamente tienes que empezar de nuevo. Especialmente dado que Kaldi está tan basado en datos, es particularmente difícil automatizar los procesos de construcción de AM, lo cual es un obstáculo para el crecimiento de la empresa si Kaldi es la herramienta principal que se utiliza allí. Reseña recopilada por y alojada en G2.com.

Nadeem P.
NP
Machine Learning Engineer
Mediana Empresa (51-1000 empleados)
"Kaldi es una herramienta fácil de usar, que nos da la libertad de explorar cosas como el reconocimiento de voz."
¿Qué es lo que más te gusta de Kaldi ASR?

Creación de modelos de lenguaje y creación de FST. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de Kaldi ASR?

La generación de léxicos requiere la ayuda de lingüistas si los datos de léxicos de código abierto no están disponibles. Reseña recopilada por y alojada en G2.com.

Ayush J.
AJ
Software developer
Pequeña Empresa (50 o menos empleados)
"Tengo una gran experiencia usando el conjunto de herramientas kaldi."
¿Qué es lo que más te gusta de Kaldi ASR?

Velocidad, precisión. Hace el trabajo más sencillo. La velocidad fue excelente. Toda la documentación estaba allí. La instrucción fue realmente útil. No hay otra herramienta como Kaldi para implementar la conversión de voz a texto. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de Kaldi ASR?

Compatibilidad del sistema operativo. Me enfrenté a un problema con el sistema operativo Windows. Kaldi era más rápido en Linux, pero fue difícil de implementar en Windows. Reseña recopilada por y alojada en G2.com.

Usuario verificado en Educación Primaria/Secundaria
UE
Pequeña Empresa (50 o menos empleados)
"Kaldi - una herramienta para ASR personalizado y sincronizado en el tiempo"
¿Qué es lo que más te gusta de Kaldi ASR?

Tiene fst para LM, lo que lo convierte en una solución muy flexible y personalizable para el dominio de la aplicación objetivo. También genera las marcas de tiempo de los fonemas en la salida ctm, lo que lo convierte en una solución ideal para la sincronización de tiempo y la calibración de la puntuación de confianza. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de Kaldi ASR?

Necesita muchos y muchos recursos de memoria para cargar los voluminosos modelos acústicos y los gráficos LM. Reseña recopilada por y alojada en G2.com.

Usuario verificado en Tecnología de la información y servicios
UT
Pequeña Empresa (50 o menos empleados)
"Kaldi es una herramienta muy bien pensada y escrita."
¿Qué es lo que más te gusta de Kaldi ASR?

recetas, estabilidad y facilidad de uso,

Personas muy inteligentes y capacitadas trabajaron en ello.

Kaldi es un excelente conjunto de herramientas que lidera continuamente la investigación en tecnologías de reconocimiento automático del habla (ASR). Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de Kaldi ASR?

El código base está en C++. En la actualidad, si estuviera en Python, sería mucho más accesible para un público más amplio. Reseña recopilada por y alojada en G2.com.

Usuario verificado en Atención hospitalaria y sanitaria
CA
Pequeña Empresa (50 o menos empleados)
"Kaldi es una herramienta útil para el reconocimiento de voz."
¿Qué es lo que más te gusta de Kaldi ASR?

Es muy conveniente y útil convertir archivos de audio en archivos estructurados. Se puede usar en muchos lenguajes de programación, incluidos Python y C++. Su proceso automático ayuda a ahorrar tiempo. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de Kaldi ASR?

El manual de Kaldi no es lo suficientemente claro y a veces necesitas buscar en Google y verificar para entender completamente el significado de algunos parámetros. Reseña recopilada por y alojada en G2.com.

Usuario verificado en Educación superior
UE
Mediana Empresa (51-1000 empleados)
"Muy útil pero limitado para casos de uso"
¿Qué es lo que más te gusta de Kaldi ASR?

La herramienta Kaldi es muy rápida y fácil de manejar. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de Kaldi ASR?

Al principio, es difícil de aprender. Si lo estás aprendiendo solo, entonces parece difícil de usar. Reseña recopilada por y alojada en G2.com.

Usuario verificado en Software de Computadora
AS
Pequeña Empresa (50 o menos empleados)
"Kaldi es un software muy bueno tanto para principiantes como para investigadores avanzados del habla."
¿Qué es lo que más te gusta de Kaldi ASR?

Las características. Como múltiples algoritmos para la extracción de características. Soporte para muchas arquitecturas neuronales. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de Kaldi ASR?

A menos que seamos expertos en C++, es bastante difícil hackear el código fuente. Reseña recopilada por y alojada en G2.com.

Usuario verificado en Software de Computadora
US
Pequeña Empresa (50 o menos empleados)
"útil para todos los investigadores del habla"
¿Qué es lo que más te gusta de Kaldi ASR?

acceso fácil a guiones de muestra para construir modelos basados en el habla. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de Kaldi ASR?

No puede manejar modelos de arquitectura de extremo a extremo. Se debe proporcionar una provisión para ellos. Reseña recopilada por y alojada en G2.com.

Precios

Los detalles de precios para este producto no están disponibles actualmente. Visita el sitio web del proveedor para obtener más información.

Kaldi ASR Comparaciones
Imagen del Avatar del Producto
OpenAI Whisper
Comparar ahora
Imagen del Avatar del Producto
HTK (Hidden Markov Model Toolkit)
Comparar ahora
Imagen del Avatar del Producto
Google Cloud Speech-to-Text
Comparar ahora
Imagen del Avatar del Producto
Kaldi ASR
Ver alternativas