Introducing G2.ai, the future of software buying.Try now
Speechmatics
Sponsorisé
Speechmatics
Visiter le site web
Image de l'avatar du produit
Kaldi ASR

Par Slashdot Media

Revendiquer le profil

Revendiquer le profil G2 de votre entreprise

Ce profil n'a pas été actif depuis plus d'un an.
Si vous travaillez chez Kaldi ASR, vous pouvez le revendiquer pour mettre à jour les informations de votre entreprise et tirer le meilleur parti de votre présence sur G2.

    Une fois approuvé, vous pouvez :

  • Mettre à jour les détails de votre entreprise et de vos produits

  • Augmenter la visibilité de votre marque sur G2, la recherche et les LLMs

  • Accéder à des informations sur les visiteurs et les concurrents

  • Répondre aux avis des clients

  • Nous vérifierons votre adresse e-mail professionnelle avant d'accorder l'accès.

4.1 sur 5 étoiles

Comment évalueriez-vous votre expérience avec Kaldi ASR ?

Speechmatics
Sponsorisé
Speechmatics
Visiter le site web
Cela fait deux mois que ce profil n'a pas reçu de nouvel avis
Laisser un avis

Avis et détails du produit Kaldi ASR

Image de l'avatar du produit

Avez-vous déjà utilisé Kaldi ASR auparavant?

Répondez à quelques questions pour aider la communauté Kaldi ASR

Avis Kaldi ASR (21)

Voir les avis vidéo de 1
Avis

Avis Kaldi ASR (21)

Voir les avis vidéo de 1
4.1
Avis 21

Rechercher des avis
Filtrer les avis
Effacer les résultats
Les avis G2 sont authentiques et vérifiés.
Nagendra K.
NK
Senior Engineer - Data Scientist
Entreprise (> 1000 employés)
"Vérification de locuteur utilisant l'outil Kaldi"
Qu'aimez-vous le plus à propos de Kaldi ASR?

C'est un ensemble d'outils open-source et très bien entretenu par le groupe principal du laboratoire de reconnaissance vocale de l'Université Johns Hopkins. Nous pouvons extraire diverses caractéristiques de pointe telles que l'i-vector, le x-vector qui peuvent être utilisées pour diverses tâches liées à la parole. Pour les tâches liées à la parole, nous pouvons atteindre le résultat de pointe. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

L'installation de Kaldi avec le support GPU est un cauchemar pour moi. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Technologie de l'information et services
UT
Petite entreprise (50 employés ou moins)
"La version actuelle de Kaldi n'est ni intuitive ni conviviale."
Qu'aimez-vous le plus à propos de Kaldi ASR?

Les avantages de Kaldi sont que, une fois que vous le connaissez très profondément après beaucoup d'expérience, les possibilités deviennent presque infinies pour personnaliser les modèles acoustiques. La communauté d'utilisateurs de Kaldi est assez vaste, interactive, et il y a de fortes chances que quelqu'un ait eu le même problème que vous si vous savez simplement quoi chercher. Il y a de nombreux outils utiles dans le dossier utils/, même s'ils nécessitent tous une personnalisation approfondie pour une utilisation appropriée dans la construction de modèles, car le processus est intrinsèquement axé sur les données. Kaldi ressemble à un immense puzzle, et l'assembler est assez gratifiant d'une manière étrange et masochiste. C'est formidable que, puisqu'il est basé sur la communauté, il existe de nombreuses recettes préexistantes facilement personnalisables pour divers cas d'utilisation et que vous puissiez contribuer avec votre propre recette. Mon propre saint graal auquel je reviens toujours est le tutoriel d'Eleanor Chodroff pour construire des modèles acoustiques Kaldi, car il décrit la structure de données particulière requise pour le processus. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Eh bien. Il y a de nombreux problèmes que je dois aborder concernant Kaldi. Ce ne sont que quelques-unes de ces choses que tout le monde connaît et a acceptées, mais en fin de compte, Kaldi n'est actuellement ni convivial ni intuitif. Bien qu'il y ait beaucoup de recettes, elles sont toutes presque inutiles car elles doivent toutes être soigneusement personnalisées, car le but de créer un modèle ASR personnalisé est qu'il soit entièrement axé sur les données. Il n'y a aucune explication sur ce que sont les nombreux utilitaires ou pourquoi ils doivent être utilisés dans un certain ordre. La seule façon d'apprendre à utiliser Kaldi est par un apprentissage approfondi par essais et erreurs. Si vous essayez de poser des questions à Dan Povey sur le forum, vous recevrez une réponse passive-agressive à peine déguisée en conseil vous disant de changer de carrière et d'arrêter de faire de la reconnaissance vocale. L'ensemble du cadre est si peu intuitif qu'il n'a aucun sens. Littéralement, n'importe quelle interface utilisateur ou des instructions plus complètes et directes seraient excellentes. Ce qui m'irrite aussi, c'est qu'il existe tant de systèmes de représentation linguistique fantastiques avec lesquels on peut créer un excellent LM, mais comme Kaldi ne fonctionne qu'avec le format ARPA, cela empêche tout grand progrès dans la qualité de l'ASR en ce qui concerne les LMs. Une autre chose est que si vous faites une erreur, vous devez pratiquement tout recommencer. Surtout que Kaldi est tellement axé sur les données, il est particulièrement difficile d'automatiser les processus de construction AM, ce qui freine la croissance de l'entreprise si Kaldi est l'outil principal utilisé là-bas. Avis collecté par et hébergé sur G2.com.

Nadeem P.
NP
Machine Learning Engineer
Marché intermédiaire (51-1000 employés)
"Kaldi est un outil convivial, qui nous donne la liberté d'explorer des choses comme la reconnaissance vocale."
Qu'aimez-vous le plus à propos de Kaldi ASR?

Création de modèle linguistique et création de FST. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

La génération de lexique nécessite l'aide de linguistes si les données de lexique open source ne sont pas disponibles. Avis collecté par et hébergé sur G2.com.

Ayush J.
AJ
Software developer
Petite entreprise (50 employés ou moins)
"J'ai une excellente expérience avec l'outil Kaldi."
Qu'aimez-vous le plus à propos de Kaldi ASR?

Vitesse, précision. Cela rend le travail plus simple. La vitesse était excellente. Toute la documentation était là. Il n'y a pas d'autre outil comme kaldi pour mettre en œuvre la conversion de la parole en texte. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Compatibilité du système d'exploitation. J'ai rencontré un problème avec le système d'exploitation Windows. Kaldi était plus rapide sous Linux mais il était difficile à mettre en œuvre sous Windows. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Éducation primaire/secondaire
Petite entreprise (50 employés ou moins)
"Kaldi - un outil pour la reconnaissance vocale automatique (ASR) personnalisée et synchronisée dans le temps"
Qu'aimez-vous le plus à propos de Kaldi ASR?

Il dispose de fst pour LM, ce qui en fait une solution très flexible et personnalisable pour cibler le domaine d'application. Il génère également les horodatages des phonèmes dans la sortie ctm, ce qui en fait une solution idéale pour la synchronisation temporelle et l'étalonnage des scores de confiance. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Il faut beaucoup, beaucoup de ressources mémoire pour charger les modèles acoustiques volumineux et les graphes LM. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Technologie de l'information et services
UT
Petite entreprise (50 employés ou moins)
"kaldi est un outil très bien pensé et écrit"
Qu'aimez-vous le plus à propos de Kaldi ASR?

recettes, stabilité et convivialité,

Des personnes très intelligentes et brillantes ont travaillé dessus.

Kaldi est un excellent outil qui continue de mener la recherche dans les technologies ASR. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Le code de base est en C++. De nos jours, s'il était en Python, il serait beaucoup plus facilement accessible à un plus large public. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Soins hospitaliers et de santé
CS
Petite entreprise (50 employés ou moins)
"Kaldi est un outil utile pour la reconnaissance vocale."
Qu'aimez-vous le plus à propos de Kaldi ASR?

Il est très pratique et utile de convertir des fichiers audio en fichiers structurés. Cela peut être utilisé dans de nombreux langages de programmation, y compris Python et C++. Son processus automatique aide à gagner du temps. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Le manuel de Kaldi n'est pas assez clair et parfois vous devez chercher sur Google et vérifier pour comprendre totalement le sens de certains paramètres. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Enseignement supérieur
UE
Marché intermédiaire (51-1000 employés)
"Très utile mais limité pour les cas d'utilisation"
Qu'aimez-vous le plus à propos de Kaldi ASR?

L'outil Kaldi est très rapide et facile à manipuler. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Au début, il est difficile d'apprendre. Si vous l'apprenez seul, cela semble difficile à utiliser. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Logiciels informatiques
AL
Petite entreprise (50 employés ou moins)
"Kaldi est un très bon logiciel pour la recherche vocale, tant pour les débutants que pour les utilisateurs avancés."
Qu'aimez-vous le plus à propos de Kaldi ASR?

Les fonctionnalités. Comme plusieurs algorithmes pour l'extraction de caractéristiques. Support pour de nombreuses architectures neuronales. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

À moins que nous soyons des maîtres en C++, il est assez difficile de pirater le code source. Avis collecté par et hébergé sur G2.com.

Utilisateur vérifié à Logiciels informatiques
UL
Petite entreprise (50 employés ou moins)
"utile pour tous les chercheurs en discours"
Qu'aimez-vous le plus à propos de Kaldi ASR?

accès facile à un script d'exemple pour construire des modèles basés sur la parole. Avis collecté par et hébergé sur G2.com.

Que n’aimez-vous pas à propos de Kaldi ASR?

Il ne peut pas gérer les modèles d'architecture de bout en bout. Une provision devrait être prévue pour ceux-ci. Avis collecté par et hébergé sur G2.com.

Tarification

Les détails de tarification pour ce produit ne sont pas actuellement disponibles. Visitez le site du fournisseur pour en savoir plus.

Comparaisons Kaldi ASR
Image de l'avatar du produit
OpenAI Whisper
Comparer maintenant
Image de l'avatar du produit
HTK (Hidden Markov Model Toolkit)
Comparer maintenant
Image de l'avatar du produit
Google Cloud Speech-to-Text
Comparer maintenant
Image de l'avatar du produit
Kaldi ASR
Voir les alternatives