G2 est fier de présenter des avis impartiaux sur la satisfaction des user dans nos évaluations et rapports. Nous n'autorisons pas les placements payés dans nos évaluations, classements ou rapports. Découvrez nos de notation.
Plateforme d'IA vocale d'entreprise conçue pour les développeurs créant des produits axés sur la voix en utilisant des API de reconnaissance vocale, de synthèse vocale ou de conversion vocale. Plus de
Deepgram est une plateforme de transcription qui fournit des services de reconnaissance vocale avec des capacités en temps réel et des fonctionnalités supplémentaires telles que la diarisation, la ponctuation et la détection de la langue. Les critiques apprécient la haute précision et la rapidité du service de transcription de Deepgram, sa capacité à gérer une forte concurrence, et la facilité d'intégration dans les systèmes existants, avec de nombreux utilisateurs louant son efficacité en termes de coût et sa performance robuste sous des charges intenses. Les utilisateurs ont signalé des échecs occasionnels de l'API, des défis liés à la tarification pour les startups, des limitations dans le stockage des résultats, des problèmes de transcription correcte des zéros répétés, et des inexactitudes dans la diarisation des locuteurs, surtout lors de réunions avec plusieurs participants et des voix qui se chevauchent.
L'API Speech de Google Cloud traite plus d'un milliard de minutes de voix par mois avec un niveau de compréhension proche de celui des humains pour de nombreuses langues couramment parlées. Alimentée
Fondée en 2017 et basée à San Francisco, AssemblyAI est une plateforme d'IA vocale servant plus de 200 000 développeurs dans le monde entier. AssemblyAI se spécialise dans la fourniture de capacités d
AssemblyAI est un service de transcription qui fournit des transcriptions précises, la diarisation des locuteurs et la détection automatique des langues. Les utilisateurs apprécient la haute précision de transcription, la rapidité, l'accessibilité financière, ainsi que la capacité à gérer plusieurs langues et locuteurs, ainsi que la facilité d'intégration et d'utilisation. Les utilisateurs ont signalé des problèmes avec l'API, la trouvant compliquée à utiliser, des inexactitudes occasionnelles avec des accents prononcés ou un discours rapide, et des limitations dans le support des fichiers vidéo et de certaines langues.
Krisp est une plateforme de productivité vocale et de communication en temps réel basée sur l'IA qui aide les équipes, les centres de contact et les développeurs à offrir des conversations plus claire
Krisp est un outil de suppression de bruit conçu pour améliorer la qualité des réunions et appels virtuels, avec des fonctionnalités telles que des notes de réunion automatisées, des transcriptions et des éléments d'action. Les critiques apprécient la suppression de bruit supérieure, la capacité de fonctionner dans n'importe quel environnement sans interférence de bruit de fond, et les notes de réunion automatisées ainsi que les transcriptions qui leur font gagner du temps. Les utilisateurs ont mentionné des problèmes tels qu'une utilisation intensive de la RAM, des retards occasionnels dans le traitement des transcriptions, des bugs dans l'application autonome et des difficultés avec l'interface utilisateur sur le bureau.
Azure AI Speech est une suite complète de services vocaux alimentés par l'IA, conçue pour améliorer les applications avec des capacités vocales avancées. Elle offre aux développeurs des outils pour in
Azure AI Speech is a speech recognition and synthesis tool that supports multiple languages and offers features such as sentiment analysis and language translation. Users like the high accuracy of Azure AI Speech, its multilingual support, and its seamless integration with other Microsoft tools and services, which simplifies deployment and enhances daily activities. Users experienced issues with Azure AI Speech's accuracy when dealing with quick speaker changes or low-quality audio, and found the setup and configuration process complex, the pricing structure complicated, and the official documentation lacking in simplicity and robustness.
Otter.ai est le principal assistant de réunion IA qui aide les équipes de vente, de marketing, de produit, de finance, de conception des opérations, de réussite client, de support client et les équipe
Otter.ai est un outil de transcription qui capture les conversations lors des réunions et génère automatiquement des notes et des résumés. Les critiques apprécient la capacité d'Otter.ai à fournir une transcription en temps réel, à générer des résumés et à créer des listes de contrôle des éléments d'action, ce qui permet de gagner du temps et de rendre les réunions plus productives. Les critiques ont mentionné des problèmes avec la précision d'Otter.ai dans la transcription des noms et des termes techniques, sa compréhension limitée des différents interlocuteurs, et la nécessité d'améliorations dans la reconnaissance vocale et l'enregistrement audio.
Speechmatics : Meilleur sur le marché pour la reconnaissance vocale et l'IA vocale pour les entreprises Speechmatics offre des solutions de reconnaissance vocale et d'IA vocale de pointe, conçues pou
Speechmatics is a transcription technology that provides speech-to-text services, speaker identification, and language recognition. Users frequently mention the high accuracy of transcriptions, the speed of the service, the ability to recognize multiple languages, and the responsive support staff. Users experienced limitations with the free trial plan, lack of support for diverse local languages, deletion of transcription jobs after 7 days, and the need to combine Speechmatics technology with other capabilities for specialized use-cases.
Les preuves numériques ont augmenté de 10 à 100 fois au cours de la dernière décennie — des caméras portées sur le corps de chaque officier, des caméras de tableau de bord sur chaque voiture, des smar
Rev est un service de transcription qui propose à la fois des transcriptions humaines et par IA, des horodatages et des résumés par IA pour les fichiers audio et vidéo. Les critiques mentionnent fréquemment la rapidité et la précision du service, la facilité d'utilisation et l'utilité des fonctionnalités telles que l'horodatage et les résumés par IA. Les critiques ont mentionné des problèmes avec la précision de la transcription par l'IA, des difficultés avec l'interface et la navigation, ainsi que des préoccupations concernant le coût et la structure tarifaire.
Notta est un preneur de notes IA sophistiqué conçu pour aider les utilisateurs à convertir les conversations vocales en texte exploitable de manière efficace. Il est capable de transcrire à la fois de
Notta est un outil de transcription qui propose la traduction automatique pour les réunions et les fichiers audio ou vidéo, et inclut également des fonctionnalités telles que la cartographie mentale, la planification de réunions et la transcription bilingue. Les critiques mentionnent fréquemment la facilité d'utilisation, la précision de la transcription, la fonctionnalité précieuse de cartographie mentale, ainsi que la commodité du planificateur de réunions et des capacités de transcription bilingue. Les critiques ont mentionné des problèmes d'identification des locuteurs, des limitations du plan gratuit, des inexactitudes occasionnelles dans la traduction, et un désir de plus de diversité linguistique.
De l'asynchrone au streaming en direct, l'API de Gladia renforce votre plateforme avec une transcription vocale précise et multilingue ainsi que des insights exploitables. Plus de 300 000 utilisateur
Gladia is a speech recognition model that offers real-time transcription, multilingual support, and easy integration for developers. Users like Gladia's high accuracy, low latency, and the ability to handle rich context conversations, making it suitable for customer support in a complex multilingual setup. Users experienced issues with transcription accuracy for non-English languages, unclear pricing for large volume enterprise use, and minor documentation issues.
Kaldi est un ensemble d'outils de reconnaissance vocale automatique qui prend en charge les transformations linéaires, MMI, MMI renforcé et l'entraînement discriminatif MCE, l'entraînement discriminat
Speech Logger est un logiciel de reconnaissance vocale et de traduction vocale basé sur le web qui inclut la ponctuation automatique, la sauvegarde automatique, les horodatages, la capacité d'édition