Introducing G2.ai, the future of software buying.Try now

AssemblyAI - Speech to Text API Reseñas y Detalles del Producto

Precios

Precios proporcionados por AssemblyAI - Speech to Text API.

Get started at no cost

Gratis

Integraciones de AssemblyAI - Speech to Text API

(20)
Verificado por AssemblyAI - Speech to Text API

Contenido Multimedia de AssemblyAI - Speech to Text API

Demo AssemblyAI - Speech to Text API - Streaming Speech-to-text
Power real-time voice experiences with ultra-fast and ultra-accurate speech-to-text, unlimited concurrency, and pricing that scales with you.
Demo AssemblyAI - Speech to Text API - Speech-to-text
Experience industry-leading speech-to-text accuracy with Speech AI models on the cutting-edge of AI research, accessible through a simple API.
Siro reduced customer complaints and support tickets by 90% after switching to AssemblyAI's Universal speech recognition model.
Reproducir vídeo de AssemblyAI - Speech to Text API
Siro reduced customer complaints and support tickets by 90% after switching to AssemblyAI's Universal speech recognition model.
By leveraging AssemblyAI's transcription capabilities, VEED converts videos into editable text, making
Reproducir vídeo de AssemblyAI - Speech to Text API
By leveraging AssemblyAI's transcription capabilities, VEED converts videos into editable text, making "video way more malleable" and significantly reducing barriers to producing professional content.
Supernormal, an AI-powered meeting platform, doubled their free-to-paid conversion rate after integrating AssemblyAI's advanced speech-to-text technology.
Reproducir vídeo de AssemblyAI - Speech to Text API
Supernormal, an AI-powered meeting platform, doubled their free-to-paid conversion rate after integrating AssemblyAI's advanced speech-to-text technology.
CallRail improved its call transcription accuracy by up to 23% and doubled the number of customers using its Conversation Intelligence product.
Reproducir vídeo de AssemblyAI - Speech to Text API
CallRail improved its call transcription accuracy by up to 23% and doubled the number of customers using its Conversation Intelligence product.
Imagen del Avatar del Producto

¿Has utilizado AssemblyAI - Speech to Text API antes?

Responde algunas preguntas para ayudar a la comunidad de AssemblyAI - Speech to Text API

Reseñas de AssemblyAI - Speech to Text API (98)

Reseñas

Reseñas de AssemblyAI - Speech to Text API (98)

4.6
Reseñas de 98

Pros y Contras

Generado a partir de reseñas de usuarios reales
Ver Todos los Pros y Contras
Buscar reseñas
Filtrar Reseñas
Borrar resultados
Las reseñas de G2 son auténticas y verificadas.
Richard V.
RV
Company Owner
Pequeña Empresa (50 o menos empleados)
"Potente, Amigable para Desarrolladores STT con Espacio para Evolucionar"
¿Qué es lo que más te gusta de AssemblyAI - Speech to Text API?

* La precisión es excelente, incluso con audio ruidoso o con múltiples hablantes. Muchas de las transcripciones requirieron una edición mínima.

* La diarización de hablantes funciona de manera confiable: poder separar quién dijo qué es una gran ventaja en grabaciones con varias personas.

* La facilidad de integración es destacable: la API está bien documentada, el proceso de incorporación es fluido y pude comenzar a usarla rápidamente.

* El modelo de precios es justo y transparente: pagas por uso en lugar de estar atado a una suscripción.

* Las funciones avanzadas como Word Boost / sugerencia de palabras clave, redacción de PII y detección automática de idioma ofrecen una flexibilidad útil para casos de uso en el mundo real. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de AssemblyAI - Speech to Text API?

* Los tiempos de latencia/respuesta pueden variar bajo carga, lo que lo hace menos predecible para necesidades en tiempo real.

* La personalización es algo limitada: el ajuste fino para vocabulario específico de dominio o peculiaridades acústicas no es tan profundo como uno podría esperar.

* La API devuelve muchos campos en la respuesta; para flujos de trabajo más simples, ese metadato adicional puede agregar sobrecarga.

* El límite de longitud de audio de 10 horas (para algunos puntos finales) se siente restrictivo para grabaciones muy largas.

* En ciertas regiones (por ejemplo, Europa), algunas funciones están ausentes o aún en desarrollo. Reseña recopilada por y alojada en G2.com.

"Interfaz intuitiva, resuelve desafíos de escucha"
¿Qué es lo que más te gusta de AssemblyAI - Speech to Text API?

Aprecio la interfaz de usuario de AssemblyAI - API de Voz a Texto, especialmente los colores y el formato atractivos que la hacen agradable de usar. El diseño mejora mi experiencia general, haciendo que la herramienta sea más acogedora y cómoda para interactuar durante las tareas de transcripción. Este aspecto de la API no solo es estéticamente agradable, sino también funcional, contribuyendo a una navegación y experiencia de uso más fluida. Además, el proceso de configuración inicial fue muy fácil, permitiéndome comenzar rápidamente sin complicaciones. Esta facilidad de uso desde el principio, combinada con una interfaz atractiva, mejora significativamente la usabilidad de la herramienta. Además, AssemblyAI - API de Voz a Texto resuelve efectivamente mi problema con la escucha, ya que me ayuda a tomar notas a pesar de enfrentar problemas de audición. Esta funcionalidad es crucial para mí y juega un papel significativo en el apoyo a mis necesidades diarias de transcripción. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de AssemblyAI - Speech to Text API?

Encuentro que el costo de AssemblyAI - API de reconocimiento de voz es alto. Reseña recopilada por y alojada en G2.com.

"Transcripciones precisas, necesita mejoras de privacidad"
¿Qué es lo que más te gusta de AssemblyAI - Speech to Text API?

Aprecio las etiquetas de hablante anónimas proporcionadas por AssemblyAI - API de Voz a Texto, que son cruciales para mantener la confidencialidad en entornos educativos como mi aplicación, Sound Pedagogy. Encuentro que la precisión de la transcripción es bastante impresionante, lo cual es vital para analizar grabaciones de audio de aulas de manera efectiva para patrones y tendencias. Además, encuentro que la configuración de AssemblyAI - API de Voz a Texto es bastante fácil, especialmente porque construí mi producto con Replit, haciendo que el proceso de implementación sea fluido y eficiente. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de AssemblyAI - Speech to Text API?

Desearía poder eliminar completamente los nombres de los estudiantes del discurso. Lo he intentado, pero los resultados no son buenos. También desearía poder eliminar o borrar la grabación una vez que el audio esté transcrito. La privacidad es primordial con mi aplicación. Reseña recopilada por y alojada en G2.com.

Sarmad W.
SW
Solutions Architect
Mediana Empresa (51-1000 empleados)
"AssemblyAI STT: Simple, asequible, pero no sin concesiones"
¿Qué es lo que más te gusta de AssemblyAI - Speech to Text API?

AssemblyAI fue sinceramente un placer trabajar con ellos. Lo que más me llamó la atención:

✅ Ridículamente fácil de usar – La API es sencilla y está bien documentada. Estaba en funcionamiento en minutos sin necesidad de profundizar en la documentación de casos extremos.

🔧 Integración sin esfuerzo – Lo conectamos directamente a nuestra tubería STT existente con cambios mínimos. Se sintió como si estuviera diseñado para encajar perfectamente.

💸 Rentable – Nos proporcionó una calidad de transcripción sólida a un precio mucho más bajo en comparación con otros proveedores, lo que lo hizo una decisión obvia desde el punto de vista del presupuesto. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de AssemblyAI - Speech to Text API?

Aunque AssemblyAI en general ofreció un valor sólido, hubo un par de áreas que no cumplieron con nuestras expectativas:

🕒 Tiempos de respuesta inconsistentes – Notamos variabilidad en la latencia de transcripción, especialmente durante ventanas de alta carga. Esto hizo que fuera complicado confiar en él para flujos de trabajo casi en tiempo real.

⚙️ Personalización limitada – La API no ofrecía mucha flexibilidad para adaptar el modelo a vocabulario específico de un dominio o peculiaridades acústicas. Si estás trabajando en una industria de nicho o necesitas una precisión ajustada, estás un poco limitado. Reseña recopilada por y alojada en G2.com.

Respuesta de Madison Boyd de AssemblyAI - Speech to Text API

¡Gracias por la revisión detallada y los comentarios!

Estamos encantados de saber que AssemblyAI ha optimizado su flujo de trabajo de transcripción de llamadas en frío y ha proporcionado ahorros de tiempo significativos para sus equipos de ventas y marketing. Su experiencia con la fácil integración y la rentabilidad realmente captura lo que buscamos con nuestra API.

Con respecto a la variabilidad en el tiempo de respuesta: Nos encantaría ayudarle a optimizar su configuración para un rendimiento más consistente. Los tiempos de respuesta pueden variar según factores como la configuración de idioma y las configuraciones de características, y nuestro equipo de soporte en support@assemblyai.com estaría encantado de revisar su caso específico para identificar posibles optimizaciones.

Para flujos de trabajo en tiempo real, también podría querer explorar nuestra opción de STT en Streaming, que está diseñada específicamente para necesidades de transcripción en tiempo real y de baja latencia y podría ser una mejor opción para sus requisitos casi en tiempo real.

Sobre las opciones de personalización: De hecho, ofrecemos varias formas de ajustar la salida del modelo tanto para audio pregrabado como en streaming a través de características como el aviso de palabras clave y el impulso. En nuestras pruebas, estas opciones de personalización ofrecen resultados comparables o mejores que los modelos personalizados de la competencia. Nuestro equipo estaría encantado de guiarle a través de estas características y ayudarle a lograr una mejor precisión específica del dominio.

Gracias de nuevo por elegir AssemblyAI y por tomarse el tiempo de compartir comentarios tan constructivos. ¡Estamos aquí para ayudarle a sacar el máximo provecho de nuestra plataforma!

Ver cómo AssemblyAI - Speech to Text API mejoró
Neha J.
NJ
UX/UI Designer
Mediana Empresa (51-1000 empleados)
"Transcripciones precisas y características robustas, poco margen de mejora"
¿Qué es lo que más te gusta de AssemblyAI - Speech to Text API?

Transcripciones muy precisas, incluso con términos técnicos y audio ruidoso. Tiene características de identificación de hablantes, resumen, detección de temas, etc. Buena integración/API amigable para desarrolladores que admite transmisión, carga de archivos, buena documentación. Escalable incluso para casos de uso de alto volumen. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de AssemblyAI - Speech to Text API?

El precio para uso intensivo y funciones avanzadas puede ser relativamente alto. Aunque es multilingüe, la precisión y las características para acentos no ingleses o de nicho son comparativamente menores. Diseñado principalmente para desarrolladores/usuarios técnicos. Reseña recopilada por y alojada en G2.com.

Fabrizio N.
FN
Sviluppatore
Pequeña Empresa (50 o menos empleados)
"AssemblyAI: transcripciones precisas API simples de integrar funcionalidades avanzadas rápido y eficaz"
¿Qué es lo que más te gusta de AssemblyAI - Speech to Text API?

AssemblyAI es una de las mejores opciones para transcribir automáticamente y analizar el audio. Es muy preciso, rápido y fácil de usar. Tiene muchas funcionalidades y es perfecto para desarrolladores, empresas tecnológicas y cualquiera que quiera gestionar grandes cantidades de datos de voz de manera automática. Con el sistema API puedes crear tu propio software y personalizarlo como quieras. Yo uso las API con mi programa en Python.

Puntos fuertes

Precisión: entre las mejores tasas de precisión del sector, con un Word Error Rate (WER) muy bajo y un rendimiento constante incluso en audios complejos.

Velocidad: transcripción asincrónica en menos de 45 segundos y en tiempo real con una latencia inferior a 600 ms.

Experiencia para desarrolladores: API bien documentada, fácil de integrar, con ejemplos prácticos y soporte técnico eficaz.

Versatilidad: adecuada tanto para casos de uso simples (transcripción de webinars, reuniones, podcasts) como para flujos de trabajo complejos (análisis de sentimientos, extracción de entidades, moderación de contenidos).

Accesibilidad: precios competitivos pay-as-you-go, sin costos ocultos. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de AssemblyAI - Speech to Text API?

No puedo decir que haya encontrado problemas en el sistema. Excelente y confiable. El mejor. Reseña recopilada por y alojada en G2.com.

Usuario verificado en Gestión Educativa
PG
Empresa (> 1000 empleados)
"Fácil de usar, barato y preciso."
¿Qué es lo que más te gusta de AssemblyAI - Speech to Text API?

AssemblyAI ha transformado cómo interactúo con los datos de voz. La plataforma es intuitiva e increíblemente fácil de integrar tanto con herramientas de automatización de bajo código como con flujos de trabajo personalizados. Su precisión ha superado a menudo mis expectativas, lo que la hace perfecta para diversas necesidades empresariales. Aprecio particularmente la claridad en los precios: es justo para el valor que obtienes, y la relación costo-beneficio es excelente. El soporte de su equipo siempre ha sido rápido y completo cuando se necesita. Me gusta mucho el producto. Me encuentro muy bien. El precio es justo, si costara menos sería mejor, pero está bien. Me gusta mucho el producto. Me encuentro muy bien. El precio es justo, si costara menos sería mejor, pero está bien. La API de transcripción de voz a texto de AssemblyAI es realmente fácil de usar; no soy un perfil técnico y la uso tanto con plataformas de automatización (como Zapier) como con código personalizado. Es barata, para algunos casos de uso cuesta casi nada. (Por ejemplo: entender mensajes de voz). Y, con el último modelo, es muy precisa. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de AssemblyAI - Speech to Text API?

Sería mejor si el costo fuera aún más bajo, pero está bien así. Sería mejor si el costo fuera aún más bajo, pero está bien así. Será perfecto si en Zapier puedo elegir residencia en la UE. Reseña recopilada por y alojada en G2.com.

sai c.
SC
"API de reconocimiento de voz a texto sólida pero necesita mejoras de velocidad"
¿Qué es lo que más te gusta de AssemblyAI - Speech to Text API?

Encuentro que AssemblyAI - API de Voz a Texto es muy efectiva para tareas de transcripción. Su funcionalidad me permite convertir el habla en texto sin problemas, destacando particularmente la naturaleza sencilla de esta tarea, que el servicio maneja hábilmente. También aprecio sus capacidades de transmisión en tiempo real, que mejoran la eficiencia y la practicidad de la herramienta para necesidades de transcripción inmediata. La configuración inicial de AssemblyAI - API de Voz a Texto es fácil, lo que la hace accesible y conveniente para integrar en mi flujo de trabajo sin complicaciones. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de AssemblyAI - Speech to Text API?

Experimento problemas con la velocidad de AssemblyAI - API de reconocimiento de voz, que parece pesada y potencialmente ralentiza los procesos. Reseña recopilada por y alojada en G2.com.

Respuesta de Lee Vaughn de AssemblyAI - Speech to Text API

¡Hola Sai!

Gracias por compartir tus comentarios con nosotros. Lamentamos que hayas tenido algunos problemas. Dependiendo de los problemas que estés viendo, podría haber formas de mejorar los resultados. Por favor, contacta a nuestro equipo de soporte en support@assemblyai.com con más detalles sobre el problema que estás viendo, ¡y estaremos encantados de ayudarte!

Vladyslav H.
VH
CMO
Pequeña Empresa (50 o menos empleados)
"Excelente soporte. Bajo costo."
¿Qué es lo que más te gusta de AssemblyAI - Speech to Text API?

Excelente documentación y soporte receptivo que te ayudará a resolver cualquier problema al usar la API. Soporte para múltiples idiomas y detección automática. La capacidad de cargar archivos directamente a su servidor, lo que lo hace más rápido que guardarlos en servicios de terceros. Pagas por uso en lugar de una suscripción, lo cual es muy agradable. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de AssemblyAI - Speech to Text API?

Durante mi tiempo usando el servicio, no he encontrado mucho que no me guste. Mi principal problema es que me gustaría ver soporte para archivos de video de servicios como YouTube directamente a través de un enlace. Actualmente, tengo que usar servicios de terceros para descargar y procesar videos de YouTube antes de enviarlos a AssamblyAI. Reseña recopilada por y alojada en G2.com.

Respuesta de Devon Malloy de AssemblyAI - Speech to Text API

Gracias por esta maravillosa reseña, ¡es genial saber que AssemblyAI está impulsando tus aplicaciones móviles y web con éxito!

Tu comentario sobre el soporte directo de URL de YouTube es muy valioso; hemos pasado tu nota a nuestro equipo de producto para que lo explore. Si deseas mantenerte actualizado sobre nuevas funciones o tienes sugerencias adicionales, no dudes en ponerte en contacto con nuestro equipo de soporte en [support.assemblyai.com].

Павел .
П
Xamarin Developer
Pequeña Empresa (50 o menos empleados)
"Servicio de transcripción asequible y fácil de integrar"
¿Qué es lo que más te gusta de AssemblyAI - Speech to Text API?

Estoy impresionado con el servicio de transcripción de AssemblyAI debido a su precio razonable. Por transcribir 243 horas de audio, pagué solo $68. En comparación, el modelo Chirp_2 de Google costó $47 por solo 35 horas, lo que habría sumado $326 para las mismas 243 horas.

Los beneficios adicionales incluyen la capacidad de separar el texto por diferentes hablantes (solo en inglés) y la detección automática de idiomas. La API es fácil de usar y fue fácil de integrar tanto en aplicaciones Flutter como en aplicaciones web de .NET Core.

En general, estoy satisfecho con el servicio y planeo seguir usándolo. Reseña recopilada por y alojada en G2.com.

¿Qué es lo que no te gusta de AssemblyAI - Speech to Text API?

Hay algunos aspectos que me gustaría ver mejorados. La respuesta de la API contiene demasiados campos innecesarios que no necesito, lo que aumenta los tiempos de carga. También agradecería velocidades más rápidas de procesamiento de voz a texto y un aumento en el límite máximo de duración más allá de la restricción actual de 10 horas. Además, el modelo slam-1 solo funciona con texto en inglés, y me gustaría que este modelo se internacionalizara para admitir múltiples idiomas. Reseña recopilada por y alojada en G2.com.

Opciones de precios

Precios proporcionados por AssemblyAI - Speech to Text API.

Get started at no cost

Gratis

Pay as you go

Paga según lo que uses
AssemblyAI - Speech to Text API Comparaciones
Imagen del Avatar del Producto
Deepgram
Comparar ahora
Imagen del Avatar del Producto
Google Cloud Speech-to-Text
Comparar ahora
Imagen del Avatar del Producto
OpenAI Whisper
Comparar ahora
Características de AssemblyAI - Speech to Text API
Instalación y configuración facilidad
API de Desarrollador y SDK
Integración de software
Precisión en entornos ruidosos
Escalabilidad de alto volumen
Adaptación al Ruido Ambiental
Detección de vivacidad
Cumplimiento Normativo
Canales de Comunicación Seguros
Autenticación basada en voz
Aprendizaje Automático y Reconocimiento de Voz Adaptativo
Diferenciación de hablantes
Imagen del Avatar del Producto
Imagen del Avatar del Producto