# Spark Streaming Reviews
**Vendor:** The Apache Software Foundation  
**Category:** [Software de Procesamiento de Flujos de Eventos](https://www.g2.com/es/categories/event-stream-processing)  
**Average Rating:** 4.2/5.0  
**Total Reviews:** 40
## About Spark Streaming
Spark Streaming trae la API integrada de lenguaje de Apache Spark al procesamiento de flujos, permitiéndote escribir trabajos de transmisión de la misma manera que escribes trabajos por lotes. Soporta Java, Scala y Python. Spark Streaming recupera tanto el trabajo perdido como el estado del operador (por ejemplo, ventanas deslizantes) de manera predeterminada, sin ningún código adicional de tu parte.




## Spark Streaming Reviews
  ### 1. Mejor herramienta para construir canalizaciones de datos a gran escala.

**Rating:** 4.5/5.0 stars

**Reviewed by:** K Madhusudan C. | Software Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** November 20, 2023

**¿Qué es lo que más te gusta de Spark Streaming?**

Su capacidad para manejar grandes volúmenes de datos lo hace escalable horizontalmente y su tolerancia a fallos a través de la replicación de datos y también su soporte para el procesamiento por lotes hacen que el procesamiento de datos sea más rápido.

**¿Qué es lo que no te gusta de Spark Streaming?**

La latencia de micro-lotes reduce la latencia y también su consumo intensivo de recursos al consumir una gran cantidad de recursos.

**¿Qué problemas resuelve Spark Streaming ¿Y cómo te beneficia eso?**

Usar Spark Streaming en Databricks nos ayudó a crear canalizaciones de eventos/datos mucho más rápido y su capacidad para procesar datos más rápido nos permitió lograr análisis casi en tiempo real. También utilizamos Delta Lake encima de eso, lo que nos ayudó a almacenar datos que se utilizan para análisis y otros propósitos.

  ### 2. Un agradecimiento sincero por el increíble Amazon Apache Spark Streaming.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sai kiran S. | Specialist Programmer , Empresa (> 1000 empleados)

**Reviewed Date:** June 08, 2023

**¿Qué es lo que más te gusta de Spark Streaming?**

Lo que más me gusta de Spark Streaming es su capacidad para manejar el procesamiento de datos en tiempo real de manera eficiente mientras mantiene un alto rendimiento. Permite una integración perfecta con el ecosistema de Apache Spark, proporcionando acceso a una amplia gama de bibliotecas y herramientas. El modelo de programación es fácil de trabajar, y sus mecanismos de tolerancia a fallos aseguran un procesamiento de datos confiable incluso frente a fallos. Además, la escalabilidad de Spark Streaming y su integración con diversas fuentes de datos lo convierten en una opción versátil para manejar datos en streaming.

**¿Qué es lo que no te gusta de Spark Streaming?**

No hay soporte incorporado para el procesamiento de tiempo de eventos.

**¿Qué problemas resuelve Spark Streaming ¿Y cómo te beneficia eso?**

Spark Streaming resuelve el problema del procesamiento y análisis de datos en tiempo real al permitir el procesamiento eficiente de datos en streaming a medida que llegan. Esto beneficia a los usuarios al proporcionar información inmediata y permitir acciones oportunas basadas en información en tiempo real. Permite una toma de decisiones más rápida, un monitoreo proactivo y la capacidad de responder rápidamente a condiciones o eventos cambiantes. La escalabilidad, tolerancia a fallos e integración de Spark Streaming con otros componentes de Spark mejoran aún más su efectividad en el manejo de grandes volúmenes de datos en streaming, lo que lleva a una mayor eficiencia operativa y mejores resultados empresariales.

  ### 3. Más rápido que un parpadeo

**Rating:** 5.0/5.0 stars

**Reviewed by:** Aditya S. | Data Engineer, Empresa (> 1000 empleados)

**Reviewed Date:** June 07, 2023

**¿Qué es lo que más te gusta de Spark Streaming?**

Con la ayuda de Spark Streaming, se pueden transferir enormes cantidades de datos con literalmente cero latencia. Los scripts son fáciles de configurar y ejecutar utilizando clústeres de Spark. Lo más importante, las fallas se pueden encontrar y resolver con los registros de la interfaz de usuario de Spark.

**¿Qué es lo que no te gusta de Spark Streaming?**

Hay mucho que aprender sobre Spark Streaming y grandes cantidades de documentación a veces pueden ser un poco abrumadoras de revisar. La visualización de datos puede mejorarse más en lugar de tener la interfaz básica. Puede ser costoso a veces si los clústeres no están debidamente optimizados.

**¿Qué problemas resuelve Spark Streaming ¿Y cómo te beneficia eso?**

Con la ayuda de Spark Streaming, puedo transferir datos en tiempo real a los usuarios finales que son cruciales para ciertas aplicaciones y servicios. Me ha ayudado mucho a proporcionar los datos correctos y ha ahorrado una cantidad considerable de tiempo.

  ### 4. Muy fácil de usar y excelentes características.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Nagahema H. | Pequeña Empresa (50 o menos empleados)

**Reviewed Date:** June 15, 2023

**¿Qué es lo que más te gusta de Spark Streaming?**

El streaming de Spark es muy simple y fácil de implementar ya que solo necesitamos configurar parámetros en el paquete existente.

**¿Qué es lo que no te gusta de Spark Streaming?**

A veces, cuando los controladores no están disponibles, perdemos la conexión fácilmente y tenemos que hacer otra ejecución limpiando estados para obtener una ejecución adecuada.

**¿Qué problemas resuelve Spark Streaming ¿Y cómo te beneficia eso?**

Transmitir los datos desde nuestra aplicación nos ayuda a resolver muchos aspectos de nuestros problemas empresariales, como obtener los datos de la interfaz de usuario y guardarlos en la base de datos según nuestro formato y necesidades.

  ### 5. Spark Streaming es lo suficientemente bueno para transmitir datos.

**Rating:** 4.0/5.0 stars

**Reviewed by:** Mohd A. | Digital Specialist Engineer(L1), Pequeña Empresa (50 o menos empleados)

**Reviewed Date:** June 17, 2023

**¿Qué es lo que más te gusta de Spark Streaming?**

Spark streaming es una de las mejores opciones para transmitir datos fácilmente, después de Kafka. Si deseas transmitir una cantidad pequeña o mediana de datos, puedes usar Spark streaming de manera fácil y segura.

**¿Qué es lo que no te gusta de Spark Streaming?**

Kafka es mejor que Spark Streaming porque Spark Streaming no funciona correctamente con una mayor cantidad de datos, mientras que Kafka Streaming maneja los datos muy bien.

**¿Qué problemas resuelve Spark Streaming ¿Y cómo te beneficia eso?**

Estaba haciendo mi proyecto personal donde necesito transferir los datos continuamente desde la fuente para hacer el pipeline, utilicé el streaming de Spark y funcionó bien para mí.

  ### 6. Rápido con transformación de datos baja con buena escalabilidad.

**Rating:** 4.0/5.0 stars

**Reviewed by:** Muddit Gupta B. | Pequeña Empresa (50 o menos empleados)

**Reviewed Date:** June 21, 2023

**¿Qué es lo que más te gusta de Spark Streaming?**

Análisis en tiempo real y una solución de código abierto.

**¿Qué es lo que no te gusta de Spark Streaming?**

Complejo de configurar inicialmente y no tan relevante para aplicaciones pequeñas.

**¿Qué problemas resuelve Spark Streaming ¿Y cómo te beneficia eso?**

Necesito que los datos se ingieran y que la canalización se ejecute tan pronto como tenga una nueva entrada en una de mis tablas. Al transmitir los datos, no necesito esperar un día para que la canalización se vuelva a ejecutar y realice esas transformaciones, sino que ahora puedo tener el análisis en tiempo real de mis datos de ventas.

  ### 7. Spark Streaming es el mejor para el procesamiento

**Rating:** 4.5/5.0 stars

**Reviewed by:** Usuario verificado en Telecomunicaciones | Mediana Empresa (51-1000 empleados)

**Reviewed Date:** July 01, 2023

**¿Qué es lo que más te gusta de Spark Streaming?**

El streaming de Spark es uno de los componentes clave que ayuda al streaming en tiempo real de datos y también ofrece muchas mejoras que ayudan al procesamiento de conjuntos de datos más grandes.

**¿Qué es lo que no te gusta de Spark Streaming?**

En general, no siento aversión, pero la compatibilidad importa en algún momento en diferentes plataformas. Pero aún así, es el mejor en transmisión y procesamiento.

**¿Qué problemas resuelve Spark Streaming ¿Y cómo te beneficia eso?**

El streaming de Spark resuelve un problema para conjuntos de datos más grandes donde podemos procesar los datos en tiempo real con streaming. No necesitas transmitir primero y luego procesar, pero con Spark streaming puedes procesar y transmitir.

  ### 8. Construcción de canalizaciones de datos

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sarvesh B. | Software Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** June 29, 2023

**¿Qué es lo que más te gusta de Spark Streaming?**

Pude construir una tubería de datos compleja utilizando Apache Spark.

**¿Qué es lo que no te gusta de Spark Streaming?**

Spark generalmente no es adecuado cuando el conjunto de datos es relativamente pequeño.

**¿Qué problemas resuelve Spark Streaming ¿Y cómo te beneficia eso?**

Pude construir una tubería de datos compleja utilizando Apache Spark. Involucró múltiples operaciones de lectura y escritura de datos. El rendimiento fue muy rápido en comparación con la computación en un servidor de un solo nodo.

  ### 9. Difícil de entender

**Rating:** 2.5/5.0 stars

**Reviewed by:** Usuario verificado en Logística y cadena de suministro | Empresa (> 1000 empleados)

**Reviewed Date:** June 09, 2023

**¿Qué es lo que más te gusta de Spark Streaming?**

Es evolución en el mundo de Big Data. Muy de moda y en evolución. Además, la gente lo está utilizando para el procesamiento en tiempo real, así como para el procesamiento por lotes, lo que también ahorra costos. Agradecido

**¿Qué es lo que no te gusta de Spark Streaming?**

Es difícil de entender y aprender. No hay muchos recursos disponibles. Además, las personas deben tener un sólido conocimiento en big data con comprensión de map reduce y java para entender mejor el streaming de spark.

**¿Qué problemas resuelve Spark Streaming ¿Y cómo te beneficia eso?**

Para capturar información en tiempo real y ayudar al equipo de marketing a reunir clientes a un ritmo más rápido. A la gente le encanta recibir ofertas promocionales con un solo clic en forma de anuncios.

  ### 10. trabajos de transmisión en tiempo real con Spark

**Rating:** 5.0/5.0 stars

**Reviewed by:** Aditya K. | Lead Software Engineer, Empresa (> 1000 empleados)

**Reviewed Date:** August 13, 2022

**¿Qué es lo que más te gusta de Spark Streaming?**

Spark es un marco muy poderoso y ejecutamos trabajos de transmisión de Spark para múltiples requisitos, como recopilar datos de flume, kafka, sqoop, hdfs y enviarlos a otros nodos.

Uno de los trabajos de transmisión de Spark que se utiliza diariamente es para copiar nuestros datos de producción a DR. Lo que hacemos aquí es copiar las fsimages del clúster de producción y DR, y luego ejecutar un trabajo de transmisión de Spark para aplanar la imagen y calcular la diferencia, después de lo cual los datos se envían a una base de datos y los datos se copian de producción a DR utilizando la diferencia de la imagen del espacio de nombres. Hemos copiado casi 800+ TB de datos utilizando este trabajo de transmisión.

**¿Qué es lo que no te gusta de Spark Streaming?**

Los trabajos de transmisión de Spark son intensivos en recursos y complejos, por lo que necesitas ingenieros que sepan bien cómo ajustar el trabajo, de lo contrario, un trabajo de transmisión de Spark podría consumir suficientes recursos como para derribar un clúster multinodo.

**¿Qué problemas resuelve Spark Streaming ¿Y cómo te beneficia eso?**

1. Copia de datos de producción a DR utilizando la canalización de transmisión de Spark  
2. Recopilación de datos de brokers de Kafka, limpieza de los registros y envío a los productores de Kafka  
3. Recolección de datos de múltiples agentes de Flume que operan para varios negocios y envío a Hadoop HDFS  
4. Análisis de datos de diferentes torres de Airtel para crear métricas significativas para mejorar el servicio a nuestros clientes  


## Spark Streaming Discussions
  - [¿Para qué se utiliza Spark Streaming?](https://www.g2.com/es/discussions/what-is-spark-streaming-used-for)
  - [What is the difference between spark streaming and structured streaming?](https://www.g2.com/es/discussions/what-is-the-difference-between-spark-streaming-and-structured-streaming)
  - [How does Kafka integrate with spark streaming?](https://www.g2.com/es/discussions/how-does-kafka-integrate-with-spark-streaming)
  - [What are the main features of Apache spark?](https://www.g2.com/es/discussions/what-are-the-main-features-of-apache-spark)
  - [What is spark streaming checkpoint?](https://www.g2.com/es/discussions/what-is-spark-streaming-checkpoint)

- [View Spark Streaming pricing details and edition comparison](https://www.g2.com/es/products/spark-streaming/reviews/spark-streaming-review-4409727?section=pricing&secure%5Bexpires_at%5D=2026-05-05+07%3A01%3A38+-0500&secure%5Bsession_id%5D=f4a866f1-5a02-49d1-b05d-69398488d485&secure%5Btoken%5D=e3357a52cd607914edc8082ba571a1d0464cda77f600e1a11b5e1e9bb80747da&format=llm_user)

## Spark Streaming Features
**Datos**
- Procesamiento de datos
- Fuentes de datos
- Integración
- Procesamiento en tiempo real

**Analytics**
- Informes y análisis

**Creación de informes**
- Transformación de datos
- Modelado de datos
- Diseño de informes WYSIWYG
- API de integración

**Plataforma**
- Soporte para usuarios móviles
- Personalización
- Administración de usuarios, roles y accesos
- Internacionalización
- Sandbox / Entornos de prueba
- Rendimiento y fiabilidad
- Amplitud de las aplicaciones de los socios

## Top Spark Streaming Alternatives
  - [Amazon Kinesis Data Streams](https://www.g2.com/es/products/aws-amazon-kinesis-data-streams/reviews) - 4.3/5.0 (81 reviews)
  - [Google Cloud Dataflow](https://www.g2.com/es/products/google-cloud-dataflow/reviews) - 4.2/5.0 (43 reviews)
  - [Confluent](https://www.g2.com/es/products/confluent/reviews) - 4.4/5.0 (110 reviews)

