Recomendaciones a otros que estén considerando Apache Beam:
Sugeriría primero revisar la documentación de Apache Beam, ya que hay buen contenido allí junto con los blogs sobre Apache Beam. Explora muchas otras herramientas ETL como Apache Spark, Flink, Storm, Samza antes de considerar Beam, ya que cada una de ellas tiene sus propios beneficios de caso de uso y decide cuál se adapta mejor a ti. He usado principalmente Beam en Google Cloud Platform DataFlow para transformar y guardar algunos cambios desde la base de datos usando Change Data Capture en Apache Druid y encontré que Beam es bastante bueno para tareas pequeñas en lugar de para grandes. Reseña recopilada por y alojada en G2.com.
¿Qué problemas resuelve Apache Beam ¿Y cómo te beneficia eso?
He utilizado Beam mientras escribía algunos ETL para el procesamiento por lotes en Cloud DataFlow para transformar los datos de manera oportuna y almacenarlos como características en alguna base de datos de series temporales. Reseña recopilada por y alojada en G2.com.