Características de Google Cloud Dataflow
base de datos (3)
Recopilación de datos en tiempo real
Recopila, almacena y organiza datos masivos y no estructurados en tiempo real
Distribución de datos
Facilita la difusión de big data recopilados a través de clústeres de computación paralela
Lago de datos
Crea un repositorio para recopilar y almacenar datos sin procesar de sensores, dispositivos, máquinas, archivos, etc.
Integraciones (2)
Integración con Hadoop
Alinea los flujos de trabajo de procesamiento y distribución sobre Apache Hadoop
Integración con Spark
Alinea los flujos de trabajo de procesamiento y distribución sobre Apache Hadoop
Plataforma (3)
Escalado de máquinas
Facilita la solución para ejecutarse y escalar a un gran número de máquinas y sistemas
Preparación de datos
Selecciona los datos recopilados para soluciones de análisis de big data para analizar, manipular y modelar
Integración con Spark
Alinea los flujos de trabajo de procesamiento y distribución sobre Apache Hadoop
Tratamiento (2)
Procesamiento en la nube
Traslada la recopilación y el procesamiento de big data a la nube
Procesamiento de cargas de trabajo
Procesa cargas de trabajo de datos por lotes, en tiempo real y de streaming en sistemas singulares, multiinquilino o en la nube
Datos (4)
Procesamiento de datos
La capacidad de procesar grandes cantidades de datos.
Fuentes de datos
La capacidad de procesar datos de una amplia variedad de fuentes y formatos.
Integración
La capacidad de trabajar sin problemas con otra plataforma de software.
Procesamiento en tiempo real
Procesamiento de datos de una variedad de fuentes en tiempo real a medida que llegan.
Analytics (1)
Informes y análisis
Herramientas para visualizar y analizar datos.





