Características de Google Cloud Dataprep
base de datos (3)
Recopilación de datos en tiempo real
Recopila, almacena y organiza datos masivos y no estructurados en tiempo real
Distribución de datos
Facilita la difusión de big data recopilados a través de clústeres de computación paralela
Lago de datos
Crea un repositorio para recopilar y almacenar datos sin procesar de sensores, dispositivos, máquinas, archivos, etc.
Integraciones (2)
Integración con Hadoop
Alinea los flujos de trabajo de procesamiento y distribución sobre Apache Hadoop
Integración con Spark
Alinea los flujos de trabajo de procesamiento y distribución sobre Apache Hadoop
Plataforma (3)
Escalado de máquinas
Facilita la solución para ejecutarse y escalar a un gran número de máquinas y sistemas
Preparación de datos
Selecciona los datos recopilados para soluciones de análisis de big data para analizar, manipular y modelar
Integración con Spark
Alinea los flujos de trabajo de procesamiento y distribución sobre Apache Hadoop
Tratamiento (2)
Procesamiento en la nube
Traslada la recopilación y el procesamiento de big data a la nube
Procesamiento de cargas de trabajo
Procesa cargas de trabajo de datos por lotes, en tiempo real y de streaming en sistemas singulares, multiinquilino o en la nube
Acceso a orígenes de datos (3)
Amplitud de las fuentes de datos
Proporciona una amplia gama de posibles conexiones de datos, incluidas aplicaciones en la nube, bases de datos locales y distribuciones de big data, entre otras.
Facilidad de conectividad de datos
Permite a las empresas conectarse fácilmente a cualquier fuente de datos
Conectividad API
Ofrece conexiones API para aplicaciones y orígenes de datos basados en la nube
Interacción de datos (8)
Elaboración de perfiles y clasificación
Permite la creación de perfiles de conjuntos de datos para una mayor organización, tanto por parte de los usuarios como del aprendizaje automático
Gestión de metadatos
Indexa descripciones de metadatos para facilitar la búsqueda y obtener información mejorada
Modelado de datos
Herramientas para (re)estructurar los datos de una manera que permita una extracción rápida y precisa de información
Unión de datos
Permite la unión de tablas de autoservicio
Combinación de datos
Proporciona la capacidad de combinar orígenes de datos en un conjunto de datos
Calidad y limpieza de datos
Permite a los usuarios y administradores limpiar fácilmente los datos para mantener la calidad y la integridad
Uso compartido de datos
Ofrece funcionalidad colaborativa para compartir consultas y conjuntos de datos
Gobierno de datos
Garantiza la administración del acceso de los usuarios, el linaje de datos y el cifrado de datos
Exportación de datos (3)
Amplitud de integraciones
Proporciona una amplia gama de posibles integraciones, incluidos análisis, integración de datos, gestión de datos maestros y herramientas de ciencia de datos
Facilidad de integraciones
Permite a las empresas integrarse fácilmente con herramientas de análisis, integración de datos, gestión de datos maestros y ciencia de datos
Flujos de trabajo de datos
Operacionaliza los flujos de trabajo de datos para escalar fácilmente las necesidades de preparación repetibles
IA generativa (1)
Generación de texto
Permite a los usuarios generar texto basado en un mensaje de texto.




