Fonctionnalités de Google Cloud Dataprep
base de données (3)
Collecte de données en temps réel
Collecte, stockage et organisation de données massives et non structurées en temps réel
Répartition des données
Facilite la diffusion des mégadonnées collectées dans les clusters de calcul parallèle
Lac de données
Crée un référentiel pour collecter et stocker des données brutes à partir de capteurs, périphériques, machines, fichiers, etc.
Intégrations (2)
Intégration Hadoop
Aligne les workflows de traitement et de distribution sur Apache Hadoop
Intégration de Spark
Aligne les workflows de traitement et de distribution sur Apache Hadoop
Plate-forme (3)
Mise à l’échelle de la machine
Facilite l’exécution et l’évolutivité de la solution à un grand nombre de machines et de systèmes
Préparation des données
Organise les données collectées pour les solutions d’analyse de Big Data afin d’analyser, de manipuler et de modéliser
Intégration de Spark
Aligne les workflows de traitement et de distribution sur Apache Hadoop
Traitement (2)
Traitement dans le cloud
Déplace la collecte et le traitement de Big Data vers le cloud
Traitement de la charge de travail
Traite les charges de travail de données par lots, en temps réel et en streaming dans des systèmes uniques, mutualisés ou cloud
Accès aux sources de données (3)
Étendue des sources de données
Fournit un large éventail de connexions de données possibles, y compris des applications cloud, des bases de données sur site et des distributions de Big Data, entre autres
Facilité de connectivité des données
Permet aux entreprises de se connecter facilement à n’importe quelle source de données
Connectivité API
Offre des connexions API pour les applications cloud et les sources de données
Interaction des données (8)
Profilage et classification
Permet le profilage des ensembles de données pour une organisation accrue, à la fois par les utilisateurs et l’apprentissage automatique
Gestion des métadonnées
Indexe les descriptions des métadonnées pour faciliter la recherche et améliorer les informations
Modélisation des données
Outils pour (re)structurer les données de manière à permettre une extraction rapide et précise des informations
Jonction de données
Permet la jonction de tables en libre-service
Fusion de données
Permet de combiner des sources de données en un seul ensemble de données
Qualité et nettoyage des données
Permet aux utilisateurs et aux administrateurs de nettoyer facilement les données pour maintenir la qualité et l’intégrité
Partage des données
Offre une fonctionnalité collaborative pour le partage de requêtes et d’ensembles de données
Gouvernance des données
Assure la gestion de l’accès des utilisateurs, la traçabilité des données et le chiffrement des données
Exportation de données (3)
Étendue des intégrations
Fournit un large éventail d’intégrations possibles, y compris l’analyse, l’intégration de données, la gestion des données de référence et les outils de science des données
Facilité d’intégration
Permet aux entreprises de s’intégrer facilement aux outils d’analyse, d’intégration de données, de gestion des données de référence et de science des données
Workflows de données
Opérationnalise les flux de données pour mettre facilement à l’échelle les besoins de préparation reproductibles
IA générative (1)
Génération de texte
Permet aux utilisateurs de générer du texte à partir d’une invite texte.




