# Google Cloud Dataflow Reviews
**Vendor:** Google  
**Category:** [Traitement et distribution des mégadonnées](https://www.g2.com/fr/categories/big-data-processing-and-distribution)  
**Average Rating:** 4.2/5.0  
**Total Reviews:** 45
## About Google Cloud Dataflow
Cloud Dataflow est un service entièrement géré pour transformer et enrichir les données en modes flux (temps réel) et batch (historique) avec une fiabilité et une expressivité égales -- plus besoin de solutions de contournement complexes ou de compromis. Et avec son approche sans serveur pour l&#39;approvisionnement et la gestion des ressources, vous avez accès à une capacité pratiquement illimitée pour résoudre vos plus grands défis de traitement de données, tout en payant uniquement pour ce que vous utilisez.



## Google Cloud Dataflow Pros & Cons
**What users like:**

- Les utilisateurs apprécient la **facilité d&#39;utilisation pour le traitement des événements en streaming** , simplifiant la création de pipelines complexes. (1 reviews)
- Les utilisateurs trouvent que la **facilité d&#39;utilisation** de Google Cloud Dataflow est utile pour construire et surveiller efficacement des pipelines de streaming. (1 reviews)
- Les utilisateurs apprécient la **gestion facile** de Google Cloud Dataflow, simplifiant le processus de création et de surveillance des pipelines de streaming. (1 reviews)
- Les utilisateurs apprécient la **facilité d&#39;utilisation et l&#39;intégration** de Google Cloud Dataflow pour construire des pipelines de streaming efficaces. (1 reviews)
- Les utilisateurs apprécient la **facilité d&#39;utilisation** de Google Cloud Dataflow, rendant la construction de pipelines de streaming complexes simple et efficace. (1 reviews)
- Intégrations (1 reviews)
- Analytique en temps réel (1 reviews)
- Traitement en temps réel (1 reviews)
- Vitesse (1 reviews)
- Diffusion en continu (1 reviews)

**What users dislike:**

- Les utilisateurs trouvent que Google Cloud Dataflow est **coûteux par rapport à d&#39;autres solutions** , ce qui affecte l&#39;abordabilité et la gestion du budget. (1 reviews)
- Les utilisateurs trouvent Google Cloud Dataflow **cher** par rapport à des alternatives comme Apache Flink, ce qui impacte la perception globale de la valeur. (1 reviews)
- Les utilisateurs trouvent **l&#39;installation difficile** avec Google Cloud Dataflow, surtout lorsqu&#39;ils implémentent des fonctionnalités comme les watermarks. (1 reviews)
- Les utilisateurs trouvent que Google Cloud Dataflow est **difficile à mettre en œuvre** , surtout lorsqu&#39;il s&#39;agit de gérer les coûts et les watermarks par rapport aux alternatives. (1 reviews)

## Google Cloud Dataflow Reviews
  ### 1. Flux de données entièrement géré qui s'adapte aux événements en temps réel

**Rating:** 4.5/5.0 stars

**Reviewed by:** Aayush M. | Data Engineer - Associate, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** April 17, 2026

**Qu'aimez-vous le plus à propos de Google Cloud Dataflow?**

La meilleure chose à propos de Dataflow est sa capacité entièrement gérée, ce qui signifie que nous n'avons pas besoin de gérer l'infrastructure et qu'il s'adapte facilement. Il offre également de nombreux modèles qui sont utiles pour les développeurs débutants et intermédiaires, et en plus de cela, ils peuvent facilement mettre à jour la configuration et le pipeline et peuvent traiter des pétaoctets de données. De plus, il prend en charge le SDK Yaml, ce qui élimine également les dépendances d'Apache Beam.

**Que n’aimez-vous pas à propos de Google Cloud Dataflow?**

Lorsque nous travaillons avec le traitement distribué, il est difficile d'obtenir une configuration correcte, surtout pour un nouvel utilisateur, c'est très complexe à mettre en place et la plupart du temps, cela coûte cher si ce n'est pas correctement configuré. Et comme cela ne prend en charge que Apache Beam, certains concepts sont très difficiles à comprendre. De plus, ils peuvent travailler sur la surveillance et la journalisation, parfois ce n'est pas clair.

**Quels sont les problèmes que Google Cloud Dataflow résout, et en quoi cela vous est-il bénéfique?**

Chaque fois qu'un nouveau cas d'utilisation pour la migration de données, le traitement de données, la transformation de données se présente, mon premier choix est toujours Dataflow en raison de la manière dont il gère à la fois les données par lots (GCS, serveurs sur site, etc.) et les données en streaming (Kafka, Pub/Sub) et peut facilement s'adapter horizontalement pour un traitement plus rapide. Dans l'ensemble, il résout les défis liés au traitement à grande échelle dans les environnements GCP tout en réduisant l'effort opérationnel à presque zéro.

  ### 2. Cloud Dataflow - Meilleure plateforme de streaming d'événements

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sanyam G. | Software Engineer, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** February 02, 2025

**Qu'aimez-vous le plus à propos de Google Cloud Dataflow?**

Google Cloud Dataflow est extrêmement facile à utiliser pour traiter un flux d'événements. Construire des pipelines de streaming complexes est simple et efficace avec Dataflow. Il offre une surveillance en temps réel du pipeline de streaming avec des métriques importantes telles que le débit, l'utilisation du CPU et de la mémoire. Il est facile à intégrer avec des sources et des puits de données tels que Cloud Pub-sub, Kafka et Cloud Spanner.

**Que n’aimez-vous pas à propos de Google Cloud Dataflow?**

C'est coûteux par rapport à d'autres solutions telles qu'Apache Flink. Difficile d'implémenter des filigranes.

**Quels sont les problèmes que Google Cloud Dataflow résout, et en quoi cela vous est-il bénéfique?**

J'utilise Cloud Dataflow pour traiter des événements en streaming et effectuer des opérations complexes dessus. Cela permet de gagner du temps sans avoir à écrire du code à partir de zéro pour le traitement des événements. Il offre une observabilité des pipelines construits dès le départ. Il prend également en charge l'autoscaling.

  ### 3. flux de données avec Google Cloud Dataflow

**Rating:** 4.5/5.0 stars

**Reviewed by:** Amit C. | Data Engineer, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** December 12, 2023

**Qu'aimez-vous le plus à propos de Google Cloud Dataflow?**

GCP Dataflow gère sans effort les tâches de big data, unifiant le code avec Apache Beam. C'est un joueur d'équipe de Google Cloud, excellant avec des services comme BigQuery.

**Que n’aimez-vous pas à propos de Google Cloud Dataflow?**

- peu de documentation et de ressources disponibles à ce sujet  
Les complexités des coûts exigent de la vigilance, et les connecteurs externes peuvent nécessiter une attention personnalisée. Bien qu'il s'harmonise au sein du domaine de Google Cloud, la dépendance à l'écosystème peut ne pas convenir à ceux dans d'autres environnements cloud.

**Quels sont les problèmes que Google Cloud Dataflow résout, et en quoi cela vous est-il bénéfique?**

Comme il s'agit d'un Apache Beam sans serveur, il aide à charger les données en streaming de manière transparente et à ne pas se soucier des services backend et de la tolérance aux pannes.

  ### 4. Dataflow résout le problème de l'ETL à grande échelle avec une observabilité de premier ordre.

**Rating:** 4.0/5.0 stars

**Reviewed by:** joseph k. | Entreprise (> 1000 employés)

**Reviewed Date:** August 30, 2023

**Qu'aimez-vous le plus à propos de Google Cloud Dataflow?**

Les flux de données en nuage vous permettent d'avoir un démon qui effectue l'ETL tout en offrant une observabilité de premier ordre. Avant cela, j'étais habitué à des tâches de longue durée avec une observabilité médiocre, ou à des outils à faible code ou sans code qui ne me permettaient pas de configurer les tâches comme je le souhaitais en utilisant du code. Dataflow me permet d'utiliser Apache Beam sur Python avec un grand effet pour créer une solution répétable et facilement surveillée.

**Que n’aimez-vous pas à propos de Google Cloud Dataflow?**

Les exemples de Python pourraient être beaucoup plus complets. De plus, le modèle de concurrence est difficile à comprendre, je rencontre parfois des contentions de verrouillage avec des instances DoFn s'exécutant simultanément et il n'est pas entièrement clair combien de threads concurrents traitent ma charge de travail.

**Quels sont les problèmes que Google Cloud Dataflow résout, et en quoi cela vous est-il bénéfique?**

Dataflow me permet de réaliser une charge de travail ETL en streaming continu tout en pouvant surveiller les indicateurs clés pour le débit, la latence et les erreurs sans suivre constamment un journal.

  ### 5. Plateforme Puissante

**Rating:** 5.0/5.0 stars

**Reviewed by:** SAHIL Y. | Education counsellor, Petite entreprise (50 employés ou moins)

**Reviewed Date:** May 12, 2023

**Qu'aimez-vous le plus à propos de Google Cloud Dataflow?**

Google Cloud Dataflow optimise automatiquement et gère les ressources pour vous. Cette plateforme prend en charge plusieurs langages de programmation, y compris Python, Java et SQL, et facilite la tâche des développeurs en leur permettant de se concentrer sur l'écriture de code.

**Que n’aimez-vous pas à propos de Google Cloud Dataflow?**

Jusqu'à présent, je n'ai trouvé aucun inconvénient. J'adore cela et chaque mise à jour de cette plateforme me fait retomber amoureux.

**Quels sont les problèmes que Google Cloud Dataflow résout, et en quoi cela vous est-il bénéfique?**

Google Cloud Dataflow optimise automatiquement mes données, donc je n'ai pas à me soucier de choses comme l'équilibrage de charge, la mise à l'échelle ou la tolérance aux pannes et il me fournit également une large gamme d'outils de surveillance et de débogage.

  ### 6. Dataflow est assez bien intégré dans l'écosystème de Google Cloud.

**Rating:** 4.0/5.0 stars

**Reviewed by:** Mohit J. | Senior Software Engineer, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** May 01, 2023

**Qu'aimez-vous le plus à propos de Google Cloud Dataflow?**

La tolérance aux pannes est la meilleure chose à propos du flux de données avec la facilité de lancer le travail et de surveiller.

**Que n’aimez-vous pas à propos de Google Cloud Dataflow?**

Le SDK Python semble moins évolué. L'intégration de Kafka pour Python n'est pas prête pour la production.

**Quels sont les problèmes que Google Cloud Dataflow résout, et en quoi cela vous est-il bénéfique?**

Il existe plusieurs pipelines pour lire à partir de pubsub et kafka, traiter et écrire dans Big Query. D'autres pipelines sont utilisés pour déplacer des données vers un bucket S3.

  ### 7. Superbes visualisations, difficiles à déboguer

**Rating:** 4.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Logiciels informatiques | Marché intermédiaire (51-1000 employés)

**Reviewed Date:** August 30, 2023

**Qu'aimez-vous le plus à propos de Google Cloud Dataflow?**

Visualisations de vos nœuds, et des informations pendant l'exécution concernant le nombre de nœuds qui ont été lancés.

**Que n’aimez-vous pas à propos de Google Cloud Dataflow?**

Une fois que vous déclenchez une exécution, il n'y a aucun moyen de l'annuler/la tuer. Cela signifie que si vous remarquez des problèmes pendant l'exécution, vous êtes pratiquement coincé.

**Quels sont les problèmes que Google Cloud Dataflow résout, et en quoi cela vous est-il bénéfique?**

Nous pouvons traiter des centaines de milliers d'articles de manière rationalisée, en transportant les résultats entre les étapes et en augmentant efficacement l'échelle à plus de 50 machines en parallèle.

  ### 8. Dataflow est ma solution de référence pour les besoins généraux de traitement de données à grande échelle.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Marketing et publicité | Entreprise (> 1000 employés)

**Reviewed Date:** May 12, 2023

**Qu'aimez-vous le plus à propos de Google Cloud Dataflow?**

J'aime vraiment Apache Beam, que j'utilise avec Dataflow. Cela fonctionne bien, sur Google Cloud, pour le traitement par lots et en flux. Le calcul fonctionne simplement, et permet à nos ingénieurs de données de faire avancer les choses.

**Que n’aimez-vous pas à propos de Google Cloud Dataflow?**

Il y a quelques années, une partie du marketing était exagérée. De nos jours, il est à la hauteur du battage médiatique. Je suis attristé que plus de gens ne l'utilisent pas, car c'est tellement puissant.

**Quels sont les problèmes que Google Cloud Dataflow résout, et en quoi cela vous est-il bénéfique?**

Nous utilisons Dataflow à la fois pour le Big Data et le traitement en flux. Avoir un service de référence pour ces deux aspects permet à nos ingénieurs de données de se concentrer sur ce qui compte vraiment : créer de la valeur commerciale, tirer des enseignements, aider nos clients internes, etc.

  ### 9. Un outil impressionnant pour développer des pipelines de données en flux continu

**Rating:** 4.5/5.0 stars

**Reviewed by:** Taapas A. | Advisor, Petite entreprise (50 employés ou moins)

**Reviewed Date:** April 25, 2023

**Qu'aimez-vous le plus à propos de Google Cloud Dataflow?**

L'interface utilisateur est très simpliste et les horaires et tâches peuvent être créés très facilement en parallèle. De plus, le support pour les modèles en Java et Python est incroyable.

**Que n’aimez-vous pas à propos de Google Cloud Dataflow?**

Le paramètre et les modèles sont très rigides et le débogage supplémentaire est difficile car les journaux ne sont pas très riches en informations. Si un pipeline échoue souvent, les erreurs et les journaux sont médiocres.

**Quels sont les problèmes que Google Cloud Dataflow résout, et en quoi cela vous est-il bénéfique?**

Google Dataflow m'a aidé à diffuser des Go et des To de données et à les fournir à mon pipeline de traitement.

  ### 10. J'ai utilisé la Google Cloud Platform à des fins d'apprentissage.

**Rating:** 3.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Matériel informatique | Petite entreprise (50 employés ou moins)

**Reviewed Date:** June 14, 2023

**Qu'aimez-vous le plus à propos de Google Cloud Dataflow?**

Big Query est la fonction la plus appréciée dans Google Cloud.

**Que n’aimez-vous pas à propos de Google Cloud Dataflow?**

Je n'ai encore rien trouvé que je n'aime pas sur cette plateforme.

**Quels sont les problèmes que Google Cloud Dataflow résout, et en quoi cela vous est-il bénéfique?**

Je n'ai pas encore exploré toutes ses fonctionnalités.


## Google Cloud Dataflow Discussions
  - [What is the difference between Google dataflow and Google Dataproc?](https://www.g2.com/fr/discussions/what-is-the-difference-between-google-dataflow-and-google-dataproc)
  - [Is Google dataflow an ETL tool?](https://www.g2.com/fr/discussions/is-google-dataflow-an-etl-tool)
  - [How does Google dataflow work?](https://www.g2.com/fr/discussions/how-does-google-dataflow-work)
  - [What is Google dataflow used for?](https://www.g2.com/fr/discussions/what-is-google-dataflow-used-for)

- [View Google Cloud Dataflow pricing details and edition comparison](https://www.g2.com/fr/products/google-cloud-dataflow/reviews/google-cloud-dataflow-review-6851585?section=pricing&secure%5Bexpires_at%5D=2026-05-21+21%3A41%3A36+-0500&secure%5Bsession_id%5D=841395ed-ce3f-4e21-b71f-5d8d1bc6dcb7&secure%5Btoken%5D=eb357f6526dfc2f8735790962b2e84aa692d8925346ed6cec690716d253a2f93&format=llm_user)
## Google Cloud Dataflow Integrations
  - [Apache Kafka](https://www.g2.com/fr/products/apache-kafka/reviews)
  - [Google Cloud Pub/Sub](https://www.g2.com/fr/products/google-cloud-pub-sub/reviews)
  - [Google Cloud Storage](https://www.g2.com/fr/products/google-cloud-storage/reviews)

## Google Cloud Dataflow Features
**Données**
- Traitement des données
- Sources de données
- Intégration
- Traitement en temps réel

**base de données**
- Collecte de données en temps réel
- Répartition des données
- Lac de données

**Analytics**
- Reporting & Analytique

**Intégrations**
- Intégration Hadoop
- Intégration de Spark

**Plate-forme**
- Mise à l’échelle de la machine
- Préparation des données
- Intégration de Spark

**Traitement**
- Traitement dans le cloud
- Traitement de la charge de travail

**Rapports de construction**
- Transformation des données
- Modélisation des données
- Conception de rapports WYSIWYG
- API d’intégration

**Plate-forme**
- Assistance aux utilisateurs mobiles
- Personnalisation
- Gestion des utilisateurs, des rôles et des accès
- Internationalisation
- Bac à sable / Environnements de test
- Performance et fiabilité
- Étendue des applications des partenaires

## Top Google Cloud Dataflow Alternatives
  - [Databricks](https://www.g2.com/fr/products/databricks/reviews) - 4.6/5.0 (748 reviews)
  - [Apache Kafka](https://www.g2.com/fr/products/apache-kafka/reviews) - 4.5/5.0 (126 reviews)
  - [Amazon Kinesis Data Streams](https://www.g2.com/fr/products/aws-amazon-kinesis-data-streams/reviews) - 4.3/5.0 (81 reviews)

