# Google Cloud Managed Service for Apache Spark Reviews
**Vendor:** Google  
**Category:** [Traitement et distribution des mégadonnées](https://www.g2.com/fr/categories/big-data-processing-and-distribution)  
**Average Rating:** 4.4/5.0  
**Total Reviews:** 17
## About Google Cloud Managed Service for Apache Spark
Cloud Dataproc est un service cloud rapide, facile à utiliser et entièrement géré pour exécuter des clusters Apache Spark et Apache Hadoop de manière plus simple et plus économique. Les opérations qui prenaient des heures ou des jours prennent des secondes ou des minutes à la place, et vous payez uniquement pour les ressources que vous utilisez (avec une facturation à la seconde). Cloud Dataproc s&#39;intègre également facilement avec d&#39;autres services de Google Cloud Platform (GCP), vous offrant une plateforme puissante et complète pour le traitement des données, l&#39;analyse et l&#39;apprentissage automatique.




## Google Cloud Managed Service for Apache Spark Reviews
  ### 1. Google Cloud Dataproc : Solution unique pour tous vos besoins en matière de clusters de big data

**Rating:** 5.0/5.0 stars

**Reviewed by:** Danveer S. | SDE II, Entreprise (> 1000 employés)

**Reviewed Date:** September 27, 2023

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

1. La suppression des clusters inactifs aide à économiser des coûts lorsque le cluster n'est pas utilisé.
2. L'autoscaling gère efficacement la charge en période de pointe.
3. L'équipe de support GCP est utile en cas de problèmes critiques.
4. Le support de l'API Java est excellent. La création de clusters, le traitement des données ETL et la suppression de clusters peuvent être effectués dans un seul pipeline.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

1. La création de clusters prend quelques minutes, ce qui n'est pas très pratique.
2. Parfois, l'autoscaling ne se déclenche pas à temps et les pipelines échouent avec une erreur de type dataproc-agent-failure.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Nous traitons des téraoctets de données sur Dataproc et apportons des informations sur les consommateurs. Cela nous aide à prendre les bonnes décisions pour notre organisation.

  ### 2. Une implémentation Hadoop très puissante sans le battage médiatique d'AWS EMR.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Edgar A. | Project Manager Architect / Google Cloud Data Engineer, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** June 02, 2023

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

Un excellent outil qui peut-être n'est pas aussi populaire qu'AWS EMR, mais qui dépasse ses attentes. Une mise en œuvre élégante.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

L'utilisation du paradigme de stockage et de traitement GCP peut causer des problèmes pour les utilisateurs habitués à Hadoop sur site.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Une solution hautement évolutive qui peut aider les utilisateurs intensifs dans leur travail quotidien.

  ### 3. Lac de données ETL géré/scalable dans le cloud Google

**Rating:** 4.5/5.0 stars

**Reviewed by:** Malathi M. | Programmer Analyst Executive, Entreprise (> 1000 employés)

**Reviewed Date:** July 05, 2022

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

Google Cloud DataProc convient le mieux pour ce qui suit :

Open Source, analytique de données gérée et évolutive
Sans serveur ou gérer des clusters par vous-même
A de bonnes intégrations avec d'autres services GCP
Cluster transitoire sécurisé et rentable avec facturation à la seconde
Écosystème Hadoop dans l'environnement GCP géré
Facile à migrer les charges de travail Hadoop existantes sur site ainsi que les entrepôts Hive.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

Les aversions sont ci-dessous :

La réduction d'échelle a des problèmes de performance et d'autres problèmes en raison d'une période de refroidissement de la tâche en attente.  
L'option sans serveur devrait être améliorée avec une mise à l'échelle basée sur le SLA.  
Toujours pour les options de streaming, optez pour Dataflow.  
Il utilise toujours le moteur de calcul, pas GKE (Google Kubernetes Engine).  
Le stockage des données GCS persistantes (HCFS - système de fichiers compatible Hadoop) à partir de Dataproc présente une certaine lenteur en raison de la séparation du calcul/stockage - c'est notre option de choisir quel stockage pour quel traitement.  
Il a un stockage HDFS alloué avec chaque cluster de nœuds Dataproc, mais pas bon pour le stockage de grandes quantités de données localement.

**Recommandations à d’autres personnes envisageant Google Cloud Managed Service for Apache Spark:**

Votre cas d'utilisation convient mieux avec dataproc par rapport à dataflow.  
Comparez également sur les pipelines de Databricks delta lake.  
Idéal à utiliser lorsque vous souhaitez intégrer plusieurs services GCP comme Pubsub, BigQuery et de nombreux services GCP.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Traitement unifié des pipelines ETL par lots et en flux  
Simplification des capacités de construction de lacs de données  
Une image dorée de moteur de calcul personnalisé évolutive et gérée peut être construite avec l'écosystème Hadoop installé pour des démarrages plus rapides.  
Également utilisable pour des cas d'utilisation en science des données.  
Migration des clusters Cloudera/HDP ambari existants sur site vers des clusters data proc dans GCP  
Facile à construire la planification de flux de travail  
Création de métastore Hive en modes multiples  

  ### 4. Meilleur pour Hadoop et Scala Spark

**Rating:** 5.0/5.0 stars

**Reviewed by:** Rahul K. | Big Data Engineer - I , Marché intermédiaire (51-1000 employés)

**Reviewed Date:** September 26, 2019

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

Dev-Ops expertise amicale, C'est très facile à utiliser. 
Il offre presque 99,9% de disponibilité et de vitesse de connexion.
Beaucoup de documentation disponible sur son site web.
Un utilisateur de site web normal cherche toujours des solutions bon marché.
Google offre un service cloud gratuit de 300 dollars pendant 1 an, ce qui est très attractif pour les petits utilisateurs de sites web.

Ceux-ci sont très évolutifs.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

Entrée tardive dans le marketing Cloud.  
Moins de fonctionnalités et de services.  
Certaines fonctionnalités sont encore en version bêta.  
Moins de centres de données dans le monde.

**Recommandations à d’autres personnes envisageant Google Cloud Managed Service for Apache Spark:**

Les clusters Dataproc sont très faciles à utiliser et à maintenir, avec un coût faible.  
Google a fourni le SDK Gcloud pour accéder facilement et utiliser Dataproc.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Nous avons (notre client d'entreprise) un cluster de préproduction et de production entièrement maintenu par Google Dataproc.  
Cela nous aide beaucoup à les maintenir.  
Nous pouvons tous les deux accéder facilement au cluster.

  ### 5. Facile à utiliser, outil de traitement de données fiable et puissant

**Rating:** 4.5/5.0 stars

**Reviewed by:** Zachary B. | Junior Data Analyst, Technologie de l'information et services, Entreprise (> 1000 employés)

**Reviewed Date:** July 09, 2019

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

Qu'il soit sans serveur - pas d'infrastructure à gérer. Grande victoire. Points bonus pour avoir Spark (plus les API), Hive et Hadoop préinstallés sur les clusters. L'option de lancer des clusters d'instances gérées est également très appréciable.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

C'est un choix difficile - soit le manque de capacités d'administration et de surveillance d'entreprise, soit l'incapacité à dépasser de manière flexible une tarification forfaitaire à capacité fixe.

**Recommandations à d’autres personnes envisageant Google Cloud Managed Service for Apache Spark:**

Dataproc est un excellent outil pour le traitement des grandes données. Nous l'avons choisi en raison de son support natif pour Spark et Hive. De plus, la capacité à faire évoluer vos besoins en traitement de données est très simple.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Nous avons utilisé Dataproc pour le traitement de grandes quantités de données, principalement parce qu'il a Spark installé sur les clusters par défaut. La capacité de lancer et de faire évoluer les clusters rapidement et facilement est très appréciable.

  ### 6. J'adore ce produit !

**Rating:** 4.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Enseignement supérieur | Petite entreprise (50 employés ou moins)

**Reviewed Date:** April 10, 2019

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

J'aime la facilité d'utilisation pour construire des clusters rapidement et efficacement. En même temps, je peux les redimensionner à tout moment. J'ai beaucoup de nœuds, donc je n'ai pas à m'inquiéter que les pipelines dépassent la capacité de mes clusters. J'aime que le prix soit basé sur l'utilisation réelle, et qu'ils m'aient donné un crédit de 300 $ pour mon projet.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

Parfois, cela peut ne pas être convivial et les clusters peuvent prendre du temps à redémarrer. Sinon, je n'ai pas d'autres plaintes.

**Recommandations à d’autres personnes envisageant Google Cloud Managed Service for Apache Spark:**

Essayez-le. Vous n'aurez pas grand-chose à redire.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Cette utilisation des clusters a permis de prévoir les opportunités pour déterminer les ventes futures, augmentant ainsi l'efficacité.

  ### 7. Google Cloud

**Rating:** 4.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Comptabilité | Marché intermédiaire (51-1000 employés)

**Reviewed Date:** April 09, 2019

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

La meilleure façon de gérer le service Spark et Hadoop qui a été offert sur la plateforme Google Cloud.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

cela ne fonctionne pas avec des sources personnalisées. Pour l'ordinateur standard, c'est toujours le composant le plus cher

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

créez des clusters gérés

  ### 8. Google Cloud Dataproc

**Rating:** 4.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Électronique grand public | Marché intermédiaire (51-1000 employés)

**Reviewed Date:** February 22, 2019

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

Ce logiciel est très bon. Sa capacité à prédire des opportunités dans les ventes ou la fabrication à partir de dossiers ou de données d'entreprise. IDE fluide et intégration transparente avec plusieurs options de langages de programmation.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

pas convivial, serait plus bénéfique pour les data scientists ou quelqu'un qui se spécialise en informatique. Les clusters prennent du temps à redémarrer lorsque la facturation est réactivée.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

L'équilibrage de charge est fluide entre les différents clusters car les tâches sont distribuées entre les nœuds. La prévisibilité des opportunités pour déterminer les ventes futures a augmenté l'efficacité. Travailler à l'exécution de tâches map-reduce pour un projet récent.

  ### 9. Utilisation de Dataproc dans l'analyse de la vente au détail

**Rating:** 4.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Détail | Marché intermédiaire (51-1000 employés)

**Reviewed Date:** April 11, 2019

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

L'utilisation de Dataproc rend l'utilisation de la solution Big Data Hadoop dans le Cloud transparente. Elle apporte la capacité de stocker des données non structurées et de découpler avec le calcul afin qu'elle soit évolutive.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

La réduction clé n'a pas été en mesure de créer un frontend SQL similaire à Hive Metastore sur la plateforme Hadoop. BigQuery ne prend actuellement pas en charge les formats AVRO et Parquet.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Analyse de données dans le cloud en utilisant les capacités de Google ML.

  ### 10. Google Cloud DataProc

**Rating:** 3.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Médecine alternative | Petite entreprise (50 employés ou moins)

**Reviewed Date:** March 22, 2019

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

Cloud Dataproc est un service cloud rapide, facile à utiliser et entièrement géré pour exécuter des clusters Apache Spark et Apache Hadoop de manière plus simple et plus économique. Les vitesses de traitement sont rapides et efficaces par rapport aux technologies passées. Cloud Dataproc s'intègre également facilement avec d'autres plateformes Google Cloud.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

Jusqu'à présent, l'entreprise n'a rencontré aucun problème en utilisant le logiciel.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Cela a aidé à améliorer l'efficacité des ventes et la prévisibilité pour les futures entreprises.

  ### 11. Expérience avec Dataproc

**Rating:** 4.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Marketing et publicité | Marché intermédiaire (51-1000 employés)

**Reviewed Date:** April 11, 2019

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

Il est facile de créer et de fermer des clusters Dataproc à la demande, d'accéder facilement à BigQuery et à Google Cloud Storage et d'exécuter des tâches Spark.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

L'interface utilisateur du travail Spark n'est pas facilement accessible.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

déployer le modèle d'apprentissage automatique en production

  ### 12. prise en charge d'autres systèmes d'exploitation

**Rating:** 3.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Télécommunications | Entreprise (> 1000 employés)

**Reviewed Date:** April 10, 2019

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

des fonctionnalités supplémentaires par rapport à Hadoop sont nécessaires, plus que Kerberos et un support de sécurité et de plateforme OS supplémentaires

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

besoin de prendre en charge Red Hat ou un autre système d'exploitation Linux

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

travailler sur la construction d'une plateforme d'analytique pour les télécommunications en utilisant des produits supplémentaires

  ### 13. Consultant en Big Data

**Rating:** 4.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Technologie de l'information et services | Entreprise (> 1000 employés)

**Reviewed Date:** April 08, 2019

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

Convivial. Bonne interface graphique. Fait ce qu'il doit faire.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

Trop d'étapes lors de l'utilisation de ssh. Réduisez le nombre d'étapes à suivre lors de l'utilisation du cloudshell.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Pas encore utilisé dans ce contexte. Juste de la pratique.

  ### 14. Génial à utiliser !

**Rating:** 4.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Technologie de l'information et services | Marché intermédiaire (51-1000 employés)

**Reviewed Date:** March 13, 2019

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

L'interface graphique utilisateur de Dataproc facilite la création de clusters et leur utilisation.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

Cela peut être plus rapide en termes de temps de calcul.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Je l'ai utilisé pour créer des clusters Hadoop et c'était facile à utiliser, interactif et maintenable.

  ### 15. Bon endroit pour exécuter des clusters Hadoop

**Rating:** 4.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Logiciels informatiques | Petite entreprise (50 employés ou moins)

**Reviewed Date:** October 17, 2018

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

IDE fluide et intégration transparente avec plusieurs options de langages de programmation.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

Les clusters prennent du temps à redémarrer lorsque la facturation est réactivée.

**Recommandations à d’autres personnes envisageant Google Cloud Managed Service for Apache Spark:**

Je suggérerais à tout le monde d'essayer lorsqu'ils commencent avec les déploiements cloud et/ou le map reduce.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Travailler à l'exécution de tâches MapReduce pour un projet récent. L'équilibrage de charge est fluide entre les différents clusters car les tâches sont distribuées entre les nœuds.

  ### 16. L'un des meilleurs outils de préparation de données sur le cloud

**Rating:** 5.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Technologie de l'information et services | Petite entreprise (50 employés ou moins)

**Reviewed Date:** September 25, 2018

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

Ils soutiennent les outils open source. Les prix sont compétitifs. Très bonne performance.

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

Rien de particulier à détester. Ils ont combiné tous les services en un seul endroit et parfois il est difficile de s'y retrouver.

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

Nous postulons en tant que partenaire technologique. Les utilisateurs pourraient utiliser notre outil pour la visualisation des données après être passés par dataproc.

  ### 17. Google pourrait examen de traitement des données

**Rating:** 3.5/5.0 stars

**Reviewed by:** Leah D. | Renal Dietitian, Entreprise (> 1000 employés)

**Reviewed Date:** April 23, 2018

**Qu'aimez-vous le plus à propos de Google Cloud Managed Service for Apache Spark?**

ce logiciel était très utile en raison de sa capacité à prédire des opportunités dans les ventes ou la fabrication à partir des dossiers ou des données d'entreprise

**Que n’aimez-vous pas à propos de Google Cloud Managed Service for Apache Spark?**

pas convivial, serait plus bénéfique pour les data scientists ou quelqu'un qui se spécialise en informatique

**Recommandations à d’autres personnes envisageant Google Cloud Managed Service for Apache Spark:**

l'assistance de quelqu'un qui se spécialise en informatique serait bénéfique lors de l'utilisation initiale de ce logiciel

**Quels sont les problèmes que Google Cloud Managed Service for Apache Spark résout, et en quoi cela vous est-il bénéfique?**

La prévisibilité des opportunités pour déterminer les ventes futures, l'efficacité accrue



- [View Google Cloud Managed Service for Apache Spark pricing details and edition comparison](https://www.g2.com/fr/products/google-cloud-managed-service-for-apache-spark/reviews?section=pricing&secure%5Bexpires_at%5D=2026-05-21+21%3A11%3A01+-0500&secure%5Bsession_id%5D=1e64295c-61fe-40d8-b372-22e636888db9&secure%5Btoken%5D=24165ffdc7a0d43a8898a00f232f2358f6dd03c9cd92f270e7a434e45d8842d9&format=llm_user)

## Google Cloud Managed Service for Apache Spark Features
**management**
- Rapports
- Audit

**base de données**
- Collecte de données en temps réel
- Répartition des données
- Lac de données

**Fonctionnalité**
- Extraction
- Transformation
- chargement
- Automatisation
- Évolutivité

**Intégrations**
- Intégration Hadoop
- Intégration de Spark

**Plate-forme**
- Mise à l’échelle de la machine
- Préparation des données
- Intégration de Spark

**Traitement**
- Traitement dans le cloud
- Traitement de la charge de travail

**Rapports de construction**
- Transformation des données
- Modélisation des données
- Conception de rapports WYSIWYG
- API d’intégration

**Plate-forme**
- Assistance aux utilisateurs mobiles
- Personnalisation
- Gestion des utilisateurs, des rôles et des accès
- Internationalisation
- Bac à sable / Environnements de test
- Performance et fiabilité
- Étendue des applications des partenaires

## Top Google Cloud Managed Service for Apache Spark Alternatives
  - [Databricks](https://www.g2.com/fr/products/databricks/reviews) - 4.6/5.0 (748 reviews)
  - [Cloudera Data Platform](https://www.g2.com/fr/products/cloudera-cloudera-data-platform/reviews) - 4.1/5.0 (131 reviews)
  - [Azure Data Factory](https://www.g2.com/fr/products/azure-data-factory/reviews) - 4.6/5.0 (95 reviews)

