# Apache Beam Reviews
**Vendor:** The Apache Software Foundation  
**Category:** [Traitement et distribution des mégadonnées](https://www.g2.com/fr/categories/big-data-processing-and-distribution)  
**Average Rating:** 4.1/5.0  
**Total Reviews:** 16
## About Apache Beam
Apache Beam est un modèle de programmation unifié open source conçu pour définir et exécuter des pipelines de traitement de données, y compris ETL, traitement par lots et traitement en flux.




## Apache Beam Reviews
  ### 1. Traitement par lots et en flux avec Beam !

**Rating:** 5.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Marketing et publicité | Entreprise (> 1000 employés)

**Reviewed Date:** May 12, 2023

**Qu'aimez-vous le plus à propos de Apache Beam?**

Beam est génial. Le traitement par lots et le traitement en flux sont gérés via les mêmes sémantiques/code. Il suffit de changer vos E/S, par exemple : base de données ou fichiers pour le traitement par lots, ou une file de messages pour les cas d'utilisation en flux.

**Que n’aimez-vous pas à propos de Apache Beam?**

Les gens ont parfois des difficultés à apprendre. J'aimerais que ce soit plus facile pour eux.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Nous utilisons Beam pour gérer la plupart de nos besoins en traitement de données. Tant pour les cas d'utilisation par lots que pour les flux, et à travers nos clouds avec une multitude d'entrées et de sorties.

  ### 2. Expérience avec Apache Beam ---> Jusqu'à présent, tout va bien.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Automobile | Petite entreprise (50 employés ou moins)

**Reviewed Date:** August 18, 2020

**Qu'aimez-vous le plus à propos de Apache Beam?**

J'ai aimé la façon dont Beam offre une abstraction pour le paradigme distribué complexe en utilisant pCollection et Transforms, etc. De plus, son approche unifiée pour traiter à la fois le traitement par lots et le traitement en flux est unique et efficace.

**Que n’aimez-vous pas à propos de Apache Beam?**

Au moment de faire le développement, j'ai trouvé que faire une opération de jointure n'était pas si simple et nous avons dû utiliser coGroupByKey pour cela, ce qui était un peu déroutant pour nous. Peut-être que fournir une abstraction aussi simple qu'une opération de jointure aiderait la communauté des utilisateurs. Peut-être que la communauté des développeurs a déjà fourni cette option, mais elle n'était pas disponible lorsque nous faisions notre cas d'utilisation.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Nous utilisons Beam pour le traitement par lots de données avec Google Cloud Storage comme source et Big Query comme destination. Nous l'avons trouvé très efficace car nous avons également effectué diverses transformations à la volée.

  ### 3. Excellente expérience de traitement parallèle

**Rating:** 4.5/5.0 stars

**Reviewed by:** Amazon C. | Human Resources Manager, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** August 21, 2020

**Qu'aimez-vous le plus à propos de Apache Beam?**

J'ai utilisé Apache Beam pour concevoir mon pipeline sur la plateforme Google Cloud. Mon expérience a été fluide. J'ai conçu pour des données par lots et en streaming.

**Que n’aimez-vous pas à propos de Apache Beam?**

Manque de cours disponibles sur Apache Beam qui peuvent aider les débutants à apprendre Beam.

**Recommandations à d’autres personnes envisageant Apache Beam:**

Je pourrais facilement recommander à quiconque d'utiliser Apache Beam pour sa simplicité et sa documentation détaillée.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

J'ai utilisé la technique de fenêtrage pour accueillir les données tardives dans mon pipeline, ce qui était une tâche brillante.

  ### 4. Excellent choix pour mettre en œuvre des pipelines de données complexes et portables.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Télécommunications | Petite entreprise (50 employés ou moins)

**Reviewed Date:** April 25, 2020

**Qu'aimez-vous le plus à propos de Apache Beam?**

En termes de capacités et de généralité, je pense qu'Apache Beam est actuellement le cadre le plus avancé et le plus flexible pour concevoir et mettre en œuvre des applications modernes intensives en données. Parfaitement capable de spécifier à la fois des calculs par lots et en streaming, et en termes de capacités de streaming, il offre vraiment beaucoup ! Il faut un certain temps pour se familiariser avec les API, mais après cela, ça se passe assez bien. Enfin, le support de divers moteurs d'exécution grâce à l'abstraction "runner" en fait un excellent choix lorsque la portabilité entre différentes plateformes, que ce soit sur site ou dans le Cloud, devient un facteur. Définitivement recommandé.

**Que n’aimez-vous pas à propos de Apache Beam?**

Actuellement, les API ne sont pas exactement très conviviales.

**Recommandations à d’autres personnes envisageant Apache Beam:**

Certainement recommandé pour un pipeline de données moderne.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Mise en œuvre de pipelines ETL évolutifs fonctionnant sur le Cloud. Mettre en œuvre des déclencheurs commerciaux basés sur une charge de travail élevée d'événements entrants.

  ### 5. Facile à mettre en œuvre et de nombreux exemples à suivre

**Rating:** 4.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Technologie de l'information et services | Marché intermédiaire (51-1000 employés)

**Reviewed Date:** August 16, 2020

**Qu'aimez-vous le plus à propos de Apache Beam?**

Mettez à jour fréquemment et prenez en charge plusieurs langues.

**Que n’aimez-vous pas à propos de Apache Beam?**

Plus fastidieux pour déboguer le code de l'application. De plus, les journaux d'erreurs ne sont pas très informatifs.

**Recommandations à d’autres personnes envisageant Apache Beam:**

Faites plus de recherches avant de commencer pour voir si ce produit vous convient.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Créer un pipeline pour collecter des données à partir de dispositifs IoT afin d'analyser les informations qu'ils fournissent. Les données sont des données de santé et de navigation.

  ### 6. Expérience Apache Beam sur Google Cloud Platform

**Rating:** 4.0/5.0 stars

**Reviewed by:** Praneet P. | Data Analyst (Deep Learning and Data Processing Engine), Logiciels informatiques, Petite entreprise (50 employés ou moins)

**Reviewed Date:** October 30, 2019

**Qu'aimez-vous le plus à propos de Apache Beam?**

Ce que j'aime le plus chez Apache Beam, c'est la facilité d'utilisation lors de la définition de pipelines pour ETL à la fois en traitement par lots et en traitement de flux. Étant un logiciel open-source, Beam est l'un des outils les plus puissants disponibles.

**Que n’aimez-vous pas à propos de Apache Beam?**

C'est un peu plus lent qu'Apache Flink car Beam est principalement classé dans les outils de base de données graphiques tandis que Flink est classé dans les outils de Big Data. De plus, il ne fournit pas d'interface utilisateur pour surveiller le statut des tâches, contrairement à Flink. Fonctionne assez bien pour les petites tâches ETL dans GCP plutôt que pour les grandes tâches qui impliquent beaucoup de traitement de flux. Flink est meilleur si votre cas d'utilisation doit gérer beaucoup de flux en même temps.

**Recommandations à d’autres personnes envisageant Apache Beam:**

Je suggérerais d'abord de parcourir la documentation d'Apache Beam, car il y a de bons contenus ainsi que les blogs sur Apache Beam. Explorez de nombreux autres outils ETL comme Apache Spark, Flink, Storm, Samza avant de considérer Beam car chacun d'eux a ses propres avantages selon les cas d'utilisation et décidez lequel vous convient le mieux. J'ai principalement utilisé Beam dans Google Cloud Platform DataFlow pour transformer et enregistrer certaines modifications de la base de données en utilisant Change Data Capture dans Apache Druid et j'ai trouvé que Beam est assez bon pour les petites tâches plutôt que pour les grandes.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

J'ai utilisé Beam lors de l'écriture de certains ETL pour le traitement par lots dans Cloud DataFlow pour transformer les données de manière opportune et les stocker en tant que caractéristiques dans une base de données de séries temporelles.

  ### 7. Les pipelines de traitement de données simplifiés

**Rating:** 5.0/5.0 stars

**Reviewed by:** Dhavala A. | Software Developer, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** October 30, 2019

**Qu'aimez-vous le plus à propos de Apache Beam?**

Avec Apache Beam, les pipelines de traitement de données sont vraiment facilités. Nous l'avons utilisé au cours des 3 derniers mois et l'avons trouvé très réussi, en particulier pour le processus ETL des données que nous produisons.

**Que n’aimez-vous pas à propos de Apache Beam?**

C'est bon pour les petits processus, mais pas conseillé pour les grands processus rationalisés.

**Recommandations à d’autres personnes envisageant Apache Beam:**

c'est ça vaut le coup.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Nous faisons ETL et produisons des caractéristiques en ML.

  ### 8. Excellent moteur de flux de travail pour le traitement des données en continu

**Rating:** 4.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Détail | Marché intermédiaire (51-1000 employés)

**Reviewed Date:** October 30, 2019

**Qu'aimez-vous le plus à propos de Apache Beam?**

C'est un moteur de flux de travail open-source qui vous permet de coder votre logique de flux de travail de traitement des données. Il vous permet de traiter vos données par lots et par flux.

**Que n’aimez-vous pas à propos de Apache Beam?**

Vous devriez apprendre la fonction de base de votre flux de travail en utilisant Java. Donc, cela prend du temps (cela dépend de votre courbe d'apprentissage).

**Recommandations à d’autres personnes envisageant Apache Beam:**

c'est un excellent moteur de traitement de flux de données en continu que vous pouvez personnaliser avec votre propre logique pour votre moteur de flux de travail.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

diffuser des données d'Apache Kafka vers BigQuery avec l'implémentation de plusieurs logiques supplémentaires (personnalisées à partir de Google Dataflow)

  ### 9. Big Data

**Rating:** 3.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Technologie de l'information et services | Marché intermédiaire (51-1000 employés)

**Reviewed Date:** October 30, 2019

**Qu'aimez-vous le plus à propos de Apache Beam?**

Apache Beam a une bonne fonctionnalité "Pardo" et "dofn" qui aide à écrire du code personnalisé et à réaliser des opérations parallèles puissantes.

**Que n’aimez-vous pas à propos de Apache Beam?**

Apache Beam n'a que la connectivité Jdbc et après l'opération d'écriture, vous ne pouvez pas ouvrir à nouveau une nouvelle pcollection.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Apache Beam est bon pour les flux de données événementielles.

  ### 10. Apache Beam est bon pour orchestrer vos pipelines de traitement de flux.

**Rating:** 3.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Détail | Entreprise (> 1000 employés)

**Reviewed Date:** November 01, 2019

**Qu'aimez-vous le plus à propos de Apache Beam?**

Liberté de choisir vos propres environnements d'exécution. Cela offre une immense flexibilité aux développeurs.

**Que n’aimez-vous pas à propos de Apache Beam?**

les instructions de déploiement et de production ainsi que les études de cas doivent être améliorées

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Nous l'évaluions pour l'environnement PCF dans Azure et n'avons pas trouvé de documentation.

  ### 11. Bonne technologie

**Rating:** 4.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Technologie de l'information et services | Petite entreprise (50 employés ou moins)

**Reviewed Date:** October 30, 2019

**Qu'aimez-vous le plus à propos de Apache Beam?**

mise en œuvre rapide de toutes les méthodes pour essayer de changer les données

**Que n’aimez-vous pas à propos de Apache Beam?**

Difficile à utiliser et ce que vous devez exactement faire

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Nettoyez les données et enregistrez-les sur BigQuery (Google Cloud)

  ### 12. Analytique évolutive

**Rating:** 5.0/5.0 stars

**Reviewed by:** Ole D. | CTO &amp; Co-founder, Petite entreprise (50 employés ou moins)

**Reviewed Date:** March 16, 2019

**Qu'aimez-vous le plus à propos de Apache Beam?**

Les SDK sont bons et faciles à utiliser. C'est incroyable à quelle vitesse on peut mettre quelque chose en marche.

**Que n’aimez-vous pas à propos de Apache Beam?**

Pas encore de support pour python3 et il y a encore certains avantages à utiliser JAVA et pas vraiment fan de JAVA.

**Recommandations à d’autres personnes envisageant Apache Beam:**

Juste sauter dedans.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Diffusion de volumes élevés de données à partir d'API/file d'attente de messages dans un magasin de données en ajoutant des éléments tels que session_id en cours de route.

  ### 13. Le streaming rendu possible et plus facile avec Beam

**Rating:** 4.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Logiciels informatiques | Marché intermédiaire (51-1000 employés)

**Reviewed Date:** April 11, 2019

**Qu'aimez-vous le plus à propos de Apache Beam?**

Comment cela nous facilite la mise en œuvre de l'ensemble du pipeline de flux de données. Nous l'utilisons à partir des services de flux de données en continu et par lots, et il a été très fiable et facile à développer. Il y a suffisamment d'exemples et de documentation pour vous lancer. Fonctionne très bien avec l'ingestion dans BQ sur GCP.

**Que n’aimez-vous pas à propos de Apache Beam?**

Certaines cas d'utilisation extrêmes sont difficiles à mettre en œuvre et certaines des instances dont nous avions besoin pour le pipeline de données n'étaient pas encore prises en charge.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Extraire des données vers notre entrepôt de données à partir d'API tierces est vital pour l'entreprise et grâce à Apache Beam, le code que nous avons développé est devenu beaucoup plus compact et facile à maintenir.

  ### 14. Technologie en avance sur son temps

**Rating:** 3.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à Gestion de l'éducation | Marché intermédiaire (51-1000 employés)

**Reviewed Date:** June 11, 2019

**Qu'aimez-vous le plus à propos de Apache Beam?**

traitement de flux distribué au fur et à mesure que les données arrivent.

**Que n’aimez-vous pas à propos de Apache Beam?**

C'est un peu compliqué à configurer et l'auto-scalabilité est un peu maladroite.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Traitement des données pour les données agrégées en temps réel

  ### 15. Programmes SDK incroyables

**Rating:** 2.0/5.0 stars

**Reviewed by:** Kerri D. | Entreprise (> 1000 employés)

**Reviewed Date:** June 12, 2018

**Qu'aimez-vous le plus à propos de Apache Beam?**

C'est une vision d'aider à améliorer mes applications en fournissant un SDK. C'est très simple à mettre en œuvre.

**Que n’aimez-vous pas à propos de Apache Beam?**

Je souhaite qu'il offre plus d'outils à utiliser, parce que j'aime vraiment la plateforme.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

L'aspect du moteur de traitement était un problème avant le lancement de ce SDK, mais maintenant il a résolu mes problèmes.

  ### 16. Données massives simplifiées

**Rating:** 5.0/5.0 stars

**Reviewed by:** Utilisateur vérifié à E-learning | Petite entreprise (50 employés ou moins)

**Reviewed Date:** July 10, 2018

**Qu'aimez-vous le plus à propos de Apache Beam?**

Soutenu par Google. C'est une solution qui a tout, de nombreux systèmes peuvent gérer à la fois le traitement par lots et le streaming, mais ils le font souvent via des API distinctes. Beam se concentre sur la capture des propriétés de vos données et de votre logique, au lieu de laisser les détails. Le projet utilise le bon modèle de programmation pour le traitement des données en streaming et par lots.

**Que n’aimez-vous pas à propos de Apache Beam?**

les capacités ne seront pas toujours exactement les mêmes sur différents exécutants Beam à un moment donné

**Recommandations à d’autres personnes envisageant Apache Beam:**

Vous devriez essayer Beam si vous commencez un nouveau projet de données.

**Quels sont les problèmes que Apache Beam résout, et en quoi cela vous est-il bénéfique?**

Big data, science des données


## Apache Beam Discussions
  - [Please create more videos which teaches Apache Beam](https://www.g2.com/fr/discussions/30870-please-create-more-videos-which-teaches-apache-beam) - 1 upvote

- [View Apache Beam pricing details and edition comparison](https://www.g2.com/fr/products/apache-beam/reviews?section=pricing&secure%5Bexpires_at%5D=2026-05-14+08%3A04%3A15+-0500&secure%5Bsession_id%5D=358a0304-e1cd-46f0-820e-4078210d9869&secure%5Btoken%5D=adba9e801165634a1f1ebc3f60fe5a4b99e24c7803102000cedc3e7d99a4d154&format=llm_user)

## Apache Beam Features
**base de données**
- Collecte de données en temps réel
- Répartition des données
- Lac de données

**Intégrations**
- Intégration Hadoop
- Intégration de Spark

**Plate-forme**
- Mise à l’échelle de la machine
- Préparation des données
- Intégration de Spark

**Traitement**
- Traitement dans le cloud
- Traitement de la charge de travail

**Rapports de construction**
- Transformation des données
- Modélisation des données
- Conception de rapports WYSIWYG
- API d’intégration

**Plate-forme**
- Assistance aux utilisateurs mobiles
- Personnalisation
- Gestion des utilisateurs, des rôles et des accès
- Internationalisation
- Bac à sable / Environnements de test
- Performance et fiabilité
- Étendue des applications des partenaires

## Top Apache Beam Alternatives
  - [Databricks](https://www.g2.com/fr/products/databricks/reviews) - 4.6/5.0 (740 reviews)
  - [Amazon EMR](https://www.g2.com/fr/products/amazon-emr/reviews) - 4.2/5.0 (60 reviews)
  - [Azure Data Lake Store](https://www.g2.com/fr/products/azure-data-lake-store/reviews) - 4.5/5.0 (37 reviews)

