# Apache Beam Reviews
**Vendor:** The Apache Software Foundation  
**Category:** [Sistemas de Processamento e Distribuição de Big Data](https://www.g2.com/pt/categories/big-data-processing-and-distribution)  
**Average Rating:** 4.1/5.0  
**Total Reviews:** 16
## About Apache Beam
Apache Beam é um modelo de programação unificado de código aberto projetado para definir e executar pipelines de processamento de dados, incluindo ETL, processamento em lote e em fluxo.




## Apache Beam Reviews
  ### 1. Processamento em lote e fluxo com Beam!

**Rating:** 5.0/5.0 stars

**Reviewed by:** Usuário Verificado em Marketing e Publicidade | Empresa (> 1000 emp.)

**Reviewed Date:** May 12, 2023

**O que você mais gosta em Apache Beam?**

Beam é incrível. Tanto o processamento em lote quanto o processamento em fluxo são tratados através da mesma semântica/código. Basta trocar seus IOs, por exemplo: banco de dados ou arquivos para lote, ou uma fila de mensagens para casos de uso de streaming.

**O que você não gosta em Apache Beam?**

As pessoas às vezes têm dificuldade em aprender. Eu gostaria que fosse mais fácil para elas.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Usamos o Beam para lidar com a maioria das nossas necessidades de processamento de dados. Tanto casos de uso em lote quanto em fluxo, e em todas as nossas nuvens, com uma variedade de entradas e saídas.

  ### 2. Experiência com Apache Beam ---> Até agora, tudo bem.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Usuário Verificado em Automotivo | Pequena Empresa (50 ou menos emp.)

**Reviewed Date:** August 18, 2020

**O que você mais gosta em Apache Beam?**

Gostei da maneira como o Beam fornece abstração para o complexo paradigma distribuído usando pCollection e Transforms, etc. Além disso, sua abordagem unificada para lidar com o processamento em lote e em fluxo é única e eficiente.

**O que você não gosta em Apache Beam?**

Na época em que estava desenvolvendo, descobri que fazer a operação de Join não era tão simples e tivemos que usar coGroupByKey para isso, o que foi um pouco confuso para nós. Talvez fornecer uma abstração como uma operação de join simples ajudaria a comunidade de usuários. Talvez a comunidade de desenvolvedores já tenha fornecido essa opção, mas ela não estava disponível quando estávamos fazendo nosso caso de uso.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Temos usado o Beam para processamento de dados em lote com a Fonte como Google Cloud Storage e o Destino como Big Query. Achamos muito eficiente, pois também fizemos várias transformações em tempo real.

  ### 3. Excelente experiência em processamento paralelo

**Rating:** 4.5/5.0 stars

**Reviewed by:** Amazon C. | Human Resources Manager, Médio Porte (51-1000 emp.)

**Reviewed Date:** August 21, 2020

**O que você mais gosta em Apache Beam?**

Eu usei o Apache Beam para projetar meu pipeline na plataforma Google Cloud. Minha experiência foi tranquila. Eu projetei para dados em lote e em streaming.

**O que você não gosta em Apache Beam?**

Falta de cursos disponíveis sobre Apache Beam que podem ajudar iniciantes a aprender Beam.

**Recomendações a outras pessoas considerando Apache Beam:**

Eu poderia facilmente recomendar a qualquer pessoa o uso do Apache Beam por sua simplicidade e documentação detalhada.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Eu usei a técnica de janelamento para acomodar dados atrasados dentro do meu pipeline, o que foi uma tarefa brilhante.

  ### 4. Ótima escolha para implementar pipelines de dados complexos e portáteis.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Usuário Verificado em Telecomunicações | Pequena Empresa (50 ou menos emp.)

**Reviewed Date:** April 25, 2020

**O que você mais gosta em Apache Beam?**

Em termos de capacidades e generalidade, acho que o Apache Beam é atualmente o framework mais avançado e flexível para projetar e implementar aplicações modernas intensivas em dados. Perfeitamente capaz de especificar tanto computações em lote quanto em streaming, além de, em termos de capacidades de streaming, oferecer realmente muito! Leva algum tempo para se familiarizar com as APIs, mas depois disso, tudo flui bem. Finalmente, o suporte para vários motores de execução graças à abstração "runner" faz dele uma ótima escolha quando a portabilidade entre diferentes plataformas, seja no local ou na nuvem, se torna um fator. Definitivamente recomendado.

**O que você não gosta em Apache Beam?**

Atualmente, as APIs não são exatamente muito amigáveis.

**Recomendações a outras pessoas considerando Apache Beam:**

Definitivamente recomendado para pipeline de dados moderno.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Implementação de pipelines ETL escaláveis na nuvem. Implementação de gatilhos de negócios com base em uma alta carga de eventos recebidos.

  ### 5. Fácil de implementar e muitos exemplos para seguir

**Rating:** 4.5/5.0 stars

**Reviewed by:** Usuário Verificado em Tecnologia da Informação e Serviços | Médio Porte (51-1000 emp.)

**Reviewed Date:** August 16, 2020

**O que você mais gosta em Apache Beam?**

Atualize frequentemente e suporte vários idiomas

**O que você não gosta em Apache Beam?**

Mais tedioso depurar o código do aplicativo. Além disso, logs de erro não muito informativos.

**Recomendações a outras pessoas considerando Apache Beam:**

Faça mais pesquisas antes de começar para ver se este é um produto adequado para você.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Criando um pipeline para coletar dados de dispositivos IoT para analisar os insights fornecidos por eles. Os dados são dados de saúde e dados de navegação.

  ### 6. Experiência com Apache Beam na Google Cloud Platform

**Rating:** 4.0/5.0 stars

**Reviewed by:** Praneet P. | Data Analyst (Deep Learning and Data Processing Engine), Software de Computador, Pequena Empresa (50 ou menos emp.)

**Reviewed Date:** October 30, 2019

**O que você mais gosta em Apache Beam?**

O que eu mais gosto no Apache Beam é a facilidade de uso ao definir pipelines para ETL tanto em Processamento em Lote quanto em Processamento de Fluxo. Sendo um software de código aberto, o Beam é uma das ferramentas mais poderosas disponíveis.

**O que você não gosta em Apache Beam?**

É um pouco mais lento que o Apache Flink, pois o Beam é principalmente classificado em ferramentas de banco de dados gráfico, enquanto o Flink é classificado em ferramentas de Big Data. Além disso, não fornece nenhuma interface de usuário para monitorar o status do trabalho, enquanto o Flink fornece. Funciona muito bem para pequenas tarefas de ETL no GCP, em vez de grandes tarefas que envolvem muito processamento de fluxos. O Flink é melhor se o seu caso de uso precisar lidar com muitos fluxos ao mesmo tempo.

**Recomendações a outras pessoas considerando Apache Beam:**

Eu sugeriria primeiro passar pelos documentos do Apache Beam, pois há um bom conteúdo lá, juntamente com os blogs sobre Apache Beam. Explore muitas outras ferramentas ETL como Apache Spark, Flink, Storm, Samza antes de considerar o Beam, já que cada uma delas tem seus próprios benefícios de caso de uso e decida qual delas se encaixa melhor para você. Eu usei principalmente o Beam no Google Cloud Platform DataFlow para transformar e salvar algumas alterações do banco de dados usando Change Data Capture no Apache Druid e descobri que o Beam é muito bom para tarefas pequenas em vez de grandes.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Usei o Beam ao escrever alguns ETL para processamento em lote no Cloud DataFlow para transformar os dados de maneira oportuna e armazená-los como características em algum banco de dados de séries temporais.

  ### 7. Pipelines de processamento de dados facilitados

**Rating:** 5.0/5.0 stars

**Reviewed by:** Dhavala A. | Software Developer, Médio Porte (51-1000 emp.)

**Reviewed Date:** October 30, 2019

**O que você mais gosta em Apache Beam?**

Com o Apache Beam, os pipelines de processamento de dados são realmente fáceis. Temos usado isso nos últimos 3 meses e achamos muito bem-sucedido, especialmente para o processo ETL dos dados que produzimos.

**O que você não gosta em Apache Beam?**

É bom para processos menores, mas não é aconselhável para grandes processos simplificados.

**Recomendações a outras pessoas considerando Apache Beam:**

é vale a pena.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Nós fazemos ETL e produzimos características em ML.

  ### 8. Ótimo mecanismo de fluxo de trabalho para processamento de dados em streaming

**Rating:** 4.5/5.0 stars

**Reviewed by:** Usuário Verificado em Varejo | Médio Porte (51-1000 emp.)

**Reviewed Date:** October 30, 2019

**O que você mais gosta em Apache Beam?**

É um motor de fluxo de trabalho de código aberto que permite codificar sua lógica de fluxo de trabalho de processamento de dados. Ele permite que você processe seus dados com base em lotes e fluxos.

**O que você não gosta em Apache Beam?**

Você deve aprender a função básica do seu fluxo de trabalho usando Java. Então, isso leva tempo (depende da sua curva de aprendizado)

**Recomendações a outras pessoas considerando Apache Beam:**

é um ótimo mecanismo de fluxo de trabalho de processamento de dados em streaming que você pode personalizar sua própria lógica para o seu mecanismo de fluxo de trabalho.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

transmitindo dados do Apache Kafka para o BigQuery com a implementação de várias lógicas adicionais (personalizadas a partir do Google Dataflow)

  ### 9. Big Data

**Rating:** 3.5/5.0 stars

**Reviewed by:** Usuário Verificado em Tecnologia da Informação e Serviços | Médio Porte (51-1000 emp.)

**Reviewed Date:** October 30, 2019

**O que você mais gosta em Apache Beam?**

O Apache Beam possui boas funcionalidades "Pardo" e "dofn", que ajudam a escrever código personalizado e realizar operações paralelas poderosas.

**O que você não gosta em Apache Beam?**

O Apache Beam possui apenas conectividade Jdbc e, após a operação de gravação, você não pode abrir uma nova PCollection novamente.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Apache Beam é bom para dados de fluxo de eventos.

  ### 10. O Apache Beam é bom para orquestrar seus pipelines de processamento de fluxo.

**Rating:** 3.0/5.0 stars

**Reviewed by:** Usuário Verificado em Varejo | Empresa (> 1000 emp.)

**Reviewed Date:** November 01, 2019

**O que você mais gosta em Apache Beam?**

Liberdade para escolher seus próprios tempos de execução. Isso dá uma flexibilidade imensa aos desenvolvedores.

**O que você não gosta em Apache Beam?**

as instruções de implantação e produção e os estudos de caso devem ser melhorados

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Estávamos avaliando para o ambiente PCF no Azure e não encontramos documentação.

  ### 11. Boa tecnologia

**Rating:** 4.0/5.0 stars

**Reviewed by:** Usuário Verificado em Tecnologia da Informação e Serviços | Pequena Empresa (50 ou menos emp.)

**Reviewed Date:** October 30, 2019

**O que você mais gosta em Apache Beam?**

implementação rápida de todos os métodos para tentar mudar os dados

**O que você não gosta em Apache Beam?**

Difícil de usar e o que exatamente você precisa fazer

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Limpe os dados e salve-os no BigQuery (Google Cloud)

  ### 12. Análise escalável

**Rating:** 5.0/5.0 stars

**Reviewed by:** Ole D. | CTO &amp; Co-founder, Pequena Empresa (50 ou menos emp.)

**Reviewed Date:** March 16, 2019

**O que você mais gosta em Apache Beam?**

Os SDKs são bons e fáceis de usar. É incrível quão rápido você consegue colocar algo em funcionamento.

**O que você não gosta em Apache Beam?**

Ainda não há suporte para python3 e ainda há alguns benefícios em usar JAVA e não sou realmente fã de JAVA.

**Recomendações a outras pessoas considerando Apache Beam:**

Apenas mergulhe direto nisso.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Transmitindo grandes volumes de dados de APIs/fila de mensagens para um armazenamento de dados, adicionando coisas como session_id no caminho.

  ### 13. Streaming possibilitado e facilitado com o Beam

**Rating:** 4.0/5.0 stars

**Reviewed by:** Usuário Verificado em Software de Computador | Médio Porte (51-1000 emp.)

**Reviewed Date:** April 11, 2019

**O que você mais gosta em Apache Beam?**

Como isso facilita para nós implementar todo o pipeline de fluxo de dados. Estamos usando-o nos serviços de Streaming e Batch Dataflow e tem sido muito confiável e fácil de desenvolver. Há exemplos e documentação suficientes para você começar. Funciona muito bem com a ingestão no BQ no GCP.

**O que você não gosta em Apache Beam?**

Alguns casos de uso extremos são difíceis de implementar e algumas das instâncias que precisávamos para o pipeline de dados ainda não eram suportadas.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Extrair dados para nosso Data Warehouse a partir de APIs de terceiros é vital para o negócio e, através do Apache Beam, o código que desenvolvemos se tornou muito mais compacto e fácil de manter.

  ### 14. Tecnologia à frente de seu tempo

**Rating:** 3.0/5.0 stars

**Reviewed by:** Usuário Verificado em Gestão Educacional | Médio Porte (51-1000 emp.)

**Reviewed Date:** June 11, 2019

**O que você mais gosta em Apache Beam?**

processamento de fluxo distribuído à medida que os dados chegam.

**O que você não gosta em Apache Beam?**

É um pouco complicado de configurar e a escalabilidade automática é um pouco desajeitada.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Processamento de dados para dados agregados em tempo real

  ### 15. Programas SDK incríveis

**Rating:** 2.0/5.0 stars

**Reviewed by:** Kerri D. | Empresa (> 1000 emp.)

**Reviewed Date:** June 12, 2018

**O que você mais gosta em Apache Beam?**

É uma visão de ajudar a melhorar meus aplicativos fornecendo um SDK. É muito simples de implementar.

**O que você não gosta em Apache Beam?**

Eu gostaria que oferecesse mais ferramentas para usar, porque eu realmente gosto da plataforma.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

O aspecto do motor de processamento era um problema antes deste SDK ser lançado, mas agora resolveu meus problemas.

  ### 16. Big data simplificado

**Rating:** 5.0/5.0 stars

**Reviewed by:** Usuário Verificado em E-Learning | Pequena Empresa (50 ou menos emp.)

**Reviewed Date:** July 10, 2018

**O que você mais gosta em Apache Beam?**

Apoiado pelo Google. É uma solução que tem tudo, muitos sistemas podem lidar com processamento em lote e em fluxo, mas frequentemente o fazem através de APIs separadas. O Beam foca em capturar as propriedades dos seus dados e da sua lógica, em vez de se ater aos detalhes. O projeto utiliza o modelo de programação correto para processamento de dados em fluxo e em lote.

**O que você não gosta em Apache Beam?**

as capacidades nem sempre serão exatamente as mesmas em diferentes executores do Beam em um determinado momento

**Recomendações a outras pessoas considerando Apache Beam:**

Você deve experimentar o Beam se estiver começando um novo projeto de dados.

**Que problemas Apache Beam está resolvendo e como isso está beneficiando você?**

Big data, ciência de dados


## Apache Beam Discussions
  - [Please create more videos which teaches Apache Beam](https://www.g2.com/pt/discussions/30870-please-create-more-videos-which-teaches-apache-beam) - 1 upvote

- [View Apache Beam pricing details and edition comparison](https://www.g2.com/pt/products/apache-beam/reviews?section=pricing&secure%5Bexpires_at%5D=2026-05-17+00%3A02%3A00+-0500&secure%5Bsession_id%5D=227a0846-2366-4c36-ae7f-93915d482f4c&secure%5Btoken%5D=2d90fa117b54eaf897138ebd5bf3d75e5afc97d615be339e99f637041ff69ef9&format=llm_user)

## Apache Beam Features
**Base de dados**
- Coleta de dados em tempo real
- Distribuição de dados
- Lagoa de dados

**Integrações**
- Integração com Hadoop
- Integração com o Spark

**Plataforma**
- Dimensionamento de Máquinas
- Preparação de dados
- Integração com o Spark

**Processamento**
- Processamento na nuvem
- Processamento de carga de trabalho

**Construindo relatórios**
- Transformação de dados
- Modelagem de dados
- Design do relatório WYSIWYG
- APIs de integração

**Plataforma**
- Suporte ao usuário móvel
- Personalização
- Gerenciamento de usuários, funções e acessos
- Internacionalização
- Sandbox / Ambientes de Teste
- Desempenho e Confiabilidade
- Abrangência de aplicativos de parceiros

## Top Apache Beam Alternatives
  - [Databricks](https://www.g2.com/pt/products/databricks/reviews) - 4.6/5.0 (744 reviews)
  - [Amazon EMR](https://www.g2.com/pt/products/amazon-emr/reviews) - 4.2/5.0 (60 reviews)
  - [Azure Data Lake Store](https://www.g2.com/pt/products/azure-data-lake-store/reviews) - 4.5/5.0 (37 reviews)

