
A melhor coisa sobre o Dataflow é sua capacidade totalmente gerenciada, de modo que não precisamos gerenciar a infraestrutura e ele escala facilmente. Ele também fornece muitos modelos que são úteis para desenvolvedores de nível iniciante e intermediário e, além disso, eles podem facilmente atualizar a configuração e o pipeline e podem processar petabytes de dados. Além disso, ele suporta o SDK Yaml, que remove as dependências do Apache Beam também. Análise coletada por e hospedada no G2.com.
Quando estamos trabalhando com processamento distribuído, é difícil obter a configuração correta, especialmente para novos usuários, é muito complexo configurá-lo e, na maioria das vezes, custa muito se não for configurado corretamente. E como ele suporta apenas o Apache Beam, alguns dos conceitos são muito difíceis de entender. Além disso, eles podem trabalhar no monitoramento e registro, às vezes não é claro. Análise coletada por e hospedada no G2.com.




