
O Spark é ótimo para trabalhar com grandes quantidades de dados. Ele pode lidar tanto com trabalhos em lote quanto com dados de streaming, e funciona com diferentes tipos de arquivos e fontes de dados. É muito mais rápido do que sistemas mais antigos porque pode processar dados na memória.
Também gosto que ele tenha ferramentas integradas para consultas de dados, streaming e até aprendizado de máquina, então você pode fazer muito sem mudar de plataforma. Análise coletada por e hospedada no G2.com.
O Spark não é tão "fácil" quanto as pessoas pensam. Se não for configurado ou ajustado corretamente, pode funcionar lentamente ou custar muito para operar. Um pequeno erro na forma como você escreve ou executa um trabalho pode desacelerar tudo.
Depurar problemas pode levar tempo, e o streaming não é realmente em tempo real; ainda funciona em pequenos lotes. Além disso, pode ser complicado combinar a versão certa do Spark com outras ferramentas na sua configuração. Análise coletada por e hospedada no G2.com.




