
Especificamente, os poucos melhores pontos que gosto sobre o Spark SQL são os seguintes:
- É a melhor escolha para análises de big data em colaboração com o Hadoop.
- Ele fornece acesso rápido aos dados em cargas de trabalho SQL.
- No Spark SQL, muitos tipos de processamento de dados podem ser usados juntos.
- É fácil integrar várias fontes de dados - desde Spark RDD até bancos de dados externos.
- O Spark SQL suporta Map-reduce, consultas SQL, dados de streaming, aprendizado de máquina (ML) e algoritmos de grafos. Análise coletada por e hospedada no G2.com.
Minha principal aversão são as limitações do Spark SQL, incluindo problemas de latência, problemas com arquivos menores e a falta de processamento de dados em tempo real. A Apache já resolveu alguns com uma solução alternativa pelo Apache Apex. No entanto, esses problemas precisam ser resolvidos no Spark SQL, pois uma alternativa é aceitável, mas alguns recursos que o Spark SQL oferece não estão disponíveis com o Apex. Análise coletada por e hospedada no G2.com.
No G2, preferimos avaliações recentes e gostamos de fazer acompanhamento com os avaliadores. Eles podem não ter atualizado o texto da avaliação, mas atualizaram a avaliação.
Validado pelo LinkedIn
Este avaliador recebeu um cartão presente nominal como agradecimento por completar esta avaliação.
Convite do G2. Este avaliador recebeu um cartão presente nominal como agradecimento por completar esta avaliação.
Esta avaliação foi traduzida de English usando IA.




