Já se passaram dois meses desde que este perfil recebeu uma nova avaliação

Avaliações e Detalhes do Produto Spark SQL

Valor em Destaque

Médias baseadas em avaliações de usuários reais.

Custo Percebido

$$$$$

Ver Mais Informações de Preços

Alternativas Mais Bem Avaliadas

Ver Todas as Alternativas

As avaliações da G2 são autênticas e verificadas.

Veja como.

Usuário Verificado em Varejo

Empresa (> 1000 emp.)

6/12/2023

"É um bom curso para iniciantes entenderem os fundamentos do Spark."

4/5

O que você mais gosta Spark SQL?

RDD (Resilient Distributed Dataset) é uma coleção distribuída de elementos que podem ser processados em paralelo em um cluster. É uma das principais abstrações do Apache Spark, permitindo que os desenvolvedores realizem operações de computação em grande escala de forma eficiente.

Para realizar operações em um RDD em nós de trabalho distribuídos, o Spark divide o RDD em partições, que são distribuídas entre os nós do cluster. Cada nó de trabalho processa suas partições localmente, o que minimiza a necessidade de transferência de dados entre nós, aumentando a eficiência.

As operações em RDDs podem ser de dois tipos: transformações e ações. Transformações, como `map` e `filter`, são operações preguiçosas que retornam um novo RDD e são avaliadas apenas quando uma ação é chamada. Ações, como `collect` e `count`, retornam um valor ao driver após a execução.

Para executar operações em um RDD:

1. Crie um RDD a partir de uma fonte de dados, como um arquivo ou uma coleção.

2. Aplique transformações para modificar ou filtrar os dados conforme necessário.

3. Use uma ação para coletar ou processar os resultados finais.

O Spark gerencia automaticamente a distribuição e a execução das tarefas nos nós de trabalho, garantindo tolerância a falhas e eficiência. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Nível muito básico, não havia muito sobre como conectar o Spark com outra fonte de dados. Análise coletada por e hospedada no G2.com.

Usuário Verificado em Tecnologia da Informação e Serviços

Pequena Empresa (50 ou menos emp.)

6/19/2023

"Realmente traz a faísca"

5/5

O que você mais gosta Spark SQL?

Cacheamento

Uso de tabelas temporárias

Pode ser usado para bancos de dados estruturados também Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Sem técnicas de otimização automática

Alta curva de aprendizado, melhor documentação necessária Análise coletada por e hospedada no G2.com.

Usuário Verificado em Consultoria de Gestão

Empresa (> 1000 emp.)

9/11/2022

"Fácil de usar, principalmente funcionalidades como SQL normal."

3/5

O que você mais gosta Spark SQL?

O que eu mais gosto no Spark SQL é que ele é fácil de usar e podemos aplicar facilmente consultas SQL normais nele. Além disso, podemos usá-lo no notebook PySpark também, usando %sql ao registrar o dataframe como uma tabela temporária. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Não tenho nenhuma aversão em particular, mas às vezes enfrento dificuldades no desempenho e no tempo de execução da célula se executarmos alguma consulta complexa que tenha muitos joins e outras condições. Para reduzir isso, uso CTE e divido a consulta em partes. Análise coletada por e hospedada no G2.com.

Que problemas é Spark SQL E como isso está te beneficiando?

Às vezes, se alguém não tem conhecimento em Python sobre transformação e se ele tem conhecimento em SQL, ele pode facilmente fazer a transformação usando SQL Spark. Eu também fiz isso muitas vezes, às vezes a consulta é complexa em PySpark, para reduzir os esforços eu usei Spark SQL. Análise coletada por e hospedada no G2.com.

Mubeen M.

Full Stack Developer

Pequena Empresa (50 ou menos emp.)

7/13/2022

""Quão conveniente é usar é incrível!""

4/5

O que você mais gosta Spark SQL?

O Spark SQL tem algumas capacidades que eu particularmente gosto:

O Spark SQL é um produto de referência porque as tecnologias de big data se integram a ele de forma tão perfeita.

Ele tem alta eficiência e pode processar rapidamente uma grande quantidade de dados.

Devido à semelhança de sua sintaxe de consulta com o SQL padrão, aprender uma nova linguagem é facilitado. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Minha principal reclamação com o Spark SQL são suas limitações, que incluem problemas de latência, pequenos problemas de arquivo e a falta de processamento de dados em tempo real. O Apache Apex, uma solução alternativa, já resolveu alguns problemas. No entanto, esses problemas devem ser resolvidos no Spark SQL, pois uma alternativa é aceitável, mas alguns recursos fornecidos pelo Spark SQL não estão disponíveis com o Apex. Análise coletada por e hospedada no G2.com.

Que problemas é Spark SQL E como isso está te beneficiando?

Estamos resolvendo o problema de usar isso para nossos algoritmos de IA e aprendizado de máquina, mas também como um sistema de armazenamento e recuperação de dados em geral. O Spark SQL requer uma grande quantidade de RAM para processar dados, resultando em consumo excessivo de memória.

Além disso, não conseguimos criar tabelas no Spark para tipos de união. Análise coletada por e hospedada no G2.com.

Arpan s.

System Engineer

Empresa (> 1000 emp.)

2/5/2022

"Como o Spark SQL é tão útil para busca e análise de dados."

4.5/5

O que você mais gosta Spark SQL?

Spark SQL é nada mais do que uma linguagem de consulta que oferece ao desenvolvedor a capacidade de buscar e analisar dados no HDFS. O Spark SQL suporta recursos de indexação, bem como recursos de partições, de modo que os dados que serão carregados são organizados de uma maneira que podem ser facilmente buscados e prontos para análise. O núcleo do Spark fornece a plataforma ou terminal onde podemos escrever nossas consultas e realizar qualquer tarefa operacional. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

O núcleo do Spark não suporta os recursos de cache, então ele não pode armazenar os resultados de consultas ou uma consulta em cache, portanto, toda vez que um desenvolvedor realiza uma consulta, ele sempre usa o armazém ou a varredura completa dos dados. Então, sinto que deveria oferecer os recursos de cache para que o custo de computação seja baixo quando alguém estiver usando o framework Spark. Análise coletada por e hospedada no G2.com.

Recomendações a outras pessoas considerando Spark SQL:

Quem deseja implementar suas habilidades em Python no backend pode usar o framework Spark também com Python. Análise coletada por e hospedada no G2.com.

Que problemas é Spark SQL E como isso está te beneficiando?

Transferindo os dados de armazéns para armazenamento em nuvem, usamos o Spark SQL para fins de transferência e análise de dados no HDFS. Assim, usamos o Spark no sistema de cluster Hadoop usando a linguagem Scala. Análise coletada por e hospedada no G2.com.

Gaurav G.

Senior Data Engineer

Empresa (> 1000 emp.)

4/21/2022

"Um motor de distribuição extremamente rápido e leve para projetar grandes conjuntos de dados."

4.5/5

O que você mais gosta Spark SQL?

Como ajuda a executar um grande número de conjuntos de dados de forma distribuída. O Spark SQL fornece uma abstração de programação chamada Data Frames e também pode atuar como um mecanismo de consulta SQL distribuído. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Nada em particular.

Mas juntar dessa maneira é difícil se você estiver juntando conjuntos de dados desequilibrados.

Isso cria um grande conjunto de dados enviesado que não é adequado para um modelo de dados apropriado. Análise coletada por e hospedada no G2.com.

Aaryan S.

Project Engineer - Turbo

Empresa (> 1000 emp.)

3/30/2022

"Um dos mais rápidos ferramentas de computação disponíveis"

3.5/5

O que você mais gosta Spark SQL?

A integração de consultas SQL com os programas Spark é uma das melhores características. A velocidade de processamento das grandes consultas, assim como a otimização do espaço de armazenamento, é incomparável. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

O custo da ferramenta é relativamente alto em comparação com o que oferece. Se você estiver na intranet, pode haver um problema de latência ao executar as consultas. Análise coletada por e hospedada no G2.com.

Niyazahmedraza M.

Médio Porte (51-1000 emp.)

4/6/2022

"Melhor software Spark"

5/5

O que você mais gosta Spark SQL?

Spark funciona de forma mais eficaz em comparação com outros bancos de dados como o MySQL. Ele pode carregar mais dados em comparação com outros bancos de dados e é melhor ao trabalhar com grandes conjuntos de dados. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Eu não diria que é uma desvantagem, mas a versão premium do Spark é mais cara em comparação com outros bancos de dados como MySQL, SQLite, mas o Spark SQL oferece uma experiência premium. Análise coletada por e hospedada no G2.com.

Kubendra Reddy M.

Data Engineer

Empresa (> 1000 emp.)

2/21/2022

"SparkSQL tornou nosso trabalho fácil"

5/5

O que você mais gosta Spark SQL?

A melhor coisa é que podemos processar nossos dados no Spark com código SQL. O SparkSQL possui um otimizador de catalisador que elabora o melhor plano de execução e DAG para executar no Spark. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Ele usa muita memória ao processar os dados, o que leva a problemas de falta de memória. Análise coletada por e hospedada no G2.com.

Recomendações a outras pessoas considerando Spark SQL:

Definitivamente, você pode ir com este mecanismo de consulta. Análise coletada por e hospedada no G2.com.

Que problemas é Spark SQL E como isso está te beneficiando?

Nós mantínhamos nosso data warehouse no Hive e criávamos data frames a partir das tabelas existentes no Hive no Spark e processávamos os dados com SparkSQL. Devido a isso, nosso tempo de processamento foi otimizado. Análise coletada por e hospedada no G2.com.

Pawan K.

Bigdata Platform Architect at HCL Technologies Limited

Empresa (> 1000 emp.)

2/16/2022

"Spark SQL é muito útil para transformação em dados distribuídos."

3.5/5

O que você mais gosta Spark SQL?

Spark SQL é mais rápido, e informações adicionais de tipo tornam mais eficiente Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Atualmente, sem suporte para tabelas de transações. Análise coletada por e hospedada no G2.com.

Recomendações a outras pessoas considerando Spark SQL:

Se a empresa tiver um projeto baseado em análise de dados e tiver um caso de negócios para processamento de dados em tempo real e em lote, eles devem usar o framework Spark. Análise coletada por e hospedada no G2.com.

Que problemas é Spark SQL E como isso está te beneficiando?

Em nosso projeto, estamos usando para processamento em lote de tabelas hive. Análise coletada por e hospedada no G2.com.