Introducing G2.ai, the future of software buying.Try now
Imagem do Avatar do Produto
Spark SQL

Por The Apache Software Foundation

Perfil Não Reivindicado

Reivindique o perfil da sua empresa na G2

Reivindicar este perfil confirma que você trabalha na Spark SQL e permite que você gerencie como ele aparece na G2.

    Uma vez aprovado, você pode:

  • Atualizar os detalhes da sua empresa e produto

  • Aumentar a visibilidade da sua marca na G2, pesquisa e LLMs

  • Acessar insights sobre visitantes e concorrentes

  • Responder a avaliações de clientes

  • Verificaremos seu e-mail de trabalho antes de conceder acesso.

4.5 de 5 estrelas

Como você classificaria sua experiência com Spark SQL?

Já se passaram dois meses desde que este perfil recebeu uma nova avaliação
Deixe uma Avaliação

Avaliações e Detalhes do Produto Spark SQL

Valor em Destaque

Médias baseadas em avaliações de usuários reais.

Custo Percebido

$$$$$
Imagem do Avatar do Produto

Já usou Spark SQL antes?

Responda a algumas perguntas para ajudar a comunidade Spark SQL

Avaliações Spark SQL (45)

Avaliações

Avaliações Spark SQL (45)

4.5
avaliações 45

Review Summary

Generated using AI from real user reviews
Os usuários elogiam consistentemente o Spark SQL por sua facilidade de uso e capacidades de processamento rápido, tornando-o uma escolha preferida para lidar com grandes conjuntos de dados com sintaxe SQL. A integração perfeita com o ecossistema Spark melhora sua funcionalidade, permitindo uma análise de dados eficiente. No entanto, alguns usuários observam limitações no processamento em tempo real e a necessidade de uma melhor documentação.
Pesquisar avaliações
Filtrar Avaliações
Limpar Resultados
As avaliações da G2 são autênticas e verificadas.
Usuário Verificado em Varejo
UV
Empresa (> 1000 emp.)
"É um bom curso para iniciantes entenderem os fundamentos do Spark."
O que você mais gosta Spark SQL?

RDD (Resilient Distributed Dataset) é uma coleção distribuída de elementos que podem ser processados em paralelo em um cluster. É uma das principais abstrações do Apache Spark, permitindo que os desenvolvedores realizem operações de computação em grande escala de forma eficiente.

Para realizar operações em um RDD em nós de trabalho distribuídos, o Spark divide o RDD em partições, que são distribuídas entre os nós do cluster. Cada nó de trabalho processa suas partições localmente, o que minimiza a necessidade de transferência de dados entre nós, aumentando a eficiência.

As operações em RDDs podem ser de dois tipos: transformações e ações. Transformações, como `map` e `filter`, são operações preguiçosas que retornam um novo RDD e são avaliadas apenas quando uma ação é chamada. Ações, como `collect` e `count`, retornam um valor ao driver após a execução.

Para executar operações em um RDD:

1. Crie um RDD a partir de uma fonte de dados, como um arquivo ou uma coleção.

2. Aplique transformações para modificar ou filtrar os dados conforme necessário.

3. Use uma ação para coletar ou processar os resultados finais.

O Spark gerencia automaticamente a distribuição e a execução das tarefas nos nós de trabalho, garantindo tolerância a falhas e eficiência. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Nível muito básico, não havia muito sobre como conectar o Spark com outra fonte de dados. Análise coletada por e hospedada no G2.com.

Usuário Verificado em Tecnologia da Informação e Serviços
UT
Pequena Empresa (50 ou menos emp.)
"Realmente traz a faísca"
O que você mais gosta Spark SQL?

Cacheamento

Uso de tabelas temporárias

Pode ser usado para bancos de dados estruturados também Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Sem técnicas de otimização automática

Alta curva de aprendizado, melhor documentação necessária Análise coletada por e hospedada no G2.com.

Usuário Verificado em Consultoria de Gestão
CC
Empresa (> 1000 emp.)
"Fácil de usar, principalmente funcionalidades como SQL normal."
O que você mais gosta Spark SQL?

O que eu mais gosto no Spark SQL é que ele é fácil de usar e podemos aplicar facilmente consultas SQL normais nele. Além disso, podemos usá-lo no notebook PySpark também, usando %sql ao registrar o dataframe como uma tabela temporária. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Não tenho nenhuma aversão em particular, mas às vezes enfrento dificuldades no desempenho e no tempo de execução da célula se executarmos alguma consulta complexa que tenha muitos joins e outras condições. Para reduzir isso, uso CTE e divido a consulta em partes. Análise coletada por e hospedada no G2.com.

Mubeen M.
MM
Full Stack Developer
Pequena Empresa (50 ou menos emp.)
""Quão conveniente é usar é incrível!""
O que você mais gosta Spark SQL?

O Spark SQL tem algumas capacidades que eu particularmente gosto:

O Spark SQL é um produto de referência porque as tecnologias de big data se integram a ele de forma tão perfeita.

Ele tem alta eficiência e pode processar rapidamente uma grande quantidade de dados.

Devido à semelhança de sua sintaxe de consulta com o SQL padrão, aprender uma nova linguagem é facilitado. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Minha principal reclamação com o Spark SQL são suas limitações, que incluem problemas de latência, pequenos problemas de arquivo e a falta de processamento de dados em tempo real. O Apache Apex, uma solução alternativa, já resolveu alguns problemas. No entanto, esses problemas devem ser resolvidos no Spark SQL, pois uma alternativa é aceitável, mas alguns recursos fornecidos pelo Spark SQL não estão disponíveis com o Apex. Análise coletada por e hospedada no G2.com.

Arpan s.
AS
System Engineer
Empresa (> 1000 emp.)
"Como o Spark SQL é tão útil para busca e análise de dados."
O que você mais gosta Spark SQL?

Spark SQL é nada mais do que uma linguagem de consulta que oferece ao desenvolvedor a capacidade de buscar e analisar dados no HDFS. O Spark SQL suporta recursos de indexação, bem como recursos de partições, de modo que os dados que serão carregados são organizados de uma maneira que podem ser facilmente buscados e prontos para análise. O núcleo do Spark fornece a plataforma ou terminal onde podemos escrever nossas consultas e realizar qualquer tarefa operacional. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

O núcleo do Spark não suporta os recursos de cache, então ele não pode armazenar os resultados de consultas ou uma consulta em cache, portanto, toda vez que um desenvolvedor realiza uma consulta, ele sempre usa o armazém ou a varredura completa dos dados. Então, sinto que deveria oferecer os recursos de cache para que o custo de computação seja baixo quando alguém estiver usando o framework Spark. Análise coletada por e hospedada no G2.com.

Gaurav G.
GG
Senior Data Engineer
Empresa (> 1000 emp.)
"Um motor de distribuição extremamente rápido e leve para projetar grandes conjuntos de dados."
O que você mais gosta Spark SQL?

Como ajuda a executar um grande número de conjuntos de dados de forma distribuída. O Spark SQL fornece uma abstração de programação chamada Data Frames e também pode atuar como um mecanismo de consulta SQL distribuído. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Nada em particular.

Mas juntar dessa maneira é difícil se você estiver juntando conjuntos de dados desequilibrados.

Isso cria um grande conjunto de dados enviesado que não é adequado para um modelo de dados apropriado. Análise coletada por e hospedada no G2.com.

Aaryan S.
AS
Project Engineer - Turbo
Empresa (> 1000 emp.)
"Um dos mais rápidos ferramentas de computação disponíveis"
O que você mais gosta Spark SQL?

A integração de consultas SQL com os programas Spark é uma das melhores características. A velocidade de processamento das grandes consultas, assim como a otimização do espaço de armazenamento, é incomparável. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

O custo da ferramenta é relativamente alto em comparação com o que oferece. Se você estiver na intranet, pode haver um problema de latência ao executar as consultas. Análise coletada por e hospedada no G2.com.

Niyazahmedraza M.
NM
A
Médio Porte (51-1000 emp.)
"Melhor software Spark"
O que você mais gosta Spark SQL?

Spark funciona de forma mais eficaz em comparação com outros bancos de dados como o MySQL. Ele pode carregar mais dados em comparação com outros bancos de dados e é melhor ao trabalhar com grandes conjuntos de dados. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Eu não diria que é uma desvantagem, mas a versão premium do Spark é mais cara em comparação com outros bancos de dados como MySQL, SQLite, mas o Spark SQL oferece uma experiência premium. Análise coletada por e hospedada no G2.com.

Kubendra Reddy M.
KM
Data Engineer
Empresa (> 1000 emp.)
"SparkSQL tornou nosso trabalho fácil"
O que você mais gosta Spark SQL?

A melhor coisa é que podemos processar nossos dados no Spark com código SQL. O SparkSQL possui um otimizador de catalisador que elabora o melhor plano de execução e DAG para executar no Spark. Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Ele usa muita memória ao processar os dados, o que leva a problemas de falta de memória. Análise coletada por e hospedada no G2.com.

Pawan K.
PK
Bigdata Platform Architect at HCL Technologies Limited
Empresa (> 1000 emp.)
"Spark SQL é muito útil para transformação em dados distribuídos."
O que você mais gosta Spark SQL?

Spark SQL é mais rápido, e informações adicionais de tipo tornam mais eficiente Análise coletada por e hospedada no G2.com.

O que você não gosta Spark SQL?

Atualmente, sem suporte para tabelas de transações. Análise coletada por e hospedada no G2.com.

Preços

Detalhes de preços para este produto não estão disponíveis no momento. Visite o site do fornecedor para saber mais.

Comparativos Spark SQL
Imagem do Avatar do Produto
Oracle Database
Comparar Agora
Imagem do Avatar do Produto
ClickHouse
Comparar Agora
Imagem do Avatar do Produto
PostgreSQL
Comparar Agora
Recursos de Spark SQL
Armazenamento
Disponibilidade
Estabilidade
Tipos de dados
Idiomas
Recuperação de desastres
Simultaneidade de dados
Gerenciamento de carga de trabalho
Esquema de dados
Linguagem de consulta
Replicação de dados
Imagem do Avatar do Produto
Spark SQL