# Apache Kudu Reviews
**Vendor:** The Apache Software Foundation  
**Category:** [Bancos de Dados Colunares](https://www.g2.com/pt/categories/columnar-databases)  
**Average Rating:** 4.1/5.0  
**Total Reviews:** 13
## About Apache Kudu
Apache Kudu é um armazenamento de dados orientado a colunas, gratuito e de código aberto, do ecossistema Apache Hadoop.


## Apache Kudu Reviews
  ### 1. Tryst With Kudu em Implantação de Produção para uma Empresa de Telecomunicações

**Rating:** 4.0/5.0 stars

**Reviewed by:** Satheesh V. | Senior Solutions Architect, Médio Porte (51-1000 emp.)

**Reviewed Date:** December 06, 2020

**O que você mais gosta em Apache Kudu?**

1. Implementar a Arquitetura Lambda (tanto em Lote quanto em Streaming em Tempo Real) com Kudu é bastante direto. Além disso, usamos o Streamsets como a Plataforma de Ingestão, que tem um bom acoplamento com o Kudu.  
2. Torna a Análise em Tempo Real bastante direta. Usamos o Kudu para executar várias Campanhas em Tempo Real.  
3. Feito sob medida para Implementar Armazéns de Dados dentro de um Ambiente de Big Data.  
4. Boa Funcionalidade de Upsert.

**O que você não gosta em Apache Kudu?**

1. Limitação de Partição - É limitada a 2000 tablets/servidor de tablet.
2. Enfrenta Timeouts Aleatórios ao se aproximar da limitação do número de tablets (máximo de 2000/servidor).
3. Necessita de um Esquema Conformado. Não há manuseio automático de esquemas flutuantes.
4. Necessita de uma Chave Primária para cada tabela.
5. #3 e #4 não são realmente desvantagens por si só.

**Recomendações a outras pessoas considerando Apache Kudu:**

Se o Datawarehouse for um caso de uso forte dentro de ambientes de Big Data e tentar estar dentro da limitação de partição/tablet, você deve estar bem.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

1. Campanhas em Tempo Real.  
2. Consultas em Tempo Real e Enriquecimento de Transações.  
3. A Implementação de Data Warehouse é bastante direta com Apache Kudu.

  ### 2. Uma boa escolha para análises eficientes de big data em tempo real + escrita de acesso aleatório

**Rating:** 4.0/5.0 stars

**Reviewed by:** Araceli M. | Data Engineer, Empresa (> 1000 emp.)

**Reviewed Date:** December 15, 2020

**O que você mais gosta em Apache Kudu?**

Na minha opinião, o que achei mais útil sobre o Apache Kudu é a possibilidade de fazer agregações de dados bastante complexas através de mecanismos SQL, enquanto também é possível realizar atualizações de forma eficiente.

**O que você não gosta em Apache Kudu?**

Provavelmente, duas desvantagens do Apache Kudu a serem consideradas são a configuração de particionamento, pois é bastante difícil encontrar a melhor configuração de particionamento para o desempenho de um caso de uso específico, e também o fato de que o Kudu não equilibra a carga se um novo nó for adicionado ao cluster.

**Recomendações a outras pessoas considerando Apache Kudu:**

Esteja preparado para gastar algumas horas ajustando o particionamento do Apache Kudu e descobrindo o melhor fator de replicação para o seu caso de uso específico.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

Enquanto trabalhava como Engenheiro de Dados Financeiros no Santander CIB, aproveitamos o potencial do Apache Kudu para análises de dados online eficientes para cálculos de derivativos financeiros em um cluster local. Percebemos que o Kudu era adequado para esse tipo de mecanismo de computação que requer tanto alta taxa de transferência quanto baixa latência devido às suas características. Também foi uma boa escolha, pois era um cluster Cloudera e tinha uma capacidade de integração muito boa com HDFS e Impala.

  ### 3. Estou feliz com o Kudu, exceto por algumas exceções.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Vikash S. | Sr AIML & Data Engineer, Empresa (> 1000 emp.)

**Reviewed Date:** December 01, 2020

**O que você mais gosta em Apache Kudu?**

É bastante bom ao ler e carregar e é o melhor banco de dados colunar em cima do Hadoop. Este Kudu vem com Cloudera, então todos os componentes estão em um só lugar. A integração com o script Impala e a compatibilidade com o formato de arquivo Parquet o tornam mais dinâmico. Sua partição dinâmica também ajuda durante a depuração. A integração do Kudu com o metastore do Hive também torna as tabelas do Hive e do Kudu acessíveis a partir da mesma plataforma. Os dados incrementais são replicados sem qualquer problema para os usuários finais. Ele suporta quase todo o SQL ANSI, então parece muito familiar.

**O que você não gosta em Apache Kudu?**

O particionamento do Kudu é feito apenas na chave primária, o que nem sempre é adequado. Em alguns casos, temos o carimbo de data/hora como chave de partição, mas que não pode ser a chave primária, então a leitura de uma tabela enorme é uma preocupação aqui. Portanto, isso precisa ser alterado no futuro. Há preocupação com a integração do Kudu Context com o Impala. Atualmente, a conectividade JDBC ainda apresenta alguns problemas para grandes volumes de dados.

É um problema de nome de tabela em camel case. Tabelas Kudu com um nome de coluna contendo caracteres maiúsculos ou não ASCII podem não ser usadas como uma tabela externa no Impala. As colunas podem ser renomeadas no Kudu para contornar esse problema.

**Recomendações a outras pessoas considerando Apache Kudu:**

Vá para kudu se você tiver um ecossistema baseado em Hadoop e carregar e ler os dados.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

Temos a criação de cubo para o nosso painel. Este kudu vem com Cloudera, então todos os componentes estão em um só lugar. A integração com o script impala e a compatibilidade com o formato de arquivo parquet tornam-no mais dinâmico. A integração do metastore do Kudu hive também torna a tabela hive e kudu acessível a partir da mesma plataforma.

  ### 4. Apache Kudu vs Hive, velocidade de execução.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Bharat M. | Specialist Architect , Empresa (> 1000 emp.)

**Reviewed Date:** December 03, 2020

**O que você mais gosta em Apache Kudu?**

Velocidade de execução, especialmente em comparação com o Apache Hive. Flexibilidade para funcionar como uma tabela RDBMS regular. Pode ser usado para um grande datamart com lógica CDC com facilidade.

**O que você não gosta em Apache Kudu?**

Você tem que decidir a chave primária para cada objeto. Então, mais foco no aspecto de Modelagem de Dados.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

Estávamos tentando criar um DataMart para um grande volume de dados financeiros e onde estávamos procurando um CDC, bem como flexibilidade para atualizar os dados conforme a necessidade do negócio. Tentamos o Hive, mas não funcionou como esperado. Então, tentamos o Kudu e está funcionando bem.

  ### 5. Trabalhando com Apache Kudu

**Rating:** 2.5/5.0 stars

**Reviewed by:** Aman K. | SDET, Médio Porte (51-1000 emp.)

**Reviewed Date:** December 05, 2020

**O que você mais gosta em Apache Kudu?**

Facilmente acessível a partir do mecanismo de consulta APACHE Impala, portanto, a construção de painéis e a experiência OLAP são contínuas.

**O que você não gosta em Apache Kudu?**

Com um grande número de dados de streaming, a carga no sistema aumenta exponencialmente, afetando outros serviços em execução no mesmo servidor.

**Recomendações a outras pessoas considerando Apache Kudu:**

É totalmente dependente do tamanho da fonte de dados de streaming e da alocação de hardware como recursos.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

Impala não suporta o processamento de dados em streaming, para construir um painel em tempo real ou realizar operações OLAP a partir de um único mecanismo de consulta, o Apache Kudu era a melhor oferta.

  ### 6. Apache Kudu: Revisão

**Rating:** 4.0/5.0 stars

**Reviewed by:** RAVI K. | Consultant, Empresa (> 1000 emp.)

**Reviewed Date:** November 04, 2020

**O que você mais gosta em Apache Kudu?**

Recursos de Integração Kudu-Impala  
Algoritmo de Consenso Raft usado para garantir tolerância a falhas

**O que você não gosta em Apache Kudu?**

Escalabilidade Limitada: dados que você pode ter no Kudu por nó de cluster e por cluster

**Recomendações a outras pessoas considerando Apache Kudu:**

Para o meu caso de uso, o Apache Kudu funcionou bem em comparação com outros. Eu sugeriria começar com um POC com o seu caso de uso e comparar com outra abordagem.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

criação de um grande datalake e configuração de acesso ao conjunto de dados via Impala para usuários a jusante.  
1. Microstrategy  
2. Equipe de Ciência de Dados

  ### 7. Muito eficaz para dados de telecomunicações

**Rating:** 4.0/5.0 stars

**Reviewed by:** Usuário Verificado em Telecomunicações | Médio Porte (51-1000 emp.)

**Reviewed Date:** November 05, 2020

**O que você mais gosta em Apache Kudu?**

O melhor benefício é que você pode executar análises em cima do Hadoop. Você não precisa propor uma solução alternativa de big data para o cliente executar análises se ele já tiver selecionado o Hadoop para armazenamento de Big Data.

**O que você não gosta em Apache Kudu?**

O Kudu tem limitações no tipo de dados que pode manipular. Você não pode armazenar dados estruturados complexos como pode fazer com o Impala.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

No meu projeto, eu tinha centenas de TB no Hadoop, inseridos a partir de nós de rede TLC, sistemas de monitoramento, etc. O Kudu nos deu a possibilidade de executar análises em cima da nossa infraestrutura de Big Data e Fast Data no Hadoop.

  ### 8. Ferramenta baseada em SQL fácil de integrar e usada para cargas de trabalho pesadas.

**Rating:** 4.0/5.0 stars

**Reviewed by:** Usuário Verificado em Tecnologia da Informação e Serviços | Empresa (> 1000 emp.)

**Reviewed Date:** December 01, 2020

**O que você mais gosta em Apache Kudu?**

Fácil de usar
Atualização e exclusão que não estão disponíveis em tabelas hive
Inserção rápida, exclusão, todas as operações ACID

**O que você não gosta em Apache Kudu?**

Documentações não estão disponíveis especialmente detalhando cargas de trabalho pesadas, otimizações

**Recomendações a outras pessoas considerando Apache Kudu:**

Mais documentações de bom nível, vídeos no YouTube para implementar cargas de trabalho pesadas.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

Transações ACID rápidas
Fácil de usar com base em SQL
Eficiente para cargas de trabalho pesadas

  ### 9. Apache Kudu: leitura e escrita extremamente rápidas

**Rating:** 5.0/5.0 stars

**Reviewed by:** Divyam G. | Big Data Developer, Empresa (> 1000 emp.)

**Reviewed Date:** April 01, 2020

**O que você mais gosta em Apache Kudu?**

não é necessário aprender HBase para processamento em tempo real, o Apache Kudu pode ajudar você. fácil de aprender, eficiente e você pode atualizar os registros. ele fornece

**O que você não gosta em Apache Kudu?**

Primário deve ser a primeira coluna, algumas vezes é difícil manter a 1ª coluna como a chave primária.

**Recomendações a outras pessoas considerando Apache Kudu:**

Todos que lidam com a aplicação em tempo real e ela funcionará em Transações também, você pode aproveitar o KUDU se você ou deus em SQL.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

enquanto trabalha com o aplicativo Spark Streaming, o Kudu oferece compatibilidade.  
escrever é muito fácil e rápido

  ### 10. Bom Mas Consumidor

**Rating:** 5.0/5.0 stars

**Reviewed by:** Hossam E. | Software Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** September 11, 2020

**O que você mais gosta em Apache Kudu?**

a consulta é muito rápida e tem um ótimo desempenho.

**O que você não gosta em Apache Kudu?**

consome muita memória, o que destrói o sistema a longo prazo.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

Eu enfrento problema em 1 tablet, estava com memória cheia, resolvi com balanceamento de carga.

  ### 11. Análise rápida de dados rápidos

**Rating:** 5.0/5.0 stars

**Reviewed by:** Mohammedansar T. | Hadoop Administrator, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 01, 2020

**O que você mais gosta em Apache Kudu?**

A coisa mais útil é que é totalmente distribuído e tolerante a falhas, o que facilita nossa vida.

**O que você não gosta em Apache Kudu?**

A única coisa que não gosto é o uso de chaves primárias, chaves primárias geradas automaticamente nem sempre são suportadas.

**Recomendações a outras pessoas considerando Apache Kudu:**

Como é um armazenamento de dados de ritmo acelerado para realizar algumas análises em dados de rápida movimentação. Este é um daqueles que fornece resultados confiáveis e necessários. Assim, qualquer empresa que deseja resultados rápidos e confiáveis deve usar isso.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

Nós conseguimos resolver nosso geofencing em dados no Kudu com Spark. Está sendo bastante útil.

  ### 12. Melhor framework orientado a colunas

**Rating:** 3.5/5.0 stars

**Reviewed by:** Usuário Verificado em Marketing e Publicidade | Médio Porte (51-1000 emp.)

**Reviewed Date:** September 12, 2020

**O que você mais gosta em Apache Kudu?**

É a integração com componentes Hadoop e velocidade impressionante. Eu gosto especialmente da integração com o Impala.

**O que você não gosta em Apache Kudu?**

Às vezes, a execução das consultas falha e fica travada por um tempo indefinido.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

Usamos o Kudu para análises e processamento de dados. Nosso relatório se tornou quase em tempo real.

  ### 13. Apache Kudu a ideia certa

**Rating:** 2.5/5.0 stars

**Reviewed by:** Usuário Verificado em Eletrônicos de Consumo | Empresa (> 1000 emp.)

**Reviewed Date:** June 15, 2018

**O que você mais gosta em Apache Kudu?**

Kudu é uma grande melhoria para os dados do Impala que precisam ser consultados rapidamente de forma ad hoc, enquanto ainda é possível adicionar incrementalmente a esses dados.

**O que você não gosta em Apache Kudu?**

Kudu parece ter uso limitado no Impala. Tentei usá-lo no Spark, mas não obtive grandes resultados (parte disso foi culpa minha). Impala não é realmente para dados de streaming, onde a velocidade é importante, então não tenho certeza se o Kudu se encaixa no meu caso de uso.

**Que problemas Apache Kudu está resolvendo e como isso está beneficiando você?**

Transmitindo dados para o Kudu para consultar rapidamente esses dados a partir do Impala ou Spark. Impala para consultas ad hoc e Spark para processamento em lote de dados. Vimos melhorias significativas no Kudu, mas não as mesmas melhorias para o Spark, então não estamos usando o Kudu para cargas de trabalho de produção, pois as consultas ad hoc não eram tão importantes para nós.


- [View Apache Kudu pricing details and edition comparison](https://www.g2.com/pt/products/apache-kudu/reviews?section=pricing&secure%5Bexpires_at%5D=2026-05-27+01%3A59%3A33+-0500&secure%5Bsession_id%5D=add80cda-a6c1-4a9d-9955-a3a21705d9af&secure%5Btoken%5D=5e3ba551be637d7c9a8a229d08472020334d7b81ca3896b9f66f0cee8ef00d74&format=llm_user)

## Apache Kudu Features
**Armazenamento**
- Modelo de dados
- Tipos de dados

**Disponibilidade**
- Compartilhamento automático
- Recuperação Automática
- Replicação de dados

**Desempenho**
- Cache integrado

**Segurança**
- Autorização baseada em função
- Autenticação
- Logs de auditoria
- Criptografia

**Apoio**
- Multi-Modelo
- Sistemas Operacionais

## Top Apache Kudu Alternatives
  - [Snowflake](https://www.g2.com/pt/products/snowflake/reviews) - 4.6/5.0 (700 reviews)
  - [ClickHouse](https://www.g2.com/pt/products/clickhouse/reviews) - 4.5/5.0 (22 reviews)
  - [Google Cloud BigQuery](https://www.g2.com/pt/products/google-cloud-bigquery/reviews) - 4.5/5.0 (1,155 reviews)