# Apache Kudu Reviews
**Vendor:** The Apache Software Foundation  
**Category:** [Spaltenorientierte Datenbanken](https://www.g2.com/de/categories/columnar-databases)  
**Average Rating:** 4.1/5.0  
**Total Reviews:** 13
## About Apache Kudu
Apache Kudu ist ein kostenloser und quelloffener spaltenorientierter Datenspeicher des Apache Hadoop-Ökosystems.


## Apache Kudu Reviews
  ### 1. Tryst mit Kudu in der Produktionsbereitstellung für einen Telekommunikationsanbieter

**Rating:** 4.0/5.0 stars

**Reviewed by:** Satheesh V. | Senior Solutions Architect, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** December 06, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

1. Die Implementierung der Lambda-Architektur (sowohl Batch- als auch Echtzeit-Streaming) mit Kudu ist ziemlich unkompliziert. Wir haben zusätzlich Streamsets als Ingestionsplattform verwendet, die eine gute Kopplung mit Kudu aufweist.  
2. Macht Echtzeitanalysen ziemlich unkompliziert. Wir haben Kudu verwendet, um mehrere Echtzeitkampagnen durchzuführen.  
3. Maßgeschneidert für die Implementierung von Data Warehouses in einer Big-Data-Umgebung.  
4. Schöne Upsert-Funktionalität.  

**Was gefällt Ihnen an Apache Kudu nicht?**

1. Partitionseinschränkung - Ist auf 2000 Tablets/Tablet-Server begrenzt.
2. Zufällige Timeouts beim Erreichen der Tablet-Zahlenbegrenzung (max. 2000/Server).
3. Benötigt ein konformes Schema. Keine automatische Handhabung von driftenden Schemata.
4. Benötigt einen Primärschlüssel für jede Tabelle.
5. #3 & #4 sind nicht wirklich Nachteile an sich.

**Empfehlungen für andere, die Apache Kudu in Betracht ziehen:**

Wenn das Datawarehouse ein starker Anwendungsfall innerhalb von Big-Data-Umgebungen ist und Sie innerhalb der Partitionen-/Tablet-Beschränkungen bleiben, sollten Sie gut aufgestellt sein.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

1. Echtzeitkampagnen.  
2. Echtzeitsuchen & Transaktionsanreicherung.  
3. Die Implementierung eines Data Warehouse ist mit Apache Kudu recht unkompliziert.

  ### 2. Eine gute Wahl für effiziente Ad-hoc-Analysen von Big Data + zufälligen Schreibzugriff

**Rating:** 4.0/5.0 stars

**Reviewed by:** Araceli M. | Data Engineer, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** December 15, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

Meiner Meinung nach ist das, was ich an Apache Kudu am hilfreichsten fand, die Möglichkeit, ziemlich komplexe Datenaggregationen durch SQL-Engines durchzuführen, während gleichzeitig effiziente Aktualisierungen möglich sind.

**Was gefällt Ihnen an Apache Kudu nicht?**

Wahrscheinlich sind zwei Nachteile von Apache Kudu, die zu berücksichtigen sind, die Partitionierungskonfiguration, da es ziemlich schwierig ist, die beste Partitionierungseinstellung für die spezifische Anwendungsfallleistung zu finden, und auch die Tatsache, dass Kudu die Last nicht ausgleicht, wenn ein neuer Knoten zum Cluster hinzugefügt wird.

**Empfehlungen für andere, die Apache Kudu in Betracht ziehen:**

Seien Sie bereit, einige Stunden mit der Feinabstimmung der Apache Kudu-Partitionierung zu verbringen und den besten Replikationsfaktor für Ihren speziellen Anwendungsfall herauszufinden.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

Während meiner Tätigkeit als Financial Data Engineer bei Santander CIB nutzten wir das Potenzial von Apache Kudu für effiziente Online-Datenanalysen zur Berechnung von Finanzderivaten in einem On-Premise-Cluster. Wir erkannten, dass Kudu aufgrund seiner Eigenschaften für diese Art von Rechen-Engine geeignet war, die sowohl hohen Durchsatz als auch geringe Latenz erfordert. Es war auch eine gute Wahl, da es sich um einen Cloudera-Cluster handelte und eine sehr gute Integrationsfähigkeit mit HDFS und Impala aufwies.

  ### 3. Ich bin mit Kudu zufrieden, abgesehen von einigen Ausnahmen.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Vikash S. | Sr AIML & Data Engineer, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** December 01, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

Es ist ziemlich gut beim Lesen und Laden und die beste spaltenorientierte Datenbank auf Hadoop. Dieses Kudu kommt mit Cloudera, sodass alle Komponenten an einem Ort sind. Die Integration mit Impala-Skripten und die Kompatibilität mit dem Parquet-Dateiformat machen es dynamischer. Die dynamische Partitionierung hilft auch beim Debuggen. Die Integration des Kudu Hive Metastore macht Hive- und Kudu-Tabellen von derselben Plattform aus zugänglich. Die inkrementellen Daten werden ohne Probleme für Endbenutzer repliziert. Es unterstützt fast alle ANSI-SQL, sodass es sehr vertraut aussieht.

**Was gefällt Ihnen an Apache Kudu nicht?**

Die Kudu-Partitionierung erfolgt nur auf dem Primärschlüssel, was nicht immer geeignet ist. In einigen Fällen haben wir einen Zeitstempel als Partitionsschlüssel, der jedoch nicht der Primärschlüssel sein kann, sodass das Lesen einer großen Tabelle hier ein Problem darstellt. Dies muss in Zukunft geändert werden. Es gibt Bedenken hinsichtlich des Kudu-Kontextes in Verbindung mit der Impala-Integration. Derzeit gibt es noch einige Probleme mit der JDBC-Konnektivität für große Datenmengen.

Es handelt sich um ein Problem mit dem CamelCase-Tabellennamen. Kudu-Tabellen mit einem Spaltennamen, der Großbuchstaben oder nicht-ASCII-Zeichen enthält, können möglicherweise nicht als externe Tabelle in Impala verwendet werden. Spalten können in Kudu umbenannt werden, um dieses Problem zu umgehen.

**Empfehlungen für andere, die Apache Kudu in Betracht ziehen:**

Wenn Sie ein Hadoop-basiertes Ökosystem haben und die Daten laden und lesen.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

Wir haben einen Würfel für unser Dashboard erstellt. Dieses Kudu kommt mit Cloudera, sodass alle Komponenten an einem Ort sind. Die Integration mit Impala-Skripten und die Kompatibilität mit dem Parquet-Dateiformat machen es dynamischer. Die Kudu-Hive-Metastore-Integration macht auch Hive- und Kudu-Tabellen von derselben Plattform aus zugänglich.

  ### 4. Apache Kudu vs Hive, Geschwindigkeit der Ausführung.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Bharat M. | Specialist Architect , Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** December 03, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

Geschwindigkeit der Ausführung, insbesondere im Vergleich zu Apache Hive. Flexibilität, als reguläre RDBMS-Tabelle zu arbeiten. Es kann problemlos für große Datenmärkte mit CDC-Logik verwendet werden.

**Was gefällt Ihnen an Apache Kudu nicht?**

Sie müssen den Primärschlüssel für jedes Objekt festlegen. Also, mehr Fokus auf den Aspekt der Datenmodellierung.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

Wir versuchten, einen DataMart für umfangreiche Finanzdaten zu erstellen, und suchten nach einem CDC sowie nach Flexibilität, um die Daten entsprechend den geschäftlichen Anforderungen zu aktualisieren. Wir versuchten es mit Hive, aber es funktionierte nicht wie erwartet. Dann versuchten wir es mit Kudu, und es funktioniert gut.

  ### 5. Arbeiten mit Apache Kudu

**Rating:** 2.5/5.0 stars

**Reviewed by:** Aman K. | SDET, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** December 05, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

Leicht zugänglich über die APACHE Impala-Abfrage-Engine, sodass das Erstellen von Dashboards und OLAP-Erfahrungen nahtlos ist.

**Was gefällt Ihnen an Apache Kudu nicht?**

Mit einer großen Menge an Streaming-Daten steigt die Belastung des Systems exponentiell, was andere Dienste auf demselben Server beeinträchtigt.

**Empfehlungen für andere, die Apache Kudu in Betracht ziehen:**

Es hängt völlig von der Größe der Streaming-Datenquelle und der Zuweisung von Hardware als Ressourcen ab.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

Impala unterstützt die Verarbeitung von Streaming-Daten nicht. Um ein Echtzeit-Dashboard zu erstellen oder OLAP-Operationen von einer Abfrage-Engine durchzuführen, war Apache Kudu das beste Angebot.

  ### 6. Apache Kudu: Bewertung

**Rating:** 4.0/5.0 stars

**Reviewed by:** RAVI K. | Consultant, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** November 04, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

Kudu-Impala-Integrationsmerkmale  
Raft-Konsensalgorithmus zur Gewährleistung der Fehlertoleranz

**Was gefällt Ihnen an Apache Kudu nicht?**

Begrenzte Skalierbarkeit: Daten, die Sie in Kudu pro Clusterknoten und pro Cluster haben können

**Empfehlungen für andere, die Apache Kudu in Betracht ziehen:**

Für meinen Anwendungsfall hat sich Apache Kudu im Vergleich zu anderen gut bewährt. Ich würde vorschlagen, mit einem POC für Ihren Anwendungsfall zu beginnen und mit anderen Ansätzen zu vergleichen.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

Erstellung eines großen Data Lakes und Einrichtung des Zugriffs auf den Datensatz über Impala für nachgelagerte Benutzer.  
1. Microstrategy  
2. Data-Science-Team

  ### 7. Sehr effektiv für Telekommunikationsdaten

**Rating:** 4.0/5.0 stars

**Reviewed by:** Verifizierter Benutzer in Telekommunikation | Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** November 05, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

Der größte Vorteil ist, dass Sie Analysen auf Hadoop ausführen können. Sie müssen dem Kunden keine alternative Big-Data-Lösung vorschlagen, um Analysen durchzuführen, wenn er sich bereits für Hadoop zur Speicherung von Big Data entschieden hat.

**Was gefällt Ihnen an Apache Kudu nicht?**

Kudu hat Einschränkungen bei der Art der Daten, die es verarbeiten kann. Sie können keine komplex strukturierten Daten speichern, wie Sie es mit Impala tun können.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

In meinem Projekt hatte ich Hunderte von TB auf Hadoop, eingefügt von TLC-Netzwerkknoten, Überwachungssystemen usw. Kudu gab uns die Möglichkeit, Analysen auf unserer Hadoop Big and Fast Data-Infrastruktur durchzuführen.

  ### 8. Ein einfaches SQL-basiertes Tool, das leicht zu integrieren ist und für hohe Arbeitslasten verwendet wird.

**Rating:** 4.0/5.0 stars

**Reviewed by:** Verifizierter Benutzer in Informationstechnologie und Dienstleistungen | Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** December 01, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

Einfach zu bedienen
Aktualisierung und Löschung, die in Hive-Tabellen nicht verfügbar sind
Schnelle Einfügung, Löschung, alle ACID-Operationen

**Was gefällt Ihnen an Apache Kudu nicht?**

Dokumentationen sind nicht verfügbar, insbesondere solche, die sich mit hohen Arbeitslasten und Optimierungen befassen.

**Empfehlungen für andere, die Apache Kudu in Betracht ziehen:**

Mehr gute Dokumentationen, YouTube-Videos zur Implementierung schwerer Arbeitslasten

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

Schnelle ACID-Transaktionen
Einfach zu verwendende SQL-basierte
Effizient bei hoher Arbeitslast

  ### 9. Apache Kudu: blitzschnelles Lesen und Schreiben

**Rating:** 5.0/5.0 stars

**Reviewed by:** Divyam G. | Big Data Developer, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** April 01, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

kein Bedarf, HBase für Echtzeitverarbeitung zu lernen, Apache Kudu kann Ihnen helfen. einfach zu lernen, effizient und Sie können die Datensätze aktualisieren. es bietet

**Was gefällt Ihnen an Apache Kudu nicht?**

Primär muss die erste Spalte sein, manchmal ist es schwierig, die erste Spalte als Primärschlüssel beizubehalten.

**Empfehlungen für andere, die Apache Kudu in Betracht ziehen:**

Jeder, der mit der Echtzeitanwendung zu tun hat, und es wird auch in Transaktionen funktionieren, kann KUDU nutzen, wenn Sie oder Gott in SQL sind.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

während der Arbeit mit der Spark Streaming-Anwendung bietet Kudu Kompatibilität. Schreiben ist sehr einfach und schnell.

  ### 10. Gut, aber zeitraubend

**Rating:** 5.0/5.0 stars

**Reviewed by:** Hossam E. | Software Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** September 11, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

die Abfrage ist sehr schnell und hat eine großartige Leistung.

**Was gefällt Ihnen an Apache Kudu nicht?**

es verbraucht viel Speicher, was das System langfristig zerstört.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

Ich habe ein Problem mit einem Tablet, es hatte vollen Speicher, ich habe es durch Lastverteilung gelöst.

  ### 11. Schnelle Analysen von schnellen Daten

**Rating:** 5.0/5.0 stars

**Reviewed by:** Mohammedansar T. | Hadoop Administrator, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 01, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

Das Nützlichste ist, dass es vollständig verteilt und fehlertolerant ist, was unser Leben erleichtert.

**Was gefällt Ihnen an Apache Kudu nicht?**

Das einzige, was ich nicht mag, ist die Verwendung von Primärschlüsseln, automatisch generierte Primärschlüssel werden immer nicht unterstützt.

**Empfehlungen für andere, die Apache Kudu in Betracht ziehen:**

Da es sich um einen schnelllebigen Datenspeicher handelt, um Analysen an schnelllebigen Daten durchzuführen. Dies ist eines derjenigen, das Ihnen zuverlässige und erforderliche Ergebnisse liefert. Daher muss jedes Unternehmen, das schnelle und zuverlässige Ergebnisse wünscht, dies verwenden.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

Wir sind in der Lage, unser Geofencing auf Daten in Kudu mit Spark zu lösen. Es ist ziemlich hilfreich.

  ### 12. Bestes spaltenorientiertes Framework

**Rating:** 3.5/5.0 stars

**Reviewed by:** Verifizierter Benutzer in Marketing und Werbung | Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** September 12, 2020

**Was gefällt Ihnen an Apache Kudu am besten?**

Es ist die Integration mit Hadoop-Komponenten und die rasante Geschwindigkeit. Besonders gefällt mir die Integration mit Impala.

**Was gefällt Ihnen an Apache Kudu nicht?**

Manchmal schlägt die Ausführung von Abfragen fehl und bleibt für unbestimmte Zeit hängen.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

Wir verwenden Kudu für Analysen und Datenverarbeitung. Unsere Berichterstattung ist nahezu in Echtzeit.

  ### 13. Apache Kudu die richtige Idee

**Rating:** 2.5/5.0 stars

**Reviewed by:** Verifizierter Benutzer in Verbraucherelektronik | Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** June 15, 2018

**Was gefällt Ihnen an Apache Kudu am besten?**

Kudu ist eine große Verbesserung für Impala-Daten, die schnell ad hoc abgefragt werden müssen, während es dennoch möglich ist, diese Daten schrittweise zu erweitern.

**Was gefällt Ihnen an Apache Kudu nicht?**

Kudu scheint in Impala nur begrenzt nützlich zu sein. Ich habe versucht, es in Spark zu verwenden, aber die Ergebnisse waren nicht besonders gut (teilweise war das mein Fehler). Impala ist nicht wirklich für Streaming-Daten geeignet, wo die Geschwindigkeit ins Spiel kommt, daher bin ich mir nicht sicher, ob Kudu für meinen Anwendungsfall geeignet ist.

**Welche Probleme löst Apache Kudu für Sie, und wie profitieren Sie davon?**

Daten in Kudu streamen, um diese Daten schnell mit Impala oder Spark abzufragen. Impala für Ad-hoc-Abfragen und Spark für die Batch-Verarbeitung von Daten. Wir sahen signifikante Verbesserungen in Kudu, aber nicht die gleichen Verbesserungen für Spark, daher verwenden wir Kudu nicht für Produktionslasten, da Ad-hoc-Abfragen für uns nicht so wichtig waren.


- [View Apache Kudu pricing details and edition comparison](https://www.g2.com/de/products/apache-kudu/reviews?section=pricing&secure%5Bexpires_at%5D=2026-05-26+15%3A42%3A34+-0500&secure%5Bsession_id%5D=a887a4dc-3f7e-488b-a2b8-8cf748406a6c&secure%5Btoken%5D=7dd5a68e05bed5ce2f47479f0d16f76d535d0dab28a9a54a9b7999424558457e&format=llm_user)

## Apache Kudu Features
**Lagerung**
- Datenmodell
- Datentypen

**Verfügbarkeit**
- Automatisches Sharding
- Automatische Wiederherstellung
- Daten-Replikation

**Leistung**
- Integrierter Cache

**Sicherheit**
- Rollenbasierte Autorisierung
- Authentifizierung
- Überwachungsprotokolle
- Verschlüsselung

**Unterstützen**
- Multi-Modell
- Betriebssysteme

## Top Apache Kudu Alternatives
  - [Snowflake](https://www.g2.com/de/products/snowflake/reviews) - 4.6/5.0 (700 reviews)
  - [ClickHouse](https://www.g2.com/de/products/clickhouse/reviews) - 4.5/5.0 (22 reviews)
  - [Google Cloud BigQuery](https://www.g2.com/de/products/google-cloud-bigquery/reviews) - 4.5/5.0 (1,155 reviews)