
Wir nutzen Kafka von Cloudera Data Flow für Streaming-Analysen. CDF liefert uns Echtzeitdaten, die entscheidend für die Erstellung von Live-Dashboards sind, und die Menge der gestreamten Daten (in Petabytes) hilft uns, CDF als zentrale Anlaufstelle für die Analyse von Live-Daten zu haben. Bewertung gesammelt von und auf G2.com gehostet.
Kafka von CDF ist zwar skalierbar, hat jedoch viele Verzögerungsprobleme und benötigt komplexe Abstimmungen. Wenn die Verzögerung auftritt, das heißt, der aktuelle Offset ist größer als der Endoffset des Verbrauchers, kann eine Verzögerung im sechs- bis siebenstelligen Bereich beobachtet werden, was bedeutet, dass die veralteten Datensätze manchmal etwa 1 Million erreichen, wodurch das Dashboard auf die neuesten Daten wartet und es manchmal Stunden dauert, diese abzurufen, und manchmal ein Neustart des Dienstes erforderlich ist, um das zu beheben. Bewertung gesammelt von und auf G2.com gehostet.

