
Ehrlich gesagt, das Beste an Apache Arrow ist, wie unglaublich schnell es die Arbeit mit großen Datensätzen macht. Das spaltenorientierte Speicherformat beschleunigt die Datenverarbeitung enorm, besonders für Analysen und maschinelles Lernen. Die Benutzerfreundlichkeit ist anfangs nicht die beste, weil es eine gewisse Lernkurve gibt, aber sobald man den Dreh raus hat, ist der Leistungszuwachs absolut lohnenswert.
Auch die Integration ist solide – es funktioniert super gut mit Pandas, Spark und Parquet, sodass der Datenaustausch zwischen Systemen viel reibungsloser verläuft als bei anderen Formaten. Und da es sprachübergreifend kompatibel ist, kann man es in Python, Java, C++ und mehr verwenden, ohne sich über lästige Formatkonvertierungen Gedanken machen zu müssen.
In Bezug auf die Anzahl der Funktionen ist es vollgepackt mit einer Menge Optimierungen für die effiziente Verarbeitung von In-Memory-Daten. Ich benutze es die ganze Zeit, und ehrlich gesagt, es ist irgendwie ein Muss für leistungsstarke Datenverarbeitung. Der einzige Nachteil? Der Kundensupport ist hauptsächlich community-basiert, sodass man manchmal nach Antworten suchen muss. Aber insgesamt ist die Implementierung nicht allzu schwierig, und sobald es eingerichtet ist, ist es ein echter Game-Changer für die Verarbeitung großer Datenmengen. Bewertung gesammelt von und auf G2.com gehostet.
Ehrlich gesagt, es ist nicht das Einfachste, damit anzufangen. Die Lernkurve ist ziemlich steil, besonders wenn man noch nie mit spaltenbasierter Speicherung zu tun hatte. Die Einrichtung kann frustrierend sein, und die Einfachheit der Implementierung ist nicht gerade reibungslos – es erfordert viel Ausprobieren, besonders wenn man versucht, es in eine bestehende Pipeline zu integrieren.
Außerdem ist die Dokumentation ziemlich verstreut. Einige Teile sind großartig, aber andere? Nicht so sehr. Manchmal ist man einfach auf Vermutungen angewiesen, was den Kundensupport fast nicht existent erscheinen lässt, da die meiste Hilfe von der Open-Source-Community kommt. Das Debuggen kann auch mühsam sein – es ist so optimiert, dass selbst eine kleine Fehlkonfiguration die Leistung auf schwer nachvollziehbare Weise beeinträchtigen kann.
Das gesagt, sobald man die anfänglichen Schwierigkeiten überwunden hat, machen die Anzahl der Funktionen und die einfache Integration mit Tools wie Pandas, Spark und Parquet es absolut lohnenswert. Aber ja, man sollte nicht erwarten, dass es super anfängerfreundlich ist – es braucht definitiv etwas Zeit, um sich daran zu gewöhnen. Bewertung gesammelt von und auf G2.com gehostet.
Bei G2 bevorzugen wir frische Bewertungen und wir möchten mit den Bewertern in Kontakt bleiben. Sie haben möglicherweise ihren Bewertungstext nicht aktualisiert, aber ihre Bewertung aktualisiert.
Bestätigt durch LinkedIn
Organische Bewertung. Diese Bewertung wurde vollständig ohne Einladung oder Anreiz von G2, einem Verkäufer oder einem Partnerunternehmen verfasst.
Diese Bewertung wurde aus English mit KI übersetzt.

