
Was ich am meisten schätze, ist, dass es serverlos ist: Es ermöglicht, Standard-SQL-Abfragen direkt auf Daten in Amazon S3 auszuführen, ohne Infrastruktur bereitstellen oder Informationen durch ETL-Prozesse verschieben zu müssen.
In der Praxis ist es super nützlich, um schnelle und ad-hoc explorative Analysen über Parquet- oder JSON-Dateien in unserem Data Lake durchzuführen. Außerdem wird durch die native Integration mit dem AWS Glue Data Catalog die Metadatenverwaltung fast transparent und viel einfacher. Bewertung gesammelt von und auf G2.com gehostet.
Was mir am wenigsten gefällt, ist, dass die Abrechnung pro gescanntem TB ziemlich unvorhersehbar werden kann, wenn die Abfragen nicht gut optimiert sind (zum Beispiel, wenn keine Partitionen vorhanden sind oder keine Kompression verwendet wird). Ein einfaches *„SELECT“ über ein großes Dataset kann überraschend teuer werden.
Außerdem sinkt die Leistung stark mit dem typischen Problem vieler kleiner Dateien in S3 (small file problem), und das zwingt uns letztendlich dazu, zusätzliche Kompaktierungsprozesse mit AWS Glue hinzuzufügen, um die Effizienz aufrechtzuerhalten.
Und schließlich ist es nicht die beste Option für Berichte mit niedriger Latenz oder hoher Parallelität: In diesen Szenarien leistet Redshift immer noch bessere Dienste. Bewertung gesammelt von und auf G2.com gehostet.
Der Bewerter hat einen Screenshot hochgeladen oder die Bewertung in der App eingereicht und sich als aktueller Benutzer verifiziert.
Über Google One Tap mit einer Geschäfts-E-Mail-Adresse validiert
Organische Bewertung. Diese Bewertung wurde vollständig ohne Einladung oder Anreiz von G2, einem Verkäufer oder einem Partnerunternehmen verfasst.
Diese Bewertung wurde aus Spanish; Castilian mit KI übersetzt.




