
Was mir an Azure Databricks am meisten gefällt, ist, wie es die Arbeit mit Daten unkompliziert erscheinen lässt, ohne dass ich mir über die Einrichtung zu viele Gedanken machen muss.
Aus meiner Erfahrung nutze ich es hauptsächlich zum Abfragen, Transformieren und Validieren von Daten, und es verarbeitet große Datensätze sehr gut, ohne mich zu verlangsamen. Ich muss mir nicht allzu viele Gedanken über die Leistung machen — ich schreibe einfach, was ich brauche, und es läuft.
Ich mag auch die Flexibilität, zwischen SQL und PySpark zu wechseln, je nachdem, was ich gerade mache. Es erleichtert das Erkunden von Daten und das schnelle Beheben von Problemen, ohne in einem Ansatz festzustecken.
Die Notebook-Umgebung ist ein weiterer großer Pluspunkt für mich. Ich nutze sie, um meine Abfragen und Logik an einem Ort zu organisieren, sodass ich jederzeit zurückgehen, Dinge anpassen oder Teile wiederverwenden kann, ohne von vorne anfangen zu müssen.
Insgesamt macht es meinen Arbeitsablauf sauberer und effizienter, besonders wenn ich mit großen Datenmengen arbeite und schnelle, zuverlässige Ergebnisse benötige. Bewertung gesammelt von und auf G2.com gehostet.
Was ich an Azure Databricks nicht mag, basierend auf meiner Nutzung, hängt hauptsächlich mit der täglichen Benutzerfreundlichkeit zusammen.
Wenn ich mit Dateien arbeite (insbesondere im Bereich /dbfs), stoße ich manchmal auf scheinbar zufällige Fehler, die nicht sehr klar sind. Es kostet zusätzliche Zeit herauszufinden, was tatsächlich schiefgelaufen ist, was frustrierend ist, wenn ich nur schnelle Ergebnisse erzielen möchte.
Debugging ist ein weiterer Bereich, der mich verlangsamen kann. Wenn eine Abfrage oder Transformation nicht wie erwartet funktioniert, ist es nicht immer offensichtlich, wo das Problem liegt, sodass ich mehr Zeit damit verbringe, die Ursache einzugrenzen, als mir lieb ist.
Die Notebook-Umgebung ist nützlich, aber wenn ein einzelnes Notebook wächst, kann es unübersichtlich und schwerer zu verwalten werden. Wenn ich nicht vorsichtig bin, verliere ich leicht die Struktur und Organisation.
Auch die Kosten sind etwas, das ich im Auge behalten muss. Selbst wenn ich nur teste oder Abfragen ausführe, können sich die Nutzungskosten schnell summieren, wenn die Ressourcen nicht richtig verwaltet werden.
Insgesamt funktioniert es gut, aber es gibt immer noch Momente, in denen es weniger intuitiv erscheint, als es sollte – besonders wenn etwas schiefgeht. Bewertung gesammelt von und auf G2.com gehostet.




