J'utilise Databricks dans mon environnement d'entreprise et mes projets pour ingérer des données de multiples sources, les transformer et les nettoyer à grande échelle, et préparer des ensembles de données fiables pour l'analyse et le reporting. Cela me permet de construire et de gérer des pipelines de données efficacement en utilisant Spark, SQL et des notebooks. J'adore avoir l'ingestion de données, le traitement à grande échelle, l'analyse et la collaboration tout en un seul endroit, ce qui rend mon flux de travail beaucoup plus rationalisé et efficace. J'apprécie vraiment la fiabilité et la confiance que je tire de fonctionnalités comme Delta Lake, qui rendent la versionnage des données, la récupération et la gestion des changements beaucoup plus sûrs, moins chers et plus faciles dans mes projets. Delta Lake est l'une des principales raisons pour lesquelles Databricks est si précieux pour moi car il répond directement aux problèmes de fiabilité et de confiance, qui sont des défis constants dans les projets de données réels. La capacité de revenir à une version précédente si quelque chose tourne mal me rend beaucoup plus confiant lors du développement, des tests ou du déploiement de changements dans les pipelines de production. De plus, la configuration initiale a été relativement simple car Databricks s'intègre bien avec notre infrastructure cloud existante. Avis collecté par et hébergé sur G2.com.
La courbe d'apprentissage peut être assez raide au début, surtout pour les utilisateurs qui sont nouveaux dans Spark ou les concepts de traitement de données à grande échelle. Déboguer des pipelines complexes ou des échecs de tâches peut parfois prendre du temps, lorsque les messages d'erreur ne sont pas très intuitifs. À mesure que les flux de travail et les environnements se développent, la gouvernance et la gestion de l'environnement peuvent nécessiter un effort supplémentaire pour garder tout bien organisé et cohérent. La gestion des coûts est un autre défi, car l'utilisation des ressources peut augmenter rapidement si les clusters et les tâches ne sont pas configurés ou surveillés avec soin. Avis collecté par et hébergé sur G2.com.
Merci d'avoir partagé votre expérience positive avec Databricks ! Nous sommes ravis d'apprendre que notre plateforme a aidé à rationaliser votre flux de travail et à fournir fiabilité et confiance dans vos projets de données. Nous comprenons les défis liés à la courbe d'apprentissage et au débogage, et nous travaillons continuellement à améliorer l'expérience utilisateur et à fournir de meilleurs messages d'erreur. Nous apprécions vos commentaires et nous nous engageons à relever ces défis.






