# Databricks Reviews
**Vendor:** Databricks Inc.  
**Category:** [Traitement et distribution des mégadonnées](https://www.g2.com/fr/categories/big-data-processing-and-distribution)  
**Average Rating:** 4.6/5.0  
**Total Reviews:** 761
## About Databricks
Databricks est l&#39;entreprise de données et d&#39;IA. Plus de 20 000 organisations dans le monde entier — y compris adidas, AT&amp;T, Bayer, Block, Mastercard, Rivian, Unilever, et plus de 60 % du Fortune 500 — comptent sur Databricks pour construire et développer des applications de données et d&#39;IA, des analyses et des agents. Basée à San Francisco avec plus de 30 bureaux à travers le monde, Databricks offre une plateforme d&#39;intelligence des données unifiée qui inclut Agent Bricks, Lakeflow, Lakehouse, Lakebase et Unity Catalog.



## Databricks Pros & Cons
**What users like:**

- Les utilisateurs apprécient les **fonctionnalités avancées d&#39;IA et la sécurité robuste des données** de Databricks, améliorant leurs capacités d&#39;apprentissage automatique. (287 reviews)
- Les utilisateurs trouvent **Databricks facile à utiliser** , surtout pour l&#39;hébergement et le service de modèles avec des intégrations transparentes et une gestion des données en temps réel. (277 reviews)
- Les utilisateurs apprécient les **intégrations transparentes** de Databricks avec divers outils, améliorant considérablement la gestion des données et la collaboration. (189 reviews)
- Les utilisateurs apprécient les **excellentes fonctionnalités de collaboration** de Databricks, permettant un travail d&#39;équipe en temps réel entre les ingénieurs de données et les analystes. (150 reviews)
- Les utilisateurs adorent les **fonctionnalités efficaces de gestion des données** de Databricks, simplifiant les tâches complexes avec des outils puissants et des intégrations. (149 reviews)
- Les utilisateurs apprécient les **intégrations faciles** de Databricks, se connectant sans effort à l&#39;infrastructure cloud et améliorant la gestion des données. (148 reviews)
- Analytique (137 reviews)
- Apprentissage automatique (136 reviews)
- Intégration ML (135 reviews)
- Évolutivité (132 reviews)

**What users dislike:**

- Les utilisateurs rencontrent une **courbe d&#39;apprentissage abrupte** avec Databricks, ce qui complique l&#39;adoption et la compréhension en raison de sa complexité. (112 reviews)
- Les utilisateurs trouvent que Databricks est **cher** , en particulier lorsqu&#39;ils traitent de grands ensembles de données et des structures de tarification incertaines. (97 reviews)
- Les utilisateurs sont confrontés à une **courbe d&#39;apprentissage abrupte** avec Databricks, rendant l&#39;adoption initiale difficile pour les équipes. (96 reviews)
- Les utilisateurs ont du mal avec les **fonctionnalités manquantes** de Databricks, ce qui limite la personnalisation et complique le processus de développement. (68 reviews)
- Les utilisateurs trouvent la **complexité** de Databricks difficile, notamment en raison de la courbe d&#39;apprentissage abrupte et des limitations d&#39;intégration. (64 reviews)
- Les utilisateurs rencontrent des **problèmes d&#39;interface utilisateur non intuitifs** qui entraînent des erreurs aléatoires et compliquent l&#39;expérience pour les utilisateurs non techniques. (61 reviews)
- Problèmes de performance (56 reviews)
- Mauvaise conception de l&#39;interface utilisateur (53 reviews)
- Apprentissage difficile (51 reviews)
- Configuration complexe (45 reviews)

## Databricks Reviews
  ### 1. Databricks Simplifies Big Data Processing and Team Collaboration

**Rating:** 4.5/5.0 stars

**Reviewed by:** Praveen M. | Associate Data Engineer, Technologie de l'information et services, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** May 07, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

What I like best about Databricks is how it simplifies large-scale data processing and collaboration in one platform. The integration with Spark and cloud service makes handling big data much more efficient. I also like the notebook environment, which makes it easier for teams for works together on analytics and machine learning tasks.

**Que n’aimez-vous pas à propos de Databricks?**

One thing I dislike about Databricks is the platform can feel complex for new users, especially when managing clusters and configurations. Pricing can also become expensive with larger workloads if resources are not optimized carefully. While integrations and AI features are powerful, the  onboarding process and support documentation could be more beginner-friendly.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Databricks helps solve the challenge of processing and analyzing large amounts of data efficiently in one platform. It combines data engineering, analytics and AI workflows, which reduce the need for the multiple separate tools. This improves collaboration, speeds up data processing, and helps generate insights much faster.

**Official Response from Jess Darnell:**

> We're glad to hear that you find Databricks helpful for simplifying large-scale data processing and collaboration. Our integration with Spark and cloud services is designed to make handling big data more efficient.

  ### 2. Powerful Lakehouse Platform for Scalable Pipelines and Collaboration

**Rating:** 3.5/5.0 stars

**Reviewed by:** Shweta D. | Enterprise Data Architect, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** May 06, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

in my role i focus on designing scalable and future ready data platform, and databricks has become a key part of that architecture i have used it across multiple project for building data pipelines, enabling analytics, and support data science teams. what stand out it brings engineering, analytics and machine learning into one platform, which simplifies overall data architecture. the biggest strength is the lakehouse approach ., it combines the flexibility of a data lake with the reliability of a data ware house, this helps to avoid maintaining separate system for storage and analytics, i also like how well it handles large scale processing using spark, whether its batch or steaming data, it performs consistently when configured properly. collaboration is another strong point, teams can work together in notebooks, share logic, and reuse code easily, which improves productivity across departments. the UI is designed for well, notebooks are clean and flexible and switching between SQL , python and scala is smooth. it integrates well with AWS , Azure and GCP and Airflow. performance is strong for large scale workloads . the AI features like Genie is very useful.

**Que n’aimez-vous pas à propos de Databricks?**

the biggest concern is cost control, if clusters are not managed properly or left running longer than needed, cost can increases faster than expected, auto scaling is helpful but without monitoring , it can still lead to higher usage. sometimes starting cluster can take time, especially when you just want to run quick tests or small jobs, this can slow down development and reduce productivity during short tasks. when something fails in a pipeline or job, debugging is not always easy, logs can be detailed, but tracing the exact issues in complex workflows can take time.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

it mainly solves the problem of handling large scale data processing and unifying different data workloads in one platform, earlier building and maintaining ETL pipelines require multiple tools and a lot of manual effort, with databricks i can build, run and manage pipelines in one place using spark, which simplifies the overall process, processing big datasets used to require heavy infrastructure setup, databricks handles this using distributed computing, so i can process large amount of data efficiently without worrying about scaling manually.in traditional setup, we needed separate tools for data engineering , analytics , machine learning, it brings all this into one platform, with shared notebooks and a unified workspace, team can collaborate more easily share code, and work on the same data.

**Official Response from Jess Darnell:**

> We're glad to hear that Databricks has helped you unify different data workloads and simplify the process of building and managing pipelines. It's great to know that it has streamlined your data processing and collaboration within your team. Thank you for sharing such a comprehensive view of the specific problems Databricks has solved for you.

  ### 3. Perfect for Cross-team Collaboration and Intensive Data Applications

**Rating:** 5.0/5.0 stars

**Reviewed by:** Artemij V. | Data Science Lead, Petite entreprise (50 employés ou moins)

**Reviewed Date:** May 04, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

The UX is one of the strongest parts. The notebook experience is clean and intuitive, collaboration is straightforward, and moving between exploration, experimentation, and production workflows feels seamless. It has enough flexibility for advanced users while still being approachable enough that onboarding new team members is fast. People can usually become productive quickly without spending weeks learning platform-specific quirks.

The integrations are also excellent. It works smoothly with the broader cloud ecosystem and connects well with data sources, orchestration tools, model serving infrastructure, and external systems. That interoperability makes it much easier to move from prototype to deployed pipeline without constantly rebuilding connectors or managing glue code.

Performance has been consistently strong, especially when working with distributed workloads and large-scale feature engineering. Spark optimization, cluster management, and managed infrastructure significantly reduce operational overhead, which lets me focus more on model development and analysis rather than environment tuning. For iterative experimentation, spin-up times and overall responsiveness are noticeably better than many alternative managed platforms.

**Que n’aimez-vous pas à propos de Databricks?**

One area where Databricks could improve is pricing. The platform delivers strong capabilities, but costs can escalate quickly for high-frequency or real-time workloads. For use cases involving continuously running low-latency tick pipelines, streaming market data, or iterative model retraining, the pricing can become fairly steep relative to the infrastructure being consumed. It sometimes feels like there’s a meaningful premium for convenience and managed orchestration, which can make cost optimization a constant consideration.

The AI integration is another area that still feels somewhat uneven. While there’s a clear push toward positioning the platform as an end-to-end AI/ML environment, some of the newer AI-focused features feel more like ecosystem additions than deeply integrated workflow improvements. In practice, there are still cases where custom tooling or external frameworks provide more flexibility and transparency, particularly for specialized model development, experimentation, and real-time inference use cases.

There can also be some complexity around tuning clusters and managing costs efficiently at scale. While the abstractions are helpful, getting the best performance-to-cost ratio sometimes requires deeper platform knowledge than the “fully managed” positioning might imply.

Overall, the platform is very strong technically, but pricing for always-on data-intensive workloads and the maturity of some AI-native capabilities are the two biggest areas where I’d like to see improvement.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Databricks solves one of the biggest challenges in modern data work: bringing together data access, large-scale processing, and collaborative development in a single environment.

For my work, the biggest benefit is real-time collaboration. It allows multiple people to work against the same datasets, notebooks, and pipelines without the usual friction of fragmented tooling or environment inconsistencies. That significantly speeds up experimentation, iteration, and knowledge sharing across projects, especially when moving quickly on model development or analyzing fast-changing data.

It also solves the challenge of scalable data access and processing. Working with high-volume time-series and transactional datasets requires infrastructure that can process large amounts of data efficiently without constant operational overhead. Databricks abstracts much of that complexity, making it possible to focus on analysis, feature engineering, and model development rather than spending time managing infrastructure.

The practical benefit is faster iteration cycles. I can move from raw data exploration to model experimentation and deployment much more quickly, which is especially valuable when working on real-time analytics, forecasting pipelines, and production-facing ML systems where speed of iteration directly impacts outcomes.

Overall, it reduces engineering friction and makes large-scale collaborative data work significantly more efficient, which translates into faster development, better experimentation, and more reliable deployment of data products.

**Official Response from Jess Darnell:**

> We appreciate your thorough review of Databricks and are pleased to hear that the platform has been instrumental in enabling cross-team collaboration and intensive data applications for your work. Your feedback on pricing and AI integration is valuable, and we are continuously striving to enhance these aspects to provide a more seamless experience for our users.

  ### 4. Genie Code and Inline Assistant Dramatically Boosted My Debugging Productivity

**Rating:** 4.5/5.0 stars

**Reviewed by:** Shyam s. | Data Engineer, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** March 27, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Genie code and the inline Assistant were the most helpful tools for me on my project. They helped me debug a 2k-line codebase and clearly explained why I wasn’t getting accurate data. It also provided a query to run in my source system (SQLMI). By running the discrepancy script in parallel on the source and target, I was able to debug the entire code much faster and improve my productivity. Overall, it cut my work time from about 8 hours down to around 1 hour.

**Que n’aimez-vous pas à propos de Databricks?**

In Delta Sharing, there isn’t a catalog-level SELECT permission, and I sometimes think having that would be helpful. Also, when I use the Genie code inside a VM, it can make the website unresponsive at times. These are areas that could be improved.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

In one of our claims-processing migration projects, the client needed near real-time data availability for downstream applications. Previously, the architecture used Amazon Redshift as the data warehouse, with Jasper and Sisense consuming the data for reporting and analytics. However, that setup didn’t support real-time or near real-time streaming efficiently, which led to delays in data availability for downstream systems.

After migrating the platform to Databricks, we were able to substantially improve the data pipeline architecture. We implemented streaming along with optimized ETL pipelines, reducing the data refresh cycle to about 30 minutes. We also created a dedicated view that retains data from the previous run, so downstream systems always have a consistent dataset available while the next pipeline execution is still in progress.

Before, we struggled with delayed refresh cycles and a limited ability to meet near real-time data needs in our Redshift-based architecture. After moving to Databricks, we enabled faster ETL processing and improved near real-time data availability.

As a result, we reduced ETL refresh time to roughly 30 minutes and enabled near real-time access for downstream tools like Jasper and Sisense. Reliability also improved because the stable view continues to serve the previous run’s data during pipeline updates. Finally, the overall architecture became simpler by consolidating processing and analytics capabilities within Databricks.

Overall, Databricks helped us build a more scalable and efficient near real-time data processing platform, significantly improving the timeliness and reliability of analytics for the claims-processing workflow.

**Official Response from Janelle Glover:**

> Merci de partager comment l'architecture de Databricks vous bénéficie. Nous avons conçu notre plateforme pour répondre aux défis de la gestion des données structurées et non structurées, et c'est formidable d'entendre qu'elle a un impact positif sur vos flux de travail d'analyse et d'apprentissage automatique.

  ### 5. The Unified Data Platform That Actually Delivers

**Rating:** 5.0/5.0 stars

**Reviewed by:** Janakiraman K. | Data Engineer, Entreprise (> 1000 employés)

**Reviewed Date:** March 27, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Databricks has transformed how our team handles end-to-end data workflows. A few standouts:

UI/UX: The notebook interface is intuitive, and the SQL editor feels polished which switching between Python, SQL, and Scala in the same workspace saves constant context-switching.

Integrations: Native connectors to Azure, Unity Catalog, and Delta Sharing mean we spend less time on plumbing. Lakehouse Federation lets us query external sources without moving data, which was an unexpected win.

Performance: Delta Lake's auto-optimization and liquid clustering noticeably reduced our query times. Photon engine on heavy aggregations is a game-changer for near real-time dashboards.

Pricing/ROI: The DBU model takes getting used to, but consolidating our data warehouse, ETL, and ML tooling into one platform cut our overall infrastructure spend significantly.

Support/Onboarding: Databricks Academy and the built-in documentation made onboarding new engineers faster. The community forum is surprisingly active for niche questions.

AI/Intelligence: Genie (AI/BI) lets business users ask questions in plain English and get accurate results reducing ad hoc requests to our data team by a noticeable margin. Databricks Assistant inside notebooks also accelerates code generation and debugging.

**Que n’aimez-vous pas à propos de Databricks?**

While Databricks is powerful, there are real friction points worth mentioning:

UI/UX: The interface can feel overwhelming for new users have the navigation between Workspaces, Catalogs, and SQL Warehouses isn't always intuitive. Folder and notebook organization could be more structured out of the box.

Integrations: Some third-party connectors still require manual configuration and custom code. Lakehouse Federation is promising but occasionally inconsistent with certain source systems, needing extra troubleshooting.

Performance: Cluster startup times remain a pain point cold starts on interactive clusters can disrupt fast-paced workflows. Serverless compute helps but isn't universally available across all features yet.

Pricing/ROI: The DBU-based pricing model lacks transparency for newer teams. It's easy to rack up unexpected costs without careful cluster policies and monitoring in place. A more straightforward cost estimator would help significantly.

Support/Onboarding: Enterprise support response times can be slow for non-critical tickets. For complex architectural issues, getting to the right expert often takes multiple escalations.

AI/Intelligence: Genie works well for standard queries but struggles with complex multi-table logic or domain-specific terminology without significant fine-tuning. The Databricks Assistant inside notebooks occasionally generates outdated or incorrect API suggestions.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Here's a natural, story-driven answer following the "before/after/result" format:

Before Databricks, our data landscape was fragmented and separate tools for ETL, warehousing, and ML meant duplicated pipelines, inconsistent data definitions, and significant engineering overhead just to maintain the plumbing.

Data Unification: We struggled with siloed data across multiple source systems. Now, with Unity Catalog and the Medallion architecture (Bronze/Silver/Gold), we have a single governed layer that all teams trust reducing data reconciliation effort by nearly 40%.

Pipeline Reliability: Building and maintaining metadata-driven pipelines used to require custom frameworks. Databricks' Lakeflow and Delta Live Tables gave us incremental and full-load capabilities out of the box, cutting pipeline development time significantly.

Self-Service Analytics: Business teams constantly depended on engineers for ad hoc queries. With Genie (AI/BI), stakeholders can now ask plain-English questions against curated gold tables reducing ad hoc data requests to our team noticeably week over week.

Cloud Cost Control: We previously ran always-on clusters without visibility into spend. Serverless compute and cluster policies now let us right-size workloads, resulting in measurable infrastructure cost reduction.

Faster Onboarding: New engineers previously took weeks to get productive. With Databricks Assistant, notebook templates, and centralized Unity Catalog documentation, ramp-up time has dropped considerably.

Overall: Databricks essentially replaced 3-4 separate tools with one cohesive platform the ROI isn't just in cost savings, it's in the speed and confidence with which we now deliver data products to the business.

**Official Response from Janelle Glover:**

> Nous sommes ravis d'apprendre que vous trouvez Databricks précieux pour l'ingénierie des données, l'analytique et l'apprentissage automatique. Merci de partager vos commentaires !

  ### 6. Scalable, All-in-One Environment with Some Learning Curve

**Rating:** 5.0/5.0 stars

**Reviewed by:** Antonio V. | Data &amp; AI Consultant, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** April 28, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

I like Databricks for its scalability and all-in-one environment for data engineering, analytics, and machine learning. It allows me to process large datasets efficiently while keeping workflows organized in one platform. The scalability is very valuable because it lets me handle growing data volumes and complex workloads without performance issues. As projects expand, the platform can scale resources efficiently.

**Que n’aimez-vous pas à propos de Databricks?**

Some features can have a learning curve, especially for new users working with advanced configurations or cluster management. The interface could also be more intuitive in certain areas. The setup was relatively smooth for core features, but some advanced settings like cluster optimization, permissions, and integrations required more time and technical knowledge.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Databricks solves major data management and analytics challenges by efficiently handling large datasets, simplifying ETL processes, and centralizing workflows. Its scalability allows me to manage growing data volumes without performance issues, ensuring resources scale efficiently as projects expand.

**Official Response from Jess Darnell:**

> We're glad to hear that you find Databricks scalable and appreciate its all-in-one environment for data engineering, analytics, and machine learning. We understand that some features may have a learning curve, and we are continuously working to improve the platform's usability and intuitiveness.

  ### 7. Performance avec Spark et des notebooks collaboratifs qui rendent le flux de données plus efficace

**Rating:** 5.0/5.0 stars

**Reviewed by:** Homero F. | Professor particular, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** April 19, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Ce que j'aime le plus, c'est la performance dans le traitement de grands volumes de données avec Spark, les notebooks collaboratifs qui facilitent le travail en équipe et les intégrations avec AWS et les outils de BI, qui rendent tout le flux de données plus efficace.

**Que n’aimez-vous pas à propos de Databricks?**

Le coût peut être élevé selon l'utilisation et certaines parties de l'interface, comme la configuration des clusters et des tâches, ne sont pas très intuitives au début. De plus, la courbe d'apprentissage peut être un peu élevée pour les nouveaux utilisateurs.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Databricks résout les problèmes de traitement de grands volumes de données, d'intégration de différentes sources et de développement de modèles d'IA dans un seul environnement. Cela améliore notre flux de travail, réduit le temps de traitement et centralise tout sur la plateforme. Les intégrations avec AWS et d'autres outils facilitent la mise en œuvre, et le support ainsi que la documentation aident à l'adaptation. De plus, les ressources d'IA permettent de créer, former et tester des modèles de manière plus rapide et efficace.

**Official Response from Jess Darnell:**

> Merci pour vos commentaires positifs !

  ### 8. Analytique unifiée puissante avec gouvernance transparente et mise à l'échelle sans effort

**Rating:** 4.5/5.0 stars

**Reviewed by:** Akhil S. | Senior Data Engineer, Entreprise (> 1000 employés)

**Reviewed Date:** April 16, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Ce que j'aime le plus chez Databricks, c'est son écosystème analytique puissant et unifié. Des fonctionnalités comme Unity Catalog et Metastore rendent la gouvernance des données et le contrôle d'accès transparents, tandis que l'architecture Lakehouse combine le meilleur des lacs de données et des entrepôts. Le support de PySpark, dbutils, et les espaces de travail collaboratifs rendent le développement efficace, et le calcul sans serveur simplifie la mise à l'échelle sans surcharge d'infrastructure.

**Que n’aimez-vous pas à propos de Databricks?**

Ce que je n'aime pas chez Databricks, c'est le temps de démarrage lent des clusters polyvalents, ce qui peut interrompre le flux de travail et réduire la productivité. De plus, l'intégration avec Git peut parfois sembler un peu lente, surtout lors des commits ou des synchronisations, rendant le contrôle de version moins fluide que prévu.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Databricks résout le défi de la gestion des flux de travail de données de bout en bout en fournissant une plateforme unifiée pour l'ingénierie des données, la science des données et l'analytique. Il permet un traitement, une transformation et un développement de modèles de données sans faille dans un environnement unique.

Cela me bénéficie en simplifiant mon flux de travail en tant qu'ingénieur de données et scientifique des données, réduisant le besoin de passer d'un outil à l'autre. De plus, son intégration avec Azure Data Factory permet une orchestration et un déclenchement de tâches fluides pour des environnements plus élevés, rendant les déploiements plus efficaces et fiables.

**Official Response from Jess Darnell:**

> Nous sommes ravis d'apprendre que Databricks simplifie vos flux de travail de données et offre une intégration transparente avec Azure Data Factory. Nous prenons note de vos préoccupations concernant les temps de démarrage lents et l'intégration Git, et nous nous engageons à optimiser ces aspects pour garantir une expérience plus fluide à nos utilisateurs. Vos commentaires nous aident à prioriser les améliorations qui correspondent aux besoins de nos utilisateurs.

  ### 9. Databricks : Plateforme Lakehouse unifiée avec des performances Spark puissantes

**Rating:** 4.0/5.0 stars

**Reviewed by:** Tejaswini R. | Data Management Specialist, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** April 16, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Je travaille en tant que spécialiste de la gestion des données et j'utilise régulièrement Databricks pour gérer les pipelines de données, le traitement de données à grande échelle et les tâches de gouvernance. Ce que j'aime le plus, c'est que Databricks offre une plateforme unifiée pour l'ingénierie des données, l'analytique et l'IA, au lieu d'utiliser plusieurs outils. Tout est disponible en un seul endroit, l'architecture du lakehouse est très utile car elle combine les capacités d'un entrepôt de données et d'un lac de données, ce qui nous permet de gérer efficacement les données structurées et non structurées. Les performances sont très solides, surtout avec Apache Spark, qui peut traiter des ensembles de données très volumineux rapidement. J'aime aussi les notebooks collaboratifs où les équipes peuvent travailler ensemble en utilisant SQL, Python ou Scala.

**Que n’aimez-vous pas à propos de Databricks?**

un problème est qu'il a une courbe d'apprentissage abrupte, surtout pour les nouveaux utilisateurs qui ne sont pas familiers avec Spark ou les systèmes distribués. la gestion des coûts peut également être difficile, si les clusters ne sont pas optimisés correctement, cela peut devenir coûteux, parfois trop de fonctionnalités et de configurations peuvent le rendre complexe à gérer pour les petites équipes. parfois, la plateforme semble complexe, avec de nombreuses fonctionnalités et configurations qui peuvent être difficiles à gérer pour les petites équipes. c'est une plateforme puissante, mais la complexité et le contrôle des coûts sont les principaux défis dans l'utilisation quotidienne.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Databricks résout le problème de la gestion du traitement de données à grande échelle et de multiples outils de données sur une seule plateforme. Avant d'utiliser Databricks, les données étaient dispersées à travers différents systèmes et nous devions utiliser des outils séparés pour l'ETL, le stockage et l'analyse, ce qui rendait le flux de travail complexe et difficile à gérer. Databricks rassemble tout en un seul endroit, nous permettant de construire des pipelines de données, de traiter de grands ensembles de données et d'exécuter des analyses sans changer d'outils. Il gère également les big data de manière efficace grâce au traitement distribué, ce qui réduit le temps de traitement et améliore les performances. Pour moi, cela a rendu les flux de travail de données plus organisés, réduit l'effort manuel et amélioré la fiabilité des données. Cela aide à un traitement des données plus rapide, une meilleure collaboration et une gestion des données plus efficace.

**Official Response from Jess Darnell:**

> C'est formidable d'apprendre que Databricks a aidé à centraliser votre traitement de données et vos outils, rendant vos flux de travail plus organisés et efficaces. Nous nous engageons à fournir une plateforme qui simplifie la gestion des données et améliore la collaboration pour nos utilisateurs. Nous comprenons que la courbe d'apprentissage et la gestion des coûts peuvent être difficiles, surtout pour les nouveaux utilisateurs et les petites équipes. Nous travaillons continuellement à améliorer l'expérience utilisateur et à offrir des solutions rentables à nos clients.

  ### 10. Plateforme collaborative et fluide qui s'adapte pour l'ingénierie des données et l'apprentissage automatique

**Rating:** 4.0/5.0 stars

**Reviewed by:** Krish G. | student, Petite entreprise (50 employés ou moins)

**Reviewed Date:** April 15, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

La capacité de Databricks à intégrer tout de manière transparente est ce que je trouve le plus attrayant. Lorsqu'on travaille sur des projets réels, cela fait vraiment une grande différence de ne pas avoir à passer d'un outil à l'autre pour l'ingénierie des données, l'analyse et l'apprentissage automatique.

L'élément collaboratif est très remarquable. Les équipes peuvent facilement collaborer sans que les choses deviennent désordonnées grâce à la fluidité et au dynamisme des notebooks. Pour un travail de données important, cela ressemble presque exactement à Google Docs.

J'aime aussi beaucoup la façon dont il gère efficacement de grandes quantités de données sans que cela ne semble difficile. Même lorsqu'on travaille avec de grands ensembles de données, la plateforme est conviviale et peut être mise à l'échelle si nécessaire.

De plus, cela a parfaitement du sens d'un point de vue IA/ML. Vous êtes capable de construire,

**Que n’aimez-vous pas à propos de Databricks?**

Databricks peut initialement sembler un peu accablant, ce qui est quelque chose que je n'aime pas. Clusters, notebooks, jobs, workflows—il y a beaucoup de choses en cours, et si vous êtes nouveau, cela prend du temps pour vraiment comprendre comment tout fonctionne ensemble.

Le contrôle des coûts est un autre inconvénient. C'est sans aucun doute puissant, mais les dépenses peuvent rapidement augmenter si vous ne faites pas attention à l'utilisation des clusters ou aux paramètres d'auto-scaling. Pour garder tout sous contrôle, vous devez faire preuve d'un peu de maîtrise de soi et surveiller les choses.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Le problème de fragmentation dans le flux de travail des données et de l'IA est principalement résolu par Databricks. Dans le passé, le stockage des données, le traitement, l'analyse et l'apprentissage automatique étaient généralement effectués à l'aide de différents outils, et les faire coopérer était souvent difficile et chronophage. Databricks élimine beaucoup de ces frictions en combinant tout cela en une seule plateforme.
Cela rend le processus de développement beaucoup plus fluide pour moi. Je n'ai pas à m'inquiéter des problèmes de compatibilité ou à perdre du temps à passer d'un environnement à l'autre. Je peux effectuer des transformations, nettoyer des données et créer des modèles tout au même endroit, ce qui réduit le temps de configuration et maintient l'organisation.
Il résout également la difficulté de gérer d'énormes quantités de données.
Je peux compter sur ses capacités de calcul distribué pour gérer des charges de travail exigeantes plutôt que de m'inquiéter de l'infrastructure ou de l'optimisation des performances dès le départ. Cela me permet de me concentrer moins sur la gestion des ressources et plus sur la recherche d'une solution au véritable problème.
La collaboration est un autre problème majeur qu'il résout. Partager du code, des résultats et des expériences peut devenir désorganisé dans des environnements d'équipe. Parce que tout est consolidé avec Databricks, il est plus simple de travailler ensemble, de suivre les changements et de maintenir l'alignement.
Tout bien considéré, cela m'aide en réduisant la complexité, en économisant du temps et en me permettant de me concentrer davantage sur le développement de solutions—qu'il s'agisse d'analyses, de modèles d'apprentissage automatique ou de pipelines de données—plutôt que de gérer la surcharge de maintenir de nombreux outils et plateformes.

**Official Response from Jess Darnell:**

> Nous sommes ravis d'apprendre que vous trouvez l'intégration transparente et les fonctionnalités collaboratives de Databricks attrayantes. Nous comprenons que la plateforme puisse sembler écrasante au début, mais nous offrons des ressources complètes et un support pour aider les utilisateurs à se familiariser rapidement. En ce qui concerne le contrôle des coûts, nous recommandons de tirer parti de notre documentation et de nos meilleures pratiques pour optimiser l'utilisation des clusters et les paramètres d'auto-scalabilité. Vos commentaires sont appréciés et nous nous engageons à améliorer continuellement l'expérience utilisateur !


## Databricks Discussions
  - [Qu&#39;est-ce que Lakehouse dans Databricks ?](https://www.g2.com/fr/discussions/what-is-lakehouse-in-databricks) - 4 comments, 2 upvotes
  - [Quelles sont les fonctionnalités de Databricks ?](https://www.g2.com/fr/discussions/what-are-the-features-of-databricks) - 4 comments, 2 upvotes
  - [What does Databricks software do?](https://www.g2.com/fr/discussions/what-does-databricks-software-do) - 3 comments
  - [Qu&#39;est-ce que la plateforme d&#39;analytique unifiée de Databricks ?](https://www.g2.com/fr/discussions/what-is-databricks-unified-analytics-platform) - 3 comments

- [View Databricks pricing details and edition comparison](https://www.g2.com/fr/products/databricks-data-intelligence-platform/reviews/databricks-data-intelligence-platform-review-11287086?section=pricing&secure%5Bexpires_at%5D=2026-05-13+16%3A02%3A30+-0500&secure%5Bsession_id%5D=4d59ecb3-08dc-423e-999f-37661b66281d&secure%5Btoken%5D=be1941680b3db3a377048b92b6feda8334631e94a874d99cd14c4966b3f51d0b&format=llm_user)
## Databricks Integrations
  - [Agentforce 360 Platform (formerly Salesforce Platform)](https://www.g2.com/fr/products/agentforce-360-platform-formerly-salesforce-platform/reviews)
  - [Agentforce Sales (formerly Salesforce Sales Cloud)](https://www.g2.com/fr/products/agentforce-sales-formerly-salesforce-sales-cloud/reviews)
  - [Alation](https://www.g2.com/fr/products/alation/reviews)
  - [Amazon EC2](https://www.g2.com/fr/products/amazon-ec2/reviews)
  - [Amazon Relational Database Service (RDS)](https://www.g2.com/fr/products/amazon-relational-database-service-rds/reviews)
  - [Anaplan](https://www.g2.com/fr/products/anaplan/reviews)
  - [Anomalo](https://www.g2.com/fr/products/anomalo/reviews)
  - [Apache Kafka](https://www.g2.com/fr/products/apache-kafka/reviews)
  - [Apache NiFi](https://www.g2.com/fr/products/apache-nifi/reviews)
  - [Atlan](https://www.g2.com/fr/products/atlan/reviews)
  - [AWS CloudFormation](https://www.g2.com/fr/products/aws-aws-cloudformation/reviews)
  - [AWS Glue](https://www.g2.com/fr/products/aws-glue/reviews)
  - [AWS Lambda](https://www.g2.com/fr/products/aws-lambda/reviews)
  - [Azure Blob Storage](https://www.g2.com/fr/products/azure-blob-storage/reviews)
  - [Azure Databricks](https://www.g2.com/fr/products/azure-databricks/reviews)
  - [Azure Data Factory](https://www.g2.com/fr/products/azure-data-factory/reviews)
  - [Azure Data Lake Store](https://www.g2.com/fr/products/azure-data-lake-store/reviews)
  - [Azure Functions](https://www.g2.com/fr/products/azure-functions/reviews)
  - [Azure Logic Apps](https://www.g2.com/fr/products/azure-logic-apps/reviews)
  - [Azure OpenAI Service](https://www.g2.com/fr/products/azure-openai-service/reviews)
  - [Azure Pipelines](https://www.g2.com/fr/products/azure-pipelines/reviews)
  - [Azure Portal](https://www.g2.com/fr/products/azure-portal/reviews)
  - [Azure SQL Database](https://www.g2.com/fr/products/azure-sql-database/reviews)
  - [Claude Code](https://www.g2.com/fr/products/anthropic-claude-code/reviews)
  - [Confluent](https://www.g2.com/fr/products/confluent/reviews)
  - [Customer.io](https://www.g2.com/fr/products/customer-io/reviews)
  - [Dash](https://www.g2.com/fr/products/dash-for-brands-ltd-dash/reviews)
  - [data.world](https://www.g2.com/fr/products/data-world/reviews)
  - [DAT iQ](https://www.g2.com/fr/products/dat-iq/reviews)
  - [dbt](https://www.g2.com/fr/products/dbt/reviews)
  - [DigitalOcean](https://www.g2.com/fr/products/digitalocean/reviews)
  - [Fivetran](https://www.g2.com/fr/products/fivetran/reviews)
  - [GEN TDS](https://www.g2.com/fr/products/gen-tds/reviews)
  - [Git](https://www.g2.com/fr/products/git/reviews)
  - [GitHub](https://www.g2.com/fr/products/github/reviews)
  - [Google Analytics](https://www.g2.com/fr/products/google-analytics/reviews)
  - [Google Cloud BigQuery](https://www.g2.com/fr/products/google-cloud-bigquery/reviews)
  - [Google Cloud Console](https://www.g2.com/fr/products/google-cloud-console/reviews)
  - [Google Cloud Run](https://www.g2.com/fr/products/google-cloud-run/reviews)
  - [HubSpot Marketing Hub](https://www.g2.com/fr/products/hubspot-marketing-hub/reviews)
  - [Immuta](https://www.g2.com/fr/products/immuta/reviews)
  - [Informatica Data Quality](https://www.g2.com/fr/products/informatica-informatica-data-quality/reviews)
  - [JD Edwards World](https://www.g2.com/fr/products/jd-edwards-world/reviews)
  - [Microsoft Copilot Studio](https://www.g2.com/fr/products/microsoft-microsoft-copilot-studio/reviews)
  - [Microsoft Fabric](https://www.g2.com/fr/products/microsoft-fabric/reviews)
  - [Microsoft Power Apps](https://www.g2.com/fr/products/microsoft-power-apps/reviews)
  - [Microsoft Power Automate](https://www.g2.com/fr/products/microsoft-power-automate/reviews)
  - [Microsoft Power BI](https://www.g2.com/fr/products/microsoft-microsoft-power-bi/reviews)
  - [Microsoft SharePoint](https://www.g2.com/fr/products/microsoft-sharepoint/reviews)
  - [Microsoft SQL Server](https://www.g2.com/fr/products/microsoft-sql-server/reviews)
  - [Microsoft Teams](https://www.g2.com/fr/products/microsoft-teams/reviews)
  - [Monte Carlo](https://www.g2.com/fr/products/monte-carlo/reviews)
  - [MySQL](https://www.g2.com/fr/products/mysql/reviews)
  - [ObjectWay SpA](https://www.g2.com/fr/products/objectway-spa/reviews)
  - [Oracle Database](https://www.g2.com/fr/products/oracle-database/reviews)
  - [Pega Platform](https://www.g2.com/fr/products/pega-platform/reviews)
  - [PostgreSQL](https://www.g2.com/fr/products/postgresql/reviews)
  - [PowerBI Portal](https://www.g2.com/fr/products/powerbi-portal/reviews)
  - [Qualtrics Customer Experience](https://www.g2.com/fr/products/qualtrics-customer-experience/reviews)
  - [React Native](https://www.g2.com/fr/products/react-native/reviews)
  - [Salesforce Agentforce](https://www.g2.com/fr/products/salesforce-agentforce/reviews)
  - [SAP Ariba](https://www.g2.com/fr/products/sap-ariba/reviews)
  - [SAP ECC](https://www.g2.com/fr/products/sap-ecc/reviews)
  - [SAS Viya](https://www.g2.com/fr/products/sas-sas-viya/reviews)
  - [Seamless (formally Seamless.AI)](https://www.g2.com/fr/products/seamless-formally-seamless-ai/reviews)
  - [ServiceNow IT Service Management](https://www.g2.com/fr/products/servicenow-it-service-management/reviews)
  - [Sigma](https://www.g2.com/fr/products/sigma-computing-sigma/reviews)
  - [Sisense](https://www.g2.com/fr/products/sisense/reviews)
  - [SnapLogic Intelligent Integration Platform (IIP)](https://www.g2.com/fr/products/snaplogic-intelligent-integration-platform-iip/reviews)
  - [Snowflake](https://www.g2.com/fr/products/snowflake/reviews)
  - [Spark](https://www.g2.com/fr/products/openclassrooms-spark/reviews)
  - [Spark](https://www.g2.com/fr/products/apache-spark/reviews)
  - [Spark SQL](https://www.g2.com/fr/products/spark-sql/reviews)
  - [SplashBI](https://www.g2.com/fr/products/splashbi/reviews)
  - [Spotfire Analytics](https://www.g2.com/fr/products/spotfire-analytics/reviews)
  - [Tableau](https://www.g2.com/fr/products/tableau/reviews)
  - [ThoughtSpot](https://www.g2.com/fr/products/thoughtspot/reviews)
  - [Visual Studio Code](https://www.g2.com/fr/products/visual-studio-code/reviews)
  - [Workday HCM](https://www.g2.com/fr/products/workday-hcm/reviews)
  - [Zendesk Sunshine](https://www.g2.com/fr/products/zendesk-sunshine/reviews)

## Databricks Features
**Rapports**
- Interface des rapports
- Étapes pour répondre
- Graphiques et tableaux
- Cartes de score
- Tableaux

**Administration**
- Modélisation des données
- Recommandations
- Gestion des flux de travail
- Tableaux de bord et visualisations

**management**
- Rapports
- Audit

**déploiement**
- Flexibilité linguistique
- Flexibilité du cadre
- Gestion des versions
- Facilité de déploiement
- Évolutivité

**Système**
- Ingestion de données et querelles

**Préparation des données**
- Connecteurs
- Gouvernance des données

**Gestion des données**
- Intégration des données
- Compression des données
- Qualité des données
- Analyse de données intégrée
- Machine Learning dans la base de données
- Analyse du lac de données

**management**
- Dictionnaire de données
- Réplication des données
- Langage de requête
- Modélisation des données
- Analyse du rendement

**management**
- Glossaire métier
- Découverte de données
- Profilage des données
- Rapports et visualisation
- Lignage des données

**déploiement**
- Flexibilité linguistique
- Flexibilité du cadre
- Gestion des versions
- Facilité de déploiement
- Évolutivité

**Gestion des données**
- Intégration des données
- Métadonnées
- Libre-service
- Flux de travail automatisés

**Évolutivité et performances - Infrastructure d’IA générative**
- Haute disponibilité
- Évolutivité de l’entraînement des modèles
- Vitesse d’inférence

**Personnalisation - Constructeurs d'agents IA**
- Configuration de la langue naturelle
- Personnalisation du ton
- Garde-fous de sécurité

**Agentic AI - Plateformes DataOps**
- Exécution autonome des tâches
- Planification en plusieurs étapes
- Intégration inter-systèmes
- Apprentissage adaptatif
- Prise de décision

**Gestion du trafic et performance - Passerelles IA**
- Limitation de débit sensible aux jetons
- Mise en cache sémantique
- Routage multi-modèle et solutions de secours

**Développement de modèles**
- Prise en charge linguistique
- Glissez et déposez
- Algorithmes prédéfinis
- Formation sur modèle

**base de données**
- Collecte de données en temps réel
- Répartition des données
- Lac de données

**Transformation des données**
- Analyse en temps réel
- Interrogation de données

**conformité**
- Conformité des données sensibles
- Formation et lignes directrices
- Application des politiques
- Surveillance de la conformité

**Fonctionnalité**
- Extraction
- Transformation
- chargement
- Automatisation
- Évolutivité

**management**
- Catalogage
- Surveillance
- Gouvernant
- Registre des modèles

**Développement de modèles**
- Ingénierie des fonctionnalités

**Modélisation et fusion des données**
- Interrogation de données
- Filtrage des données
- Fusion de données

**Intégration**
- Intégration IA / ML
- Intégration de l’outil BI
- Intégration du lac de données

**Entretien**
- Migration des données
- Sauvegarde et restauration
- Environnement multi-utilisateurs

**Sécurité**
- Contrôle d’accès
- Gestion des rôles
- Gestion de la conformité

**Opérations**
- Métriques
- Gestion de l’infrastructure
- Collaboration

**Analytics**
- Capacités d’analyse
- Visualisations Dasboard

**Coût et efficacité - Infrastructure d’IA générative**
- Coût par appel d’API
- Flexibilité de l’allocation des ressources
- Efficacité énergétique

**Fonctionnalité - Constructeurs d'agents IA**
- Support omnicanal
- Agent Branding
- Capacités de réponse proactive
- Escalade humaine transparente

**Gouvernance et Observabilité - Passerelles IA**
- Confidentialité des données
- Suivi des coûts
- Sécurité centralisée des clés API

**Services d’apprentissage automatique/profond**
- Vision par ordinateur
- Traitement du langage naturel
- Génération de langage naturel
- Réseaux de neurones artificiels

**Intégrations**
- Intégration Hadoop
- Intégration de Spark

**Qualité des données**
- Préparation des données
- Répartition des données
- Unification des données

**Services d’apprentissage automatique/profond**
- Compréhension du langage naturel
- Apprentissage profond

**déploiement**
- Sur site
- Nuage

**Sécurité**
- Cryptage des données
- Contrôle d’accès utilisateur

**Maintenance**
- Gestion de la qualité des données
- Gestion des politiques

**management**
- Catalogage
- Surveillance
- Gouvernant

**Suivi et gestion**
- Observabilité des données
- Capacités de test

**IA générative**
- Génération de texte
- Résumé du texte

**Intégration et extensibilité - Infrastructure d’IA générative**
- Prise en charge multicloud
- Intégration du pipeline de données
- Prise en charge et flexibilité de l’API

**Données et analyses - Constructeurs d'agents IA**
- Analytique & Rapport
- Conscience contextuelle
- Conformité à la protection des données

**déploiement**
- Service géré
- Application
- Évolutivité

**Plate-forme**
- Mise à l’échelle de la machine
- Préparation des données
- Intégration de Spark

**Connectivité**
- Intégration Hadoop
- Intégration de Spark
- Analyse multi-sources
- Lac de données

**Performance**
- Évolutivité

**Déploiement dans le cloud**
- Prise en charge du cloud hybride
- Capacités de migration vers le cloud

**IA générative**
- Génération de texte
- Résumé du texte

**IA générative**
- Génération de texte
- Résumé du texte

**Sécurité et conformité - Infrastructure d’IA générative**
- RGPD et conformité réglementaire
- Contrôle d’accès basé sur les rôles
- Cryptage des données

**Intégration - Constructeurs d'agents IA**
- Automatisation du flux de travail
- Utilisation de l'API
- Interopérabilité des plateformes
- Intégration des données CRM

**Agentic AI - Plateformes d'analyse**
- Exécution autonome des tâches
- Planification en plusieurs étapes
- Intégration inter-systèmes
- Apprentissage adaptatif
- Interaction en Langage Naturel
- Assistance proactive
- Prise de décision

**Libre-service**
- Champs calculés
- Filtrage des colonnes de données
- Découverte de données
- Rechercher
- Collaboration / Flux de travail
- Automodelage

**Traitement**
- Traitement dans le cloud
- Traitement de la charge de travail

**Opérations**
- Visualisation des données
- Flux de travail de données
- Découverte régie
- Analyse intégrée
- Cahiers

**Sécurité**
- Gouvernance des données
- Sécurité des données

**IA générative**
- Génération de texte
- Résumé du texte
- Synthèse de texte en image

**IA générative**
- Génération de texte
- Résumé du texte

**Facilité d’utilisation et prise en charge - Infrastructure d’IA générative**
- Qualité de la documentation
- Activité communautaire

**IA agentique - Gouvernance des données**
- Exécution autonome des tâches
- Planification en plusieurs étapes
- Intégration inter-systèmes
- Apprentissage adaptatif
- Interaction en Langage Naturel
- Prise de décision

**Déploiement et Intégration - Plateformes d'Analytique**
- Constructeur de tableau de bord sans code
- Planification et automatisation des rapports
- Analytique intégrée et marque blanche
- Connectivité de la source de données

**Analytique avancée**
- Analyse prédictive
- Visualisation des données
- Big Data Services

**IA générative**
- Génération de texte
- Résumé du texte

**Agentic AI - Plateformes de science des données et d'apprentissage automatique**
- Exécution autonome des tâches
- Planification en plusieurs étapes
- Intégration inter-systèmes
- Apprentissage adaptatif
- Interaction en Langage Naturel
- Assistance proactive
- Prise de décision

**Performance et évolutivité - Plateformes d'analyse**
- Gestion de grandes quantités de données et vitesse de requête
- Support utilisateur simultané

**Analytique Avancée & Modélisation - Plateformes d'Analytique**
- Modélisation et gouvernance des données
- Intégration de cahier et de script
- Modèles prédictifs et statistiques intégrés

**Capacités d'IA agentiques - Plateformes d'analyse**
- Informations et récits générés automatiquement
- Requêtes en langage naturel
- Surveillance proactive des indicateurs clés de performance et alertes
- Agents IA pour suivis analytiques

**Intelligence Personnalisée - Plateformes d'Analyse**
- Apprentissage comportemental pour le raffinement contextuel des requêtes
- Personnalisation des informations basée sur les rôles
- Analytique conversationnelle et basée sur des invites

**Rapports de construction**
- Transformation des données
- Modélisation des données
- Conception de rapports WYSIWYG
- API d’intégration

**Plate-forme**
- Assistance aux utilisateurs mobiles
- Personnalisation
- Gestion des utilisateurs, des rôles et des accès
- Internationalisation
- Bac à sable / Environnements de test
- Performance et fiabilité
- Étendue des applications des partenaires

## Top Databricks Alternatives
  - [Cloudera Data Platform](https://www.g2.com/fr/products/cloudera-cloudera-data-platform/reviews) - 4.1/5.0 (131 reviews)
  - [Snowflake](https://www.g2.com/fr/products/snowflake/reviews) - 4.6/5.0 (687 reviews)
  - [Teradata Vantage](https://www.g2.com/fr/products/teradata-teradata-vantage/reviews) - 4.3/5.0 (345 reviews)

