# Databricks Reviews
**Vendor:** Databricks Inc.  
**Category:** [Traitement et distribution des mégadonnées](https://www.g2.com/fr/categories/big-data-processing-and-distribution)  
**Average Rating:** 4.6/5.0  
**Total Reviews:** 785
## About Databricks
Databricks est une plateforme unifiée de données et d&#39;IA qui aide les organisations à construire, gouverner et faire évoluer des pipelines de données, des analyses, des applications d&#39;apprentissage automatique, d&#39;IA et des agents. Plus de 20 000 organisations dans le monde — y compris adidas, AT&amp;T, Bayer, Block, Mastercard, Rivian, Unilever, et 70 % du Fortune 500 — comptent sur Databricks pour travailler avec des données d&#39;entreprise et de l&#39;IA à grande échelle. Basée à San Francisco avec plus de 30 bureaux dans le monde, Databricks offre une plateforme unifiée qui inclut Agent Bricks, Lakeflow, Lakehouse, Lakebase, Genie et Unity Catalog. Fondée en 2013 par les créateurs originaux d&#39;Apache Spark™, Delta Lake, MLflow et Unity Catalog, Databricks est construite sur une architecture de lakehouse ouverte qui réunit données, analyses et IA. La plateforme est utilisée par des ingénieurs de données, des scientifiques de données, des analystes, des développeurs, des équipes d&#39;apprentissage automatique, des équipes d&#39;IA et des utilisateurs professionnels pour collaborer tout au long du cycle de vie des données et de l&#39;IA. Les principales capacités de Databricks incluent : - Ingénierie des données : Construire, automatiser et gérer des pipelines de données batch, en streaming et en temps réel fiables. - Analytique et intelligence d&#39;affaires : Exécuter des analyses SQL, créer des tableaux de bord et permettre aux équipes commerciales d&#39;explorer les données. - Gouvernance des données : Découvrir, sécuriser et gérer les actifs de données et d&#39;IA à travers les équipes, les clouds et les charges de travail. - Apprentissage automatique et IA : Développer des modèles, construire des applications d&#39;IA générative et créer des agents d&#39;IA de qualité production. - Applications de données : Construire et déployer des applications basées sur les données en utilisant des données d&#39;entreprise gouvernées. Disponible sur AWS, Azure et Google Cloud, Databricks aide les organisations à travailler à travers les clouds, à réduire les silos de données et à simplifier la collaboration entre les équipes et les outils. Les clients utilisent Databricks pour des cas d&#39;utilisation tels que la personnalisation client, la détection de fraude, la maintenance prédictive, l&#39;analyse en temps réel, la cybersécurité, la recherche en santé, la gestion des risques financiers, l&#39;optimisation de la chaîne d&#39;approvisionnement et la prise de décision alimentée par l&#39;IA. Databricks est utilisé dans des industries telles que les services financiers, la santé et les sciences de la vie, le commerce de détail, la fabrication, l&#39;énergie et le secteur public. Les organisations utilisent la plateforme pour moderniser l&#39;infrastructure de données, accélérer l&#39;adoption de l&#39;IA et transformer les données d&#39;entreprise en valeur commerciale.



## Databricks Pros & Cons
**What users like:**

- Les utilisateurs louent la **facilité d&#39;utilisation et les nombreuses fonctionnalités** de Databricks, améliorant leurs tâches de traitement de données et d&#39;apprentissage automatique. (192 reviews)
- Les utilisateurs louent la **facilité d&#39;utilisation** de Databricks, améliorant leur expérience globale grâce à son interface intuitive. (155 reviews)
- Les utilisateurs apprécient les **intégrations transparentes** de Databricks, améliorant le traitement en temps réel et prenant en charge divers langages de développement. (141 reviews)
- Les utilisateurs apprécient la **collaboration fluide** que Databricks offre, améliorant le travail d&#39;équipe sur les projets de données avec des insights en temps réel. (114 reviews)
- Les utilisateurs apprécient les **fonctionnalités analytiques intégrées** de Databricks, qui améliorent les opérations et fournissent des insights complets sur la technologie. (113 reviews)
- Évolutivité (111 reviews)
- Intégration ML (106 reviews)
- Les utilisateurs apprécient les **intégrations faciles** de Databricks, se connectant sans effort à l&#39;infrastructure cloud et améliorant la gestion des données. (102 reviews)
- Apprentissage automatique (97 reviews)
- Les utilisateurs adorent les **fonctionnalités efficaces de gestion des données** de Databricks, simplifiant les flux de travail et améliorant les capacités de prise de décision. (87 reviews)

**What users dislike:**

- Les utilisateurs notent une **courbe d&#39;apprentissage** significative avec Databricks, notamment en raison de ses autorisations complexes et de ses modes de calcul. (78 reviews)
- Les utilisateurs trouvent que Databricks est **cher** , surtout lorsqu&#39;il s&#39;agit de gérer de grandes quantités de données, ce qui limite son accessibilité pour certains clients. (71 reviews)
- Les utilisateurs trouvent la **courbe d&#39;apprentissage abrupte** de Databricks difficile, en particulier pour ceux qui sont nouveaux dans les outils de big data. (64 reviews)
- Les utilisateurs trouvent la **complexité** de Databricks difficile, surtout avec les fonctionnalités avancées et les exigences de configuration initiale. (45 reviews)
- Les utilisateurs rencontrent un **processus de configuration complexe** au départ, mais le support aide à simplifier l&#39;expérience au fil du temps. (35 reviews)
- Problèmes de performance (34 reviews)
- Les utilisateurs rencontrent des **problèmes d&#39;interface utilisateur non intuitifs** qui entraînent des erreurs aléatoires et compliquent l&#39;expérience pour les utilisateurs non techniques. (34 reviews)
- Mauvaise conception de l&#39;interface utilisateur (33 reviews)
- Les utilisateurs trouvent que les **fonctionnalités manquantes** dans Databricks sont limitantes, entravant la productivité et compliquant l&#39;expérience globale. (31 reviews)
- Coût (29 reviews)

## Databricks Reviews
  ### 1. Databricks dans mon cas : Intégrations multiples, interface utilisateur intuitive et performance fiable

**Rating:** 4.0/5.0 stars

**Reviewed by:** Yelnur K. | Schedule Manager, Compagnies aériennes/Aviation, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** May 19, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Ce que j'aime le plus chez Databricks, c'est sa partie Intégrations. Au travail, nous intégrons la base de données avec plusieurs sources de données. De plus, je ne peux pas terminer mon avis sans mentionner le design UX et UI, qui rend le flux de travail global intuitif et vraiment convivial. En ce qui concerne la rapidité des processus, cela ne nous a jamais offensés. Cela fonctionne comme prévu. Comparativement aux prix du marché, le prix du service est assez fiable pour nous. Il y a un centre d'aide chez Databricks, si vous ne trouvez pas de réponses à vos questions, il y a des spécialistes qui peuvent vous aider avec vos demandes. Par exemple, je me souviens d'un cas où nous avions un problème lors d'un processus d'examen, ils nous ont aidés à résoudre ce problème.

**Que n’aimez-vous pas à propos de Databricks?**

Concernant les défauts de la qualité de l'IA de Genie. Les gars, cela pourrait être amélioré, surtout la partie raisonnement. Aussi, je peux mentionner le cas où nous avons eu un problème avec le processus d'examen. Les spécialistes nous ont aidés, mais cela nous a causé quelques désagréments. Eh bien,

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Dans l'aviation, nous utilisons ce logiciel pour l'analyse des données. Nous avons automatisé de nombreux processus que les outils de travail simples ne peuvent pas gérer. Nous intégrons également plusieurs outils (dont je ne peux pas mentionner les noms pour des raisons de sécurité). En particulier, cela nous aide à analyser la demande des passagers par itinéraire et par saison. Nous combinons et analysons de grands ensembles de données à l'aide de ce logiciel. Dans l'ensemble, c'est un bon outil. Notre équipe est satisfaite.

**Official Response from Sara Steffen:**

> Merci pour vos commentaires détaillés. Nous sommes ravis d'apprendre que Databricks a été essentiel pour automatiser les processus et analyser de grands ensembles de données pour vos besoins en aviation. Nous prenons vos commentaires sur Genie AI et les processus de support au sérieux et nous nous engageons à apporter des améliorations dans ces domaines.

  ### 2. Plateforme Delta Lake tout-en-un qui rend l'ETL rapide et économique

**Rating:** 5.0/5.0 stars

**Reviewed by:** Kavipriya S. | Data Engineer, Technologie de l'information et services, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** May 27, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Delta Lake + Workflows + Unity Catalog sur une seule plateforme ont éliminé le besoin de rassembler des outils d'ingestion, de transformation et de gouvernance séparés. En tant qu'ingénieur de données, je passe plus de temps à construire des pipelines et moins de temps à gérer l'infrastructure. L'expérience du notebook et l'auto-scalabilité des clusters rendent l'itération sur des ETL complexes rapide et rentable.

**Que n’aimez-vous pas à propos de Databricks?**

Les temps de démarrage des clusters et la prévisibilité des coûts restent les principaux points de friction pour moi. Les démarrages à froid peuvent vraiment ralentir le travail ad hoc, et les coûts DBU doivent être surveillés de près pour éviter les mauvaises surprises. L'interface utilisateur des flux de travail s'est beaucoup améliorée au fil du temps, mais elle ne semble toujours pas aussi flexible que les orchestrateurs dédiés lorsque vous traitez des DAGs plus complexes. Même ainsi, je considère cela principalement comme des éléments de finition - la valeur fondamentale de la plateforme les surpasse largement.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Databricks résout un problème majeur de fragmentation dans notre pile d'ingénierie des données. Auparavant, nous dépendions d'outils séparés pour l'ingestion, la transformation, l'orchestration et la gouvernance—chacun avec sa propre courbe d'apprentissage, ses frais de maintenance et ses points de défaillance potentiels. Maintenant, tout est consolidé en une seule plateforme.

En pratique, cela nous aide à exécuter des pipelines ETL à grande échelle qui traitent des millions d'enregistrements quotidiennement, avec Delta Lake améliorant la fiabilité grâce aux transactions ACID, à l'application de schémas et au voyage dans le temps pour le débogage. Cela comble également le fossé de collaboration entre les ingénieurs de données et les data scientists : nous construisons les pipelines, et ils peuvent consommer les mêmes tables directement dans les notebooks sans duplication de données ni problèmes de synchronisation.

Unity Catalog a résolu un problème de gouvernance de longue date en centralisant le contrôle d'accès à travers les espaces de travail. Dans l'ensemble, le résultat est un développement de pipeline plus rapide, moins d'incidents de production liés à des problèmes de qualité des données, et beaucoup moins de code de liaison à maintenir. Ce qui prenait des semaines à construire et stabiliser prend maintenant des jours.

**Official Response from Jess Darnell:**

> Nous sommes ravis d'apprendre que Databricks a consolidé votre pile d'ingénierie des données et amélioré la fiabilité de vos pipelines ETL. Nous comprenons vos commentaires concernant les temps de démarrage des clusters et la prévisibilité des coûts, et nous travaillons activement à optimiser ces aspects de notre plateforme pour offrir une meilleure expérience utilisateur.

  ### 3. Analytique en libre-service, et performance solide du pilote automatique

**Rating:** 4.0/5.0 stars

**Reviewed by:** Bob K. | Data and Analytics Leader, Technologie de l'information et services, Entreprise (> 1000 employés)

**Reviewed Date:** May 27, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

La gestion des autorisations à travers des équipes de vente et de marketing diversifiées a été simplifiée. Le catalogue nous a permis de sécuriser facilement les données sensibles tout en permettant à notre équipe et aux analystes de se servir eux-mêmes. La traçabilité automatisée au niveau des colonnes a été très utile pour retracer comment nos métriques de prévision de pipeline étaient calculées.

J'aime la performance en pilote automatique. Mon équipe a passé moins de temps sur la maintenance manuelle de la base de données. L'optimisation prédictive a automatiquement pris en charge la compaction des fichiers (Optimize) et nettoyé les anciens fichiers (Vacuum). De plus, le Clustering Liquide a maintenu nos tables de transactions de vente en forte croissance performantes efficacement sans que nous ayons besoin de concevoir et de maintenir manuellement des stratégies de partitionnement complexes.

Le support pour les formats ouverts comme Delta Lake et Apache Iceberg a assuré que nos données restent portables. Grâce aux API ouvertes et au partage Delta, nous avons pu partager en toute sécurité des insights avec des partenaires commerciaux externes sans avoir à répliquer et déplacer d'énormes ensembles de données.

Une chose de plus, la plateforme a permis à notre équipe d'ingénierie des données et aux analystes de collaborer en un seul endroit. Cet alignement entre l'architecture technique et la stratégie commerciale a facilité la conversion des modèles de pipeline technique en valeur commerciale.

**Que n’aimez-vous pas à propos de Databricks?**

Comme nous le savons, les outils de vente et de marketing changent fréquemment leurs schémas de données, par exemple en ajoutant ou en renommant des champs personnalisés dans Salesforce. Lorsque ces mises à jour se produisaient, nos flux d'ingestion utilisant le chargeur automatique ou le streaming structuré échouaient et nécessitaient des redémarrages manuels pour s'adapter. Cela causait occasionnellement des retards temporaires dans la mise à jour de nos tableaux de bord opérationnels.

Le suivi de l'attribution marketing complexe et multi-touch et des parcours clients nécessitait des opérations de streaming avec état (telles que les jointures et les agrégations). La gestion des journaux d'événements désordonnés et des données arrivant en retard dans ces flux s'est avérée très complexe et a nécessité une ingénierie personnalisée significative pour garantir que les résultats restent précis.

Parce que les tables gérées par Unity Catalog ne prennent pas en charge l'accès basé sur le chemin, nous avons dû nous assurer que tout le code hérité et les systèmes externes passaient à l'utilisation de conventions de nommage de namespace à trois niveaux appropriées, ce qui nécessitait un effort initial de refactorisation pour éviter les erreurs d'accès aux données.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Chez Basware, mon principal objectif était de permettre aux équipes de vente et de marketing mondiales d'optimiser leurs performances, de construire des prévisions de pipeline précises et d'assurer une gouvernance solide autour de nos données clients. Databricks a servi de plateforme fondamentale pour nous aider à atteindre ces objectifs.

Nous avons utilisé Lakeflow Connect, en particulier le connecteur Salesforce, ainsi que d'autres méthodes d'ingestion pour extraire des données de notre CRM, des systèmes d'automatisation du marketing et des fichiers locaux dans le lakehouse. Cela nous a permis de construire une vue consolidée et unique du client.

Les pipelines déclaratifs Lakeflow Spark nous ont aidés à organiser nos données brutes de marketing et de vente en architecture Medallion. Cela signifie que nous pouvions transformer des journaux d'événements marketing semi-structurés et des enregistrements CRM en ensembles de données structurés prêts pour l'intelligence d'affaires et les prévisions.

Pour soutenir le VP des opérations de vente et de marketing et d'autres dirigeants seniors, nous avons déployé des espaces génie AI/BI. Cela a permis aux cadres de consulter les métriques de pipeline et les tendances de prévision en utilisant le langage naturel. Pour les rapports standard, nous avons utilisé Partner Connect pour lier nos tables Gold propres directement à des outils BI externes.

**Official Response from Jess Darnell:**

> It's great to hear how Databricks has helped you optimize sales and marketing performance, build accurate pipeline forecasts, and ensure robust governance around customer data. We're committed to providing a platform that supports your business goals and enables efficient data management and analysis. Thank you for sharing your use case with us.

  ### 4. Des pipelines de télémétrie puissants à faible latence avec des tables de streaming et des vues matérialisées

**Rating:** 4.0/5.0 stars

**Reviewed by:** Jose P. | Head of Network Strategy, Télécommunications, Entreprise (> 1000 employés)

**Reviewed Date:** May 26, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Dans un environnement de télécommunications traitant des volumes massifs de données provenant de réseaux fixes et mobiles (GPON, cœur 4g/5g et RAN), ingérant de manière incrémentale des télémétries de fréquence non structurées ou semi-structurées à partir de nos fonctions virtualisées comme vEPC, vCPE ou VHGW) avec une configuration minimale.

Mon équipe travaille en étroite collaboration avec les fonctions réseau virtualisées et l'informatique en périphérie multi-accès. Des fonctionnalités comme les tables de streaming et les vues matérialisées nous aident à construire des pipelines à faible latence qui traitent les métriques de performance réseau en quasi temps réel, nous aidant à surveiller les indicateurs de performance réseau et l'efficacité de la qualité de service.

Parce que l'expertise principale de mon équipe réside dans la conception de réseaux et la virtualisation des systèmes plutôt que dans l'administration de bases de données, l'optimisation prédictive et le clustering liquide sont très bénéfiques. Ils gèrent de manière autonome la maintenance des tables, la compaction des fichiers et l'optimisation de la disposition des données, libérant ainsi nos ressources pour nous concentrer sur l'architecture réseau.

**Que n’aimez-vous pas à propos de Databricks?**

Les fonctions réseau virtualisées, les routeurs et le matériel désagrégé subissent fréquemment des mises à jour logicielles, qui introduisent souvent des changements subtils dans les schémas de sortie de télémétrie. Lors de l'utilisation de flux structuré ou de chargeur automatique, ces dérives de schéma provoquent l'échec de nos requêtes de streaming, nécessitant un redémarrage manuel du flux pour replanifier le schéma.

Lorsque nous devons mettre à jour la logique d'un KPI réseau complexe défini dans une vue matérialisée, tout changement de la requête déclenche un recalcul complet de la vue. Étant donné l'ampleur massive des ensembles de données de transactions télécoms, cela peut entraîner des coûts de calcul notables.

Nous comptons sur une variété d'outils de données au sein de notre écosystème TIC, mais toutes les solutions présentées dans Partner Connect ne prennent pas en charge nativement Unity Catalog. Cela peut créer des obstacles d'intégration et de gouvernance lorsque nous essayons de connecter certains outils d'analyse et de préparation de données tiers à notre lac de données sécurisé.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Nous ingérons des flux continus de données de performance provenant de fonctions réseau virtualisées et de couches de transport traditionnelles. En construisant des pipelines de streaming, nous pouvons surveiller les cœurs virtualisés et les routeurs pour identifier les anomalies ou les dégradations dans le trafic réseau.

Aligné avec mon intérêt pour l'IA réseau et l'apprentissage automatique, nos data scientists utilisent la plateforme pour développer des modèles prédictifs. Nous entraînons des modèles sur les échecs historiques des lignes GPON/DSL, les charges des tours cellulaires mobiles et les modèles d'utilisation des clients pour prédire la congestion du réseau, planifier une maintenance proactive et atténuer le désabonnement des clients à travers les segments de clientèle.

En tant qu'évangéliste de l'évolution technologique, j'utilise la plateforme pour combler le fossé entre nos équipes d'ingénierie réseau de base et les unités commerciales. En connectant les sémantiques commerciales et en établissant des protocoles de partage Delta sécurisés, nous fournissons aux analystes commerciaux et aux décideurs un accès autonome et gouverné aux informations réseau sans risquer la conformité en matière de sécurité.

**Official Response from Jess Darnell:**

> C'est fantastique d'entendre comment Databricks vous aide à ingérer et traiter des flux continus de données de performance, à développer des modèles prédictifs et à combler le fossé entre les équipes d'ingénierie réseau et les unités commerciales. Nous nous engageons à fournir des solutions qui bénéficient à nos utilisateurs dans divers aspects de leur travail.

  ### 5. Rendre les systèmes de données moins désordonnés avec une approche unifiée de Lakehouse

**Rating:** 5.0/5.0 stars

**Reviewed by:** Hunar M. | Data Analyst, Geospatial Intelligence - Data &amp; Analytics, Entreprise (> 1000 employés)

**Reviewed Date:** May 21, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

L'écosystème. Ce que j'aime le plus chez Databricks, c'est la façon dont il élimine une grande partie du désordre habituel que l'on rencontre dans le travail de données. Au lieu de jongler avec des outils séparés pour l'ingénierie, l'analytique et le ML—et ensuite passer du temps supplémentaire à les faire communiquer entre eux—il rassemble tout en un seul endroit. Cela seul réduit beaucoup de friction et fait gagner du temps.

J'aime aussi l'idée du Lakehouse parce qu'elle semble vraiment pratique : vous n'avez pas à choisir entre un lac de données et un entrepôt. Vous pouvez travailler avec une configuration unifiée et obtenir des performances quand vous en avez besoin.

Au quotidien, c'est aussi agréable que différentes équipes puissent collaborer dans le même environnement sans copier constamment des données ou reconstruire des pipelines. Dans l'ensemble, cela simplifie et accélère les choses, surtout lorsque vous itérez.

**Que n’aimez-vous pas à propos de Databricks?**

Ce que je n'aime pas chez Databricks, c'est que cela peut sembler un peu lourd lorsque vous essayez simplement de faire quelque chose de simple. Il y a beaucoup de choses qui se passent en arrière-plan, et bien que ce soit excellent pour l'évolutivité, cela s'accompagne également d'une courbe d'apprentissage. Des éléments comme les clusters, les configurations et la configuration des tâches prennent un certain temps pour s'y habituer.

Le coût est une autre préoccupation. L'utilisation peut augmenter rapidement si vous ne la surveillez pas activement, surtout lorsque les équipes peuvent lancer des calculs librement. Et parfois, l'expérience globale semble un peu fragmentée entre les notebooks, les tâches et les dépôts, plutôt que d'être un flux fluide et unifié.

Donc, oui, c'est puissant, mais cela demande certainement de la discipline pour garder les choses propres, efficaces et sous contrôle.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Ce que Databricks résout vraiment pour moi, c'est la friction habituelle qui apparaît lorsque les systèmes de données sont répartis sur trop d'outils.

Au lieu de faire fonctionner un système pour l'ingestion, un autre pour le stockage, un autre encore pour la transformation, puis des configurations séparées pour l'analytique et le ML, cela regroupe la plupart de ces éléments en un seul endroit. Cela signifie que je n'ai pas à déplacer constamment les données ou à m'inquiéter de leur désynchronisation.

D'un point de vue de l'architecture de solution, c'est un grand avantage car cela simplifie la conception globale. Plutôt que de rassembler un tas de systèmes, vous pouvez construire autour d'une configuration Lakehouse unique qui prend en charge plusieurs cas d'utilisation. C'est plus facile à mettre à l'échelle, plus facile à gouverner, et globalement plus facile à comprendre.

Au quotidien, cela signifie également que je passe moins de temps sur l'infrastructure et la plomberie et plus de temps à réfléchir à la conception de bons modèles de données et de pipelines. Et parce que tout le monde travaille à partir des mêmes données, il y a beaucoup moins de confusion et de retouches entre les équipes.

Dans l'ensemble, cela élimine beaucoup de bruit et me permet de me concentrer sur la construction de solutions de données solides et évolutives.

**Official Response from Jess Darnell:**

> Nous sommes ravis d'apprendre que vous trouvez notre écosystème et notre approche Lakehouse bénéfiques pour simplifier et unifier votre travail de données. Nous comprenons vos préoccupations concernant la courbe d'apprentissage et le coût, et nous travaillons continuellement à améliorer l'expérience utilisateur et à proposer des solutions rentables. Merci de nous avoir fait part de vos commentaires détaillés.

  ### 6. Databricks centralise les données, l'analytique et l'IA

**Rating:** 5.0/5.0 stars

**Reviewed by:** Leonardo Q. | RPA Developer, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** May 16, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Ce que j'aime le plus dans Databricks, c'est la façon dont il centralise l'ingénierie des données, l'analytique et l'IA sur une seule plateforme, ce qui facilite grandement le flux de travail au quotidien. L'intégration entre les notebooks, les pipelines et le traitement distribué rend le développement plus rapide et organisé, surtout dans les projets avec un grand volume de données et d'automatisations.

Un autre point que je considère très fort est l'expérience avec Apache Spark, intégrée de manière simplifiée. Même dans des scénarios plus complexes, la performance est généralement excellente, permettant de traiter des données à grande échelle avec une bonne stabilité et évolutivité. Cela aide beaucoup dans les intégrations, les ETL et les analyses qui, dans d'autres solutions, nécessiteraient beaucoup plus d'efforts.

**Que n’aimez-vous pas à propos de Databricks?**

Bien que j'aime beaucoup la plateforme, certains aspects de Databricks peuvent encore être difficiles. Le principal d'entre eux est le coût, surtout dans des environnements avec un traitement intensif ou lorsque les clusters ne sont pas bien optimisés. Sans un contrôle d'utilisation plus rigoureux, les dépenses peuvent augmenter rapidement.

Un autre aspect est la courbe d'apprentissage, qui peut être élevée pour les équipes qui commencent dans l'écosystème des données distribuées. Les concepts liés à Spark, aux clusters, à l'optimisation et à la gestion des ressources nécessitent un temps d'adaptation, surtout pour ceux qui viennent d'outils plus traditionnels.

En UI/UX, bien que l'interface soit globalement bonne, certains processus administratifs et configurations plus avancées peuvent sembler confus au début. Dans certains scénarios, identifier des problèmes de performance ou de permissions peut également nécessiter une connaissance plus technique.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Databricks a principalement aidé à résoudre des problèmes liés à la centralisation, au traitement et à l'analyse de grands volumes de données. Auparavant, de nombreux processus étaient répartis entre différents outils, ce qui compliquait les intégrations, la maintenance et la gouvernance. Avec Databricks, une grande partie du flux d'ingénierie des données, d'analytique et d'IA peut être concentrée sur une seule plateforme, apportant plus de cohérence au travail quotidien.

**Official Response from Jess Darnell:**

> Nous sommes ravis d'apprendre que vous trouvez la centralisation des données, de l'analytique et de l'IA par Databricks bénéfique pour votre flux de travail. Nous comprenons l'importance de l'intégration et de la simplification, et nous nous engageons à fournir une plateforme qui répond à vos besoins.

  ### 7. Databricks simplifie le traitement des Big Data et la collaboration en équipe

**Rating:** 4.5/5.0 stars

**Reviewed by:** Praveen M. | Associate Data Engineer, Technologie de l'information et services, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** May 07, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Ce que j'aime le plus chez Databricks, c'est la façon dont il simplifie le traitement des données à grande échelle et la collaboration sur une seule plateforme. L'intégration avec Spark et les services cloud rend la gestion des big data beaucoup plus efficace. J'aime aussi l'environnement de notebook, qui facilite le travail en équipe sur les tâches d'analyse et d'apprentissage automatique.

**Que n’aimez-vous pas à propos de Databricks?**

Une chose que je n'aime pas à propos de Databricks est que la plateforme peut sembler complexe pour les nouveaux utilisateurs, surtout lorsqu'il s'agit de gérer les clusters et les configurations. Les prix peuvent également devenir coûteux avec des charges de travail plus importantes si les ressources ne sont pas optimisées avec soin. Bien que les intégrations et les fonctionnalités d'IA soient puissantes, le processus d'intégration et la documentation de support pourraient être plus adaptés aux débutants.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Databricks aide à résoudre le défi du traitement et de l'analyse de grandes quantités de données de manière efficace sur une seule plateforme. Il combine l'ingénierie des données, l'analytique et les flux de travail d'IA, ce qui réduit le besoin de multiples outils séparés. Cela améliore la collaboration, accélère le traitement des données et aide à générer des insights beaucoup plus rapidement.

**Official Response from Jess Darnell:**

> Nous sommes ravis d'apprendre que vous trouvez Databricks utile pour simplifier le traitement de données à grande échelle et la collaboration. Notre intégration avec Spark et les services cloud est conçue pour rendre la gestion des big data plus efficace.

  ### 8. Parfait pour la collaboration inter-équipes et les applications de données intensives

**Rating:** 5.0/5.0 stars

**Reviewed by:** Artemij V. | Data Science Lead, Petite entreprise (50 employés ou moins)

**Reviewed Date:** May 04, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

L'UX est l'un des points forts. L'expérience du notebook est propre et intuitive, la collaboration est simple, et passer de l'exploration à l'expérimentation, puis aux flux de travail de production, semble fluide. Il offre suffisamment de flexibilité pour les utilisateurs avancés tout en restant suffisamment accessible pour que l'intégration de nouveaux membres de l'équipe soit rapide. Les gens peuvent généralement devenir productifs rapidement sans passer des semaines à apprendre les particularités spécifiques à la plateforme.

Les intégrations sont également excellentes. Il fonctionne parfaitement avec l'écosystème cloud plus large et se connecte bien avec les sources de données, les outils d'orchestration, l'infrastructure de service de modèles et les systèmes externes. Cette interopérabilité facilite grandement le passage du prototype au pipeline déployé sans avoir à reconstruire constamment des connecteurs ou à gérer du code de liaison.

Les performances ont été constamment solides, surtout lorsqu'on travaille avec des charges de travail distribuées et de l'ingénierie de fonctionnalités à grande échelle. L'optimisation de Spark, la gestion des clusters et l'infrastructure gérée réduisent considérablement les frais généraux opérationnels, ce qui me permet de me concentrer davantage sur le développement et l'analyse des modèles plutôt que sur le réglage de l'environnement. Pour l'expérimentation itérative, les temps de démarrage et la réactivité globale sont nettement meilleurs que de nombreuses plateformes gérées alternatives.

**Que n’aimez-vous pas à propos de Databricks?**

Un domaine où Databricks pourrait s'améliorer est la tarification. La plateforme offre de solides capacités, mais les coûts peuvent augmenter rapidement pour les charges de travail à haute fréquence ou en temps réel. Pour les cas d'utilisation impliquant des pipelines de ticks à faible latence fonctionnant en continu, des données de marché en streaming ou un réentraînement itératif de modèles, la tarification peut devenir assez élevée par rapport à l'infrastructure consommée. Il semble parfois qu'il y ait une prime significative pour la commodité et l'orchestration gérée, ce qui peut faire de l'optimisation des coûts une considération constante.

L'intégration de l'IA est un autre domaine qui semble encore quelque peu inégal. Bien qu'il y ait une volonté claire de positionner la plateforme comme un environnement IA/ML de bout en bout, certaines des nouvelles fonctionnalités axées sur l'IA ressemblent davantage à des ajouts à l'écosystème qu'à des améliorations de flux de travail profondément intégrées. En pratique, il existe encore des cas où des outils personnalisés ou des cadres externes offrent plus de flexibilité et de transparence, en particulier pour le développement de modèles spécialisés, l'expérimentation et les cas d'utilisation d'inférence en temps réel.

Il peut également y avoir une certaine complexité autour de l'optimisation des clusters et de la gestion efficace des coûts à grande échelle. Bien que les abstractions soient utiles, obtenir le meilleur rapport performance-coût nécessite parfois une connaissance plus approfondie de la plateforme que ce que le positionnement "entièrement géré" pourrait laisser entendre.

Dans l'ensemble, la plateforme est très solide techniquement, mais la tarification pour les charges de travail intensives en données toujours actives et la maturité de certaines capacités natives de l'IA sont les deux plus grands domaines où j'aimerais voir des améliorations.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Databricks résout l'un des plus grands défis du travail moderne sur les données : réunir l'accès aux données, le traitement à grande échelle et le développement collaboratif dans un seul environnement.

Pour mon travail, le plus grand avantage est la collaboration en temps réel. Cela permet à plusieurs personnes de travailler sur les mêmes ensembles de données, notebooks et pipelines sans les frictions habituelles des outils fragmentés ou des incohérences d'environnement. Cela accélère considérablement l'expérimentation, l'itération et le partage des connaissances à travers les projets, surtout lorsqu'il s'agit de développer rapidement des modèles ou d'analyser des données en évolution rapide.

Il résout également le défi de l'accès et du traitement des données à grande échelle. Travailler avec des ensembles de données transactionnels et de séries temporelles à haut volume nécessite une infrastructure capable de traiter de grandes quantités de données efficacement sans surcharge opérationnelle constante. Databricks abstrait une grande partie de cette complexité, rendant possible de se concentrer sur l'analyse, l'ingénierie des caractéristiques et le développement de modèles plutôt que de passer du temps à gérer l'infrastructure.

Le bénéfice pratique est des cycles d'itération plus rapides. Je peux passer de l'exploration de données brutes à l'expérimentation et au déploiement de modèles beaucoup plus rapidement, ce qui est particulièrement précieux lorsque l'on travaille sur des analyses en temps réel, des pipelines de prévision et des systèmes ML orientés production où la rapidité d'itération impacte directement les résultats.

Dans l'ensemble, cela réduit les frictions d'ingénierie et rend le travail collaboratif sur les données à grande échelle beaucoup plus efficace, ce qui se traduit par un développement plus rapide, une meilleure expérimentation et un déploiement plus fiable des produits de données.

**Official Response from Jess Darnell:**

> Nous apprécions votre examen approfondi de Databricks et sommes ravis d'apprendre que la plateforme a été essentielle pour permettre la collaboration inter-équipes et les applications de données intensives dans votre travail. Vos commentaires sur les prix et l'intégration de l'IA sont précieux, et nous nous efforçons continuellement d'améliorer ces aspects pour offrir une expérience plus fluide à nos utilisateurs.

  ### 9. Genie Code et l'assistant en ligne ont considérablement augmenté ma productivité en débogage.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Shyam s. | Data Engineer, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** March 27, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Le code Genie et l'assistant intégré ont été les outils les plus utiles pour moi sur mon projet. Ils m'ont aidé à déboguer une base de code de 2 000 lignes et ont clairement expliqué pourquoi je n'obtenais pas de données précises. Ils ont également fourni une requête à exécuter dans mon système source (SQLMI). En exécutant le script de divergence en parallèle sur la source et la cible, j'ai pu déboguer l'ensemble du code beaucoup plus rapidement et améliorer ma productivité. Dans l'ensemble, cela a réduit mon temps de travail d'environ 8 heures à environ 1 heure.

**Que n’aimez-vous pas à propos de Databricks?**

Dans Delta Sharing, il n'y a pas de permission SELECT au niveau du catalogue, et je pense parfois que cela serait utile. De plus, lorsque j'utilise le code Genie à l'intérieur d'une VM, cela peut rendre le site web non réactif par moments. Ce sont des domaines qui pourraient être améliorés.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Dans l'un de nos projets de migration de traitement des réclamations, le client avait besoin d'une disponibilité des données quasi en temps réel pour les applications en aval. Auparavant, l'architecture utilisait Amazon Redshift comme entrepôt de données, avec Jasper et Sisense consommant les données pour les rapports et l'analyse. Cependant, cette configuration ne supportait pas efficacement le streaming en temps réel ou quasi en temps réel, ce qui entraînait des retards dans la disponibilité des données pour les systèmes en aval.

Après avoir migré la plateforme vers Databricks, nous avons pu améliorer considérablement l'architecture du pipeline de données. Nous avons mis en œuvre le streaming ainsi que des pipelines ETL optimisés, réduisant le cycle de rafraîchissement des données à environ 30 minutes. Nous avons également créé une vue dédiée qui conserve les données de l'exécution précédente, de sorte que les systèmes en aval disposent toujours d'un ensemble de données cohérent pendant que la prochaine exécution du pipeline est encore en cours.

Auparavant, nous avions du mal avec des cycles de rafraîchissement retardés et une capacité limitée à répondre aux besoins de données quasi en temps réel dans notre architecture basée sur Redshift. Après être passés à Databricks, nous avons permis un traitement ETL plus rapide et amélioré la disponibilité des données quasi en temps réel.

En conséquence, nous avons réduit le temps de rafraîchissement ETL à environ 30 minutes et permis un accès quasi en temps réel pour les outils en aval comme Jasper et Sisense. La fiabilité s'est également améliorée car la vue stable continue de servir les données de l'exécution précédente pendant les mises à jour du pipeline. Enfin, l'architecture globale est devenue plus simple en consolidant les capacités de traitement et d'analyse au sein de Databricks.

Dans l'ensemble, Databricks nous a aidés à construire une plateforme de traitement de données quasi en temps réel plus évolutive et efficace, améliorant considérablement la rapidité et la fiabilité des analyses pour le flux de travail de traitement des réclamations.

**Official Response from Janelle Glover:**

> Merci de partager comment l'architecture de Databricks vous bénéficie. Nous avons conçu notre plateforme pour répondre aux défis de la gestion des données structurées et non structurées, et c'est formidable d'entendre qu'elle a un impact positif sur vos flux de travail d'analyse et d'apprentissage automatique.

  ### 10. La plateforme de données unifiée qui tient réellement ses promesses

**Rating:** 5.0/5.0 stars

**Reviewed by:** Janakiraman K. | Data Engineer, Entreprise (> 1000 employés)

**Reviewed Date:** March 27, 2026

**Qu'aimez-vous le plus à propos de Databricks?**

Databricks a transformé la façon dont notre équipe gère les flux de travail de données de bout en bout. Quelques points forts :

UI/UX : L'interface du notebook est intuitive, et l'éditeur SQL semble soigné, ce qui permet de passer de Python à SQL et Scala dans le même espace de travail sans changement de contexte constant.

Intégrations : Les connecteurs natifs à Azure, Unity Catalog et Delta Sharing signifient que nous passons moins de temps sur la plomberie. Lakehouse Federation nous permet d'interroger des sources externes sans déplacer les données, ce qui a été une victoire inattendue.

Performance : L'auto-optimisation de Delta Lake et le clustering liquide ont réduit de manière notable nos temps de requête. Le moteur Photon sur les agrégations lourdes est un changement radical pour les tableaux de bord en temps quasi réel.

Tarification/ROI : Le modèle DBU demande un certain temps d'adaptation, mais la consolidation de notre entrepôt de données, ETL et outils ML en une seule plateforme a réduit de manière significative nos dépenses d'infrastructure globales.

Support/Intégration : Databricks Academy et la documentation intégrée ont accéléré l'intégration des nouveaux ingénieurs. Le forum communautaire est étonnamment actif pour des questions de niche.

IA/Intelligence : Genie (AI/BI) permet aux utilisateurs métier de poser des questions en anglais simple et d'obtenir des résultats précis, réduisant ainsi les demandes ad hoc à notre équipe de données de manière notable. Databricks Assistant à l'intérieur des notebooks accélère également la génération de code et le débogage.

**Que n’aimez-vous pas à propos de Databricks?**

Bien que Databricks soit puissant, il existe de véritables points de friction qui méritent d'être mentionnés :

UI/UX : L'interface peut sembler accablante pour les nouveaux utilisateurs, la navigation entre les Espaces de travail, les Catalogues et les Entrepôts SQL n'est pas toujours intuitive. L'organisation des dossiers et des carnets pourrait être plus structurée dès le départ.

Intégrations : Certains connecteurs tiers nécessitent encore une configuration manuelle et du code personnalisé. La Fédération Lakehouse est prometteuse mais parfois incohérente avec certains systèmes sources, nécessitant un dépannage supplémentaire.

Performance : Les temps de démarrage des clusters restent un point douloureux, les démarrages à froid sur les clusters interactifs peuvent perturber les flux de travail rapides. Le calcul sans serveur aide mais n'est pas encore universellement disponible pour toutes les fonctionnalités.

Tarification/ROI : Le modèle de tarification basé sur les DBU manque de transparence pour les nouvelles équipes. Il est facile d'accumuler des coûts inattendus sans politiques de cluster et surveillance attentives. Un estimateur de coûts plus simple aiderait considérablement.

Support/Intégration : Les temps de réponse du support entreprise peuvent être lents pour les tickets non critiques. Pour les problèmes architecturaux complexes, il faut souvent plusieurs escalades pour atteindre le bon expert.

IA/Intelligence : Genie fonctionne bien pour les requêtes standard mais a du mal avec la logique complexe multi-tables ou la terminologie spécifique au domaine sans un ajustement significatif. L'Assistant Databricks dans les carnets génère parfois des suggestions d'API obsolètes ou incorrectes.

**Quels sont les problèmes que Databricks résout, et en quoi cela vous est-il bénéfique?**

Voici une réponse naturelle et axée sur l'histoire suivant le format "avant/après/résultat" :

Avant Databricks, notre paysage de données était fragmenté et l'utilisation d'outils séparés pour l'ETL, l'entreposage et le ML signifiait des pipelines dupliqués, des définitions de données incohérentes et un surcroît de travail d'ingénierie juste pour maintenir l'infrastructure.

Unification des données : Nous avions du mal avec des données cloisonnées à travers plusieurs systèmes sources. Maintenant, avec Unity Catalog et l'architecture Medallion (Bronze/Argent/Or), nous avons une couche gouvernée unique en laquelle toutes les équipes ont confiance, réduisant l'effort de réconciliation des données de près de 40%.

Fiabilité des pipelines : Construire et maintenir des pipelines basés sur les métadonnées nécessitait auparavant des cadres personnalisés. Lakeflow et Delta Live Tables de Databricks nous ont offert des capacités de chargement incrémentiel et complet prêtes à l'emploi, réduisant considérablement le temps de développement des pipelines.

Analytique en libre-service : Les équipes commerciales dépendaient constamment des ingénieurs pour les requêtes ad hoc. Avec Genie (IA/BI), les parties prenantes peuvent désormais poser des questions en anglais simple sur des tables d'or organisées, réduisant de manière notable les demandes de données ad hoc à notre équipe semaine après semaine.

Contrôle des coûts du cloud : Nous faisions auparavant fonctionner des clusters toujours actifs sans visibilité sur les dépenses. Le calcul sans serveur et les politiques de cluster nous permettent maintenant de dimensionner correctement les charges de travail, entraînant une réduction mesurable des coûts d'infrastructure.

Intégration plus rapide : Les nouveaux ingénieurs mettaient auparavant des semaines à devenir productifs. Avec Databricks Assistant, les modèles de notebooks et la documentation centralisée de Unity Catalog, le temps de montée en compétence a considérablement diminué.

Dans l'ensemble : Databricks a essentiellement remplacé 3 à 4 outils séparés par une plateforme cohérente. Le retour sur investissement ne réside pas seulement dans les économies de coûts, mais aussi dans la rapidité et la confiance avec lesquelles nous livrons désormais des produits de données à l'entreprise.

**Official Response from Janelle Glover:**

> Nous sommes ravis d'apprendre que vous trouvez Databricks précieux pour l'ingénierie des données, l'analytique et l'apprentissage automatique. Merci de partager vos commentaires !


## Databricks Discussions
  - [Qu&#39;est-ce que Lakehouse dans Databricks ?](https://www.g2.com/fr/discussions/what-is-lakehouse-in-databricks) - 4 comments, 2 upvotes
  - [Quelles sont les fonctionnalités de Databricks ?](https://www.g2.com/fr/discussions/what-are-the-features-of-databricks) - 4 comments, 2 upvotes
  - [What does Databricks software do?](https://www.g2.com/fr/discussions/what-does-databricks-software-do) - 3 comments
  - [Qu&#39;est-ce que la plateforme d&#39;analytique unifiée de Databricks ?](https://www.g2.com/fr/discussions/what-is-databricks-unified-analytics-platform) - 3 comments

- [View Databricks pricing details and edition comparison](https://www.g2.com/fr/products/databricks/reviews/databricks-review-12542177?section=pricing&secure%5Bexpires_at%5D=2026-06-01+23%3A26%3A25+-0500&secure%5Bsession_id%5D=f785e314-7fe3-46fb-9764-88fb62782cd9&secure%5Btoken%5D=08c4d9e5f4a70ac57ec84563bbf30ae7c3713bda33c2ebcacc37ab4f0134d428&format=llm_user)
## Databricks Integrations
  - [Agentforce 360 Platform (formerly Salesforce Platform)](https://www.g2.com/fr/products/agentforce-360-platform-formerly-salesforce-platform/reviews)
  - [Agentforce Sales (formerly Salesforce Sales Cloud)](https://www.g2.com/fr/products/agentforce-sales-formerly-salesforce-sales-cloud/reviews)
  - [Alation](https://www.g2.com/fr/products/alation/reviews)
  - [Amazon EC2](https://www.g2.com/fr/products/amazon-ec2/reviews)
  - [Amazon Redshift](https://www.g2.com/fr/products/amazon-redshift/reviews)
  - [Amazon Relational Database Service (RDS)](https://www.g2.com/fr/products/amazon-relational-database-service-rds/reviews)
  - [Anaplan](https://www.g2.com/fr/products/anaplan/reviews)
  - [Anomalo](https://www.g2.com/fr/products/anomalo/reviews)
  - [Apache Airflow](https://www.g2.com/fr/products/apache-airflow/reviews)
  - [Apache Kafka](https://www.g2.com/fr/products/apache-kafka/reviews)
  - [Apache NiFi](https://www.g2.com/fr/products/apache-nifi/reviews)
  - [Atlan](https://www.g2.com/fr/products/atlan/reviews)
  - [AWS Glue](https://www.g2.com/fr/products/aws-glue/reviews)
  - [AWS Lambda](https://www.g2.com/fr/products/aws-lambda/reviews)
  - [Azure Blob Storage](https://www.g2.com/fr/products/azure-blob-storage/reviews)
  - [Azure Databricks](https://www.g2.com/fr/products/azure-databricks/reviews)
  - [Azure Data Factory](https://www.g2.com/fr/products/azure-data-factory/reviews)
  - [Azure Data Lake Store](https://www.g2.com/fr/products/azure-data-lake-store/reviews)
  - [Azure Functions](https://www.g2.com/fr/products/azure-functions/reviews)
  - [Azure Logic Apps](https://www.g2.com/fr/products/azure-logic-apps/reviews)
  - [Azure OpenAI Service](https://www.g2.com/fr/products/azure-openai-service/reviews)
  - [Azure Pipelines](https://www.g2.com/fr/products/azure-pipelines/reviews)
  - [Azure Portal](https://www.g2.com/fr/products/azure-portal/reviews)
  - [Azure SQL Database](https://www.g2.com/fr/products/azure-sql-database/reviews)
  - [Claude Code](https://www.g2.com/fr/products/anthropic-claude-code/reviews)
  - [Confluent](https://www.g2.com/fr/products/confluent/reviews)
  - [Crunchbase](https://www.g2.com/fr/products/crunchbase/reviews)
  - [Customer.io](https://www.g2.com/fr/products/customer-io/reviews)
  - [Dash](https://www.g2.com/fr/products/dash-for-brands-ltd-dash/reviews)
  - [data.world](https://www.g2.com/fr/products/data-world/reviews)
  - [DAT iQ](https://www.g2.com/fr/products/dat-iq/reviews)
  - [dbt](https://www.g2.com/fr/products/dbt/reviews)
  - [DigitalOcean](https://www.g2.com/fr/products/digitalocean/reviews)
  - [Fivetran](https://www.g2.com/fr/products/fivetran/reviews)
  - [GEN TDS](https://www.g2.com/fr/products/gen-tds/reviews)
  - [Git](https://www.g2.com/fr/products/git/reviews)
  - [GitHub](https://www.g2.com/fr/products/github/reviews)
  - [GitLab](https://www.g2.com/fr/products/gitlab/reviews)
  - [Google Analytics](https://www.g2.com/fr/products/google-analytics/reviews)
  - [Google Cloud Run](https://www.g2.com/fr/products/google-cloud-run/reviews)
  - [HubSpot Marketing Hub](https://www.g2.com/fr/products/hubspot-marketing-hub/reviews)
  - [Immuta](https://www.g2.com/fr/products/immuta/reviews)
  - [JD Edwards World](https://www.g2.com/fr/products/jd-edwards-world/reviews)
  - [Microsoft Copilot Studio](https://www.g2.com/fr/products/microsoft-microsoft-copilot-studio/reviews)
  - [Microsoft Fabric](https://www.g2.com/fr/products/microsoft-fabric/reviews)
  - [Microsoft Power Apps](https://www.g2.com/fr/products/microsoft-power-apps/reviews)
  - [Microsoft Power Automate](https://www.g2.com/fr/products/microsoft-power-automate/reviews)
  - [Microsoft Power BI](https://www.g2.com/fr/products/microsoft-microsoft-power-bi/reviews)
  - [Microsoft SharePoint](https://www.g2.com/fr/products/microsoft-sharepoint/reviews)
  - [Microsoft SQL Server](https://www.g2.com/fr/products/microsoft-sql-server/reviews)
  - [Microsoft Teams](https://www.g2.com/fr/products/microsoft-teams/reviews)
  - [Monte Carlo](https://www.g2.com/fr/products/monte-carlo/reviews)
  - [MySQL](https://www.g2.com/fr/products/mysql/reviews)
  - [ObjectWay SpA](https://www.g2.com/fr/products/objectway-spa/reviews)
  - [Oracle Database](https://www.g2.com/fr/products/oracle-database/reviews)
  - [Pega Platform](https://www.g2.com/fr/products/pega-platform/reviews)
  - [PostgreSQL](https://www.g2.com/fr/products/postgresql/reviews)
  - [PowerBI Portal](https://www.g2.com/fr/products/powerbi-portal/reviews)
  - [Prophecy](https://www.g2.com/fr/products/prophecy-prophecy/reviews)
  - [Qualtrics Customer Experience](https://www.g2.com/fr/products/qualtrics-customer-experience/reviews)
  - [React Native](https://www.g2.com/fr/products/react-native/reviews)
  - [Salesforce Agentforce](https://www.g2.com/fr/products/salesforce-agentforce/reviews)
  - [SAP Ariba](https://www.g2.com/fr/products/sap-ariba/reviews)
  - [SAP ECC](https://www.g2.com/fr/products/sap-ecc/reviews)
  - [SAS Viya](https://www.g2.com/fr/products/sas-sas-viya/reviews)
  - [Seamless (formally Seamless.AI)](https://www.g2.com/fr/products/seamless-formally-seamless-ai/reviews)
  - [ServiceNow IT Service Management](https://www.g2.com/fr/products/servicenow-it-service-management/reviews)
  - [Sigma](https://www.g2.com/fr/products/sigma-computing-sigma/reviews)
  - [Sisense](https://www.g2.com/fr/products/sisense/reviews)
  - [SnapLogic Intelligent Integration Platform (IIP)](https://www.g2.com/fr/products/snaplogic-intelligent-integration-platform-iip/reviews)
  - [Snowflake](https://www.g2.com/fr/products/snowflake/reviews)
  - [Spark](https://www.g2.com/fr/products/apache-spark/reviews)
  - [Spark SQL](https://www.g2.com/fr/products/spark-sql/reviews)
  - [SplashBI](https://www.g2.com/fr/products/splashbi/reviews)
  - [Spotfire Analytics](https://www.g2.com/fr/products/spotfire-analytics/reviews)
  - [Tableau](https://www.g2.com/fr/products/tableau/reviews)
  - [ThoughtSpot](https://www.g2.com/fr/products/thoughtspot/reviews)
  - [Visual Studio Code](https://www.g2.com/fr/products/visual-studio-code/reviews)
  - [Workday HCM](https://www.g2.com/fr/products/workday-hcm/reviews)

## Databricks Features
**Rapports**
- Interface des rapports
- Étapes pour répondre
- Graphiques et tableaux
- Cartes de score
- Tableaux

**Administration**
- Modélisation des données
- Recommandations
- Gestion des flux de travail
- Tableaux de bord et visualisations

**management**
- Rapports
- Audit

**déploiement**
- Flexibilité linguistique
- Flexibilité du cadre
- Gestion des versions
- Facilité de déploiement
- Évolutivité

**Système**
- Ingestion de données et querelles

**Préparation des données**
- Connecteurs
- Gouvernance des données

**Gestion des données**
- Intégration des données
- Compression des données
- Qualité des données
- Analyse de données intégrée
- Machine Learning dans la base de données
- Analyse du lac de données

**management**
- Dictionnaire de données
- Réplication des données
- Langage de requête
- Modélisation des données
- Analyse du rendement

**management**
- Glossaire métier
- Découverte de données
- Profilage des données
- Rapports et visualisation
- Lignage des données

**déploiement**
- Flexibilité linguistique
- Flexibilité du cadre
- Gestion des versions
- Facilité de déploiement
- Évolutivité

**Gestion des données**
- Intégration des données
- Métadonnées
- Libre-service
- Flux de travail automatisés

**Évolutivité et performances - Infrastructure d’IA générative**
- Haute disponibilité
- Évolutivité de l’entraînement des modèles
- Vitesse d’inférence

**Personnalisation - Constructeurs d'agents IA**
- Configuration de la langue naturelle
- Personnalisation du ton
- Garde-fous de sécurité

**Agentic AI - Plateformes DataOps**
- Exécution autonome des tâches
- Planification en plusieurs étapes
- Intégration inter-systèmes
- Apprentissage adaptatif
- Prise de décision

**Gestion du trafic et performance - Passerelles IA**
- Limitation de débit sensible aux jetons
- Mise en cache sémantique
- Routage multi-modèle et solutions de secours

**Développement de modèles**
- Prise en charge linguistique
- Glissez et déposez
- Algorithmes prédéfinis
- Formation sur modèle

**base de données**
- Collecte de données en temps réel
- Répartition des données
- Lac de données

**Transformation des données**
- Analyse en temps réel
- Interrogation de données

**conformité**
- Conformité des données sensibles
- Formation et lignes directrices
- Application des politiques
- Surveillance de la conformité

**Fonctionnalité**
- Extraction
- Transformation
- chargement
- Automatisation
- Évolutivité

**management**
- Catalogage
- Surveillance
- Gouvernant
- Registre des modèles

**Développement de modèles**
- Ingénierie des fonctionnalités

**Modélisation et fusion des données**
- Interrogation de données
- Filtrage des données
- Fusion de données

**Intégration**
- Intégration IA / ML
- Intégration de l’outil BI
- Intégration du lac de données

**Entretien**
- Migration des données
- Sauvegarde et restauration
- Environnement multi-utilisateurs

**Sécurité**
- Contrôle d’accès
- Gestion des rôles
- Gestion de la conformité

**Opérations**
- Métriques
- Gestion de l’infrastructure
- Collaboration

**Analytics**
- Capacités d’analyse
- Visualisations Dasboard

**Coût et efficacité - Infrastructure d’IA générative**
- Coût par appel d’API
- Flexibilité de l’allocation des ressources
- Efficacité énergétique

**Fonctionnalité - Constructeurs d'agents IA**
- Support omnicanal
- Agent Branding
- Capacités de réponse proactive
- Escalade humaine transparente

**Gouvernance et Observabilité - Passerelles IA**
- Confidentialité des données
- Suivi des coûts
- Sécurité centralisée des clés API

**Services d’apprentissage automatique/profond**
- Vision par ordinateur
- Traitement du langage naturel
- Génération de langage naturel
- Réseaux de neurones artificiels

**Intégrations**
- Intégration Hadoop
- Intégration de Spark

**Qualité des données**
- Préparation des données
- Répartition des données
- Unification des données

**Services d’apprentissage automatique/profond**
- Compréhension du langage naturel
- Apprentissage profond

**déploiement**
- Sur site
- Nuage

**Sécurité**
- Cryptage des données
- Contrôle d’accès utilisateur

**Maintenance**
- Gestion de la qualité des données
- Gestion des politiques

**management**
- Catalogage
- Surveillance
- Gouvernant

**Suivi et gestion**
- Observabilité des données
- Capacités de test

**IA générative**
- Génération de texte
- Résumé du texte

**Intégration et extensibilité - Infrastructure d’IA générative**
- Prise en charge multicloud
- Intégration du pipeline de données
- Prise en charge et flexibilité de l’API

**Données et analyses - Constructeurs d'agents IA**
- Analytique & Rapport
- Conscience contextuelle
- Conformité à la protection des données

**déploiement**
- Service géré
- Application
- Évolutivité

**Plate-forme**
- Mise à l’échelle de la machine
- Préparation des données
- Intégration de Spark

**Connectivité**
- Intégration Hadoop
- Intégration de Spark
- Analyse multi-sources
- Lac de données

**Performance**
- Évolutivité

**Déploiement dans le cloud**
- Prise en charge du cloud hybride
- Capacités de migration vers le cloud

**IA générative**
- Génération de texte
- Résumé du texte

**IA générative**
- Génération de texte
- Résumé du texte

**Sécurité et conformité - Infrastructure d’IA générative**
- RGPD et conformité réglementaire
- Contrôle d’accès basé sur les rôles
- Cryptage des données

**Intégration - Constructeurs d'agents IA**
- Automatisation du flux de travail
- Utilisation de l'API
- Interopérabilité des plateformes
- Intégration des données CRM

**Agentic AI - Plateformes d'analyse**
- Exécution autonome des tâches
- Planification en plusieurs étapes
- Intégration inter-systèmes
- Apprentissage adaptatif
- Interaction en Langage Naturel
- Assistance proactive
- Prise de décision

**Libre-service**
- Champs calculés
- Filtrage des colonnes de données
- Découverte de données
- Rechercher
- Collaboration / Flux de travail
- Automodelage

**Traitement**
- Traitement dans le cloud
- Traitement de la charge de travail

**Opérations**
- Visualisation des données
- Flux de travail de données
- Découverte régie
- Analyse intégrée
- Cahiers

**Sécurité**
- Gouvernance des données
- Sécurité des données

**IA générative**
- Génération de texte
- Résumé du texte
- Synthèse de texte en image

**IA générative**
- Génération de texte
- Résumé du texte

**Facilité d’utilisation et prise en charge - Infrastructure d’IA générative**
- Qualité de la documentation
- Activité communautaire

**IA agentique - Gouvernance des données**
- Exécution autonome des tâches
- Planification en plusieurs étapes
- Intégration inter-systèmes
- Apprentissage adaptatif
- Interaction en Langage Naturel
- Prise de décision

**Déploiement et Intégration - Plateformes d'Analytique**
- Constructeur de tableau de bord sans code
- Planification et automatisation des rapports
- Analytique intégrée et marque blanche
- Connectivité de la source de données

**Analytique avancée**
- Analyse prédictive
- Visualisation des données
- Big Data Services

**IA générative**
- Génération de texte
- Résumé du texte

**Agentic AI - Plateformes de science des données et d'apprentissage automatique**
- Exécution autonome des tâches
- Planification en plusieurs étapes
- Intégration inter-systèmes
- Apprentissage adaptatif
- Interaction en Langage Naturel
- Assistance proactive
- Prise de décision

**Performance et évolutivité - Plateformes d'analyse**
- Gestion de grandes quantités de données et vitesse de requête
- Support utilisateur simultané

**Analytique Avancée & Modélisation - Plateformes d'Analytique**
- Modélisation et gouvernance des données
- Intégration de cahier et de script
- Modèles prédictifs et statistiques intégrés

**Capacités d'IA agentiques - Plateformes d'analyse**
- Informations et récits générés automatiquement
- Requêtes en langage naturel
- Surveillance proactive des indicateurs clés de performance et alertes
- Agents IA pour suivis analytiques

**Intelligence Personnalisée - Plateformes d'Analyse**
- Apprentissage comportemental pour le raffinement contextuel des requêtes
- Personnalisation des informations basée sur les rôles
- Analytique conversationnelle et basée sur des invites

**Rapports de construction**
- Transformation des données
- Modélisation des données
- Conception de rapports WYSIWYG
- API d’intégration

**Plate-forme**
- Assistance aux utilisateurs mobiles
- Personnalisation
- Gestion des utilisateurs, des rôles et des accès
- Internationalisation
- Bac à sable / Environnements de test
- Performance et fiabilité
- Étendue des applications des partenaires

## Top Databricks Alternatives
  - [Cloudera Data Platform](https://www.g2.com/fr/products/cloudera-cloudera-data-platform/reviews) - 4.1/5.0 (131 reviews)
  - [Snowflake](https://www.g2.com/fr/products/snowflake/reviews) - 4.6/5.0 (705 reviews)
  - [Teradata Vantage](https://www.g2.com/fr/products/teradata-teradata-vantage/reviews) - 4.3/5.0 (355 reviews)

