Recensioni e Dettagli del Prodotto Databricks

Databricks è l'azienda di Data e AI. Più di 20.000 organizzazioni in tutto il mondo — tra cui adidas, AT&T, Bayer, Block, Mastercard, Rivian, Unilever e oltre il 60% delle aziende Fortune 500 — si affidano a Databricks per costruire e scalare app di dati e AI, analisi e agenti. Con sede a San Francisco e oltre 30 uffici in tutto il mondo, Databricks offre una piattaforma unificata di Data Intelligence che include Agent Bricks, Lakeflow, Lakehouse, Lakebase e Unity Catalog.

Sito web del prodotto

Venditore

Databricks Inc.

Discussioni

Comunità Databricks

Lingue supportate

German, English, French, Italian, Japanese, Korean, Portuguese

Panoramica di

Colette Chavalia

Valore a colpo d'occhio

Medie basate su recensioni di utenti reali.

Tempo di Implementazione

4 mesi

Visualizza Maggiori Informazioni sui Prezzi

Media di Databricks

Demo di Databricks - Automated ETL processing

Once ingested, raw data needs transforming so that it’s ready for analytics and AI. Databricks provides powerful ETL capabilities for data engineers, data scientists and analysts with Delta Live Tables (DLT).

Demo di Databricks - Reliable workflow orchestration

Databricks Workflows is the fully managed orchestration service for all your data, analytics and AI that is native to your Lakehouse Platform. Orchestrate diverse workloads for the full lifecycle including Delta Live Tables and Jobs for SQL, Spark, notebooks, dbt, ML models and more.

Demo di Databricks - End-to-end observability and monitoring

The Lakehouse Platform gives you visibility across the entire data and AI lifecycle so data engineers and operations teams can see the health of their production workflows in real time, manage data quality and understand historical trends. In Databricks Workflows you can access dataflow graphs an...

Demo di Databricks - Security and governance at scale

Delta Lake reduces risk by enabling fine-grained access controls for data governance, functionality typically not possible with data lakes.

Demo di Databricks - Automated and trusted data engineering

Simplify data engineering with Delta Live Tables – an easy way to build and manage data pipelines for fresh, high-quality data on Delta Lake.

Demo di Databricks - Eliminate resource management with serverless compute

Databricks SQL serverless removes the need to manage, configure or scale cloud infrastructure on the Lakehouse, freeing up your data team for what they do best.

Le recensioni di G2 sono autentiche e verificate.

Ecco come.

Vijayaramuprawin V.

Sr. Cloud and DevOps Engineer

Mid-Market (51-1000 dip.)

4/1/2026

Partner commerciale del venditore o concorrente del venditore, non incluso nei punteggi G2.

"All-in-One Platform That Helps Us Iterate Fast and Deploy with Confidence"

5/5

Cosa ti piace di più di Databricks?

We use Databricks daily as our core data platform for building and running pipelines across a medallion architecture, from extracting data out of SAP and Arkieva all the way to reporting-ready datasets. The notebook experience is intuitive, the feature set is massive, and Asset Bundles have made our CI/CD story with Azure DevOps really solid. Integration with cloud services was smooth, and once things are set up they just work. The learning curve can be steep for newer team members, especially around things like Unity Catalog and DABs, and costs can creep up if you're not staying on top of cluster configurations. Support is decent and the docs are strong enough that we rarely need to open a ticket. Overall, it's a powerful platform that does a lot under one roof, and it's hard to imagine our data engineering workflow without it. Recensione raccolta e ospitata su G2.com.

Cosa non ti piace di Databricks?

The cost can creep up fast if you're not careful with cluster sizing and job configurations, so it takes some effort to keep things optimized. Also, the learning curve for newer team members can be steep, especially around things like Asset Bundles, Unity Catalog, and getting the CI/CD pieces wired up properly. Recensione raccolta e ospitata su G2.com.

Quali problemi sta risolvendo Databricks e come ti sta beneficiando?

Databricks is solving the problem of having fragmented data spread across multiple systems like SAP and Arkieva by giving us one unified platform to extract, transform, and serve it all. That means our business teams get clean, reliable, reporting-ready data without us having to juggle a bunch of separate tools, and we can deploy and manage everything consistently across environments with confidence. Recensione raccolta e ospitata su G2.com.

Dharun T.

Senior Data Engineer

Mid-Market (51-1000 dip.)

4/1/2026

"Streamlined, Collaborative Data Workflows with Powerful Performance"

5/5

Cosa ti piace di più di Databricks?

What I like most about Databricks is how it streamlines the entire data workflow by bringing processing, analysis, and machine learning into one platform. The collaborative notebook environment makes it easy to share code, context, and reasoning with teammates, which helps everyone stay aligned. It also performs strongly on large datasets while abstracting away most of the cluster management, so I can focus on solving the problem rather than dealing with infrastructure. On top of that, centralized access control and clear visibility into data usage support responsible data governance, offering a solid balance between power and ease of use. Recensione raccolta e ospitata su G2.com.

Cosa non ti piace di Databricks?

Databricks has a few downsides, although many of them feel more like trade-offs than outright negatives. My biggest concern is cost: if clusters aren’t managed carefully, expenses can climb quickly, even though the platform can scale very efficiently when it’s tuned properly. There’s also a real learning curve with Spark and distributed computing concepts, and debugging or performance tuning can be more involved than with simpler tools. Lastly, because it’s a managed service, you give up some low-level control compared with self-hosted systems, but the upside is that it takes a lot of the operational and infrastructure work off your plate. Recensione raccolta e ospitata su G2.com.

Balakumaran R.

Data Team Lead

Enterprise (> 1000 dip.)

3/31/2026

Partner commerciale del venditore o concorrente del venditore, non incluso nei punteggi G2.

"Dal Caos di Hive al Catalogo di Unità - Vale Ogni DBU"

5/5

Cosa ti piace di più di Databricks?

Unity Catalog è stato il singolo valore aggiunto più grande per la nostra migrazione aziendale. Siamo passati da un'architettura Hive Metastore a Unity Catalog e abbiamo ottenuto governance centralizzata, tracciamento della lineage e controllo degli accessi dettagliato su tutti i nostri asset di dati senza dover integrare strumenti di terze parti. Per un'organizzazione multi-dominio (finanza, produzione, catena di approvvigionamento, approvvigionamento), avere un unico catalogo che applica una denominazione e permessi coerenti attraverso i livelli bronzo, argento, oro e platino ci ha risparmiato settimane di lavoro manuale sulle policy.

UI/UX: L'esperienza del notebook con Spark SQL e PySpark inline, combinata con il browser dei file del workspace, rende semplice per il nostro team sviluppare e testare trasformazioni in modo iterativo. L'editor SQL per query ad-hoc contro le tabelle di Unity Catalog è pulito e reattivo.

Integrazioni: Il supporto nativo per Delta Lake significa che non gestiamo conversioni di formato. L'integrazione con Azure Key Vault tramite secret scopes (dbutils.secrets.get) mantiene le credenziali fuori dal codice. L'integrazione ADF per l'orchestrazione nel nostro ambiente V1 è stata senza problemi, e i Databricks Asset Bundles (DAB) per il deployment V2 ci offrono un percorso CI/CD pulito con configurazioni databricks.yml mirate a dev/qa/prod senza scripting personalizzato.

Prestazioni: Passare a CTE rispetto a viste temporanee nei nostri notebook Gold ha ridotto notevolmente la pressione sulla memoria del cluster. La possibilità di dimensionare correttamente i cluster per ambiente (1 worker per dev, 3 per produzione) con nodi Standard_D4ds_v5 mantiene i costi prevedibili pur mantenendo le prestazioni per i nostri carichi di lavoro ETL batch.

Prezzi/ROI: Il modello di calcolo pay-as-you-go abbinato a cluster in modalità di sicurezza per singolo utente significa che non stiamo sovrapponendo le risorse. Consolidare il nostro livello ETL, di governance e di BI in un'unica piattaforma ha eliminato le licenze per strumenti separati di catalogazione, orchestrazione e qualità dei dati.

AI/Intelligenza (Genie): Genie Spaces è stata una vittoria inaspettata. I nostri analisti aziendali in finanza e catena di approvvigionamento possono porre domande in linguaggio naturale contro tabelle Gold/Platinum curate senza scrivere SQL. Ha ridotto il numero di richieste di report ad-hoc che arrivano al team dei dati, offrendo agli utenti di dominio un percorso self-service che rispetta comunque i permessi di Unity Catalog.

Supporto/Onboarding: La documentazione è completa e l'approccio basato sulle competenze per l'apprendimento (bundle, Unity Catalog, lavori, SQL) si adatta bene a come il nostro team lavora effettivamente. L'onboarding di nuovi ingegneri all'architettura V2 ha richiesto circa la metà del tempo rispetto a V1 perché le convenzioni della piattaforma (architettura medaglione, asset bundle, denominazione del catalogo) sono ben documentate e coerenti. Recensione raccolta e ospitata su G2.com.

Cosa non ti piace di Databricks?

UI/UX: L'editor del notebook sembra ancora indietro rispetto agli IDE dedicati. Nessuna ricerca nativa su più file, supporto limitato per il refactoring e l'interfaccia utente dell'integrazione git è goffa per i team che gestiscono dozzine di notebook attraverso pacchetti di flussi di lavoro. Abbiamo finito per fare tutto lo sviluppo reale in VS Code e trattare lo spazio di lavoro Databricks come un obiettivo di distribuzione, il che aggiunge attrito. Il browser dei file dello spazio di lavoro non gestisce bene le strutture delle cartelle quando hai più di 50 notebook organizzati per dominio: non ci sono filtri, tag o preferiti.

Integrazioni: I Databricks Asset Bundles (DAB) sono un passo avanti, ma la documentazione presenta lacune per distribuzioni complesse multi-bundle. Gestiamo un bundle Global_Utilities condiviso da cui dipendono altri bundle di flussi di lavoro, e far funzionare in modo affidabile i riferimenti tra bundle attraverso gli obiettivi dev/qa/prod ha richiesto molti tentativi ed errori. L'integrazione ADF-to-Databricks funziona, ma il debug delle esecuzioni di pipeline fallite significa saltare tra l'interfaccia di monitoraggio ADF e le esecuzioni di job Databricks senza una vista unificata. Una stretta integrazione tra orchestrazione e monitoraggio del calcolo farebbe risparmiare ore di risoluzione dei problemi.

Prestazioni: I tempi di avvio a freddo dei cluster rimangono un punto dolente per i flussi di lavoro di sviluppo. Avviare un cluster a nodo singolo Standard_D4ds_v5 richiede 4-7 minuti, il che interrompe il flusso quando si sta iterando sulla logica del notebook. Il calcolo serverless aiuta ma non è ancora disponibile per tutti i tipi di carico di lavoro, e il premio di costo è difficile da giustificare per ambienti di sviluppo/test.

Prezzi/ROI: Il modello di prezzo DBU è opaco per la pianificazione della capacità. Stimare i costi mensili per un progetto con oltre 30 job programmati, cluster di sviluppo interattivi e query SQL warehouse richiede la costruzione di fogli di calcolo personalizzati perché gli strumenti di gestione dei costi integrati non forniscono una previsione chiara per flusso di lavoro o dominio. Siamo stati sorpresi da picchi di costo da job che sono durati più del previsto senza un modo semplice per impostare avvisi di budget per job.

Supporto/Onboarding: I tempi di risposta del supporto aziendale sono incoerenti. Problemi critici con i permessi di Unity Catalog durante la nostra migrazione hanno richiesto 3-5 giorni lavorativi per la triage iniziale, il che ha bloccato la nostra timeline di distribuzione. I forum della comunità sono utili per modelli comuni, ma per i casi limite di Unity Catalog (lineage cross-catalog, eredità complessa dei permessi), la base di conoscenza è scarsa.

AI/Intelligenza: Genie è promettente ma ancora grezzo per l'uso in produzione. Ha difficoltà con join su più di 3-4 tabelle, a volte genera SQL errato contro il nostro livello Gold, e non c'è un modo semplice per curare o correggere le sue risposte per migliorare l'accuratezza nel tempo. I nostri utenti aziendali si sono entusiasmati, l'hanno provato, hanno ottenuto risposte sbagliate su domande moderatamente complesse e hanno perso fiducia. Un ciclo di feedback in cui gli esperti di dominio possono segnalare e correggere gli output di Genie lo renderebbe veramente pronto per la produzione. Recensione raccolta e ospitata su G2.com.

Quali problemi sta risolvendo Databricks e come ti sta beneficiando?

Frammentazione della Governance dei Dati → Catalogo Unificato Abbiamo avuto difficoltà con un ambiente Hive Metastore dove la proprietà delle tabelle, il controllo degli accessi e la tracciabilità erano gestiti attraverso un insieme di documentazione manuale e script personalizzati. Dopo aver implementato Unity Catalog, ora abbiamo una governance centralizzata su 4 livelli di catalogo (bronzo, argento, oro, platino) che coprono 6 domini aziendali. Ciò che richiedeva un data steward a tempo pieno per essere tracciato manualmente è ora applicato automaticamente attraverso permessi a livello di catalogo e tracciabilità. Questo ha ridotto il nostro tempo di provisioning degli accessi da giorni a meno di un'ora per richiesta.

Logica ETL Isolata → Architettura Medallion Standardizzata Prima di Databricks, i nostri pipeline ETL erano incoerenti — team diversi scrivevano trasformazioni in modo diverso, senza utilità o modelli condivisi. Abbiamo costruito un framework standardizzato (Batch_Utilities.py) con funzioni riutilizzabili per la validazione degli schemi, operazioni di merge, controlli di qualità dei dati e gestione delle colonne di audit. Ogni notebook in tutti i domini ora segue la stessa struttura a 7 celle. Questo ha ridotto il tempo di sviluppo di nuovi notebook da 2-3 giorni a circa 4 ore, e l'onboarding di un nuovo sviluppatore al modello richiede un solo pomeriggio invece di una settimana.

Fallimenti Costosi di Aggiornamento dei Report → Orchestrazione Affidabile dei Pipeline Avevamo problemi ricorrenti con i report Power BI che estraevano dati obsoleti o incompleti perché i lavori a monte fallivano silenziosamente. Con Databricks Jobs e il tracciamento dei pipeline basato su metadati (stato del pipeline, timestamp di inizio/fine registrati per esecuzione), ora intercettiamo i fallimenti al livello di trasformazione prima che si propaghino ai report. I problemi di freschezza dei dati dei report sono diminuiti di circa l'80%, e il nostro team finanziario ha smesso di programmare riunioni di "verifica dei dati" che consumavano 3-4 ore a settimana.

Caos di Distribuzione Multi-Ambiente → Pacchetti di Asset Distribuire notebook tra dev, QA e produzione comportava copie manuali di file e modifiche di configurazione specifiche per l'ambiente — soggetto a errori e lento. I Pacchetti di Asset di Databricks ci hanno fornito configurazioni databricks.yml dichiarative con sostituzione delle variabili per target. Una distribuzione che richiedeva 45 minuti di passaggi manuali ora viene eseguita in meno di 5 minuti tramite CLI. Distribuiamo con fiducia perché la stessa definizione del pacchetto è convalidata prima di arrivare in produzione.

Gap di Analisi Self-Service → Genie + Livello Platinum Gli analisti aziendali nella catena di approvvigionamento e nella finanza erano completamente dipendenti dal team dei dati per qualsiasi analisi ad hoc. Costruendo tabelle Platinum denormalizzate ottimizzate per il reporting e esponendole tramite Genie Spaces, abbiamo abilitato le query self-service in linguaggio naturale. L'adozione iniziale ha ridotto le richieste di report ad hoc al team dei dati di circa il 30%, liberando capacità ingegneristica per lo sviluppo di nuove funzionalità.

Visibilità dei Costi → Calcolo Dimensionato Correttamente Stavamo sovra-provisionando i cluster perché non avevamo una chiara visione dell'utilizzo effettivo. Standardizzando sui nodi Standard_D4ds_v5 con conteggi di lavoratori specifici per ambiente (1 per dev/QA, 3 per produzione) e modalità di sicurezza per singolo utente, abbiamo ridotto la nostra spesa mensile per il calcolo di circa il 25% rispetto al modello di cluster condiviso che gestivamo in V1. Recensione raccolta e ospitata su G2.com.

Sabareeswar K.

Data Engineer

Enterprise (> 1000 dip.)

4/1/2026

"Databricks: Intuitive, Unified Platform with Seamless Integrations and Fast Support"

5/5

Cosa ti piace di più di Databricks?

As a data engineer, Databricks has become my go-to platform for end-to-end data work. The ease of use is outstanding notebooks, Delta Live Tables, and Genie all have intuitive interfaces that reduce rampup time significantly. Implementation was smooth thanks to excellent documentation and responsive customer support that actually resolves issues fast. I use it daily, and the sheer number of features from Unity Catalog to AI/BI Genie keeps growing. Integration with cloud storage, BI tools, and ML frameworks is seamless, making it a true unified platform. Recensione raccolta e ospitata su G2.com.

Cosa non ti piace di Databricks?

One challenge is the lack of cost transparency at a granular job level it's difficult to pinpoint exactly which pipeline or notebook is driving up DBU consumption without investing in custom monitoring. Auto scaling clusters, while powerful, can silently balloon costs overnight if not carefully configured with proper limits. Additionally, the SQL warehouse tiers can be confusing to choose from upfront, making budget planning tricky for teams. A built in cost allocation dashboard per job or user would be a huge improvement for day to day cost governance. Recensione raccolta e ospitata su G2.com.

Quali problemi sta risolvendo Databricks e come ti sta beneficiando?

Databricks has eliminated the silos between our data engineering, analytics, and ML teams. Previously, we juggled multiple tools for ingestion, transformation, and reporting. Now everything lives in one lakehouse. Genie specifically has been a game-changer business stakeholders can ask natural language questions directly against our data without writing SQL, which dramatically reduces ad-hoc request bottlenecks for our engineering team. Decision making is faster, data is more democratized, and we've cut our reporting pipeline overhead by a significant margin. Recensione raccolta e ospitata su G2.com.

Risposta da Janelle Glover di Databricks

modifica

It's great to hear that Databricks has helped eliminate silos between your data engineering, analytics, and ML teams. We're pleased that Genie has been a game-changer for your business stakeholders. We also understand the challenges you've mentioned regarding cost transparency and auto-scaling clusters. We are continuously working to improve our platform and will take your suggestions into consideration for future enhancements.

Isla H.

Data Engineer

Mid-Market (51-1000 dip.)

4/1/2026

"Databricks semplifica le pipeline di dati end-to-end con flussi di lavoro stabili e scalabili"

4.5/5

Cosa ti piace di più di Databricks?

Databricks si distingue per la sua capacità di gestire flussi di lavoro dati end-to-end senza la necessità di strumenti multipli. Posso ingerire dati grezzi, trasformarli e pubblicare dataset curati dallo stesso ambiente. Funzionalità come la pianificazione dei lavori, i cluster con scalabilità automatica e le tabelle Delta rendono le pipeline più stabili e facili da mantenere nel tempo. Mi piace anche come l'integrazione del controllo di versione mantenga lo sviluppo organizzato, specialmente quando più ingegneri lavorano sulle stesse pipeline. Recensione raccolta e ospitata su G2.com.

Cosa non ti piace di Databricks?

Una sfida è mantenere l'uso del calcolo sotto controllo, specialmente quando le pipeline si espandono o vengono eseguite più frequentemente. Senza un monitoraggio adeguato, i costi possono aumentare più rapidamente del previsto. Inoltre, il debug dei lavori falliti può a volte richiedere tempo, in particolare quando si affrontano dipendenze complesse o problemi a livello di Spark. La piattaforma è potente, ma richiede un certo livello di comprensione tecnica per essere ottimizzata completamente. Recensione raccolta e ospitata su G2.com.

Quali problemi sta risolvendo Databricks e come ti sta beneficiando?

Databricks aiuta a risolvere il problema dei sistemi di dati frammentati fornendo un unico luogo per elaborare e gestire grandi set di dati. In precedenza, avevamo strumenti separati per l'ingestione, la trasformazione e l'archiviazione, il che creava ritardi e incoerenze. Con Databricks, le pipeline sono più affidabili, i controlli di qualità dei dati sono più facili da applicare e i cicli di distribuzione sono più veloci. Ha ridotto lo sforzo manuale nella gestione delle pipeline e ci ha permesso di scalare l'elaborazione dei dati senza preoccuparci costantemente dell'infrastruttura. Recensione raccolta e ospitata su G2.com.

Risposta da Janelle Glover di Databricks

modifica

It's fantastic to hear how Databricks has helped streamline your data processing and management, reducing manual effort and improving data quality. We're committed to providing a platform that enables efficient and scalable data processing, and we're thrilled to hear about the positive impact it's had on your workflows.

Karuppusamy V.

Data and BI Engineer

Enterprise (> 1000 dip.)

3/31/2026

Partner commerciale del venditore o concorrente del venditore, non incluso nei punteggi G2.

"Databricks rende i flussi di lavoro dei dati end-to-end veloci, collaborativi e facili"

5/5

Cosa ti piace di più di Databricks?

Quello che mi piace di più di Databricks è come semplifica l'intero flusso di lavoro dei dati. Invece di passare tra diversi strumenti per l'elaborazione dei dati, l'analisi e il machine learning, tutto è disponibile in un unico posto. L'ambiente notebook rende la collaborazione davvero fluida, sembra naturale lavorare con i compagni di squadra, condividere codice e spiegare la logica senza sforzi extra.

Un'altra cosa che apprezzo è la performance. Lavorare con grandi set di dati può essere solitamente doloroso, ma Databricks lo gestisce in modo efficiente in background. Non devi preoccuparti troppo di gestire i cluster o ottimizzare tutto manualmente, funziona semplicemente la maggior parte delle volte, il che ti permette di concentrarti di più sulla risoluzione del problema reale piuttosto che sulla gestione dell'infrastruttura.

Quello che spicca anche è il modo in cui gestisce la governance e l'organizzazione dei dati. Con funzionalità come il controllo centralizzato degli accessi e una migliore visibilità sull'uso dei dati, diventa molto più facile gestire i dati in modo responsabile, specialmente nei progetti più grandi. Nel complesso, offre un buon equilibrio tra potenza e facilità d'uso, ed è per questo che mi piace lavorarci. Recensione raccolta e ospitata su G2.com.

Cosa non ti piace di Databricks?

Una cosa che non mi piace particolarmente di Databricks è che può diventare costoso piuttosto rapidamente, specialmente se i cluster non sono gestiti correttamente. Se dimentichi di terminare i cluster o esegui carichi di lavoro pesanti senza ottimizzazione, i costi possono aumentare senza molta visibilità all'inizio. Per i team che stanno ancora imparando o sperimentando, questo può diventare una preoccupazione.

Un altro svantaggio è che il debug può a volte sembrare un po' complicato, in particolare quando si lavora con lavori distribuiti. Gli errori non sono sempre chiari e rintracciare i problemi su più nodi può richiedere più tempo rispetto a lavorare in un ambiente locale più semplice. Richiede un certo livello di esperienza per comprendere rapidamente e risolvere i problemi.

Inoltre, sebbene la piattaforma sia potente, ha una certa curva di apprendimento per i principianti. Concetti come la configurazione dei cluster, la pianificazione dei lavori e la governance dei dati non sono sempre molto intuitivi all'inizio. Ci vuole un po' di tempo pratico prima di sentirsi completamente a proprio agio nel navigare e utilizzare tutto in modo efficiente. Recensione raccolta e ospitata su G2.com.

Quali problemi sta risolvendo Databricks e come ti sta beneficiando?

Ciò che Databricks risolve veramente è il problema di gestire dati su larga scala senza rendere il processo eccessivamente complesso. In passato, lavorare con big data significava affrontare diversi strumenti, gestire l'infrastruttura e spendere molto tempo solo per impostare le cose. Databricks semplifica tutto ciò portando l'ingegneria dei dati, l'analisi e il machine learning in un unico posto, così l'attenzione si sposta più verso la risoluzione di problemi aziendali reali invece di gestire i sistemi.

Affronta anche problemi di prestazioni e scalabilità. Quando si lavora con enormi volumi di dati, i sistemi tradizionali spesso faticano o rallentano. Databricks gestisce questo in modo efficiente in background, permettendo ai carichi di lavoro di scalare senza molto sforzo manuale. Per me, questo significa che posso elaborare grandi set di dati più velocemente ed eseguire trasformazioni o query senza preoccuparmi costantemente dell'ottimizzazione delle prestazioni.

Un altro grande problema che risolve è la collaborazione e la gestione dei dati. In molti progetti, i team lottano con il controllo delle versioni, la gestione degli accessi e il mantenimento della coerenza dei dati. Databricks rende più facile collaborare, tracciare le modifiche e controllare chi può accedere a cosa. Questo mi aiuta a lavorare più agevolmente con gli altri, riduce gli errori e garantisce che i dati che sto utilizzando siano affidabili e ben governati. Recensione raccolta e ospitata su G2.com.

Risposta da Janelle Glover di Databricks

modifica

We're glad to hear that you find Databricks to be a comprehensive and efficient platform for managing data workflows. We understand your concerns about cost management and the learning curve for beginners, and we will share your feedback with our team to further review.

Harshavarthini G.

Data Architect

Enterprise (> 1000 dip.)

3/31/2026

Partner commerciale del venditore o concorrente del venditore, non incluso nei punteggi G2.

"Databricks unifica dati, analisi e ML per flussi di lavoro scalabili nel Lakehouse"

5/5

Cosa ti piace di più di Databricks?

Databricks è particolarmente utile perché riunisce ingegneria dei dati, analisi e machine learning in un'unica piattaforma unificata, riducendo la necessità di gestire più strumenti separati. Costruito su Apache Spark, può elaborare rapidamente enormi set di dati e scalare senza problemi man mano che i carichi di lavoro crescono, rendendolo una scelta forte per i casi d'uso di big data. Supporta anche notebook collaborativi dove i team possono lavorare insieme in linguaggi come Python e SQL, il che facilita la collaborazione efficace tra data scientist e ingegneri.

Con la sua architettura lakehouse alimentata da Delta Lake, Databricks combina la flessibilità dei data lake con l'affidabilità dei data warehouse, contribuendo a garantire una migliore coerenza e prestazioni dei dati. Inoltre, si integra con strumenti come MLflow per semplificare il ciclo di vita del machine learning da un capo all'altro, dalla sperimentazione al deployment. In generale, Databricks semplifica i flussi di lavoro complessi dei dati, migliora le prestazioni e aiuta le organizzazioni a costruire soluzioni scalabili di dati e AI in modo più efficiente. Recensione raccolta e ospitata su G2.com.

Cosa non ti piace di Databricks?

Databricks ha alcune limitazioni, anche se molte di esse sembrano più compromessi che veri e propri aspetti negativi. Un inconveniente frequentemente citato è il costo: sebbene la piattaforma sia flessibile e scalabile, le spese possono aumentare rapidamente se i cluster non vengono gestiti con attenzione. Allo stesso tempo, quel costo spesso riflette la sua capacità di gestire carichi di lavoro molto grandi in modo efficiente quando è ottimizzato correttamente.

Un'altra considerazione è la curva di apprendimento, soprattutto per i principianti che non hanno familiarità con Apache Spark o i sistemi distribuiti. Quella complessità può essere impegnativa all'inizio, ma porta anche il vantaggio di potenti capacità una volta che ci si sente a proprio agio con essa. Alcuni utenti trovano anche che il debug e l'ottimizzazione delle prestazioni siano meno diretti rispetto a strumenti più semplici; tuttavia, Databricks offre funzionalità di monitoraggio e ottimizzazione dettagliate che possono rendere questi compiti più facili nel tempo.

Infine, poiché è una piattaforma gestita, può esserci una sensazione di controllo ridotto rispetto ai sistemi completamente autogestiti. In cambio, elimina gran parte dell'onere operativo che deriva dalla gestione dell'infrastruttura. Nel complesso, sebbene queste aree possano essere viste come gli aspetti "meno utili", sono spesso bilanciate dalla scalabilità, integrazione e guadagni di produttività della piattaforma. Recensione raccolta e ospitata su G2.com.

Quali problemi sta risolvendo Databricks e come ti sta beneficiando?

Databricks aiuta a risolvere la sfida dei dati frammentati e dei flussi di lavoro disconnessi attraverso diversi settori aziendali fornendo una piattaforma unificata di lakehouse. Nel mio ruolo di ingegnere dei dati, questo mi permette di consolidare i dati da diverse fonti in un unico sistema affidabile utilizzando Apache Spark per l'elaborazione scalabile e Delta Lake per garantire la qualità e la coerenza dei dati. Questo riduce significativamente la complessità delle pipeline, migliora l'affidabilità e consente una consegna più rapida di dati puliti e governati ai team a valle. Di conseguenza, sono in grado di supportare i casi d'uso di analisi e apprendimento automatico in modo più efficiente, riducendo al minimo il sovraccarico operativo e migliorando la produttività complessiva dell'organizzazione. Recensione raccolta e ospitata su G2.com.

Risposta da Janelle Glover di Databricks

modifica

Thank you for sharing your positive experiences with Databricks. It's great to hear that the platform's ability to bring together data engineering, analytics, and machine learning in a single unified platform is benefiting your organization. We understand the trade-offs and challenges you've mentioned, and we're continuously working on these parts of our platform.

Demetrius A.

Data Engineer

Mid-Market (51-1000 dip.)

3/31/2026

"Databricks veloce e senza interruzioni per pipeline di Big Data e analisi in un unico posto"

4.5/5

Cosa ti piace di più di Databricks?

Quello che amo di più di Databricks è quanto tutto sia veloce e connesso. Rispetto ad altre piattaforme, gestisce pipeline di big data pesanti senza alcuna difficoltà. Ma la parte migliore è quanto sia facile utilizzare quei dati una volta elaborati. Che io debba costruire un rapido dashboard analitico o addestrare modelli di machine learning personalizzati specifici per i nostri dati, tutto si connette senza problemi. Elimina semplicemente il mal di testa di spostare i dati e ti permette di fare tutto in un unico posto. Recensione raccolta e ospitata su G2.com.

Cosa non ti piace di Databricks?

Se dovessi scegliere cosa non mi piace, si riduce principalmente al costo e a quanto possa essere complesso.

Innanzitutto, può diventare costoso molto rapidamente. Se non stai attento a gestire i tuoi cluster di calcolo e a spegnerli quando hai finito, le bollette possono aumentare senza che te ne accorga.

In secondo luogo, a volte può sembrare eccessivo per compiti più semplici. Poiché è costruito per gestire grandi quantità di dati, dover scavare tra complicati registri di errore quando qualcosa si rompe può essere un vero mal di testa rispetto all'uso di strumenti più leggeri. Recensione raccolta e ospitata su G2.com.

Risposta da Janelle Glover di Databricks

modifica

We're thrilled to hear that you find Databricks fast and seamless for handling big data pipelines and analytics. We understand your concerns about cost and complexity, and we are continuously working to optimize these aspects of our platform to address these challenges.

Hirlekha M.

AI/ ML Technical Lead

Mid-Market (51-1000 dip.)

3/30/2026

"Piattaforma ML Unificata Che Rimuove l'Atrito dell'Infrastruttura"

5/5

Cosa ti piace di più di Databricks?

L'esperienza della piattaforma unificata è davvero difficile da battere: avere MLflow per il tracciamento degli esperimenti, Unity Catalog per la governance, la ricerca vettoriale e gli endpoint serverless tutti in un unico posto elimina gran parte dell'attrito infrastrutturale. Le pipeline di ingegneria delle caratteristiche e il deployment dei modelli sembrano coesi piuttosto che assemblati insieme. Il flusso di lavoro ibrido SQL warehouse + notebook rende anche facile il passaggio tra l'ingegneria dei dati e il lavoro di ML senza cambiare strumenti. Recensione raccolta e ospitata su G2.com.

Cosa non ti piace di Databricks?

Gli endpoint serverless presentano alcune difficoltà — l'inizializzazione del contesto Spark si comporta diversamente rispetto ai cluster interattivi, il che può causare errori silenziosi se non si presta attenzione a dove si inizializzano le cose. La latenza di avvio a freddo sui serverless è anche evidente per gli endpoint di produzione a basso traffico. La documentazione su alcune delle funzionalità più recenti (come le configurazioni degli indici di ricerca vettoriale) tende a essere in ritardo rispetto al comportamento effettivo del prodotto, quindi si finisce per fare molti tentativi ed errori. Recensione raccolta e ospitata su G2.com.

Quali problemi sta risolvendo Databricks e come ti sta beneficiando?

Utilizziamo Databricks per consolidare lo sviluppo di modelli di ML, l'ingegneria delle caratteristiche e il deployment per una piattaforma di carte e pagamenti — un lavoro che in precedenza richiedeva di destreggiarsi tra strumenti separati per l'elaborazione dei dati, l'addestramento e il servizio. L'ambiente unificato significa che i nostri ingegneri di ML possono passare dai dati di transazione grezzi a un modello di previsione del churn distribuito senza lasciare la piattaforma. Il tracciamento di MLflow mantiene gli esperimenti riproducibili e Unity Catalog ci fornisce la storia della governance dei dati di cui il nostro cliente bancario ha bisogno. Ha ridotto significativamente la quantità di coordinamento necessario che accompagna le pipeline di ML multi-strumento. Recensione raccolta e ospitata su G2.com.

Risposta da Janelle Glover di Databricks

modifica

It's great to hear how Databricks has streamlined your ML workflows and reduced coordination overhead. We appreciate your feedback on the serverless endpoints and documentation, and we'll strive to address these issues to enhance your experience with our platform.

Mukundan R.

Data Engineer

Mid-Market (51-1000 dip.)

3/30/2026

"Da 1 Ora a 10 Minuti: Come Databricks Ha Modernizzato il Nostro Flusso di Lavoro"

4.5/5

Cosa ti piace di più di Databricks?

Usavamo ADF per ottenere dati da SQL Server e poi lavorarci su in Databricks prima di inserirli in Salesforce. L'intero processo richiedeva più di un'ora perché ADF aggiungeva lavoro extra.

Ora tutto avviene all'interno di Databricks. Trasformiamo i dati grezzi in Databricks e li inseriamo in Salesforce tutto in un unico posto. Questo ha reso l'intero processo molto più veloce, ora richiede 10 minuti. Questo è un miglioramento rispetto a quello che avevamo con ADF.

Delta Lake è stato anche davvero utile. Ci aiuta a tenere traccia dei cambiamenti e a tornare indietro se qualcosa va storto. Possiamo vedere cosa è successo prima. Correggere gli errori facilmente.

Delta Lake assicura anche che i dati siano buoni prima di entrare nel pipeline. Impedisce ai dati di entrare e causare problemi successivamente in Salesforce. Questo rende l'intero processo più affidabile e più facile da gestire. Recensione raccolta e ospitata su G2.com.

Cosa non ti piace di Databricks?

Databricks è davvero bravo in quello che fa.. A volte ci vuole un po' per avviare e far funzionare il cluster.. L'interfaccia utente è lenta a volte. Questo può essere fastidioso quando abbiamo fretta di fare le cose per Salesforce. I connettori Salesforce in Databricks possono essere un po' complicati da usare. Spesso devono essere configurati correttamente e non funzionano come ci aspettiamo. Questo significa che dobbiamo lavorare quando cerchiamo di risolvere i problemi o tenere d'occhio le pipeline, in Databricks per Salesforce. Recensione raccolta e ospitata su G2.com.

Quali problemi sta risolvendo Databricks e come ti sta beneficiando?

Sta risolvendo i nostri problemi di prestazioni e affidabilità, permettendoci di estrarre, trasformare e caricare i dati in Salesforce tutto in un unico posto senza ADF. Questo flusso di lavoro unificato ha ridotto il nostro tempo di esecuzione da 1 ora a 10 minuti, permettendoci di completare i lavori più velocemente e aggiornare i dati di Salesforce in tempo. Con le funzionalità di delta lake come le transazioni ACID e il time travel, i nostri dati sono più accurati e più facili da recuperare quando qualcosa va storto. Recensione raccolta e ospitata su G2.com.

Risposta da Janelle Glover di Databricks

modifica

Siamo lieti di sapere che Databricks è stato in grado di migliorare significativamente il tuo flusso di lavoro riducendo il tempo di esecuzione. È fantastico sapere che Delta Lake è stato utile nel mantenere l'accuratezza dei dati e nel fornire opzioni di recupero più semplici. Comprendiamo le tue preoccupazioni riguardo al tempo di configurazione del cluster e alla velocità dell'interfaccia utente, così come le sfide con i connettori Salesforce. Apprezziamo il tuo feedback e lo condivideremo con il nostro team per ulteriori miglioramenti.