# Databricks Reviews
**Vendor:** Databricks Inc.  
**Category:** [Sistemas de Processamento e Distribuição de Big Data](https://www.g2.com/pt/categories/big-data-processing-and-distribution)  
**Average Rating:** 4.6/5.0  
**Total Reviews:** 790
## About Databricks
Databricks é uma plataforma unificada de dados e IA que ajuda as organizações a construir, governar e escalar pipelines de dados, análises, aprendizado de máquina, aplicações de IA e agentes. Mais de 20.000 organizações em todo o mundo — incluindo adidas, AT&amp;T, Bayer, Block, Mastercard, Rivian, Unilever e 70% das empresas da Fortune 500 — confiam no Databricks para trabalhar com dados empresariais e IA em escala. Com sede em São Francisco e mais de 30 escritórios ao redor do mundo, o Databricks oferece uma plataforma unificada que inclui Agent Bricks, Lakeflow, Lakehouse, Lakebase, Genie e Unity Catalog. Fundado em 2013 pelos criadores originais do Apache Spark™, Delta Lake, MLflow e Unity Catalog, o Databricks é construído em uma arquitetura de lakehouse aberta que reúne dados, análises e IA. A plataforma é usada por engenheiros de dados, cientistas de dados, analistas, desenvolvedores, equipes de aprendizado de máquina, equipes de IA e usuários de negócios para colaborar em todo o ciclo de vida de dados e IA. As principais capacidades do Databricks incluem: - Engenharia de dados: Construa, automatize e gerencie pipelines de dados em lote, streaming e em tempo real de forma confiável. - Análise e inteligência de negócios: Execute análises SQL, crie dashboards e permita que as equipes de negócios explorem dados. - Governança de dados: Descubra, proteja e gerencie dados e ativos de IA entre equipes, nuvens e cargas de trabalho. - Aprendizado de máquina e IA: Desenvolva modelos, construa aplicações de IA generativa e crie agentes de IA em nível de produção. - Aplicações de dados: Construa e implante aplicações orientadas a dados usando dados empresariais governados. Disponível em AWS, Azure e Google Cloud, o Databricks ajuda as organizações a trabalhar entre nuvens, reduzir silos de dados e simplificar a colaboração entre equipes e ferramentas. Os clientes usam o Databricks para casos de uso como personalização de clientes, detecção de fraudes, manutenção preditiva, análises em tempo real, cibersegurança, pesquisa em saúde, gestão de risco financeiro, otimização da cadeia de suprimentos e tomada de decisão impulsionada por IA. O Databricks é usado em diversos setores, incluindo serviços financeiros, saúde e ciências da vida, varejo, manufatura, energia e setor público. As organizações usam a plataforma para modernizar a infraestrutura de dados, acelerar a adoção de IA e transformar dados empresariais em valor de negócios.



## Databricks Pros & Cons
**What users like:**

- Os usuários elogiam a **facilidade de uso e os inúmeros recursos** do Databricks, aprimorando suas tarefas de processamento de dados e aprendizado de máquina. (192 reviews)
- Os usuários elogiam a **facilidade de uso** do Databricks, melhorando sua experiência geral com sua interface intuitiva. (155 reviews)
- Os usuários apreciam as **integrações perfeitas** do Databricks, melhorando o processamento em tempo real e suportando várias linguagens de desenvolvimento. (141 reviews)
- Os usuários valorizam a **colaboração perfeita** que o Databricks oferece, aprimorando o trabalho em equipe em projetos de dados com insights em tempo real. (114 reviews)
- Os usuários valorizam os **recursos analíticos integrados** do Databricks, melhorando as operações e fornecendo insights abrangentes sobre tecnologia. (113 reviews)
- Escalabilidade (111 reviews)
- Integração de ML (106 reviews)
- Os usuários apreciam as **integrações fáceis** do Databricks, conectando-se perfeitamente com a infraestrutura de nuvem e aprimorando o gerenciamento de dados. (102 reviews)
- Aprendizado de Máquina (97 reviews)
- Os usuários adoram os **recursos eficazes de gerenciamento de dados** do Databricks, simplificando fluxos de trabalho e aprimorando as capacidades de tomada de decisão. (87 reviews)

**What users dislike:**

- Os usuários notam uma **curva de aprendizado** significativa com o Databricks, particularmente devido às suas permissões complexas e modos de computação. (78 reviews)
- Os usuários acham o Databricks **caro** , especialmente ao lidar com grandes volumes de dados, limitando sua acessibilidade para alguns clientes. (71 reviews)
- Os usuários acham a **curva de aprendizado íngreme** do Databricks desafiadora, especialmente para aqueles que são novos em ferramentas de big data. (64 reviews)
- Os usuários acham a **complexidade** do Databricks desafiadora, especialmente com recursos avançados e requisitos de configuração inicial. (45 reviews)
- Os usuários experimentam um **processo de configuração complexo** inicialmente, mas o suporte ajuda a simplificar a experiência ao longo do tempo. (35 reviews)
- Problemas de Desempenho (34 reviews)
- Os usuários enfrentam **problemas de interface não intuitiva** que levam a erros aleatórios e complicam a experiência para usuários não técnicos. (34 reviews)
- Design de UI ruim (33 reviews)
- Os usuários acham que os **recursos ausentes** no Databricks são limitantes, prejudicando a produtividade e complicando a experiência geral. (31 reviews)
- Custo (29 reviews)

## Databricks Reviews
  ### 1. Databricks no meu caso: Múltiplas Integrações, Interface Intuitiva e Desempenho Confiável

**Rating:** 4.0/5.0 stars

**Reviewed by:** Yelnur K. | Schedule Manager, Linhas Aéreas/Aviação, Médio Porte (51-1000 emp.)

**Reviewed Date:** May 19, 2026

**O que você mais gosta em Databricks?**

O que mais gosto no Databricks é a parte de Integrações. No ambiente de trabalho, integramos o Banco de Dados com várias fontes de dados. Além disso, não posso completar minha avaliação sem mencionar o design de UX e UI, que torna o fluxo de trabalho geral intuitivo e genuinamente amigável. Quando se trata da velocidade dos processos, nunca nos decepcionou. Funciona como esperado. Comparativamente ao preço de mercado, o preço do serviço é bastante confiável para nós. Existe um centro de ajuda do Databricks, se você não conseguir encontrar respostas para suas perguntas, há especialistas que podem ajudá-lo com suas dúvidas. Como exemplo, posso lembrar de um caso em que tivemos um problema durante o processo de exame, eles nos ajudaram a resolver esse problema.

**O que você não gosta em Databricks?**

A qualidade da IA do Genie não é apreciada. Pessoal, isso poderia ser melhorado, especialmente a parte de raciocínio. Além disso, posso mencionar o caso em que tivemos um problema com o processo de exame. Especialistas nos ajudaram, mas nos causou um pouco de desconforto. Bem,

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Na aviação, utilizamos este software para análise de dados. Automatizamos muitos processos que ferramentas simples de trabalho não conseguem lidar. Também integramos com várias ferramentas (nomes que não posso mencionar por motivos de segurança). Particularmente, ele nos ajuda a analisar a demanda de passageiros por rota e estação. Combinamos e analisamos grandes conjuntos de dados usando este software. No geral, uma boa ferramenta. Nossa equipe está satisfeita.

**Official Response from Sara Steffen:**

> Obrigado pelo seu feedback detalhado. Estamos satisfeitos em saber que o Databricks tem sido fundamental na automação de processos e análise de grandes conjuntos de dados para suas necessidades de aviação. Levamos a sério seu feedback sobre o Genie AI e os processos de suporte e estamos dedicados a fazer melhorias nessas áreas.

  ### 2. Lakebase - Good Option for Low Latency Data Serving with Databricks Integration

**Rating:** 4.5/5.0 stars

**Reviewed by:** Senthil K. | Associate Director, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 25, 2026

**O que você mais gosta em Databricks?**

I have setup the lakebase which is in sync with lakehouse for enterpise application low latency access, we have enabled the below options

- Lakebase using Postgres 17,HTTPS Data API is helping to access database in easier way from Databricks Apps

- Integration sync between Lakehouse and Lakebase for API access

- It has branching option to maintain schema or feature changes

- Restore from previous point/time history - helps reducing recovery effort - Snapshots and backup support

 - Autoscaling compute and suspend option

- Monitoring, logs and query metrics are giving visibility on active queries, performance and database health

- OAuth access and postgres role based connection is helping better security and controlled access

Lakebase pricing model with autoscaling and scale down option based on available compute pricing

**O que você não gosta em Databricks?**

Lakebase all postgress features not available, so we can't directly migrate any existing postgres directly to lakebase

Scale down to zero not happens instantly faced some issues like disconnect from app for short time temporary pauses

Custom admin operations in database postgres are limited and not posisble

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Lakebase helps serve near real-time inventory data,availability tracking and reducing out-of-stock situation

Processed Lakehouse data can be served through Lakebase for customer buying pattern, product recommendation and promotion effectiveness

Transactional sales data can be made available quickly for store level dashboards, helping business teams monitor sales trend usings web apps

Near real-time operational data availability
applications access low latency data for pricing, promotions for TPO-TPM integrations

Also we integrated the AI to include the real time context 

Low latency

**Official Response from Janelle Glover:**

> Obrigado por compartilhar suas experiências positivas com o Genie, incluindo sua capacidade de preencher a lacuna entre as equipes de negócios e de dados, eliminar silos de dados e melhorar a visibilidade de custos e desempenho. Entendemos suas preocupações sobre as limitações do Modo Agente e a necessidade de maior autonomia. Trabalharemos para abordar essas áreas e melhorar sua experiência geral.

  ### 3. Plataforma Delta Lake Tudo-em-Um que Torna o ETL Rápido e Econômico

**Rating:** 5.0/5.0 stars

**Reviewed by:** Kavipriya S. | Data Engineer, Tecnologia da Informação e Serviços, Médio Porte (51-1000 emp.)

**Reviewed Date:** May 27, 2026

**O que você mais gosta em Databricks?**

Delta Lake + Workflows + Unity Catalog em uma única plataforma eliminou a necessidade de juntar ferramentas separadas de ingestão, transformação e governança. Como engenheiro de dados, passo mais tempo construindo pipelines e menos tempo gerenciando infraestrutura. A experiência com notebooks e o auto-escalonamento de clusters tornam a iteração em ETL complexos rápida e econômica.

**O que você não gosta em Databricks?**

Os tempos de inicialização de clusters e a previsibilidade de custos ainda são os maiores pontos de atrito para mim. Inícios a frio podem realmente atrasar o trabalho ad-hoc, e os custos de DBU precisam ser monitorados de perto para evitar surpresas desagradáveis. A interface do Workflows melhorou muito ao longo do tempo, mas ainda não parece tão flexível quanto orquestradores dedicados quando se lida com DAGs mais complexos. Mesmo assim, vejo isso principalmente como itens de acabamento—o valor central da plataforma supera facilmente esses pontos.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Databricks resolve um grande problema de fragmentação em nossa pilha de engenharia de dados. Anteriormente, dependíamos de ferramentas separadas para ingestão, transformação, orquestração e governança—cada uma com sua própria curva de aprendizado, sobrecarga de manutenção e potenciais pontos de falha. Agora, está tudo consolidado em uma única plataforma.

Na prática, isso nos ajuda a executar pipelines ETL em larga escala que processam milhões de registros diariamente, com o Delta Lake melhorando a confiabilidade através de transações ACID, imposição de esquemas e "time travel" para depuração. Também fecha a lacuna de colaboração entre engenheiros de dados e cientistas de dados: nós construímos os pipelines, e eles podem consumir as mesmas tabelas diretamente em notebooks sem duplicação de dados ou problemas de sincronização.

O Unity Catalog resolveu um antigo problema de governança centralizando o controle de acesso em todos os workspaces. No geral, o resultado é um desenvolvimento de pipelines mais rápido, menos incidentes de produção ligados a problemas de qualidade de dados e muito menos código "glue" para manter. O que costumava levar semanas para construir e estabilizar agora leva dias.

**Official Response from Jess Darnell:**

> Estamos encantados em saber que o Databricks consolidou sua pilha de engenharia de dados e melhorou a confiabilidade de seus pipelines ETL. Entendemos seu feedback sobre os tempos de inicialização de clusters e a previsibilidade de custos, e estamos trabalhando ativamente para otimizar esses aspectos de nossa plataforma para proporcionar uma melhor experiência ao usuário.

  ### 4. Análise de Autoatendimento e Forte Desempenho do Piloto Automático

**Rating:** 4.0/5.0 stars

**Reviewed by:** Bob K. | Data and Analytics Leader, Tecnologia da Informação e Serviços, Empresa (> 1000 emp.)

**Reviewed Date:** May 27, 2026

**O que você mais gosta em Databricks?**

Gerenciar permissões em equipes diversificadas de vendas e marketing foi simplificado. O catálogo nos permitiu proteger dados sensíveis facilmente, enquanto ainda possibilitava que nossa equipe e analistas se servissem sozinhos. A linhagem automatizada em nível de coluna foi extremamente útil para rastrear como nossas métricas de previsão de pipeline foram calculadas.

Eu gosto do desempenho do piloto automático. Minha equipe gastou menos tempo na manutenção manual do banco de dados. A otimização preditiva cuidou automaticamente da compactação de arquivos (Optimize) e limpou arquivos antigos (Vacuum). Além disso, o Luquid Clustering manteve nossas tabelas de transações de vendas em rápido crescimento funcionando eficientemente sem exigir que projetássemos e mantivéssemos manualmente estratégias complexas de particionamento.

O suporte para formatos abertos como Delta Lake e Apache Iceberg garantiu que nossos dados permanecessem portáteis. Através de APIs abertas e compartilhamento Delta, pudemos compartilhar insights com parceiros comerciais externos de forma segura, sem precisar replicar e mover grandes conjuntos de dados.

Mais uma coisa, a plataforma permitiu que nossa equipe de engenharia de dados e analistas colaborassem em um único lugar. Esse alinhamento entre arquitetura técnica e estratégia de negócios facilitou a conversão de modelos técnicos de pipeline em valor comercial.

**O que você não gosta em Databricks?**

Como sabemos, as ferramentas de Vendas e Marketing frequentemente mudam seus esquemas de dados, por exemplo, adicionando ou renomeando campos personalizados no Salesforce. Quando essas atualizações ocorriam, nossos fluxos de ingestão usando auto loader ou streaming estruturado falhavam e exigiam reinicializações manuais para se adaptar. Isso ocasionalmente causava atrasos temporários na atualização de nossos painéis operacionais.

Rastrear atribuição de marketing complexa e multi-toque e jornadas de clientes exigia operações de streaming com estado (como junções e agregações). Gerenciar logs de eventos fora de ordem e dados que chegavam atrasados nesses fluxos provou ser altamente complexo e exigiu engenharia personalizada significativa para garantir que os resultados permanecessem precisos.

Como as tabelas gerenciadas pelo Unity Catalog não suportam acesso baseado em caminho, tivemos que garantir que todo o código legado e sistemas externos fossem transicionados para usar convenções de nomenclatura de namespace de três níveis adequadas, o que exigiu um esforço inicial de refatoração para evitar erros de acesso a dados.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Na Basware, meu foco principal era capacitar as equipes globais de vendas e marketing para otimizar seu desempenho, construir previsões de pipeline precisas e garantir uma governança robusta em torno dos nossos dados de clientes. O Databricks serviu como uma plataforma fundamental para nos ajudar a alcançar esses objetivos.

Usamos o Lakeflow Connect, especificamente o Conector Salesforce junto com outros métodos de ingestão para extrair dados do nosso CRM, sistemas de automação de marketing e arquivos locais para o lakehouse. Isso nos permitiu construir uma visão consolidada e única do cliente.

Os Lakeflow Spark Declarative Pipelines nos ajudaram a organizar nossos dados brutos de marketing e vendas em uma arquitetura Medallion. Isso significa que pudemos transformar logs de eventos de marketing semiestruturados e registros de CRM em conjuntos de dados estruturados prontos para inteligência de negócios e previsão.

Para apoiar o VP de Operações de Vendas e Marketing e outros líderes seniores, implantamos espaços de AI/BI genie. Isso permitiu que os executivos consultassem métricas de pipeline e tendências de previsão usando linguagem natural. Para relatórios padrão, usamos o Partner connect para vincular nossas tabelas Gold limpas diretamente a ferramentas externas de BI.

**Official Response from Jess Darnell:**

> It's great to hear how Databricks has helped you optimize sales and marketing performance, build accurate pipeline forecasts, and ensure robust governance around customer data. We're committed to providing a platform that supports your business goals and enables efficient data management and analysis. Thank you for sharing your use case with us.

  ### 5. Poderosos Pipelines de Telemetria de Baixa Latência com Tabelas de Streaming e Visões Materializadas

**Rating:** 4.0/5.0 stars

**Reviewed by:** Jose P. | Head of Network Strategy, Telecomunicações, Empresa (> 1000 emp.)

**Reviewed Date:** May 26, 2026

**O que você mais gosta em Databricks?**

Em um ambiente de telecomunicações lidando com volumes massivos de dados de redes fixas e móveis (GPON, núcleo 4g/5g e RAN) ingerindo telemetria de frequência não estruturada ou semi-estruturada de forma incremental a partir de nossas funções virtualizadas como vEPC, vCPE ou VHGW) com configuração mínima.

Minha equipe trabalha em estreita colaboração com funções de rede virtualizadas e Computação de Borda de Acesso Múltiplo. Recursos como Tabelas de Streaming e Visões Materializadas nos ajudam a construir pipelines de baixa latência que processam métricas de desempenho de rede quase em tempo real, ajudando-nos a monitorar KPIs de rede e eficiência de QoS.

Como a principal expertise da minha equipe está no design de rede e virtualização de sistemas, em vez de administração de banco de dados, a Otimização Preditiva e o Agrupamento Líquido são altamente benéficos. Eles lidam autonomamente com a manutenção de tabelas, compactação de arquivos e otimização de layout de dados, liberando nossos recursos para focar na arquitetura de rede.

**O que você não gosta em Databricks?**

Funções de rede virtualizadas, roteadores e hardware desagregado frequentemente passam por atualizações de software, que muitas vezes introduzem mudanças sutis nos esquemas de saída de telemetria. Ao usar streaming estruturado ou carregador automático, essas derivações de esquema fazem com que nossas consultas de streaming falhem, exigindo uma reinicialização manual do fluxo para replanejar o esquema.

Quando precisamos atualizar a lógica de um KPI de rede complexo definido dentro de uma visão materializada, qualquer alteração na consulta aciona um recálculo completo da visão. Dada a escala massiva dos conjuntos de dados de transações de telecomunicações, isso pode resultar em custos computacionais notáveis.

Dependemos de uma variedade de ferramentas de dados dentro do nosso ecossistema de TIC, nem todas as soluções apresentadas no Partner Connect suportam nativamente o Unity Catalog. Isso pode criar obstáculos de integração e governança quando tentamos conectar certas ferramentas de análise e preparação de dados de terceiros ao nosso data lake seguro.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Ingerimos fluxos contínuos de dados de desempenho de funções de rede virtualizadas e camadas de transporte tradicionais. Ao construir pipelines de streaming, podemos monitorar núcleos virtualizados e roteadores para identificar anomalias ou degradações no tráfego de rede.

Alinhando com meu interesse em IA de Rede e Aprendizado de Máquina, nossos cientistas de dados usam a plataforma para desenvolver modelos preditivos. Treinamos modelos em falhas históricas de linhas GPON/DSL, cargas de torres de celular móveis e padrões de uso de clientes para prever congestionamento de rede, agendar manutenção proativa e mitigar a rotatividade de clientes em diferentes segmentos.

Como evangelista da evolução tecnológica, uso a plataforma para preencher a lacuna entre nossas equipes de engenharia de rede principais e as unidades de negócios. Ao conectar semânticas de negócios e estabelecer protocolos seguros de Delta Sharing, fornecemos aos analistas de negócios e tomadores de decisão acesso autônomo e governado a insights de rede sem comprometer a conformidade de segurança.

**Official Response from Jess Darnell:**

> É fantástico ouvir como o Databricks está ajudando você a ingerir e processar fluxos contínuos de dados de desempenho, desenvolver modelos preditivos e preencher a lacuna entre as equipes de engenharia de rede e as unidades de negócios. Estamos comprometidos em fornecer soluções que beneficiem nossos usuários em vários aspectos de seu trabalho.

  ### 6. Tornando os sistemas de dados menos confusos com uma abordagem unificada de Lakehouse

**Rating:** 5.0/5.0 stars

**Reviewed by:** Hunar M. | Data Analyst, Geospatial Intelligence - Data &amp; Analytics, Empresa (> 1000 emp.)

**Reviewed Date:** May 21, 2026

**O que você mais gosta em Databricks?**

O ecossistema. O que eu mais gosto no Databricks é como ele elimina grande parte da confusão habitual que você encontra ao trabalhar com dados. Em vez de lidar com ferramentas separadas para engenharia, análise e ML — e depois gastar tempo extra para fazê-las se comunicarem — ele traz tudo para um só lugar. Isso por si só reduz muito a fricção e economiza tempo.

Também gosto da ideia do Lakehouse porque parece genuinamente prática: você não precisa escolher entre um data lake e um data warehouse. Você pode trabalhar com uma configuração unificada e ainda obter desempenho quando precisar.

No dia a dia, também é bom que diferentes equipes possam colaborar no mesmo ambiente sem precisar copiar dados constantemente ou reconstruir pipelines. No geral, isso mantém as coisas mais simples e rápidas, especialmente quando você está iterando.

**O que você não gosta em Databricks?**

O que eu não gosto no Databricks é que ele pode parecer um pouco pesado quando você está apenas tentando fazer algo simples. Há muita coisa acontecendo nos bastidores, e embora isso seja ótimo para escalabilidade, também vem com uma curva de aprendizado. Coisas como clusters, configurações e configuração de tarefas levam algum tempo para se acostumar.

O custo é outra preocupação. O uso pode aumentar rapidamente se você não estiver monitorando ativamente, especialmente quando as equipes podem iniciar computação livremente. E, às vezes, a experiência geral parece um pouco fragmentada entre notebooks, tarefas e repositórios, em vez de ser um fluxo suave e unificado.

Então, sim—é poderoso, mas definitivamente requer disciplina para manter as coisas limpas, eficientes e sob controle.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O que o Databricks realmente resolve para mim é o atrito usual que aparece quando os sistemas de dados estão espalhados por muitas ferramentas.

Em vez de executar um sistema para ingestão, outro para armazenamento, algo diferente para transformação e, em seguida, configurações separadas novamente para análises e ML, ele traz a maior parte disso para um só lugar. Isso significa que não preciso ficar movendo dados ou me preocupar constantemente com coisas saindo de sincronia.

Do ponto de vista da arquitetura de soluções, isso é uma grande vitória porque simplifica o design geral. Em vez de costurar um monte de sistemas, você pode construir em torno de uma única configuração de Lakehouse que suporta múltiplos casos de uso. É mais fácil de escalar, mais fácil de governar e, no geral, mais fácil de entender.

No dia a dia, isso também significa que passo menos tempo em infraestrutura e encanamento e mais tempo pensando em como projetar bons modelos de dados e pipelines. E como todos estão trabalhando a partir dos mesmos dados, há muito menos confusão e retrabalho entre as equipes.

No geral, isso remove muito do ruído e me permite focar em construir soluções de dados sólidas e escaláveis.

**Official Response from Jess Darnell:**

> Estamos felizes em saber que você considera nosso ecossistema e abordagem Lakehouse benéficos para simplificar e unificar seu trabalho com dados. Entendemos suas preocupações sobre a curva de aprendizado e custo, e estamos continuamente trabalhando para melhorar a experiência do usuário e fornecer soluções econômicas. Obrigado por compartilhar seu feedback detalhado conosco.

  ### 7. Databricks centraliza dados, analytics e IA

**Rating:** 5.0/5.0 stars

**Reviewed by:** Leonardo Q. | RPA Developer, Médio Porte (51-1000 emp.)

**Reviewed Date:** May 16, 2026

**O que você mais gosta em Databricks?**

O que mais gosto no Databricks é como ele centraliza engenharia de dados, analytics e IA em uma única plataforma, o que facilita muito o fluxo de trabalho no dia a dia. A integração entre notebooks, pipelines e processamento distribuído deixa o desenvolvimento mais rápido e organizado, especialmente em projetos com grande volume de dados e automações.

Outro ponto que considero muito forte é a experiência com o Apache Spark, integrada de forma simplificada. Mesmo em cenários mais complexos, o desempenho costuma ser excelente, permitindo processar dados em larga escala com boa estabilidade e escalabilidade. Isso ajuda bastante em integrações, ETLs e análises que, em outras soluções, exigiriam bem mais esforço.

**O que você não gosta em Databricks?**

Apesar de eu gostar bastante da plataforma, alguns pontos do Databricks ainda podem ser desafiadores. O principal deles é o custo, especialmente em ambientes com processamento intenso ou quando os clusters não estão bem otimizados. Sem um controle de uso mais rigoroso, os gastos podem aumentar rapidamente.

Outro aspecto é a curva de aprendizado, que pode ser alta para equipes que estão começando no ecossistema de dados distribuídos. Conceitos ligados a Spark, clusters, otimização e gerenciamento de recursos exigem tempo de adaptação, principalmente para quem vem de ferramentas mais tradicionais.

Em UI/UX, embora a interface seja boa no geral, alguns processos administrativos e configurações mais avançadas podem parecer confusos no início. Em certos cenários, identificar problemas de performance ou de permissões também pode exigir um conhecimento mais técnico.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Databricks tem ajudado principalmente a resolver problemas relacionados à centralização, ao processamento e à análise de grandes volumes de dados. Antes, muitos processos ficavam distribuídos entre diferentes ferramentas, o que dificultava integrações, manutenção e governança. Com o Databricks, grande parte do fluxo de engenharia de dados, analytics e IA pode ser concentrada em uma única plataforma, trazendo mais consistência para o trabalho do dia a dia.

**Official Response from Jess Darnell:**

> Estamos felizes em saber que você considera a centralização de dados, análises e IA do Databricks benéfica para o seu fluxo de trabalho. Entendemos a importância da integração e simplificação, e estamos comprometidos em fornecer uma plataforma que atenda às suas necessidades.

  ### 8. Databricks Simplifica o Processamento de Big Data e a Colaboração em Equipe

**Rating:** 4.5/5.0 stars

**Reviewed by:** Praveen M. | Associate Data Engineer, Tecnologia da Informação e Serviços, Médio Porte (51-1000 emp.)

**Reviewed Date:** May 07, 2026

**O que você mais gosta em Databricks?**

O que eu mais gosto no Databricks é como ele simplifica o processamento de dados em grande escala e a colaboração em uma única plataforma. A integração com o Spark e serviços de nuvem torna o manuseio de big data muito mais eficiente. Também gosto do ambiente de notebooks, que facilita para as equipes trabalharem juntas em tarefas de análise e aprendizado de máquina.

**O que você não gosta em Databricks?**

Uma coisa que não gosto no Databricks é que a plataforma pode parecer complexa para novos usuários, especialmente ao gerenciar clusters e configurações. O preço também pode se tornar caro com cargas de trabalho maiores se os recursos não forem otimizados cuidadosamente. Embora as integrações e os recursos de IA sejam poderosos, o processo de integração e a documentação de suporte poderiam ser mais amigáveis para iniciantes.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Databricks ajuda a resolver o desafio de processar e analisar grandes quantidades de dados de forma eficiente em uma única plataforma. Ele combina engenharia de dados, análises e fluxos de trabalho de IA, o que reduz a necessidade de múltiplas ferramentas separadas. Isso melhora a colaboração, acelera o processamento de dados e ajuda a gerar insights muito mais rapidamente.

**Official Response from Jess Darnell:**

> Estamos felizes em saber que você acha o Databricks útil para simplificar o processamento de dados em grande escala e a colaboração. Nossa integração com o Spark e serviços em nuvem é projetada para tornar o manuseio de big data mais eficiente.

  ### 9. Perfeito para Colaboração entre Equipes e Aplicações Intensivas de Dados

**Rating:** 5.0/5.0 stars

**Reviewed by:** Artemij V. | Data Science Lead, Pequena Empresa (50 ou menos emp.)

**Reviewed Date:** May 04, 2026

**O que você mais gosta em Databricks?**

A experiência do usuário é uma das partes mais fortes. A experiência com o notebook é limpa e intuitiva, a colaboração é direta, e mover-se entre exploração, experimentação e fluxos de trabalho de produção parece ser contínuo. Tem flexibilidade suficiente para usuários avançados, enquanto ainda é acessível o bastante para que a integração de novos membros da equipe seja rápida. As pessoas geralmente conseguem se tornar produtivas rapidamente sem gastar semanas aprendendo peculiaridades específicas da plataforma.

As integrações também são excelentes. Funciona suavemente com o ecossistema de nuvem mais amplo e se conecta bem com fontes de dados, ferramentas de orquestração, infraestrutura de serviço de modelos e sistemas externos. Essa interoperabilidade torna muito mais fácil passar de protótipo para pipeline implantado sem precisar reconstruir constantemente conectores ou gerenciar código de "cola".

O desempenho tem sido consistentemente forte, especialmente ao trabalhar com cargas de trabalho distribuídas e engenharia de características em larga escala. A otimização do Spark, o gerenciamento de clusters e a infraestrutura gerenciada reduzem significativamente a sobrecarga operacional, o que me permite focar mais no desenvolvimento e análise de modelos em vez de ajuste de ambiente. Para experimentação iterativa, os tempos de inicialização e a capacidade de resposta geral são notavelmente melhores do que muitas plataformas gerenciadas alternativas.

**O que você não gosta em Databricks?**

Uma área onde a Databricks poderia melhorar é na precificação. A plataforma oferece capacidades robustas, mas os custos podem escalar rapidamente para cargas de trabalho de alta frequência ou em tempo real. Para casos de uso que envolvem pipelines de ticks de baixa latência em execução contínua, transmissão de dados de mercado ou re-treinamento iterativo de modelos, a precificação pode se tornar bastante elevada em relação à infraestrutura consumida. Às vezes, parece haver um prêmio significativo pela conveniência e orquestração gerenciada, o que pode tornar a otimização de custos uma consideração constante.

A integração de IA é outra área que ainda parece um pouco desigual. Embora haja um claro esforço para posicionar a plataforma como um ambiente de IA/ML de ponta a ponta, alguns dos recursos mais novos focados em IA parecem mais adições ao ecossistema do que melhorias profundamente integradas ao fluxo de trabalho. Na prática, ainda há casos em que ferramentas personalizadas ou frameworks externos oferecem mais flexibilidade e transparência, particularmente para desenvolvimento de modelos especializados, experimentação e casos de uso de inferência em tempo real.

Também pode haver alguma complexidade em torno do ajuste de clusters e do gerenciamento eficiente de custos em escala. Embora as abstrações sejam úteis, obter a melhor relação desempenho-custo às vezes requer um conhecimento mais profundo da plataforma do que o posicionamento "totalmente gerenciado" pode sugerir.

No geral, a plataforma é muito forte tecnicamente, mas a precificação para cargas de trabalho intensivas em dados sempre ativas e a maturidade de algumas capacidades nativas de IA são as duas maiores áreas onde eu gostaria de ver melhorias.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Databricks resolve um dos maiores desafios no trabalho moderno com dados: reunir acesso a dados, processamento em larga escala e desenvolvimento colaborativo em um único ambiente.

Para o meu trabalho, o maior benefício é a colaboração em tempo real. Isso permite que várias pessoas trabalhem nos mesmos conjuntos de dados, notebooks e pipelines sem a fricção usual de ferramentas fragmentadas ou inconsistências de ambiente. Isso acelera significativamente a experimentação, iteração e compartilhamento de conhecimento entre projetos, especialmente ao avançar rapidamente no desenvolvimento de modelos ou na análise de dados que mudam rapidamente.

Ele também resolve o desafio do acesso e processamento escalável de dados. Trabalhar com conjuntos de dados transacionais e de séries temporais de alto volume requer uma infraestrutura que possa processar grandes quantidades de dados de forma eficiente, sem a sobrecarga operacional constante. O Databricks abstrai grande parte dessa complexidade, tornando possível focar na análise, engenharia de características e desenvolvimento de modelos, em vez de gastar tempo gerenciando a infraestrutura.

O benefício prático é ciclos de iteração mais rápidos. Posso passar da exploração de dados brutos para a experimentação e implantação de modelos muito mais rapidamente, o que é especialmente valioso ao trabalhar em análises em tempo real, pipelines de previsão e sistemas de ML voltados para produção, onde a velocidade de iteração impacta diretamente os resultados.

No geral, reduz a fricção de engenharia e torna o trabalho colaborativo com dados em larga escala significativamente mais eficiente, o que se traduz em desenvolvimento mais rápido, melhor experimentação e implantação mais confiável de produtos de dados.

**Official Response from Jess Darnell:**

> Agradecemos sua análise detalhada do Databricks e ficamos satisfeitos em saber que a plataforma tem sido fundamental para viabilizar a colaboração entre equipes e aplicações intensivas de dados para o seu trabalho. Seu feedback sobre preços e integração de IA é valioso, e estamos continuamente nos esforçando para aprimorar esses aspectos para proporcionar uma experiência mais fluida para nossos usuários.

  ### 10. O Genie Code e o Assistente Inline aumentaram drasticamente minha produtividade de depuração.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Shyam s. | Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 27, 2026

**O que você mais gosta em Databricks?**

O código Genie e o Assistente inline foram as ferramentas mais úteis para mim no meu projeto. Eles me ajudaram a depurar uma base de código de 2 mil linhas e explicaram claramente por que eu não estava obtendo dados precisos. Também forneceu uma consulta para executar no meu sistema de origem (SQLMI). Ao executar o script de discrepância em paralelo na origem e no destino, consegui depurar todo o código muito mais rápido e melhorar minha produtividade. No geral, reduziu meu tempo de trabalho de cerca de 8 horas para cerca de 1 hora.

**O que você não gosta em Databricks?**

No Delta Sharing, não há permissão de SELECT a nível de catálogo, e às vezes acho que ter isso seria útil. Além disso, quando uso o código Genie dentro de uma VM, ele pode tornar o site não responsivo às vezes. Estas são áreas que poderiam ser melhoradas.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Em um dos nossos projetos de migração de processamento de sinistros, o cliente precisava de disponibilidade de dados quase em tempo real para aplicações a jusante. Anteriormente, a arquitetura utilizava o Amazon Redshift como o data warehouse, com o Jasper e o Sisense consumindo os dados para relatórios e análises. No entanto, essa configuração não suportava de forma eficiente o streaming em tempo real ou quase em tempo real, o que levava a atrasos na disponibilidade de dados para os sistemas a jusante.

Após migrar a plataforma para o Databricks, conseguimos melhorar substancialmente a arquitetura do pipeline de dados. Implementamos streaming junto com pipelines ETL otimizados, reduzindo o ciclo de atualização de dados para cerca de 30 minutos. Também criamos uma visualização dedicada que retém dados da execução anterior, para que os sistemas a jusante sempre tenham um conjunto de dados consistente disponível enquanto a próxima execução do pipeline ainda está em andamento.

Antes, enfrentávamos dificuldades com ciclos de atualização atrasados e uma capacidade limitada de atender às necessidades de dados quase em tempo real em nossa arquitetura baseada no Redshift. Após a mudança para o Databricks, habilitamos um processamento ETL mais rápido e melhoramos a disponibilidade de dados quase em tempo real.

Como resultado, reduzimos o tempo de atualização do ETL para cerca de 30 minutos e habilitamos o acesso quase em tempo real para ferramentas a jusante como o Jasper e o Sisense. A confiabilidade também melhorou porque a visualização estável continua a servir os dados da execução anterior durante as atualizações do pipeline. Finalmente, a arquitetura geral tornou-se mais simples ao consolidar as capacidades de processamento e análise dentro do Databricks.

No geral, o Databricks nos ajudou a construir uma plataforma de processamento de dados quase em tempo real mais escalável e eficiente, melhorando significativamente a pontualidade e a confiabilidade das análises para o fluxo de trabalho de processamento de sinistros.

**Official Response from Janelle Glover:**

> Obrigado por compartilhar como a arquitetura do Databricks está beneficiando você. Nós projetamos nossa plataforma para enfrentar os desafios de gerenciar dados estruturados e não estruturados, e é ótimo saber que está tendo um impacto positivo em seus fluxos de trabalho de análise e aprendizado de máquina.

  ### 11. A Plataforma de Dados Unificada Que Realmente Entrega

**Rating:** 5.0/5.0 stars

**Reviewed by:** Janakiraman K. | Data Engineer, Empresa (> 1000 emp.)

**Reviewed Date:** March 27, 2026

**O que você mais gosta em Databricks?**

Databricks transformou a forma como nossa equipe lida com fluxos de trabalho de dados de ponta a ponta. Alguns destaques:

UI/UX: A interface do notebook é intuitiva, e o editor SQL parece refinado, o que alternar entre Python, SQL e Scala no mesmo espaço de trabalho economiza trocas constantes de contexto.

Integrações: Conectores nativos para Azure, Unity Catalog e Delta Sharing significam que passamos menos tempo em encanamentos. Lakehouse Federation nos permite consultar fontes externas sem mover dados, o que foi uma vitória inesperada.

Desempenho: A auto-otimização do Delta Lake e o agrupamento líquido reduziram visivelmente nossos tempos de consulta. O motor Photon em agregações pesadas é um divisor de águas para dashboards quase em tempo real.

Preço/ROI: O modelo DBU leva um tempo para se acostumar, mas consolidar nosso data warehouse, ETL e ferramentas de ML em uma única plataforma reduziu significativamente nossos gastos gerais com infraestrutura.

Suporte/Integração: A Databricks Academy e a documentação embutida tornaram a integração de novos engenheiros mais rápida. O fórum da comunidade é surpreendentemente ativo para perguntas de nicho.

IA/Inteligência: O Genie (AI/BI) permite que usuários de negócios façam perguntas em inglês simples e obtenham resultados precisos, reduzindo solicitações ad hoc para nossa equipe de dados por uma margem notável. O Databricks Assistant dentro dos notebooks também acelera a geração de código e a depuração.

**O que você não gosta em Databricks?**

Embora o Databricks seja poderoso, existem pontos de atrito reais que vale a pena mencionar:

UI/UX: A interface pode parecer opressiva para novos usuários, pois a navegação entre Workspaces, Catálogos e SQL Warehouses nem sempre é intuitiva. A organização de pastas e notebooks poderia ser mais estruturada desde o início.

Integrações: Alguns conectores de terceiros ainda exigem configuração manual e código personalizado. O Lakehouse Federation é promissor, mas ocasionalmente inconsistente com certos sistemas de origem, necessitando de solução de problemas adicional.

Desempenho: Os tempos de inicialização de clusters continuam sendo um ponto problemático; inícios a frio em clusters interativos podem interromper fluxos de trabalho rápidos. A computação serverless ajuda, mas ainda não está disponível universalmente em todos os recursos.

Preço/ROI: O modelo de preços baseado em DBU carece de transparência para equipes mais novas. É fácil acumular custos inesperados sem políticas de cluster cuidadosas e monitoramento em vigor. Um estimador de custos mais direto ajudaria significativamente.

Suporte/Integração: Os tempos de resposta do suporte empresarial podem ser lentos para tickets não críticos. Para questões arquitetônicas complexas, chegar ao especialista certo muitas vezes requer múltiplas escalonamentos.

IA/Inteligência: O Genie funciona bem para consultas padrão, mas tem dificuldades com lógica complexa de múltiplas tabelas ou terminologia específica de domínio sem ajustes significativos. O Assistente do Databricks dentro dos notebooks ocasionalmente gera sugestões de API desatualizadas ou incorretas.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Antes do Databricks, nosso cenário de dados era fragmentado e ferramentas separadas para ETL, armazenamento de dados e ML significavam pipelines duplicados, definições de dados inconsistentes e um grande esforço de engenharia apenas para manter a infraestrutura.

Unificação de Dados: Lutávamos com dados isolados em vários sistemas de origem. Agora, com o Unity Catalog e a arquitetura Medallion (Bronze/Prata/Ouro), temos uma camada única e governada que todas as equipes confiam, reduzindo o esforço de reconciliação de dados em quase 40%.

Confiabilidade de Pipeline: Construir e manter pipelines orientados por metadados costumava exigir frameworks personalizados. O Lakeflow e o Delta Live Tables do Databricks nos deram capacidades de carga incremental e completa prontas para uso, reduzindo significativamente o tempo de desenvolvimento de pipelines.

Análise de Autoatendimento: As equipes de negócios dependiam constantemente dos engenheiros para consultas ad hoc. Com o Genie (AI/BI), as partes interessadas agora podem fazer perguntas em inglês simples contra tabelas de ouro curadas, reduzindo notavelmente as solicitações de dados ad hoc para nossa equipe semana após semana.

Controle de Custos na Nuvem: Anteriormente, executávamos clusters sempre ativos sem visibilidade sobre os gastos. A computação sem servidor e as políticas de cluster agora nos permitem dimensionar corretamente as cargas de trabalho, resultando em uma redução mensurável nos custos de infraestrutura.

Integração Mais Rápida: Novos engenheiros anteriormente levavam semanas para se tornarem produtivos. Com o Databricks Assistant, modelos de notebooks e documentação centralizada do Unity Catalog, o tempo de integração caiu consideravelmente.

No geral: O Databricks essencialmente substituiu 3-4 ferramentas separadas por uma plataforma coesa. O ROI não está apenas na economia de custos, mas na velocidade e confiança com que agora entregamos produtos de dados para o negócio.

**Official Response from Janelle Glover:**

> Estamos felizes em saber que você considera o Databricks valioso para engenharia de dados, análises e aprendizado de máquina. Obrigado por compartilhar seu feedback!

  ### 12. Ambiente escalável e tudo-em-um com alguma curva de aprendizado

**Rating:** 5.0/5.0 stars

**Reviewed by:** Antonio V. | Data &amp; AI Consultant, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 28, 2026

**O que você mais gosta em Databricks?**

Gosto do Databricks por sua escalabilidade e ambiente tudo-em-um para engenharia de dados, análises e aprendizado de máquina. Ele me permite processar grandes conjuntos de dados de forma eficiente enquanto mantém os fluxos de trabalho organizados em uma única plataforma. A escalabilidade é muito valiosa porque me permite lidar com volumes de dados crescentes e cargas de trabalho complexas sem problemas de desempenho. À medida que os projetos se expandem, a plataforma pode escalar os recursos de forma eficiente.

**O que você não gosta em Databricks?**

Algumas funcionalidades podem ter uma curva de aprendizado, especialmente para novos usuários trabalhando com configurações avançadas ou gerenciamento de clusters. A interface também poderia ser mais intuitiva em certas áreas. A configuração foi relativamente tranquila para funcionalidades principais, mas algumas configurações avançadas como otimização de clusters, permissões e integrações exigiram mais tempo e conhecimento técnico.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Databricks resolve grandes desafios de gerenciamento e análise de dados ao lidar eficientemente com grandes conjuntos de dados, simplificar processos de ETL e centralizar fluxos de trabalho. Sua escalabilidade me permite gerenciar volumes de dados crescentes sem problemas de desempenho, garantindo que os recursos escalem eficientemente à medida que os projetos se expandem.

**Official Response from Jess Darnell:**

> Estamos felizes em saber que você considera o Databricks escalável e aprecia seu ambiente tudo-em-um para engenharia de dados, análise e aprendizado de máquina. Entendemos que alguns recursos podem ter uma curva de aprendizado, e estamos continuamente trabalhando para melhorar a usabilidade e a intuitividade da plataforma.

  ### 13. Desempenho com Spark e notebooks colaborativos que deixam o fluxo de dados mais eficiente

**Rating:** 5.0/5.0 stars

**Reviewed by:** Homero F. | Professor particular, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 19, 2026

**O que você mais gosta em Databricks?**

O que mais gosto é o desempenho no processamento de grandes volumes de dados com Spark, os notebooks colaborativos que facilitam o trabalho em equipe e as integrações com AWS e ferramentas de BI, que deixam todo o fluxo de dados mais eficiente.

**O que você não gosta em Databricks?**

O custo pode ser alto dependendo do uso e algumas partes da interface, como configuração de clusters e jobs, não são tão intuitivas no início. Além disso, a curva de aprendizado pode ser um pouco elevada para novos usuários.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Databricks resolve problemas de processamento de grandes volumes de dados, integração de diferentes fontes e desenvolvimento de modelos de IA em um só ambiente. Isso melhora nosso fluxo de trabalho, reduz o tempo de processamento e centraliza tudo na plataforma. As integrações com AWS e outras ferramentas facilitam a implementação, e o suporte junto com a documentação ajudam na adaptação. Além disso, os recursos de IA permitem criar, treinar e testar modelos de forma mais rápida e eficiente.

**Official Response from Jess Darnell:**

> Obrigado pelo seu feedback positivo!

  ### 14. Análise Unificada Poderosa com Governança Sem Costura e Escalonamento Sem Esforço

**Rating:** 4.5/5.0 stars

**Reviewed by:** Akhil S. | Senior Data Engineer, Empresa (> 1000 emp.)

**Reviewed Date:** April 16, 2026

**O que você mais gosta em Databricks?**

O que eu mais gosto no Databricks é seu poderoso e unificado ecossistema de análises. Recursos como o Unity Catalog e o Metastore tornam a governança de dados e o controle de acesso sem complicações, enquanto a arquitetura Lakehouse combina o melhor dos data lakes e data warehouses. O suporte a PySpark, dbutils e os espaços de trabalho colaborativos tornam o desenvolvimento eficiente, e a computação serverless simplifica a escalabilidade sem sobrecarga de infraestrutura.

**O que você não gosta em Databricks?**

O que eu não gosto no Databricks é o tempo de inicialização lento dos clusters de uso geral, que pode interromper o fluxo de trabalho e reduzir a produtividade. Além disso, a integração com o Git pode parecer um pouco lenta às vezes, especialmente durante commits ou sincronizações, tornando o controle de versão menos fluido do que o esperado.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Databricks resolve o desafio de gerenciar fluxos de trabalho de dados de ponta a ponta ao fornecer uma plataforma unificada para engenharia de dados, ciência de dados e análises. Ele permite o processamento de dados, transformação e desenvolvimento de modelos de forma integrada em um único ambiente.

Isso me beneficia ao simplificar meu fluxo de trabalho tanto como engenheiro de dados quanto como cientista de dados, reduzindo a necessidade de alternar entre ferramentas. Além disso, sua integração com o Azure Data Factory permite uma orquestração e acionamento de tarefas suaves para ambientes superiores, tornando as implantações mais eficientes e confiáveis.

**Official Response from Jess Darnell:**

> Estamos satisfeitos em saber que o Databricks está simplificando seus fluxos de trabalho de dados e proporcionando uma integração perfeita com o Azure Data Factory. Tomamos nota de suas preocupações sobre os tempos de inicialização lentos e a integração com o Git, e estamos comprometidos em otimizar esses aspectos para garantir uma experiência mais suave para nossos usuários. Seu feedback nos ajuda a priorizar melhorias que estejam alinhadas com as necessidades de nossos usuários.

  ### 15. Plataforma Colaborativa e Sem Costura que Escala para Engenharia de Dados e ML

**Rating:** 4.0/5.0 stars

**Reviewed by:** Krish G. | student, Pequena Empresa (50 ou menos emp.)

**Reviewed Date:** April 15, 2026

**O que você mais gosta em Databricks?**

A capacidade do Databricks de integrar tudo de forma perfeita é o que acho mais atraente. Ao trabalhar em projetos reais, faz uma grande diferença não ter que alternar entre várias ferramentas para engenharia de dados, análise e aprendizado de máquina.

O elemento colaborativo é muito notável. As equipes podem colaborar facilmente sem que as coisas fiquem confusas, graças à sensação fluida e dinâmica dos notebooks. Para trabalhos significativos com dados, assemelha-se quase exatamente ao Google Docs.

Também gosto muito de como ele gerencia grandes quantidades de dados de forma eficiente, sem parecer complicado. Mesmo ao trabalhar com grandes conjuntos de dados, a plataforma parece amigável e pode ser escalada quando necessário.

Além disso, faz todo o sentido do ponto de vista de IA/ML. Você é capaz de construir,

**O que você não gosta em Databricks?**

O Databricks pode inicialmente parecer um pouco avassalador, o que é algo que eu não gosto. Clusters, notebooks, jobs, workflows—há muita coisa acontecendo, e se você é novo, leva algum tempo para realmente entender como tudo funciona junto.

O controle de custos é outra desvantagem. É indubitavelmente poderoso, mas as despesas podem aumentar rapidamente se você não tomar cuidado com o uso de clusters ou as configurações de auto-escalonamento. Para manter tudo sob controle, você precisa exercer algum autocontrole e ficar de olho nas coisas.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

A questão da fragmentação no fluxo de trabalho de dados e IA é resolvida principalmente pelo Databricks. No passado, o armazenamento, processamento, análise de dados e aprendizado de máquina eram geralmente realizados usando ferramentas diferentes, e fazer com que todas cooperassem era frequentemente difícil e demorado. O Databricks elimina grande parte do atrito ao combinar tudo em uma única plataforma.
Isso torna o processo de desenvolvimento muito mais fluido para mim. Não preciso me preocupar com problemas de compatibilidade ou perder tempo alternando entre ambientes. Posso realizar transformações, limpar dados e criar modelos tudo em um só lugar, o que reduz o tempo de configuração e mantém a organização.
Também aborda a dificuldade de lidar com grandes volumes de dados.
Posso confiar em suas capacidades de computação distribuída para gerenciar cargas de trabalho exigentes, em vez de me preocupar com infraestrutura ou otimização de desempenho do zero. Isso me permite concentrar menos na gestão de recursos e mais em encontrar uma solução para o problema real.
A colaboração é outra questão importante que ele resolve. Compartilhar código, descobertas e experimentos pode se tornar desorganizado em ambientes de equipe. Como tudo está consolidado com o Databricks, é mais fácil trabalhar em conjunto, monitorar mudanças e manter o alinhamento.
Considerando tudo, ele me ajuda a reduzir a complexidade, economizar tempo e me permite concentrar mais no desenvolvimento de soluções—sejam elas análises, modelos de aprendizado de máquina ou pipelines de dados—em vez de lidar com a sobrecarga de manter inúmeras ferramentas e plataformas.

**Official Response from Jess Darnell:**

> Estamos felizes em saber que você acha a integração perfeita e os recursos colaborativos do Databricks atraentes. Entendemos que a plataforma pode parecer avassaladora inicialmente, mas oferecemos recursos abrangentes e suporte para ajudar os usuários a se familiarizarem rapidamente. Em relação ao controle de custos, recomendamos aproveitar nossa documentação e melhores práticas para otimizar o uso de clusters e as configurações de auto-escalonamento. Seu feedback é apreciado e estamos comprometidos em melhorar continuamente a experiência do usuário!

  ### 16. Databricks como um Engenheiro de Dados Prático: Solucionando Desafios Reais de ETL, Governança e Lakehouse

**Rating:** 5.0/5.0 stars

**Reviewed by:** KAVIN P. | Data Engineer, Tecnologia da Informação e Serviços, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 08, 2026

**O que você mais gosta em Databricks?**

Acredito que a coisa mais atraente sobre o Databricks reside na sua natureza tudo-em-um, que facilita o gerenciamento de dados. Anteriormente, quando eu usava várias ferramentas para atividades relacionadas a dados, a experiência não era ótima, mas aqui tudo parece estar interconectado e direto.

A capacidade de utilizar notebooks, especialmente ao trabalhar com PySpark, é outra vantagem do Databricks que eu gosto no núcleo. A ferramenta permite executar rapidamente mudanças e modificações sem preparação excessiva. Isso também impacta positivamente o processo de colaboração entre minha equipe, que pode trabalhar simultaneamente em seus projetos e monitorar o progresso geral. No entanto, o controle de versão às vezes pode parecer um pouco confuso na minha visão.

Em termos de desempenho, o Databricks parece eficiente para mim ao lidar com big data e operar suavemente sem atrasos. O dimensionamento de clusters ocorre automaticamente, permitindo que eu e minha equipe economizemos tempo no nível da infraestrutura. Portanto, é fácil, pois não são necessários planejamentos e ajustes adicionais.

Existem pequenos problemas com a interface do usuário, que às vezes funciona lentamente. Mas, no geral, devido a outros aspectos super como métodos fáceis de implementar e integrar coisas, isso me incentiva a utilizar o Databricks com frequência.

**O que você não gosta em Databricks?**

Um aspecto do Databricks que não gosto é sua interface de usuário. À medida que você passa mais tempo usando a ferramenta, mover-se entre notebooks e clusters se torna irritante às vezes.

Outro problema são os custos que podem se acumular rapidamente quando não somos cautelosos. Clusters desnecessários podem estar rodando por um período mais longo do que o necessário e sem o meu conhecimento ou o da minha equipe, aumentando assim os custos em nossos projetos.

Há também a complexidade de depurar os erros, que são difíceis às vezes, pois envolve gastar esforço extra tentando descobrir onde as coisas podem ter dado errado, principalmente ao lidar com pipelines complexos.

Às vezes, há algumas discrepâncias em relação ao atendimento ao cliente, que nos levam a lugares onde não precisamos estar.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

A questão mais importante que o Databricks resolve é a questão de trabalhar com grandes volumes de dados e manter a consistência. Anteriormente, havia processos separados para engenharia de dados, análises e operações de aprendizado de máquina, exigindo ferramentas separadas e tornando difícil para mim lidar com isso, mas agora tudo está em um só lugar. Outro problema crítico resolvido pelo Databricks é o processamento de grandes volumes de dados. Utilizando o Spark e a computação distribuída, ele permite realizar tarefas que eram extremamente lentas nos sistemas legados com os quais trabalhei. Isso ajudou a acelerar meu pipeline, embora às vezes ocorram atrasos. A colaboração também é outro problema que o Databricks aborda. Vários usuários podem colaborar no mesmo notebook ou conjuntos de dados. A colaboração anteriormente era confusa, e agora é fácil, boa e facilmente compreensível, e principalmente fácil compartilhar notebooks e ativos. A escalabilidade é outra questão resolvida pelo Databricks; não há necessidade de prestar atenção à gestão da infraestrutura. O dimensionamento do cluster depende dos requisitos do usuário, economizando tempo. Anteriormente, era necessário prestar mais atenção à configuração da infraestrutura.

**Official Response from Jess Darnell:**

> Estamos felizes em saber que você considera a natureza tudo-em-um e a interconexão do Databricks benéficas para a gestão de dados, ajudando sua equipe a economizar tempo. Agradecemos seu feedback sobre as vantagens de utilizar notebooks e a eficiência no manuseio de big data.

  ### 17. Espaço de Trabalho Unificado do Databricks Que Simplifica a Colaboração e os Fluxos de Trabalho de Dados Complexos

**Rating:** 4.0/5.0 stars

**Reviewed by:** Neeraj Kumar N. | AI Data Specialist | Transcription &amp; Annotation Expert | AI Model Training at Sigma AI, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 12, 2026

**O que você mais gosta em Databricks?**

O que eu mais gosto no Databricks é como ele reúne engenharia de dados, análise e aprendizado de máquina em um espaço de trabalho unificado. Acho a colaboração muito mais fácil com cadernos compartilhados, e a integração perfeita com ferramentas de big data me economiza tempo. Ele simplifica fluxos de trabalho complexos, enquanto ainda oferece capacidades poderosas quando eu preciso delas.

**O que você não gosta em Databricks?**

Uma coisa que não gosto no Databricks é que pode parecer caro, especialmente para projetos ou equipes menores. Também acho a configuração de clusters e o gerenciamento de custos um pouco complexos às vezes. A interface, embora poderosa, pode ser intimidante para iniciantes, e depurar trabalhos distribuídos nem sempre é tão simples quanto eu gostaria.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Databricks resolve o desafio de lidar com o processamento de dados em grande escala, análises e aprendizado de máquina em um só lugar. Para mim, ele elimina o incômodo de gerenciar ferramentas e infraestrutura separadas. Eu me beneficio trabalhando de forma mais eficiente, colaborando facilmente com minha equipe e transformando dados complexos em insights úteis mais rapidamente, com menos sobrecarga operacional no geral.

**Official Response from Jess Darnell:**

> Estamos felizes em saber que você considera valiosos os recursos de espaço de trabalho unificado e colaboração do Databricks para o seu trabalho. Entendemos suas preocupações sobre custo e complexidade, e estamos continuamente trabalhando para melhorar nessas áreas.

  ### 18. Plataforma de dados confiável com suporte poderoso para pipelines

**Rating:** 4.5/5.0 stars

**Reviewed by:** Chandhuru B. | Data Engineer, Tecnologia da Informação e Serviços, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 06, 2026

**O que você mais gosta em Databricks?**

O que eu mais gosto no Databricks é como ele reúne engenharia de dados, análise e aprendizado de máquina em um espaço de trabalho limpo. Ele economiza tempo, facilita a colaboração e ajuda as equipes a avançarem mais rapidamente com grandes volumes de dados.

**O que você não gosta em Databricks?**

O que eu não gosto no Databricks é que o Auto Loader pode se tornar frustrante quando os dados de origem mudam com frequência, especialmente se os nomes das colunas ou os tipos de dados mudam sem aviso prévio.

Por exemplo, um campo como customer_id pode de repente aparecer como cust_id, ou uma coluna que anteriormente era uma string pode começar a chegar como um inteiro, o que pode causar deriva de esquema e quebrar o processamento a jusante.

Também acho inconveniente quando a inferência de esquema não é totalmente precisa, como quando JSON aninhado ou dados semiestruturados são lidos incorretamente, porque isso então requer correções manuais extras e manutenção para manter os pipelines funcionando sem problemas.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

A Databricks está resolvendo o problema de construir e gerenciar pipelines de dados em escala sem tanto esforço manual. Ela ajuda com a ingestão confiável, evolução de esquemas e orquestração, para que as equipes possam processar dados mais rapidamente e manter os pipelines mais estáveis, mesmo quando os arquivos de origem mudam.

Para mim, isso significa menos tempo gasto corrigindo trabalhos quebrados e mais tempo focando em transformar e usar os dados. Também me beneficia ao tornar os fluxos de trabalho em lote e streaming mais fáceis de gerenciar em uma única plataforma, o que é especialmente útil quando os dados continuam mudando.

**Official Response from Janelle Glover:**

> Estamos felizes em saber que você considera o Databricks uma plataforma confiável para engenharia de dados, análises e aprendizado de máquina. Entendemos a frustração com o Auto Loader ao lidar com dados de origem que mudam frequentemente. Estamos continuamente trabalhando para melhorar a precisão da inferência de esquema e o tratamento de JSON aninhado ou dados semiestruturados para minimizar correções manuais e manutenção para nossos usuários.

  ### 19. Adoro o Databricks e seus recursos e o Unity Catalog para governança simplificada

**Rating:** 4.5/5.0 stars

**Reviewed by:** Prashant N. | Data Engineer, Empresa (> 1000 emp.)

**Reviewed Date:** May 26, 2026

**O que você mais gosta em Databricks?**

No Databricks, eu realmente gosto dos recursos mais novos, como o Gennie, o Assistente do Databricks, agentes e o mecanismo de disparo de eventos.

Além disso, o recurso Unity Catalog é incrível. Ter um lugar para todas as fontes facilita muito as coisas, e o UC ajuda a governar as tabelas de uma maneira mais organizada.

**O que você não gosta em Databricks?**

Nada de especial para não gostar, mas há um recurso para pular para um comando específico. O recurso em si é bom, mas está colocado bem ao lado do caderno, o que facilita clicar acidentalmente, e isso quebra meu fluxo de trabalho.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Estou usando isso no meu projeto para processamento de dados e análise de qualidade de dados. Com o Databricks e sua funcionalidade, estou construindo agentes no espaço Genie. Usando o UC, estou gerenciando todas as tabelas gerenciadas e externas em um só lugar.

**Official Response from Jess Darnell:**

> Estamos felizes em saber que você está gostando dos novos recursos como Gennie, Databricks Assistant, agentes e o mecanismo de gatilho de eventos, assim como o recurso Unity Catalog. Agradecemos seu feedback!

  ### 20. Databricks: Plataforma Unificada para Processamento e Análise de Dados

**Rating:** 5.0/5.0 stars

**Reviewed by:** Banu Prakash M. | Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 02, 2026

**O que você mais gosta em Databricks?**

Gosto que o Databricks traga tudo para um só lugar, tornando desnecessário o uso de diferentes ferramentas para processamento de dados, análises e trabalho de pipeline. Ele lida bem com grandes volumes de dados, e não precisamos nos preocupar em gerenciar clusters manualmente. Além disso, o Databricks lida bem com colaboração e experimentação, tornando fácil experimentar coisas novas.

**O que você não gosta em Databricks?**

Do meu ponto de vista, a única área que pode ser melhorada é a gestão de custos. Se os clusters não forem monitorados cuidadosamente, os custos podem aumentar mais rápido do que o esperado. Uma melhoria que ajudaria é uma melhor visibilidade dos custos em um nível mais detalhado. Mais alertas embutidos ou recomendações quando os custos começarem a aumentar inesperadamente também seriam úteis.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Databricks nos ajuda a lidar com grandes conjuntos de dados e construir pipelines de dados. Ele simplifica o processamento, a transformação e a análise de dados usando Spark e SQL, tudo em um só lugar. Ele resolve o problema do processamento de dados lento espalhado por sistemas, gerenciando a infraestrutura automaticamente e facilitando a colaboração e a experimentação.

**Official Response from Janelle Glover:**

> Estamos entusiasmados em saber que o Databricks tem sido benéfico para lidar com grandes conjuntos de dados e simplificar o processamento e análise de dados para você. Agradecemos seu feedback sobre a gestão de custos e exploraremos maneiras de melhorar a visibilidade dos custos e fornecer melhores ferramentas de monitoramento.

  ### 21. Um Cavalo de Batalha Confiável para Engenharia de Dados e Análise

**Rating:** 5.0/5.0 stars

**Reviewed by:** Supriya  M. | Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 31, 2026

**O que você mais gosta em Databricks?**

A abordagem de plataforma unificada é o que mais aprecio. Ter notebooks, pipelines de engenharia de dados, fluxos de trabalho de ML e análises SQL tudo em um só lugar economiza muito tempo em vez de lidar com várias ferramentas. Os notebooks colaborativos facilitam o compartilhamento de trabalho com colegas de equipe, e o gerenciamento de clusters ficou muito mais suave ao longo do tempo. A integração com o Delta Lake também é uma grande vantagem para manter nossos dados confiáveis e consistentes.

**O que você não gosta em Databricks?**

O custo pode sair do controle rapidamente se você não for cuidadoso com o dimensionamento do cluster e o tempo de atividade. Nem sempre é óbvio como otimizar os gastos, e o modelo de preços parece complexo. A curva de aprendizado para novos membros da equipe também é mais íngreme do que eu gostaria, especialmente para pessoas que não estão familiarizadas com o Spark. Às vezes, a interface do usuário pode parecer lenta ao trabalhar com notebooks maiores, e a depuração de falhas de trabalho poderia ser mais direta.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Databricks me ajuda a resolver falhas complexas em pipelines de ETL e problemas persistentes de qualidade de dados em análises de cadeia de suprimentos, unificando o processamento em lote e em streaming de sistemas SAP com Delta Live Tables. Também elimina muitos dos problemas de gerenciamento de infraestrutura graças aos clusters de auto-escalonamento, para que eu possa me concentrar em escrever código para cargas de trabalho de multi-terabytes em vez de me preocupar constantemente com o dimensionamento dos clusters.

Para meus projetos de dados de manufatura, o Databricks acelera os ciclos de desenvolvimento de semanas para dias através de notebooks colaborativos e pipelines DLT, permitindo relatórios mais rápidos no Power BI e decisões de stakeholders. O Unity Catalog centraliza a governança em fontes Azure e SAP, prevenindo a deriva de esquemas que atormentava os lagos baseados em Hive anteriormente.

**Official Response from Janelle Glover:**

> Obrigado por destacar os benefícios da abordagem de plataforma unificada e os recursos que economizam tempo do Databricks. Entendemos suas preocupações sobre a gestão de custos e a curva de aprendizado, e estamos continuamente trabalhando para simplificar nosso modelo de preços e melhorar a experiência de integração para novos membros da equipe. É ótimo ouvir como o Databricks está ajudando você a resolver falhas complexas em pipelines ETL e a acelerar os ciclos de desenvolvimento para seus projetos de dados de manufatura.

  ### 22. Tudo-em-Um Potente com Espaço para Clareza de Preços

**Rating:** 4.5/5.0 stars

**Reviewed by:** Thoufeeq A. | DevOps Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 02, 2026

**O que você mais gosta em Databricks?**

Gosto que o Databricks seja uma potência tudo-em-um onde posso realizar múltiplos trabalhos em um só lugar. É poderoso para gerenciar dados de várias fontes e tê-los em um único UC para gerenciar permissões com segurança em nível de linha. Também aprecio que posso criar experimentos, executar múltiplos modelos e selecionar o melhor a partir dos logs, o que era difícil em outras plataformas. Uma vez que aprendi a configuração, tem sido fácil e confortável trabalhar com ele.

**O que você não gosta em Databricks?**

Acho difícil usar a calculadora para determinar os preços dos endpoints de serviço de CPU porque a documentação não explica isso explicitamente. Ela apenas menciona que 1 concorrência equivale a 1 DBU na página da Azure, o que não é claro. A calculadora de preços tem uma única opção para endpoints de serviço, rotulada como média com quatro DBU, mas não possui opções separadas para GPU ou CPU e suas concorrências, tornando difícil entender como funciona corretamente. Inicialmente, também achei muito difícil aprender Databricks e gerenciar implantações de workspaces, embora tenha se tornado mais fácil com o tempo.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Databricks consolida várias ferramentas em uma única plataforma, tornando-a poderosa e conveniente. Posso gerenciar permissões com segurança em nível de linha e executar facilmente experimentos para selecionar os melhores modelos, tudo em um só lugar.

**Official Response from Janelle Glover:**

> Obrigado por compartilhar sua experiência positiva com o Databricks. Entendemos suas preocupações sobre a calculadora de preços e levaremos seu feedback em consideração para melhorar a clareza de nossa documentação.

  ### 23. Potência do Databricks Lakehouse com Unity Catalog e Fast Photon SQL

**Rating:** 4.0/5.0 stars

**Reviewed by:** Vidhyadar R. | Data Engineer, Empresa (> 1000 emp.)

**Reviewed Date:** April 01, 2026

**O que você mais gosta em Databricks?**

Eu realmente valorizo como a plataforma reúne data lakes e data warehouses em um só lugar. Isso torna o gerenciamento de dados muito mais fácil, e o desempenho do SQL é muito rápido graças ao motor Photon. Também gosto dos notebooks colaborativos porque me permitem trabalhar com SQL e Python de forma integrada em um único ambiente.

**O que você não gosta em Databricks?**

O custo pode ser alto, e o sistema de faturamento DBU é bastante complexo de acompanhar. Também descobri que há uma curva de aprendizado significativa quando se trata de Spark e configuração de clusters. Para tarefas menores e rápidas, o tempo de configuração e a sobrecarga técnica às vezes podem parecer um pouco demais.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Resolve o problema de ter dados espalhados por toda parte. Adoro poder alternar entre SQL e Python no mesmo lugar, e a velocidade de processamento é de primeira linha. Tem sido um divisor de águas para construir nossos modelos financeiros rapidamente, sem a lentidão habitual.

**Official Response from Janelle Glover:**

> Agradecemos seu feedback sobre os benefícios do Databricks, como a gestão centralizada de dados e a capacidade de trabalhar com SQL e Python em um único ambiente. Entendemos suas preocupações sobre custo e curva de aprendizado, e estamos trabalhando ativamente para melhorar a plataforma para atender melhor às suas necessidades.

  ### 24. Engenharia de Dados, Ciência e Análise Unificadas em Uma Plataforma Colaborativa

**Rating:** 4.5/5.0 stars

**Reviewed by:** Sivabalan A. | Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 02, 2026

**O que você mais gosta em Databricks?**

O que mais aprecio no Databricks é sua capacidade de unificar engenharia de dados, ciência de dados e análises em uma única plataforma. O ambiente colaborativo—especialmente os notebooks e os fluxos de trabalho integrados—torna muito mais fácil para equipes com diferentes níveis de habilidade trabalharem juntas sem a necessidade constante de troca de contexto.

Outro destaque é a integração com ferramentas populares e serviços de nuvem amplamente utilizados no mercado hoje, o que facilita a movimentação de dados entre eles. Os recursos de monitoramento de desempenho e agendamento de tarefas ajudam a manter a visibilidade sobre os pipelines, e o suporte ao Delta Lake para gerenciamento confiável de dados também tem sido muito útil.

**O que você não gosta em Databricks?**

A gestão de custos é uma área que poderia ser melhorada. Embora o Databricks ofereça opções de escalonamento automático e clusters flexíveis, é fácil que o uso de recursos aumente inesperadamente, especialmente com grandes conjuntos de dados e tarefas de longa duração. Manter os custos previsíveis muitas vezes requer supervisão cuidadosa e uma compreensão sólida do modelo de preços da plataforma.

Além disso, alguns dos recursos mais avançados — como controles de acesso granulares e orquestração de tarefas mais complexas — podem parecer menos intuitivos. A documentação é extensa, mas ocasionalmente deixa lacunas que acabam exigindo tentativa e erro.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Databricks aborda vários desafios importantes nos fluxos de trabalho de dados modernos, particularmente em torno da escalabilidade, confiabilidade dos dados e análises colaborativas. Um problema principal que ele resolve é o gerenciamento e processamento de conjuntos de dados em grande escala de forma eficiente. Ao aproveitar o framework de computação distribuída do Apache Spark, o Databricks permite pipelines ETL paralelizados e transformações de dados em grande escala que seriam impraticáveis em infraestruturas tradicionais.

Outro desafio é garantir a consistência e confiabilidade dos dados em todos os pipelines. Com o Delta Lake, o Databricks fornece armazenamento compatível com ACID, tabelas versionadas e aplicação de esquemas, o que reduz erros de dados e simplifica a governança de dados. Isso é especialmente benéfico quando várias equipes estão trabalhando em diferentes estágios dos pipelines de dados ao mesmo tempo.

O Databricks também ajuda a resolver o problema de fluxos de trabalho fragmentados para cientistas de dados e engenheiros. Seu ambiente unificado suporta várias linguagens (Python, SQL, R, Scala) e inclui aprendizado de máquina integrado com o MLFlow, facilitando a colaboração e a transição da preparação de dados para análises e ML em um só lugar.

**Official Response from Janelle Glover:**

> É ótimo saber como o Databricks está ajudando a resolver os desafios de escalabilidade, confiabilidade de dados e análises colaborativas para sua equipe. Agradecemos seu feedback sobre gerenciamento de custos e usabilidade de recursos avançados. Estamos continuamente trabalhando para melhorar nossa transparência de preços e aprimorar a experiência do usuário para todos os nossos recursos.

  ### 25. Plataforma Tudo-em-Um Que Nos Ajuda a Iterar Rapidamente e Implantar com Confiança

**Rating:** 5.0/5.0 stars

**Reviewed by:** Vijayaramuprawin V. | Sr. Cloud and DevOps Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 01, 2026

**O que você mais gosta em Databricks?**

Usamos o Databricks diariamente como nossa plataforma de dados principal para construir e executar pipelines em uma arquitetura de medalhão, desde a extração de dados do SAP e Arkieva até conjuntos de dados prontos para relatórios. A experiência com notebooks é intuitiva, o conjunto de recursos é enorme, e os Asset Bundles tornaram nossa história de CI/CD com o Azure DevOps realmente sólida. A integração com serviços de nuvem foi tranquila, e uma vez que as coisas estão configuradas, elas simplesmente funcionam. A curva de aprendizado pode ser íngreme para novos membros da equipe, especialmente em relação a coisas como Unity Catalog e DABs, e os custos podem aumentar se você não estiver atento às configurações de cluster. O suporte é decente e a documentação é forte o suficiente para que raramente precisemos abrir um ticket. No geral, é uma plataforma poderosa que faz muito sob um mesmo teto, e é difícil imaginar nosso fluxo de trabalho de engenharia de dados sem ela.

**O que você não gosta em Databricks?**

O custo pode aumentar rapidamente se você não for cuidadoso com o dimensionamento de clusters e as configurações de trabalho, então é necessário algum esforço para manter as coisas otimizadas. Além disso, a curva de aprendizado para novos membros da equipe pode ser íngreme, especialmente em relação a coisas como Asset Bundles, Unity Catalog e a configuração adequada das peças de CI/CD.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

A Databricks está resolvendo o problema de ter dados fragmentados espalhados por vários sistemas como SAP e Arkieva, oferecendo-nos uma plataforma unificada para extrair, transformar e servir tudo. Isso significa que nossas equipes de negócios obtêm dados limpos, confiáveis e prontos para relatórios sem que precisemos lidar com uma série de ferramentas separadas, e podemos implantar e gerenciar tudo de forma consistente em todos os ambientes com confiança.

**Official Response from Janelle Glover:**

> Estamos felizes em saber que o Databricks tem sido fundamental para otimizar seu fluxo de trabalho de engenharia de dados e fornecer uma plataforma poderosa para suas necessidades. Agradecemos seu feedback sobre a curva de aprendizado e considerações de custo, e estamos continuamente trabalhando para melhorar nessas áreas.

  ### 26. Fluxos de Trabalho de Dados Colaborativos e Simplificados com Desempenho Poderoso

**Rating:** 5.0/5.0 stars

**Reviewed by:** Dharun T. | Senior Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 01, 2026

**O que você mais gosta em Databricks?**

O que eu mais gosto no Databricks é como ele simplifica todo o fluxo de trabalho de dados ao reunir processamento, análise e aprendizado de máquina em uma única plataforma. O ambiente colaborativo de notebooks facilita o compartilhamento de código, contexto e raciocínio com os colegas de equipe, o que ajuda todos a se manterem alinhados. Ele também tem um desempenho forte em grandes conjuntos de dados enquanto abstrai a maior parte do gerenciamento de clusters, permitindo que eu me concentre em resolver o problema em vez de lidar com a infraestrutura. Além disso, o controle de acesso centralizado e a visibilidade clara no uso de dados apoiam uma governança de dados responsável, oferecendo um equilíbrio sólido entre poder e facilidade de uso.

**O que você não gosta em Databricks?**

O Databricks tem algumas desvantagens, embora muitas delas pareçam mais como compensações do que como aspectos negativos diretos. Minha maior preocupação é o custo: se os clusters não forem geridos cuidadosamente, as despesas podem aumentar rapidamente, mesmo que a plataforma possa escalar de forma muito eficiente quando está devidamente ajustada. Há também uma curva de aprendizado real com o Spark e conceitos de computação distribuída, e a depuração ou ajuste de desempenho pode ser mais complexo do que com ferramentas mais simples. Por último, por ser um serviço gerenciado, você abre mão de algum controle de baixo nível em comparação com sistemas auto-hospedados, mas a vantagem é que isso tira muito do trabalho operacional e de infraestrutura das suas mãos.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Como meu cliente precisa de código seguro e reutilizável, o Databricks nos ajuda a escrever Python de forma eficiente enquanto aplicamos princípios de POO e padrões de design. Também torna simples a extensão da funcionalidade ao longo do tempo e a construção de código personalizado que interage com APIs e bancos de dados.

**Official Response from Janelle Glover:**

> Estamos felizes em saber que você considera o Databricks uma plataforma poderosa e simplificada para fluxos de trabalho colaborativos de dados. Entendemos as preocupações sobre a gestão de custos e a curva de aprendizado associada aos conceitos de computação distribuída. Trabalhamos continuamente para melhorar nossa plataforma e fornecer recursos para ajudar os usuários a otimizar seu uso e superar desafios.

  ### 27. Databricks: Solução Completa para Dados e Análise

**Rating:** 5.0/5.0 stars

**Reviewed by:** FABIN P. | Senior Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** April 01, 2026

**O que você mais gosta em Databricks?**

O que eu mais gosto no Databricks é que ele reúne tudo em um só lugar, facilitando o trabalho com dados, a construção de modelos e o gerenciamento de fluxos de trabalho. Ele ajuda as equipes a colaborarem facilmente em tempo real. Também funciona muito rápido com grandes volumes de dados usando o Apache Spark, e recursos como automação e Delta Lake tornam o manuseio de big data muito mais simples.

**O que você não gosta em Databricks?**

Uma coisa que eu não gosto no Databricks é que pode ser caro, especialmente para grandes cargas de trabalho. Às vezes, a interface e a configuração podem parecer complexas para iniciantes. Além disso, gerenciar clusters e configurações pode exigir algum esforço se você não estiver muito familiarizado com isso.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Databricks resolve o problema de lidar com grandes quantidades de dados de forma eficiente. Ele reúne engenharia de dados, análise e aprendizado de máquina em uma única plataforma. Isso elimina a necessidade de usar várias ferramentas. Ele ajuda no processamento mais rápido de dados usando o Apache Spark. Facilita a colaboração para equipes. Simplifica a construção e gestão de pipelines de dados. Melhora a confiabilidade dos dados com recursos como o Delta Lake. Reduz o trabalho manual através da automação. Economiza tempo e esforço nas tarefas diárias. No geral, me ajuda a trabalhar mais rápido e de forma mais eficiente com dados.

**Official Response from Janelle Glover:**

> Estamos felizes em saber que o Databricks tem sido fundamental para otimizar seu fluxo de trabalho de engenharia de dados e fornecer uma plataforma poderosa para suas necessidades. Agradecemos seu feedback sobre a curva de aprendizado e considerações de custo, e estamos continuamente trabalhando para melhorar nessas áreas.

  ### 28. Do Caos do Hive ao Catálogo de Unidade - Vale Cada DBU

**Rating:** 5.0/5.0 stars

**Reviewed by:** Balakumaran R. | Data Team Lead, Empresa (> 1000 emp.)

**Reviewed Date:** March 31, 2026

**O que você mais gosta em Databricks?**

O Unity Catalog tem sido o maior valor agregado para nossa migração empresarial. Mudamos de uma arquitetura Hive Metastore para o Unity Catalog e ganhamos governança centralizada, rastreamento de linhagem e controle de acesso detalhado em todos os nossos ativos de dados sem adicionar ferramentas de terceiros. Para uma organização multi-domínio (finanças, manufatura, cadeia de suprimentos, compras), ter um catálogo que aplica nomenclatura e permissões consistentes nas camadas bronze, prata, ouro e platina nos poupou semanas de trabalho manual de políticas.

UI/UX: A experiência no notebook com Spark SQL e PySpark embutidos, combinada com o navegador de arquivos do workspace, torna simples para nossa equipe desenvolver e testar transformações de forma iterativa. O editor SQL para consultas ad-hoc contra tabelas do Unity Catalog é limpo e responsivo.

Integrações: O suporte nativo ao Delta Lake significa que não gerenciamos conversões de formato. A integração com o Azure Key Vault via escopos de segredo (dbutils.secrets.get) mantém as credenciais fora do código. A integração com o ADF para orquestração em nosso ambiente V1 foi tranquila, e os Databricks Asset Bundles (DAB) para implantação V2 nos dão um caminho limpo de CI/CD com configurações databricks.yml direcionadas para dev/qa/prod sem scripts personalizados.

Desempenho: A mudança para CTEs em vez de visualizações temporárias em nossos notebooks Gold reduziu visivelmente a pressão de memória do cluster. A capacidade de dimensionar corretamente os clusters por ambiente (1 trabalhador para desenvolvimento, 3 para produção) com nós Standard_D4ds_v5 mantém os custos previsíveis enquanto mantém o desempenho para nossas cargas de trabalho ETL em lote.

Preço/ROI: O modelo de computação pay-as-you-go combinado com clusters de modo de segurança de usuário único significa que não estamos superprovisionando. Consolidar nossa camada de ETL, governança e BI em uma única plataforma eliminou o licenciamento para ferramentas separadas de catálogo, orquestração e qualidade de dados.

AI/Inteligência (Genie): Os Genie Spaces foram uma vitória inesperada. Nossos analistas de negócios em finanças e cadeia de suprimentos podem fazer perguntas em linguagem natural contra tabelas Gold/Platinum curadas sem escrever SQL. Isso reduziu o número de solicitações de relatórios ad-hoc que chegam à equipe de dados, dando aos usuários de domínio um caminho de autoatendimento que ainda respeita as permissões do Unity Catalog.

Suporte/Onboarding: A documentação é completa, e a abordagem baseada em habilidades para aprendizado (bundles, Unity Catalog, jobs, SQL) se alinha bem com a forma como nossa equipe realmente trabalha. A integração de novos engenheiros na arquitetura V2 levou cerca de metade do tempo em comparação com a V1 porque as convenções da plataforma (arquitetura medallion, asset bundles, nomenclatura de catálogo) são bem documentadas e consistentes.

**O que você não gosta em Databricks?**

UI/UX: O editor de notebook ainda parece estar atrás dos IDEs dedicados. Não há busca nativa em múltiplos arquivos, suporte limitado a refatoração, e a interface de integração com o Git é desajeitada para equipes que gerenciam dezenas de notebooks em pacotes de fluxo de trabalho. Acabamos fazendo todo o desenvolvimento real no VS Code e tratando o espaço de trabalho do Databricks como um alvo de implantação, o que adiciona fricção. O navegador de arquivos do espaço de trabalho também não lida bem com estruturas de pastas quando você tem mais de 50 notebooks organizados por domínio, não há filtragem, marcação ou favoritos.

Integrações: Os Databricks Asset Bundles (DAB) são um avanço, mas a documentação tem lacunas para implantações complexas de múltiplos pacotes. Executamos um pacote Global_Utilities compartilhado do qual outros pacotes de fluxo de trabalho dependem, e fazer referências entre pacotes funcionarem de forma confiável em alvos de desenvolvimento/QA/prod exigiu muito tentativa e erro. A integração ADF-para-Databricks funciona, mas depurar execuções de pipeline falhadas significa pular entre a interface de monitoramento do ADF e as execuções de trabalho do Databricks sem uma visão unificada. Uma integração mais estreita entre orquestração e monitoramento de computação economizaria horas de solução de problemas.

Desempenho: Os tempos de inicialização a frio do cluster continuam sendo um ponto problemático para fluxos de trabalho de desenvolvimento. Iniciar um cluster de nó único Standard_D4ds_v5 leva de 4 a 7 minutos, o que quebra o fluxo quando você está iterando na lógica do notebook. A computação sem servidor ajuda, mas ainda não está disponível para todos os tipos de carga de trabalho, e o custo premium é difícil de justificar para ambientes de desenvolvimento/teste.

Preços/ROI: O modelo de preços DBU é opaco para planejamento de capacidade. Estimar custos mensais para um projeto com mais de 30 trabalhos agendados, clusters de desenvolvimento interativos e consultas de armazém SQL requer a construção de planilhas personalizadas porque as ferramentas de gerenciamento de custos embutidas não fornecem uma previsão clara por fluxo de trabalho ou domínio. Fomos surpreendidos por picos de custo de trabalhos que duraram mais do que o esperado, sem uma maneira fácil de definir alertas de orçamento por trabalho.

Suporte/Integração: Os tempos de resposta do suporte empresarial são inconsistentes. Questões críticas com permissões do Unity Catalog durante nossa migração levaram de 3 a 5 dias úteis para triagem inicial, o que atrasou nosso cronograma de implantação. Os fóruns da comunidade são úteis para padrões comuns, mas para casos extremos do Unity Catalog (linhagem entre catálogos, herança complexa de permissões), a base de conhecimento é escassa.

AI/Inteligência: O Genie é promissor, mas ainda está bruto para uso em produção. Ele tem dificuldades com junções em mais de 3-4 tabelas, às vezes gera SQL incorreto contra nossa camada Gold, e não há uma maneira fácil de curar ou corrigir suas respostas para melhorar a precisão ao longo do tempo. Nossos usuários de negócios ficaram animados, tentaram, encontraram respostas erradas em perguntas moderadamente complexas e perderam a confiança. Um ciclo de feedback onde especialistas em domínio possam sinalizar e corrigir as saídas do Genie o tornaria genuinamente pronto para produção.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Fragmentação da Governança de Dados → Catálogo Unificado

Lutávamos com um ambiente Hive Metastore onde a propriedade das tabelas, o controle de acesso e a linhagem eram geridos através de uma colcha de retalhos de documentação manual e scripts personalizados. Após implementar o Unity Catalog, agora temos governança centralizada em 4 camadas de catálogo (bronze, prata, ouro, platina) abrangendo 6 domínios de negócios. O que antes exigia um administrador de dados em tempo integral para rastrear manualmente agora é aplicado automaticamente através de permissões e linhagem a nível de catálogo. Isso reduziu nosso tempo de provisionamento de acesso de dias para menos de uma hora por solicitação.

Lógica ETL Siloada → Arquitetura Medallion Padronizada

Antes do Databricks, nossos pipelines ETL eram inconsistentes — diferentes equipes escreviam transformações de maneiras diferentes, sem utilitários ou padrões compartilhados. Construímos uma estrutura padronizada (Batch_Utilities.py) com funções reutilizáveis para validação de esquema, operações de mesclagem, verificações de qualidade de dados e gerenciamento de colunas de auditoria. Cada notebook em todos os domínios agora segue a mesma estrutura de 7 células. Isso reduziu o tempo de desenvolvimento de novos notebooks de 2-3 dias para aproximadamente 4 horas, e a integração de um novo desenvolvedor ao padrão leva uma única tarde em vez de uma semana.

Falhas Custosas de Atualização de Relatórios → Orquestração Confiável de Pipeline

Tínhamos problemas recorrentes com relatórios do Power BI puxando dados desatualizados ou incompletos porque os trabalhos a montante falhavam silenciosamente. Com Jobs do Databricks e rastreamento de pipeline orientado por metadados (status do pipeline, timestamps de início/fim registrados por execução), agora capturamos falhas na camada de transformação antes que se propaguem para os relatórios. Os problemas de frescor dos dados dos relatórios caíram aproximadamente 80%, e nossa equipe financeira parou de agendar reuniões de "verificação de dados" que costumavam consumir 3-4 horas por semana.

Caos de Implantação Multiambiente → Pacotes de Ativos

Implantar notebooks em dev, QA e produção costumava envolver cópias manuais de arquivos e edições de configuração específicas do ambiente — propenso a erros e lento. Os Pacotes de Ativos do Databricks nos deram configs declarativos databricks.yml com substituição de variáveis por alvo. Uma implantação que levava 45 minutos de etapas manuais agora é executada em menos de 5 minutos via CLI. Implantamos com confiança porque a mesma definição de pacote é validada antes de chegar à produção.

Lacuna de Análise de Autoatendimento → Genie + Camada Platinum

Analistas de negócios em cadeia de suprimentos e finanças eram totalmente dependentes da equipe de dados para qualquer análise ad-hoc. Ao construir tabelas Platinum desnormalizadas otimizadas para relatórios e expô-las através de Genie Spaces, habilitamos consultas de autoatendimento em linguagem natural. A adoção inicial reduziu as solicitações de relatórios ad-hoc para a equipe de dados em aproximadamente 30%, liberando capacidade de engenharia para o desenvolvimento de novos recursos.

Visibilidade de Custos → Computação Dimensionada Corretamente

Estávamos superprovisionando clusters porque não tínhamos uma visão clara da utilização real. Ao padronizar nos nós Standard_D4ds_v5 com contagens de trabalhadores específicas do ambiente (1 para dev/QA, 3 para produção) e modo de segurança de usuário único, reduzimos nosso gasto mensal com computação em aproximadamente 25% em comparação com o modelo de cluster compartilhado que rodávamos na V1.

**Official Response from Janelle Glover:**

> Agradecemos seu feedback detalhado sobre sua experiência com o Databricks. É ótimo saber que o Unity Catalog, UI/UX, integrações, desempenho, Genie e suporte/integração tiveram um impacto positivo na migração da sua empresa. Entendemos as áreas de melhoria que você mencionou e as levaremos em consideração para futuros aprimoramentos.

  ### 29. Databricks: Plataforma Intuitiva e Unificada com Integrações Sem Costura e Suporte Rápido

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sabareeswar K. | Data Engineer, Empresa (> 1000 emp.)

**Reviewed Date:** April 01, 2026

**O que você mais gosta em Databricks?**

Como engenheiro de dados, o Databricks se tornou minha plataforma preferida para trabalho de dados de ponta a ponta. A facilidade de uso é excepcional - notebooks, Delta Live Tables e Genie têm interfaces intuitivas que reduzem significativamente o tempo de adaptação. A implementação foi tranquila graças à excelente documentação e ao suporte ao cliente responsivo que realmente resolve os problemas rapidamente. Eu o uso diariamente, e o número impressionante de recursos - desde o Unity Catalog até o AI/BI Genie - continua crescendo. A integração com armazenamento em nuvem, ferramentas de BI e frameworks de ML é perfeita, tornando-o uma verdadeira plataforma unificada.

**O que você não gosta em Databricks?**

Um desafio é a falta de transparência de custos em um nível granular de trabalho; é difícil identificar exatamente qual pipeline ou notebook está aumentando o consumo de DBU sem investir em monitoramento personalizado. Clusters de autoescalonamento, embora poderosos, podem aumentar os custos silenciosamente durante a noite se não forem configurados cuidadosamente com limites adequados. Além disso, os níveis de armazém SQL podem ser confusos para escolher antecipadamente, tornando o planejamento orçamentário complicado para as equipes. Um painel de alocação de custos embutido por trabalho ou usuário seria uma grande melhoria para a governança de custos no dia a dia.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

A Databricks eliminou os silos entre nossas equipes de engenharia de dados, análise e ML. Anteriormente, usávamos várias ferramentas para ingestão, transformação e relatórios. Agora, tudo está em um único lakehouse. O Genie, especificamente, tem sido um divisor de águas, pois as partes interessadas nos negócios podem fazer perguntas em linguagem natural diretamente aos nossos dados sem escrever SQL, o que reduz drasticamente os gargalos de solicitações ad-hoc para nossa equipe de engenharia. A tomada de decisões é mais rápida, os dados são mais democratizados e reduzimos significativamente os custos gerais do nosso pipeline de relatórios.

**Official Response from Janelle Glover:**

> É ótimo saber que o Databricks ajudou a eliminar silos entre suas equipes de engenharia de dados, análise e ML. Estamos satisfeitos que o Genie tenha sido um divisor de águas para seus stakeholders de negócios. Também entendemos os desafios que você mencionou em relação à transparência de custos e ao dimensionamento automático de clusters. Estamos continuamente trabalhando para melhorar nossa plataforma e levaremos suas sugestões em consideração para futuros aprimoramentos.

  ### 30. Databricks torna os fluxos de trabalho de dados de ponta a ponta rápidos, colaborativos e fáceis

**Rating:** 5.0/5.0 stars

**Reviewed by:** Karuppusamy V. | Technical Lead, Empresa (> 1000 emp.)

**Reviewed Date:** March 31, 2026

**O que você mais gosta em Databricks?**

O que eu mais gosto no Databricks é como ele simplifica todo o fluxo de trabalho de dados. Em vez de alternar entre várias ferramentas para processamento de dados, análise e aprendizado de máquina, tudo está disponível em um só lugar. O ambiente de notebook torna a colaboração realmente suave, parece natural trabalhar com colegas, compartilhar código e explicar a lógica sem esforço extra.

Outra coisa que aprecio é o desempenho. Trabalhar com grandes conjuntos de dados geralmente pode ser doloroso, mas o Databricks lida com isso de forma eficiente em segundo plano. Você não precisa se preocupar muito em gerenciar clusters ou otimizar tudo manualmente, simplesmente funciona na maioria das vezes, o que permite que você se concentre mais em resolver o problema real em vez de lidar com a infraestrutura.

O que também se destaca é a forma como ele lida com governança e organização de dados. Com recursos como controle de acesso centralizado e melhor visibilidade no uso de dados, torna-se muito mais fácil gerenciar dados de forma responsável, especialmente em projetos maiores. No geral, ele oferece um bom equilíbrio entre poder e facilidade de uso, e é por isso que gosto de trabalhar com ele.

**O que você não gosta em Databricks?**

Uma coisa que eu não gosto particularmente no Databricks é que ele pode se tornar caro rapidamente, especialmente se os clusters não forem geridos adequadamente. Se você esquecer de terminar clusters ou executar cargas de trabalho pesadas sem otimização, os custos podem aumentar sem muita visibilidade a princípio. Para equipes que ainda estão aprendendo ou experimentando, isso pode se tornar uma preocupação.

Outra desvantagem é que a depuração pode às vezes parecer um pouco complicada, particularmente ao trabalhar com trabalhos distribuídos. Os erros nem sempre são diretos, e rastrear problemas em vários nós pode levar mais tempo em comparação com o trabalho em um ambiente local mais simples. Requer um certo nível de experiência para entender rapidamente e corrigir problemas.

Além disso, embora a plataforma seja poderosa, ela tem uma curva de aprendizado para iniciantes. Conceitos como configuração de cluster, agendamento de trabalhos e governança de dados nem sempre são muito intuitivos no início. Leva algum tempo prático antes de você se sentir totalmente confortável navegando e usando tudo de forma eficiente.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O que o Databricks realmente resolve é o problema de lidar com dados em grande escala sem tornar o processo excessivamente complexo. Anteriormente, trabalhar com big data significava lidar com várias ferramentas, gerenciar infraestrutura e gastar muito tempo apenas configurando as coisas. O Databricks simplifica tudo isso ao reunir engenharia de dados, análises e aprendizado de máquina em um só lugar, de modo que o foco se desloca mais para resolver problemas reais de negócios em vez de gerenciar sistemas.

Ele também aborda questões de desempenho e escalabilidade. Ao trabalhar com grandes volumes de dados, os sistemas tradicionais muitas vezes enfrentam dificuldades ou desaceleram. O Databricks lida com isso de forma eficiente em segundo plano, permitindo que as cargas de trabalho escalem sem muito esforço manual. Para mim, isso significa que posso processar grandes conjuntos de dados mais rapidamente e executar transformações ou consultas sem me preocupar constantemente com o ajuste de desempenho.

Outro grande problema que ele resolve é a colaboração e o gerenciamento de dados. Em muitos projetos, as equipes enfrentam dificuldades com controle de versão, gerenciamento de acesso e manutenção da consistência dos dados. O Databricks facilita a colaboração, o rastreamento de mudanças e o controle de quem pode acessar o quê. Isso me ajuda a trabalhar mais suavemente com os outros, reduz erros e garante que os dados que estou usando sejam confiáveis e bem governados.

**Official Response from Janelle Glover:**

> Estamos felizes em saber que você considera o Databricks uma plataforma abrangente e eficiente para gerenciar fluxos de trabalho de dados. Entendemos suas preocupações sobre a gestão de custos e a curva de aprendizado para iniciantes, e compartilharemos seu feedback com nossa equipe para uma revisão mais aprofundada.

  ### 31. Databricks Unifica Dados, Análise e ML para Workflows de Lakehouse Escaláveis

**Rating:** 5.0/5.0 stars

**Reviewed by:** Harshavarthini G. | Data Architect, Empresa (> 1000 emp.)

**Reviewed Date:** March 31, 2026

**O que você mais gosta em Databricks?**

O Databricks é especialmente útil porque reúne engenharia de dados, análises e aprendizado de máquina em uma única plataforma unificada, o que reduz a necessidade de gerenciar várias ferramentas separadas. Construído sobre o Apache Spark, ele pode processar conjuntos de dados massivos rapidamente e escalar suavemente à medida que as cargas de trabalho crescem, tornando-o uma escolha forte para casos de uso de big data. Ele também suporta notebooks colaborativos onde equipes podem trabalhar juntas em linguagens como Python e SQL, o que facilita a colaboração eficaz entre cientistas de dados e engenheiros.

Com sua arquitetura de lakehouse impulsionada pelo Delta Lake, o Databricks combina a flexibilidade dos data lakes com a confiabilidade dos data warehouses, ajudando a garantir melhor consistência e desempenho dos dados. Além disso, ele se integra a ferramentas como o MLflow para simplificar o ciclo de vida do aprendizado de máquina de ponta a ponta, desde a experimentação até a implantação. No geral, o Databricks simplifica fluxos de trabalho de dados complexos, melhora o desempenho e ajuda as organizações a construir soluções escaláveis de dados e IA de forma mais eficiente.

**O que você não gosta em Databricks?**

O Databricks tem algumas limitações, embora muitas delas pareçam mais como compensações do que desvantagens absolutas. Uma desvantagem frequentemente citada é o custo: embora a plataforma seja flexível e escalável, as despesas podem aumentar rapidamente se os clusters não forem geridos com cuidado. Ao mesmo tempo, esse custo muitas vezes reflete sua capacidade de lidar com cargas de trabalho muito grandes de forma eficiente quando está devidamente otimizado.

Outra consideração é a curva de aprendizado, especialmente para iniciantes que não estão familiarizados com o Apache Spark ou sistemas distribuídos. Essa complexidade pode ser desafiadora no início, mas também vem com o benefício de capacidades poderosas uma vez que você se sinta confortável com ela. Alguns usuários também acham que a depuração e o ajuste de desempenho são menos diretos do que com ferramentas mais simples; no entanto, o Databricks oferece recursos detalhados de monitoramento e otimização que podem facilitar essas tarefas ao longo do tempo.

Finalmente, por ser uma plataforma gerida, pode haver uma sensação de controle reduzido em comparação com sistemas totalmente autogeridos. Em troca, ela remove grande parte do fardo operacional que vem com a gestão de infraestrutura. No geral, embora essas áreas possam ser vistas como os aspectos "menos úteis", elas são frequentemente equilibradas pela escalabilidade, integração e ganhos de produtividade da plataforma.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

A Databricks ajuda a resolver o desafio de dados fragmentados e fluxos de trabalho desconectados em vários setores de negócios, fornecendo uma plataforma unificada de lakehouse. No meu papel como engenheiro de dados, isso me permite consolidar dados de diferentes fontes em um único sistema confiável, usando o Apache Spark para processamento escalável e o Delta Lake para garantir a qualidade e consistência dos dados. Isso reduz significativamente a complexidade dos pipelines, melhora a confiabilidade e permite a entrega mais rápida de dados limpos e governados para as equipes a jusante. Como resultado, sou capaz de apoiar casos de uso de análise e aprendizado de máquina de forma mais eficiente, enquanto minimizo a sobrecarga operacional e melhoro a produtividade geral em toda a organização.

**Official Response from Janelle Glover:**

> Obrigado por compartilhar suas experiências positivas com o Databricks. É ótimo saber que a capacidade da plataforma de reunir engenharia de dados, análises e aprendizado de máquina em uma única plataforma unificada está beneficiando sua organização. Entendemos as compensações e desafios que você mencionou, e estamos continuamente trabalhando nessas partes da nossa plataforma.

  ### 32. Databricks simplifica o ETL de ponta a ponta com o Unity Catalog e a depuração com inteligência artificial

**Rating:** 4.5/5.0 stars

**Reviewed by:** Dinesh Sundar S. | Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 30, 2026

**O que você mais gosta em Databricks?**

O que se destaca para mim é como o Databricks simplifica o ciclo de vida ETL de ponta a ponta. A integração constante de novas funcionalidades na plataforma reduziu notavelmente o atrito na ingestão de dados de uma ampla gama de sistemas de origem.

O Unity Catalog (UC) também foi um divisor de águas para a administração de dados. Ele oferece uma camada de governança centralizada e robusta que torna o gerenciamento de ambientes complexos muito mais intuitivo e fácil de controlar.

Estou especialmente impressionado com as atualizações recentes impulsionadas por IA. O Genie Code tornou-se uma parte essencial do meu fluxo de trabalho; ele melhorou drasticamente minha velocidade de depuração e já está se mostrando um ativo valioso no meu projeto atual de migração do UC. No geral, a maneira como o Databricks combina engenharia de dados tradicional com inteligência assistida parece genuinamente inovadora.

**O que você não gosta em Databricks?**

Embora o Auto Loader seja poderoso, ainda existem lacunas notáveis no Lakehouse Data Pipeline (LDP) em torno da inferência de esquema. Atualmente, quando o inferSchema está habilitado, o esquema inferido se aplica apenas ao primeiro nível da hierarquia. Em conjuntos de dados complexos com campos multi-aninhados, a falta de inferência de esquema profundo cria uma sobrecarga manual e torna mais difícil construir e manter pipelines de CDC em streaming.

O Lakeflow Connect parece ser um passo na direção certa, mas a biblioteca de conectores nativos ainda parece incompleta em comparação com alguns concorrentes. E embora os recursos de IA (como o Genie) sejam promissores e genuinamente interessantes, eles ainda parecem estar em um estágio de "desenvolvimento" — às vezes faltando a consistência necessária para ambientes de produção de alto risco. Eu gostaria de ver essas capacidades evoluírem de "extras inovadores" para ferramentas robustas e prontas para produção.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Problema: Silos de Dados e Operações de Suporte Ineficientes
Em muitas organizações, o conhecimento institucional crítico acaba espalhado por sistemas desconectados, como MySQL (estruturado), Jira (transacional) e Confluence (não estruturado). Quando a informação está fragmentada dessa forma, as equipes de suporte têm dificuldade em encontrar respostas rápidas e precisas para os tickets recebidos. O resultado é um MTTR (Tempo Médio de Resolução) mais alto e muito esforço manual e repetitivo.

A Solução: Uma "Plataforma de Inteligência" Unificada
O Databricks resolve isso servindo como um tecido único que conecta esses silos. No meu trabalho, foco em usar o Lakehouse Data Pipeline (LDP) para ingerir e unificar essas diferentes fontes em um ambiente governado.

Como isso beneficia meu projeto:
Uso o Databricks para uma ingestão sem interrupções, centralizando dados do MySQL, Jira e Confluence para construir uma "Base de Conhecimento" abrangente sem precisar gerenciar várias ferramentas ETL distintas.

Também conto com a integração nativa de IA. Com o Mosaic AI Vector Search, posso converter os dados unificados em embeddings diretamente na plataforma, o que me permite construir um Agente de Automação de IA para nosso sistema de tickets.

Finalmente, ele suporta a solução automatizada. O agente pode executar a correspondência vetorial em tickets recém-criados contra toda a base de conhecimento histórica e, em seguida, propor soluções precisas e contextualmente conscientes aos engenheiros imediatamente.

O Impacto
O maior benefício para nós é a velocidade operacional. O Databricks transformou nossos dados de um arquivo passivo em um motor "inteligente" ativo. Ele reduz o tempo gasto em pesquisas manuais e nos ajuda a automatizar a primeira linha de suporte, melhorando a precisão das resoluções de tickets enquanto reduz a carga sobre nossas equipes técnicas.

**Official Response from Janelle Glover:**

> Obrigado por compartilhar sua experiência positiva com o Databricks! Ficamos felizes em saber que a simplificação do ciclo de vida ETL de ponta a ponta da nossa plataforma e o Unity Catalog foram transformadores para sua administração de dados. Agradecemos seu feedback sobre as atualizações impulsionadas por IA e estamos entusiasmados em saber que o Genie melhorou seu fluxo de trabalho. Estamos comprometidos em aprimorar continuamente nossa plataforma para proporcionar uma experiência inovadora para nossos usuários.

  ### 33. Rápido, Integrado Databricks para Pipelines de Big Data e Análises em Um Só Lugar

**Rating:** 4.5/5.0 stars

**Reviewed by:** Demetrius A. | Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 31, 2026

**O que você mais gosta em Databricks?**

O que eu mais amo no Databricks é o quão rápido e conectado tudo é. Comparado a outras plataformas, ele lida com pipelines de big data pesados sem suar a camisa. Mas a melhor parte é como é fácil usar esses dados uma vez que estão processados. Quer eu precise construir um painel de análise rápido ou treinar modelos de aprendizado de máquina personalizados específicos para nossos dados, tudo se conecta perfeitamente. Isso simplesmente elimina a dor de cabeça de mover dados e permite que você faça tudo em um só lugar.

**O que você não gosta em Databricks?**

Se eu tivesse que escolher o que não gosto, basicamente se resume ao custo e à complexidade que pode ter.

Primeiro, pode ficar caro muito rapidamente. Se você não tomar cuidado ao gerenciar seus clusters de computação e desligá-los quando terminar, as contas podem aumentar sem que você perceba.

Segundo, às vezes pode parecer exagero para tarefas mais simples. Como é feito para dados massivos, ter que vasculhar logs de erro complicados quando algo dá errado pode ser uma verdadeira dor de cabeça em comparação com o uso de ferramentas mais leves.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O principal problema que o Databricks me ajuda a resolver no meu negócio é o desempenho. Costumávamos esperar horas para que os pipelines fossem executados no ADF, e agora conseguimos concluí-los em minutos.

**Official Response from Janelle Glover:**

> Estamos entusiasmados em saber que você considera o Databricks rápido e eficiente para lidar com pipelines de big data e análises. Entendemos suas preocupações sobre custo e complexidade, e estamos continuamente trabalhando para otimizar esses aspectos de nossa plataforma para enfrentar esses desafios.

  ### 34. Plataforma Unificada de ML que Remove o Atrito de Infraestrutura

**Rating:** 5.0/5.0 stars

**Reviewed by:** Hirlekha M. | AI/ ML Technical Lead, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 30, 2026

**O que você mais gosta em Databricks?**

A experiência de plataforma unificada é realmente difícil de superar — ter o MLflow para rastreamento de experimentos, o Unity Catalog para governança, busca vetorial e endpoints serverless tudo em um só lugar remove muito da fricção de infraestrutura. Os pipelines de engenharia de características e a implantação de modelos parecem coesos em vez de remendados. O fluxo de trabalho híbrido de armazém SQL + notebook também facilita a transição entre o trabalho de engenharia de dados e ML sem trocar de ferramentas.

**O que você não gosta em Databricks?**

Os endpoints serverless têm algumas arestas afiadas — a inicialização do contexto do Spark se comporta de maneira diferente do que em clusters interativos, o que pode causar falhas silenciosas se você não tomar cuidado com onde inicializa as coisas. A latência de inicialização a frio em serverless também é perceptível para endpoints de produção com baixo tráfego. A documentação sobre alguns dos recursos mais novos (como configurações de índice de busca vetorial) tende a ficar atrás do comportamento real do produto, então você acaba fazendo muitos testes e erros.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Usamos o Databricks para consolidar o desenvolvimento de modelos de ML, engenharia de características e implantação para uma plataforma de cartões e pagamentos — trabalho que anteriormente exigia o uso de ferramentas separadas para processamento de dados, treinamento e serviço. O ambiente unificado significa que nossos engenheiros de ML podem ir de dados de transações brutos a um modelo de previsão de churn implantado sem sair da plataforma. O rastreamento do MLflow mantém os experimentos reprodutíveis, e o Unity Catalog nos dá a história de governança de dados que nosso cliente bancário precisa. Isso reduziu significativamente a sobrecarga de coordenação que vem com pipelines de ML de múltiplas ferramentas.

**Official Response from Janelle Glover:**

> É ótimo saber como o Databricks simplificou seus fluxos de trabalho de ML e reduziu a sobrecarga de coordenação. Agradecemos seu feedback sobre os endpoints sem servidor e a documentação, e nos esforçaremos para resolver essas questões para melhorar sua experiência com nossa plataforma.

  ### 35. Lakebase: Potencializando Dados e IA juntos

**Rating:** 5.0/5.0 stars

**Reviewed by:** Ajay P. | Manager - Data, AI &amp; Automation, Pequena Empresa (50 ou menos emp.)

**Reviewed Date:** September 08, 2024

**O que você mais gosta em Databricks?**

Eu uso o Lakebase dentro do Databricks como a base para nossas soluções de IA, onde modelos de dados e aplicações trabalham juntos de forma harmoniosa. O Lakebase fornece uma única base de dados unificada para construir IA diretamente em dados consistentes e em tempo real. Eu também gosto do Agent Bricks no Databricks porque nos ajuda a construir rapidamente agentes de IA inteligentes e automatizar fluxos de trabalho usando esses dados. A facilidade de configuração foi um grande ponto positivo para nós, pois foi super fácil começar.

**O que você não gosta em Databricks?**

Agentbricks precisa de mais integração nativa para reduzir a configuração manual e acelerar a automação do fluxo de trabalho.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Databricks - Lakebase nos ajuda a reunir dados e IA em uma única plataforma, reduzindo a complexidade e evitando movimentações de dados. O Agent Bricks nos permite construir rapidamente agentes de IA inteligentes e automatizar fluxos de trabalho usando dados em tempo real.

**Official Response from Jess Darnell:**

> Estamos entusiasmados em saber que você acha o Lakebase simples de usar e repleto de recursos para desenvolver pipelines de dados e IA. É ótimo saber que tem sido útil na implementação do GenAI e na integração com diferentes fontes através do LakeFlow.

  ### 36. De 1 Hora para 10 Minutos: Como o Databricks Modernizou Nosso Fluxo de Trabalho

**Rating:** 4.5/5.0 stars

**Reviewed by:** Mukundan R. | Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 30, 2026

**O que você mais gosta em Databricks?**

Costumávamos usar o ADF para obter dados do SQL Server e depois trabalhá-los no Databricks antes de colocá-los no Salesforce. Todo o processo demorava mais de uma hora porque o ADF adicionava trabalho extra. Agora tudo acontece dentro do Databricks. Transformamos os dados brutos no Databricks e os colocamos no Salesforce, tudo em um só lugar. Isso tornou todo o processo muito mais rápido, agora leva 10 minutos. Isso é uma melhoria em relação ao que tínhamos com o ADF. O Delta Lake também tem sido muito útil. Ele nos ajuda a acompanhar as mudanças e voltar atrás se algo der errado. Podemos ver o que aconteceu antes. Corrigir erros facilmente. O Delta Lake também garante que os dados sejam bons antes de entrar no pipeline. Ele impede que dados entrem e causem problemas posteriormente no Salesforce. Isso torna todo o processo mais confiável e fácil de cuidar.

**O que você não gosta em Databricks?**

O Databricks é realmente bom no que faz. Às vezes, leva um tempo para que o cluster esteja em funcionamento. A interface do usuário é lenta às vezes. Isso pode ser irritante quando estamos com pressa para concluir tarefas para o Salesforce. Os conectores do Salesforce no Databricks podem ser um pouco complicados de trabalhar. Eles frequentemente precisam ser configurados corretamente e não funcionam como esperamos. Isso significa que temos que nos esforçar quando estamos tentando resolver problemas ou monitorar os pipelines no Databricks para o Salesforce.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Está resolvendo nossos problemas de desempenho e confiabilidade - permitindo-nos extrair, transformar e carregar os dados no Salesforce tudo em um só lugar sem ADF. Este fluxo de trabalho unificado reduziu nosso tempo de execução de 1 hora para 10 minutos, proporcionando-nos uma conclusão de tarefas mais rápida e atualizações de dados do Salesforce em tempo hábil. Com recursos do delta lake, como transações ACID e viagem no tempo, nossos dados são mais precisos e mais fáceis de recuperar quando algo dá errado.

**Official Response from Janelle Glover:**

> Estamos felizes em saber que o Databricks conseguiu melhorar significativamente o seu fluxo de trabalho ao reduzir o tempo de execução. É ótimo saber que o Delta Lake tem sido útil na manutenção da precisão dos dados e na oferta de opções de recuperação mais fáceis. Entendemos suas preocupações sobre o tempo de configuração do cluster e a velocidade da interface do usuário, bem como os desafios com os conectores do Salesforce. Agradecemos seu feedback e o compartilharemos com nossa equipe para futuras melhorias.

  ### 37. Databricks: Rico em Recursos, Fácil de Usar e Mantém Tudo em Uma Plataforma

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sivabalan A. | Technical Lead - Data Engineering, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 27, 2026

**O que você mais gosta em Databricks?**

Entre as várias plataformas com as quais trabalhei, o Databricks se destaca como um ambiente genuinamente coeso. Parece menos um conjunto de recursos desconectados e mais um espaço de trabalho unificado — um que pode evoluir junto com as equipes que o utilizam. A interface é intuitiva o suficiente para reduzir a barreira de entrada, ao mesmo tempo que oferece a profundidade e o poder necessários para engenharia de alto desempenho.

Uma de suas maiores forças é como consolida o ciclo de vida dos dados. Ao reunir engenharia, ciência de dados e análises SQL sob um mesmo teto, ajuda a dissolver os silos que muitas vezes levam ao "desvio de dados" e à falta de comunicação entre departamentos. Na prática, também simplifica a infraestrutura subjacente, substituindo uma dúzia de ferramentas especializadas (e às vezes conflitantes) por uma única e mais clara fonte de verdade.

Além de simplesmente "manter as coisas organizadas", a plataforma também se destaca quando se trata de transparência colaborativa. Com notebooks e experimentos compartilhados em tempo real, a lacuna entre uma ideia inicial de dados e um modelo pronto para produção pode ser dramaticamente encurtada. Além disso, seu compromisso com padrões abertos como o Delta Lake significa que você não está preso a uma caixa preta proprietária — você está construindo sobre uma base que se alinha com a direção da comunidade de dados mais ampla. No geral, atinge um equilíbrio raro: uma interface polida e amigável em torno de alguns dos motores de computação distribuída mais poderosos disponíveis hoje.

**O que você não gosta em Databricks?**

A Desagregação da “Grande Tarefa”

Quando o Genie processa um grande volume de dados, muitas vezes acaba enviando uma enorme quantidade de JSON de volta para o navegador para que ele possa renderizar essas tabelas e visualizações.

Sobrecarga de memória: Navegadores (e especialmente o Chrome) podem ser verdadeiros devoradores de memória. Se uma resposta do Genie inclui um conjunto de resultados muito grande ou um plano de execução massivo, o uso de RAM pode aumentar rapidamente, o que pode levar àquela conhecida suspensão de “Não Respondendo”.

O atraso do “DOM”: Cada linha em uma tabela e cada linha de código se torna um elemento que o navegador tem que acompanhar. À medida que você rola ou digita, o navegador tem que repintar milhares desses elementos. Quando a tarefa é muito grande, o thread principal do navegador pode ficar ocupado com a renderização, e sua digitação começa a parecer que está atrasada por alguns segundos.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Você acertou na razão principal pela qual o Databricks está conquistando tantas equipes de dados: eles estão reduzindo o "imposto de integração". Na maioria das empresas, você pode facilmente perder cerca de 30% do seu tempo apenas movendo dados entre a ferramenta de "armazenamento", a ferramenta de "processamento" e a ferramenta de "BI".

O Painel de AI/BI é um ótimo exemplo dessa mudança mais ampla — de uma "coleção de ferramentas" para uma plataforma mais unificada.

O que começou como uma camada básica de visualização evoluiu para um sistema de "AI Composto". Aqui está como ele se tornou tão útil:

A integração "Pergunte ao Gênio": Você não está mais limitado a olhar para um gráfico estático. A partir de 2026, todo painel publicado inclui um botão "Pergunte ao Gênio" por padrão. Se um interessado notar um pico em um gráfico de linha, ele não precisa te ligar; ele pode clicar com o botão direito no gráfico e perguntar: "Gênio, por que isso caiu na terça-feira?" e ele usará o modo Agente para rastrear o motivo.

Velocidade direta para o armazém: Como ele vive dentro do Databricks, não há necessidade de "extrair" dados para um servidor de BI separado. Ele consulta os dados onde eles já estão (Unity Catalog), o que significa que o painel permanece tão atualizado quanto sua última execução de ETL.

Autoria assistida por AI: Você pode construir widgets inteiros apenas descrevendo o que deseja. Em vez de arrastar campos, você pode digitar, "Mostre-me um gráfico de funil de nossa conversão de vendas por região," e ele gera o SQL e a visualização para você.

Governança profunda: Como é integrado, suas políticas de segurança (segurança em nível de linha, tags) seguem os dados automaticamente. Você não precisa recriar permissões em uma ferramenta separada como Tableau ou Power BI.

**Official Response from Janelle Glover:**

> Obrigado por destacar os benefícios do Databricks na redução do 'imposto de integração' e na simplificação do movimento de dados entre armazenamento, processamento e ferramentas de BI. Estamos satisfeitos em saber como o Painel de AI/BI e o Genie têm sido valiosos em fornecer velocidade direta ao armazém e autoria assistida por IA.

  ### 38. Código Databricks Genie - AI Aplicada Agente para o ciclo de vida SDL de ponta a ponta

**Rating:** 4.5/5.0 stars

**Reviewed by:** Senthil K. | Senior Cloud Solution Architect - Accenture Data &amp; AI (Applied Intelligence), Empresa (> 1000 emp.)

**Reviewed Date:** October 03, 2023

**O que você mais gosta em Databricks?**

Código Genie

1) O Código Genie automatizou nossos processos ETL, reduzindo o esforço manual e aumentando a eficiência. Com o SDL da Agentic, implementamos pipelines CI/CD para atualizações e implantações mais rápidas e contínuas.

2) O Código Genie simplificou mapeamentos STTM complexos, melhorando a precisão e a velocidade. As atualizações em tempo real da Agentic garantiram que os ajustes de mapeamento fossem feitos dinamicamente para se alinhar com os dados de transações em mudança.

3) Definimos testes unitários automatizados usando o SKILL.md, garantindo que as transformações de dados sejam validadas antes da implantação. Isso reduziu erros e garantiu a qualidade dos dados, aumentando a confiança em nossas análises.

4) Usando o Skills.md, adicionamos extensões personalizadas ao Código Genie, como a integração de dados de terceiros para relatórios enriquecidos. Essa agilidade nos permitiu adaptar rapidamente às necessidades de negócios e entregar novas capacidades.

5) O SDL da Agentic possibilitou o processamento de dados em tempo real, fornecendo análises imediatas para a tomada de decisões. Nossas equipes de marketing e vendas agora agem com dados atualizados instantaneamente, melhorando os tempos de resposta e a eficiência geral.

**O que você não gosta em Databricks?**

Espero que possa ser melhorado na próxima atualização -

Depurar problemas em fluxos de trabalho complexos pode ser demorado devido à visibilidade limitada nas transformações de dados intermediárias.

O Genie Code carece de mecanismos avançados de recuperação de erros, tornando difícil gerenciar falhas em pipelines de dados em larga escala.

À medida que o volume de dados aumenta, o desempenho do Genie Code pode degradar, exigindo ajustes manuais significativos para garantir uma operação suave em escala.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

1) Processamento Escalável - Construído na arquitetura baseada em Spark do Databricks, o Genie Code lida e escala eficientemente o processamento de conjuntos de dados massivos, garantindo desempenho mesmo com volumes de dados crescentes.

2) O Genie Code automatiza fluxos de trabalho ETL de ponta a ponta, desde a extração de dados até a transformação e carregamento, simplificando as operações de dados e eliminando tarefas manuais.

3) Colaboração em tempo real - O Genie Code permite a colaboração em tempo real entre equipes usando notebooks compartilhados, facilitando para os profissionais de dados a construção e o refinamento coletivo de fluxos de trabalho.

**Official Response from Aunalisa Arellano:**

> É ótimo saber que a Plataforma de Inteligência de Dados da Databricks está ajudando você com a plataforma de lakehouse unificada, orquestração de fluxos de trabalho, integrações e compartilhamento de dados. Estamos comprometidos em fornecer soluções que atendam às necessidades do seu negócio.

  ### 39. Plataforma Unificada da Databricks: SQL Rápido, Pipelines Simplificados e IA Contextual

**Rating:** 5.0/5.0 stars

**Reviewed by:** Deeraj R. | Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 27, 2026

**O que você mais gosta em Databricks?**

A experiência de plataforma unificada é o que me mantém no Databricks. Ter notebooks, pipelines, armazéns SQL, ML e governança tudo em um só lugar sob o Unity Catalog significa que não estou constantemente juntando cinco ferramentas diferentes apenas para realizar o trabalho.

Os Lakeflow Pipelines (anteriormente DLT) tornam simples a construção de pipelines de arquitetura medallion, e o motor Photon oferece ganhos reais de desempenho em cargas de trabalho SQL sem exigir alterações no código. Adições recentes como o Genie Code e agentes em segundo plano também mostram que eles estão sérios sobre IA agentiva—não parece um copiloto acoplado, porque ele pode realmente entender o contexto dos seus dados através do Unity Catalog. A computação sem servidor tem sido outra grande melhoria na qualidade de vida também, já que não preciso mais esperar pela inicialização do cluster quando só quero executar consultas rápidas e ad hoc.

**O que você não gosta em Databricks?**

A gestão de custos pode ser complicada—os DBUs se acumulam rapidamente se você não for cuidadoso com o dimensionamento de clusters e a auto-escalabilidade de armazéns. O modelo de preços também nem sempre é transparente, especialmente quando você está misturando computação sem servidor e clássica.

O Unity Catalog é poderoso, mas a configuração inicial e a migração do HMS legado podem ser dolorosas, particularmente para grandes organizações com anos de objetos de metastore Hive existentes. A documentação é geralmente boa, mas às vezes fica atrás dos novos lançamentos de recursos. Além disso, a interface do usuário do workspace pode parecer lenta às vezes, especialmente quando você está trabalhando com um grande número de ativos.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Antes do Databricks, nossa pilha de dados estava fragmentada — ferramentas separadas para ETL, análises, ML e governança. Isso significava troca constante de contexto, dados duplicados e lacunas de governança. O Databricks consolida tudo isso em uma única plataforma lakehouse. O Delta Lake nos oferece transações ACID confiáveis no data lake, o Unity Catalog lida com a linhagem e o controle de acesso em toda a linha, e os armazéns SQL permitem que nossos analistas se autoatendam sem precisar de um produto de data warehouse separado. Isso reduziu significativamente nosso tempo de desenvolvimento de pipeline e tornou a governança de dados algo que podemos realmente aplicar de forma consistente, em vez de apenas torcer pelo melhor.

**Official Response from Janelle Glover:**

> Estamos felizes em saber que você está aproveitando a experiência da plataforma unificada e encontrando valor no Lakeflow Pipelines, no motor Photon e no Genie Code. Entendemos suas preocupações sobre a gestão de custos e a transparência nos preços, assim como os desafios com a configuração inicial e a interface do usuário do workspace. Seu feedback é valioso e será compartilhado com nossa equipe para melhorias futuras.

  ### 40. Plataforma Databricks Tudo-em-Um com Governança Forte, Desempenho Rápido do Spark e Genie

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sabareeswara S. | Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 27, 2026

**O que você mais gosta em Databricks?**

A plataforma tudo-em-um elimina a dispersão de ferramentas. O Unity Catalog oferece governança, linhagem e capacidade de descoberta sem a necessidade de anexar um catálogo separado. A interface do notebook é limpa e facilita a iteração no PySpark. O Genie é o recurso de IA de destaque, transformando tabelas curadas em interfaces de linguagem natural para usuários de negócios, e o SDK permite configurá-lo programaticamente para que permaneça sustentável. O DLT lida bem com a orquestração de pipelines. O desempenho em cargas de trabalho Spark é sólido, especialmente com o Photon. As integrações com Airflow, S3 e o ecossistema mais amplo são diretas. Em termos de ROI, consolidar o que antes exigia várias ferramentas em uma única plataforma se paga pela redução da complexidade.

**O que você não gosta em Databricks?**

Prever preços pode ser difícil. Os custos de computação escalam rapidamente se você não for cuidadoso com o dimensionamento do cluster e a seleção de SKU, e nem sempre é óbvio qual nível de carga de trabalho você realmente precisa até ver a conta. O IDE do notebook, embora funcional, ainda fica atrás de um editor real para refatoração, navegação entre vários arquivos e fluxos de trabalho de revisão de código.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

A consolidação de ferramentas é a maior delas. Antes, você precisaria de sistemas separados para ingestão, transformação, armazenamento, governança e serviço, cada um com sua própria curva de aprendizado, sobrecarga de manutenção e dores de cabeça de integração. O Databricks colapsa isso em uma única plataforma. O Unity Catalog resolve o problema de governança de dados ao fornecer linhagem, controle de acesso e capacidade de descoberta em um só lugar, em vez de gerenciar permissões em sistemas desconectados.

**Official Response from Janelle Glover:**

> Obrigado por compartilhar sua experiência positiva com o Databricks! Ficamos felizes em saber que você considera o Delta Live Tables, o Unity Catalog e o Genie benéficos. Também agradecemos seu feedback sobre os preços e compartilharemos seus comentários com nossa equipe.

  ### 41. Databricks continua removendo atritos com forte governança e ferramentas de IA intuitivas

**Rating:** 4.5/5.0 stars

**Reviewed by:** Praveenkumar S. | Solutions Architect, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 27, 2026

**O que você mais gosta em Databricks?**

O que mais gosto no Databricks é como suas funcionalidades têm consistentemente correspondido às necessidades em evolução das equipes de engenharia. Ao longo dos anos, vi a plataforma crescer de um sólido sistema de dados para um espaço de trabalho que realmente simplifica como construímos e gerenciamos soluções de dados e IA. O Unity Catalog tem sido uma das maiores melhorias para nós, ter um único lugar para gerenciar permissões e linhagem removeu muitos passos manuais que costumávamos lidar separadamente em diferentes sistemas. O Genie AI e BI também se tornaram parte do meu fluxo de trabalho regular; poder gerar SQL ou explorar conjuntos de dados através de conversas naturais ajuda as equipes a chegarem a respostas mais rapidamente, especialmente quando estamos sob pressão de tempo. A capacidade de Apps adicionou um valor inesperado ao nos permitir criar e compartilhar ferramentas internas simplificadas diretamente na plataforma, eliminando a necessidade de configurar infraestrutura extra. E com o Lakebase, conseguimos suportar mais casos de uso de estilo transacional sem perder a flexibilidade de um lago, o que tornou certas pipelines muito mais fáceis de manter. No conjunto, essas melhorias removeram muita fricção do trabalho diário e tornaram a plataforma algo que realmente gosto de usar à medida que continua a evoluir.

**O que você não gosta em Databricks?**

O que eu não gosto no Databricks é que algumas das experiências mais recentes de IA, especialmente o Genie para geração de código, podem parecer instáveis às vezes e podem perder o contexto durante sessões de desenvolvimento mais longas. Isso interrompe meu fluxo de trabalho quando o assistente não consegue reter a lógica anterior ou manter a continuidade em várias iterações.

Também notei uma lacuna nos conectores nativos para certos sistemas empresariais, como DFS, compartilhamentos SMB ou sistemas de origem baseados em Windows, e plataformas como DB2 no AS/400, dos quais muitos clientes ainda dependem. Embora o Databricks continue a expandir seu ecossistema, a falta de conectividade direta nessas áreas muitas vezes significa que precisamos de middleware extra ou pipelines personalizados para preencher a lacuna.

Nenhum desses pontos é um fator decisivo, mas são áreas onde a experiência geralmente suave da plataforma ainda pode parecer um pouco incompleta.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

A Databricks nos ajudou a resolver vários desafios de longa data em como gerenciamos e entregamos dados e IA. Antes de adotar suas capacidades mais recentes, estávamos lidando com governança fragmentada, conjuntos de dados duplicados e muito esforço manual para manter permissões e linhagens consistentes em diferentes sistemas. O Unity Catalog melhorou isso ao nos fornecer um único lugar para gerenciar segurança e propriedade, o que reduziu a confusão entre as equipes e diminuiu visivelmente o retrabalho durante as auditorias.

Também costumávamos gastar uma quantidade significativa de tempo ajudando as equipes a explorar dados ou elaborar consultas. Com o Genie AI e BI, eles agora podem gerar SQL, resumos e insights visuais de forma mais independente. Como resultado, o tempo de uma pergunta até uma resposta utilizável foi reduzido, especialmente quando estamos trabalhando sob ciclos de entrega apertados.

Outro ponto problemático era construir pequenas ferramentas internas em torno dos nossos dados. Configurar infraestrutura separada ou ambientes de hospedagem criava uma sobrecarga desnecessária. Com os Databricks Apps, agora podemos construir e compartilhar essas ferramentas dentro da própria plataforma, o que economiza tempo de configuração e reduz a manutenção contínua.

Finalmente, tivemos dificuldades para suportar cargas de trabalho que precisavam tanto da flexibilidade de um lago quanto da confiabilidade de um banco de dados. O Lakebase ajudou a fechar essa lacuna ao permitir operações de estilo transacional diretamente em nossos dados de lago, o que simplificou vários pipelines e reduziu o número de sistemas que temos que manter.

No geral, a Databricks nos moveu de lidar com várias ferramentas desconectadas para trabalhar em um ambiente mais unificado e previsível. Essa mudança acelerou a entrega, reduziu a sobrecarga operacional e melhorou a clareza dos nossos fluxos de trabalho.

**Official Response from Janelle Glover:**

> Obrigado por compartilhar sua experiência positiva com o Databricks! Estamos entusiasmados em saber que nossa plataforma tem conseguido atender consistentemente às necessidades em evolução de suas equipes de engenharia e otimizar suas soluções de dados e IA. Agradecemos seu feedback sobre o Unity Catalog, Genie e Lakebase, e estamos comprometidos em melhorar e evoluir continuamente nossa plataforma para proporcionar uma experiência de usuário suave e agradável.

  ### 42. Exploração de Dados Autônoma e Rápida com Governança usando o Databricks Genie

**Rating:** 3.5/5.0 stars

**Reviewed by:** Yuvashree M. | Senior Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 27, 2026

**O que você mais gosta em Databricks?**

Como engenheiro de dados, eu uso o Databricks Genie para interagir com dados em linguagem natural, enquanto ainda dependo das mesmas tabelas governadas, métricas e modelos semânticos que minha equipe construiu. Em vez de pular direto para cadernos SQL para cada consulta exploratória, eu ou usuários de negócios podemos formular perguntas em linguagem simples e deixar o Genie traduzi-las em consultas estruturadas e cientes do catálogo. Isso mantém o autoatendimento rápido, mas também seguro e governado.

**O que você não gosta em Databricks?**

Estabilidade do laptop ao multitarefar
Meu laptop pode travar ou ficar visivelmente lento quando estou trabalhando com várias abas e painéis do Genie ao mesmo tempo, especialmente durante consultas mais pesadas ou visualizações mais exigentes. Isso prejudica a experiência geral do usuário e pode retardar o desenvolvimento iterativo e a análise.

Latência com modelos de dados complexos
Com esquemas muito amplos ou modelos semânticos mais complexos, o Genie às vezes seleciona junções subótimas ou um nível de granularidade excessivamente amplo/estreito. Como resultado, ainda preciso revisar o SQL gerado e otimizá-lo eu mesmo. Nesse sentido, ele continua sendo um assistente útil, em vez de um mecanismo de consulta totalmente autônomo.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Em um projeto recente, a empresa queria entender uma queda no valor vitalício do cliente (CLV) em uma região específica. Um gerente de produto usou o Genie para explorar as tendências de CLV por região e coorte, excluindo reembolsos, diretamente de um painel de controle de IA/BI. A partir dessa conversa, capturei a lógica principal, envolvi-a em um pipeline de Tabela Delta Live e agendei como um trabalho recorrente. Isso reduziu as solicitações ad hoc em cerca de 30–40% e permitiu acesso contínuo e autônomo a insights de CLV enquanto eu me concentrava em ajustar o desempenho e as regras de qualidade de dados.

No geral, o Genie me ajuda a conversar com meus dados em linguagem natural, melhora a rapidez com que descobrimos insights e apoia melhores práticas de qualidade de dados — embora trabalhar em várias abas suportadas pelo Genie possa sobrecarregar o hardware local e, às vezes, desacelerar o fluxo de trabalho.

**Official Response from Janelle Glover:**

> Obrigado por compartilhar sua experiência positiva ao usar o Genie para exploração de dados de autoatendimento. Pedimos desculpas pelos problemas que você notou com estabilidade e latência. Nossa equipe está trabalhando ativamente para resolver essas preocupações e melhorar a experiência do usuário.

  ### 43. Databricks Genie Acerta nas Migrações do Unity Catalog com Orientação Contextual

**Rating:** 4.0/5.0 stars

**Reviewed by:** Nandhini E. | Senior Data Architect, Empresa (> 1000 emp.)

**Reviewed Date:** March 27, 2026

**O que você mais gosta em Databricks?**

A compreensão contextual do Unity Catalog pelo Databricks Genie é realmente impressionante. Ao trabalhar em uma migração complexa do UC, navegando por namespaces de três níveis, caminhos de volume, modos de segurança e execução de SQL orientada por widgets, o Genie raciocinou sobre os detalhes em vez de recorrer a respostas genéricas. Ele realmente fala a linguagem da migração do UC, o que reduz muito o vai-e-vem e torna a solução de problemas mais direta. No geral, a plataforma é poderosa para gerenciar trabalhos de engenharia de dados em larga escala em Python, Scala e pipelines baseados em notebooks, tudo em um só lugar.

**O que você não gosta em Databricks?**

Minha maior frustração com o Genie é a falta de memória de sessão persistente. Em um projeto de migração de longa duração com mais de 60 casos de teste e múltiplos componentes interconectados, ter que restabelecer o contexto a cada sessão cria um verdadeiro ônus. O Genie também tem dificuldades com o raciocínio entre componentes: ele lida bem com cadernos individuais, mas rastrear problemas através de múltiplas camadas de um framework ainda é em grande parte um esforço manual. Ocasionalmente, as respostas parecem excessivamente cautelosas quando o que é necessário é uma resposta mais direta e confiante.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Estamos usando o Databricks para realizar uma migração completa do Unity Catalog para uma grande estrutura de ingestão automatizada, saindo do antigo Hive Metastore e também atualizando o ambiente de runtime. O Databricks fornece uma plataforma unificada onde o trabalho de migração, teste e validação podem acontecer em um só lugar. Durante os testes, o Genie, em particular, ajudou a acelerar a análise da causa raiz, por exemplo, ele identificou por que um notebook de extração de dados estava falhando ao resolver referências de tabelas gerenciadas pelo UC e identificou que adicionar uma instrução USE CATALOG era a solução. Esse tipo de assistência direcionada e ciente do contexto reduz diretamente o tempo de investigação durante migrações complexas.

**Official Response from Janelle Glover:**

> É fantástico saber que o Databricks está ajudando a simplificar seus processos de migração e teste do Unity Catalog. Agradecemos seu exemplo específico de como a assistência contextual do Genie reduziu diretamente o tempo de investigação durante migrações complexas. Também agradecemos seu feedback sobre eficiência e levaremos seus comentários em consideração para melhorias futuras.

  ### 44. Impulsionando a Inovação em IA e Dados com uma Plataforma Unificada da Databricks

**Rating:** 4.5/5.0 stars

**Reviewed by:** Ajay Kumar P. | Associate Consultant-Data Engineer, Pequena Empresa (50 ou menos emp.)

**Reviewed Date:** August 09, 2023

**O que você mais gosta em Databricks?**

Eu uso o Databricks para ETL, Relatórios e IA, e aprecio que ele funcione como uma solução unificada para todas as necessidades de dados e IA. Isso facilita o acompanhamento dos dados e a criação de insights, ajudando-nos a lidar com silos de dados. Eu gosto do Unity Catalog, pois nos ajuda a gerenciar e governar dados em um só lugar. Também gosto de usar o AgentBricks como um sistema multiagente para criar aplicações de IA a partir de PDFs e outros documentos. Acho o Genie valioso, pois permite que os usuários de negócios façam perguntas em linguagem natural e obtenham respostas exatas. A configuração inicial do Databricks foi muito fácil, tornando a transição suave.

**O que você não gosta em Databricks?**

Acho que o fluxo de trabalho poderia ser melhorado adicionando múltiplos gatilhos ao mesmo pipeline, pois atualmente, se quisermos agendar o mesmo pipeline várias vezes ao dia, temos que cloná-lo para cada horário.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Eu uso o Databricks para eliminar silos de dados e facilitar o rastreamento de dados e a criação de insights. O Unity Catalog gerencia a governança de dados, o AgentBricks desenvolve aplicações de IA, e o Genie fornece respostas usando linguagem natural em dados estruturados.

**Official Response from Aunalisa Arellano:**

> Estamos entusiasmados em saber que a Plataforma de Inteligência Databricks está proporcionando valor ao abordar questões de governança de dados e simplificar o gerenciamento de dados. Seu feedback sobre a necessidade de fluxos de trabalho mais robustos foi anotado, e estamos comprometidos em melhorar continuamente nossa plataforma para atender melhor às necessidades de Engenheiros de Dados, Engenheiros de ML e Analistas.

  ### 45. O Modo de Agente do Genie Code tornou nossa migração para o Databricks rápida e precisa.

**Rating:** 4.0/5.0 stars

**Reviewed by:** Dharun T. | Senior Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 26, 2026

**O que você mais gosta em Databricks?**

Genie Code (Agente Assistente do Databricks) — Atualmente estou trabalhando na migração de cargas de trabalho existentes do ADF e SQLMI para o Databricks. Como parte disso, preciso converter procedimentos armazenados e fluxos de dados do ADF em notebooks do Databricks. Inicialmente, refatoramos todo o código manualmente, mas uma vez que o Modo Agente estava disponível em pré-visualização, tentamos usá-lo para converter os procedimentos armazenados e fluxos de dados em código PySpark do Databricks. Fiquei impressionado com a precisão: ele lidou com cerca de 90% da conversão de código sem erros, exceto por alguns ajustes de tratamento de casos e similares.

Além disso, o Lakeflow Connect me ajudou a conectar dados do SharePoint e SFTP ao Databricks mais facilmente.

**O que você não gosta em Databricks?**

Não é um grande problema, mas no meu projeto o cliente nos pediu para gerar descrições de tabelas e colunas usando IA no Unity Catalog. Para cada ambiente, essas descrições variam, e eu tenho cerca de 300 tabelas apenas na zona Bronze. Ter que clicar em cada tabela e gerar descrições de IA uma por uma é muito demorado, e os resultados não são consistentes entre os ambientes.

Seria muito mais eficiente se tivéssemos uma opção para gerar descrições no nível do esquema, e se houvesse um esquema de informações ou tabelas de sistema que armazenassem descrições de tabelas e colunas como metadados. Dessa forma, poderíamos facilmente replicá-las entre os ambientes. Em alguns casos, os clientes também têm documentação do sistema de origem que poderíamos aproveitar para gerar descrições de tabelas e colunas mais precisas.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Um dos meus principais cenários foi migrar todos os procedimentos armazenados existentes e fluxos de dados do ADF para notebooks do Databricks. Fazer isso manualmente levou mais de 6 horas para completar tanto o desenvolvimento quanto a validação. Mais tarde, usamos o Agent Mode Preview e convertimos mais de 80 procedimentos armazenados médios/complexos e mais de 20 fluxos de dados do ADF em notebooks do Databricks. Isso economizou mais de 100 horas e também gerou scripts de validação para cada tabela para encerrar os testes unitários.

Além do Agent Assistant, também usamos volume externo. Anteriormente, dependíamos da biblioteca Azure para processamento de arquivos no armazenamento ADLS, mas enfrentamos problemas de limite de taxa, não conseguíamos processar em paralelo e, às vezes, o trabalho era abortado. Depois que criamos um volume externo apontando para o contêiner ADLS necessário, conseguimos processamento paralelo e leituras e gravações mais rápidas, em vez de usar código Python personalizado.

**Official Response from Janelle Glover:**

> Obrigado por compartilhar sua experiência positiva com o Genie e o Lakeflow Connect no Databricks! Ficamos felizes em saber que isso tornou seu processo de migração rápido e preciso.

  ### 46. Databricks: Uma Verdadeira Plataforma Unificada de Análise e IA que Aumenta a Velocidade e a Confiabilidade

**Rating:** 5.0/5.0 stars

**Reviewed by:** Amit D. | Data Architect, Empresa (> 1000 emp.)

**Reviewed Date:** March 26, 2026

**O que você mais gosta em Databricks?**

O que eu mais gosto no Databricks é como ele finalmente entregou o que todo engenheiro de dados/profissional de dados desejava — uma verdadeira plataforma unificada de análises e IA.
Lembro-me de trabalhar com cinco ferramentas diferentes apenas para obter um único pipeline desde a ingestão até o relatório. O Databricks colapsou tudo isso em um único ambiente, e isso mudou tudo para mim.
O Delta Lake foi o primeiro avanço. Quando chegou por volta de 2020, as transações ACID e o "time-travel" eliminaram imediatamente a dor operacional que costumávamos considerar "normal". Se um trabalho corrompesse uma tabela, eu poderia reverter para uma versão anterior em segundos, em vez de passar horas restaurando backups. Essa confiabilidade por si só evitou múltiplas falhas a jusante.
Antes de o Delta existir, nossos pipelines dependiam fortemente de padrões de sobrescrita porque não havia uma maneira confiável de aplicar atualizações ou lidar com dados que chegavam atrasados de forma segura. As sobrescritas eram lentas, caras e arriscadas — especialmente para tabelas grandes. Uma única falha durante a sobrescrita poderia deixar a tabela em um estado inconsistente e meio escrito. O processamento demorava mais, os custos de computação aumentavam, e a recuperação muitas vezes significava reconstruir manualmente as partições do zero.
O ROI tornou-se óbvio assim que usamos o Databricks de ponta a ponta. Como uma plataforma lida com ingestão → transformação → ML → BI → governança, aposentamos categorias inteiras de ferramentas legadas e reduzimos drasticamente a sobrecarga operacional.
Então o Genie chegou — e transformou genuinamente meu trabalho do dia a dia.
Uma vez precisei de um módulo PySpark para verificações de qualidade de dados. O Genie gerou toda a lógica — verificações de nulos, validação de esquema, agregações — em segundos. Em vez de gastar 30 minutos escrevendo código padrão, passei 3 minutos refinando a lógica. Isso mudou meu foco de sintaxe para decisões.
Integrações são outra força. Conectar o Databricks ao S3, SQL Server e especialmente ao Power BI tem sido tranquilo. Publicar tabelas Delta diretamente em modelos de BI removeu a necessidade de extratos frágeis e acelerou as atualizações. O Unity Catalog tornou tudo ainda mais limpo com permissões e linhagens consistentes.
O desempenho é consistentemente forte quando importa — junções pesadas, funções de janela, pipelines de múltiplos estágios ou cargas de trabalho de streaming. A computação sem servidor começa instantaneamente, e as cargas de trabalho escalam de forma previsível mesmo sob pressão.
Finalmente, o onboarding me surpreendeu. Recursos como computação sem servidor, consultas em linguagem natural, sugestões de código geradas por IA e comentários automáticos tornam o Databricks intuitivo mesmo para engenheiros novos no Spark. Parece que a plataforma ajuda ativamente você a aprender.
Em resumo: o Databricks me permite trabalhar mais rápido, recuperar instantaneamente, integrar-se perfeitamente e escalar com confiança — tudo em um só lugar. É a rara plataforma que melhora tanto a velocidade quanto a confiabilidade ao mesmo tempo.

**O que você não gosta em Databricks?**

O que mais me desagrada no Databricks é a visibilidade e previsibilidade dos custos. Mesmo como um engenheiro experiente, pode ser difícil obter uma visão clara e em tempo real do custo de um fluxo de trabalho antes de executá-lo. Photon vs. runtime padrão, comportamento de escalonamento automático, operações pesadas de shuffle, DBUs — tudo isso pode se acumular rapidamente, e surpresas de custo acontecem a menos que você monitore e ajuste tudo ativamente. Uma simples configuração incorreta de pipeline pode dobrar silenciosamente seus gastos.
Outro desafio é o ritmo acelerado de novas funcionalidades e mudanças. O Databricks inova incrivelmente rápido, o que é ótimo, mas também significa que as funcionalidades podem ser lançadas antes que a documentação, as melhores práticas ou os padrões de governança estejam totalmente maduros. Às vezes, a funcionalidade se comporta de maneira diferente entre runtimes ou provedores de nuvem, e manter-se atualizado requer aprendizado contínuo e refatoração. Isso pode criar atrito na equipe e dívida técnica.

Em resumo: o Databricks é excepcional, mas o modelo de custos nem sempre é transparente, e o rápido lançamento de funcionalidades pode introduzir complexidade operacional que as equipes devem gerenciar ativamente.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Negócios: Antes de adotar o Databricks, nosso ambiente de análise aeroespacial — particularmente em torno do monitoramento da saúde dos motores dos clientes — sofria dos mesmos desafios que muitas organizações de engenharia tradicionais enfrentam.
Tínhamos múltiplos sistemas desconectados lidando com a ingestão de telemetria, processamento de códigos de falha, análise de frotas e previsão de manutenção. Os dados dos sensores dos motores (FADEC, vibração, térmicos, sistemas de óleo) chegavam em diferentes formatos e exigiam muito trabalho manual apenas para normalizar. Os pipelines dependiam de regravações completas porque nossa configuração legada não suportava atualizações ou dados que chegavam atrasados, o que tornava o processamento lento e caro.
Lutávamos com a ingestão lenta de telemetria dos motores, conjuntos de dados inconsistentes entre as equipes de engenharia e longos tempos de resposta para modelos de detecção de anomalias.

Desafio de arquitetura: Antes de usar o Databricks, operávamos em um cenário de dados fragmentado.
Tínhamos múltiplos sistemas, camadas de armazenamento desconectadas e uma forte dependência de trabalhos ETL baseados em regravação porque nossa antiga plataforma de dados não suportava atualizações, dados que chegavam atrasados ou garantias ACID. Isso significava que os pipelines eram lentos, propensos a erros e caros. Reverter dados ruins podia levar horas, e as inconsistências de dados entre as equipes eram comuns.
Lutávamos com sistemas isolados, pipelines lentos, dados não confiáveis e alto custo operacional.

Lutávamos com regravações manuais e dados inconsistentes — mas agora podemos usar o Delta Lake com ACID e viagem no tempo,
o que resultou em:

Rollback instantâneo em cenários de corrupção de dados
Processamento incremental confiável em vez de regravações completas
Dados consistentes consumidos por equipes de engenharia, BI e ML

Isso reduziu nossa janela de processamento de pipeline de telemetria de horas para menos de 30 minutos para um lote diário de toda a frota.

Lutávamos com múltiplas ferramentas e arquiteturas duplicadas — mas agora temos um único Lakehouse unificado,
o que resultou em:

Uma única plataforma para ingestão → transformação → ML → BI → governança
Remoção de 3–5 ferramentas legadas (agendadores ETL, extrações BI, infra ML legada)
Menor manutenção e custos de licenciamento

Lutávamos com ciclos de desenvolvimento lentos — mas agora podemos aproveitar o Genie para engenharia assistida por IA,
o que resultou em:

Criação de módulos PySpark 70–80% mais rápida
Geração automática de verificações de esquema, verificações de nulos e lógica de DQ
Mais tempo gasto em decisões, menos em código boilerplate

Por exemplo, um módulo de qualidade de dados que costumava levar 30 minutos agora leva 2–3 minutos para ser estruturado.

Lutávamos com governança inconsistente — mas agora o Unity Catalog nos dá visibilidade de ponta a ponta,
o que resultou em:

Onboarding mais rápido (reduzido de dias para minutos)
Permissões centralizadas, linhagem e trilhas de auditoria
Alinhamento mais forte com a conformidade

Lutávamos para escalar pipelines e cargas de trabalho de ML — mas agora usamos computação distribuída + Photon,
o que resultou em:

Junções grandes e operações de janela executando até 10× mais rápido
Manuseio estável de conjuntos de dados em escala de terabytes
Desempenho previsível mesmo sob cargas de trabalho pesadas

**Official Response from Janelle Glover:**

> Obrigado por compartilhar sua experiência positiva com o Databricks! Estamos entusiasmados em saber como nossa plataforma melhorou seu fluxo de trabalho e proporcionou confiabilidade e velocidade. Agradecemos seu feedback e estamos comprometidos em melhorar continuamente nossa plataforma para atender melhor às suas necessidades.

  ### 47. Quanto a nós: De Prova de Conceito de ML a Aplicativos de Produção Seguros—Rápidos, Sem Servidor e Bem Governados

**Rating:** 4.0/5.0 stars

**Reviewed by:** Luis V. | Partner, Serviços de Informação, Médio Porte (51-1000 emp.)

**Reviewed Date:** May 24, 2026

**O que você mais gosta em Databricks?**

Pessoalmente, gosto de usar este aplicativo pela capacidade de rapidamente transformar um conceito de prova de aprendizado de máquina ou geração aumentada por recuperação em uma aplicação segura e pronta para produção, usando frameworks Python familiares como streamlit, gradio ou dash. Executar em computação sem servidor significa que nossa equipe pode demonstrar valor aos clientes rapidamente, sem esperar pela provisão de infraestrutura separada.

Também gostamos do catálogo de unidade, que fornece governança unificada em dados estruturados e não estruturados, modelos de ML e métricas de negócios. Recursos como Linhagem Automatizada simplificam auditorias de conformidade dos clientes.

**O que você não gosta em Databricks?**

Sim, há algo a ser melhorado. Em streaming estruturado e carregador automático, uma mudança de esquema durante a execução faz com que a consulta falhe e requer uma reinicialização manual. Para ambientes de produção de clientes com SLAs rigorosos, essas interrupções podem aumentar a sobrecarga de manutenção.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Para clientes que buscam análises imediatas sem uma migração cara de vários meses, implantamos a federação Lakehouse. Este recurso ajuda nossa equipe a consultar e governar dados no local através de sistemas díspares diretamente da interface do Databricks, acelerando a entrega de insights estratégicos.

Também estamos aproveitando ferramentas integradas como a busca vetorial do Mosaic AI para construir aplicações RAG, e utilizando aplicativos do Databricks para entregar front-ends de análises preditivas interativas aos clientes. No geral, é assim que utilizamos este software.

**Official Response from Jess Darnell:**

> Estamos satisfeitos em saber que o aplicativo tem sido fundamental para demonstrar valor aos clientes rapidamente e fornecer governança unificada em dados estruturados e não estruturados, modelos de ML e métricas de negócios. Entendemos os desafios com mudanças de esquema durante a execução e trabalharemos para melhorar esse aspecto para uma experiência mais suave. É ótimo saber que o Databricks está ajudando sua equipe a implantar a federação Lakehouse e aproveitar ferramentas integradas como a busca vetorial do Mosaic AI. Obrigado pelo seu feedback detalhado sobre sua experiência e obrigado por escolher o Databricks!

  ### 48. Uma Plataforma Unificada para Cargas de Trabalho de Dados e IA em Escala

**Rating:** 4.5/5.0 stars

**Reviewed by:** Janani D. | Senior Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 27, 2026

**O que você mais gosta em Databricks?**

O Databricks é ótimo porque reúne tudo o que você precisa para dados e IA em um só lugar. Em vez de alternar entre diferentes ferramentas para engenharia de dados, limpeza de dados, análises e aprendizado de máquina, você pode fazer tudo em um único ambiente. Isso torna a vida muito mais fácil.

**O que você não gosta em Databricks?**

Databricks não é amigável para iniciantes. Muitas vezes, é necessário ter sólidas habilidades em engenharia de dados para usá-lo de forma eficaz. As avaliações apontam que, embora o Databricks seja extremamente capaz, é "uma oficina de alto nível" que requer expertise e não é fácil para equipes menos técnicas. O Databricks usa unidades de custo (DBUs), que muitas pessoas acham difíceis de estimar e gerenciar. Mesmo as avaliações de especialistas destacam que sua precificação é notoriamente complicada e pode esconder custos inesperados.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

A Databricks utiliza a arquitetura Lakehouse para combinar as forças dos data lakes e data warehouses em uma plataforma unificada. Isso significa que dados estruturados e não estruturados coexistem e estão prontos para análises ou aprendizado de máquina.

**Official Response from Janelle Glover:**

> Obrigado por compartilhar como a arquitetura do Databricks está beneficiando você. Nós projetamos nossa plataforma para enfrentar os desafios de gerenciar dados estruturados e não estruturados, e é ótimo saber que está tendo um impacto positivo em seus fluxos de trabalho de análise e aprendizado de máquina.

  ### 49. Os Notebooks do Databricks tornam a colaboração perfeita entre Python, SQL e Scala.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Joseph F. | Cloud Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 25, 2026

**O que você mais gosta em Databricks?**

Os notebooks colaborativos do Databricks são realmente úteis e me permitem trabalhar em qualquer linguagem que eu precise para atender aos meus requisitos de forma eficaz. A capacidade de misturar Python, SQL e até mesmo Scala dentro de um painel torna a colaboração e o trabalho em equipe muito mais suaves. Também aprecio como ele se integra facilmente com outras ferramentas e plataformas de nuvem, de modo que se encaixa nos meus fluxos de trabalho existentes com muito pouca fricção.

**O que você não gosta em Databricks?**

Gosto do suporte ao cliente deles e as atualizações frequentes são uma grande razão pela qual isso se tornou meu favorito para gerenciamento de dados. Também aprecio como ele se integra bem com ferramentas externas como o Power BI para relatórios, é realmente bom.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Isso simplifica a colaboração entre equipes e nos ajuda a trabalhar com grandes conjuntos de dados sem ter que nos preocupar muito com infraestrutura ou sobrecarga de análises. Os cálculos e relatórios são rápidos, o que melhorou nossos ciclos de desenvolvimento e reduziu o vai e vem entre as equipes de engenharia e análise.

**Official Response from Janelle Glover:**

> É ótimo saber que o Databricks está simplificando a colaboração entre equipes e melhorando os ciclos de desenvolvimento para você. Nos esforçamos para fornecer uma plataforma que reduz a sobrecarga de infraestrutura e análise, permitindo que as equipes se concentrem em seus objetivos principais.

  ### 50. Best tool to work with big dealer data, but requires technical team.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Dilkash N. | Assistant Sales Manager (Institutional Sales), Empresa (> 1000 emp.)

**Reviewed Date:** June 02, 2026

**O que você mais gosta em Databricks?**

We have a very big dealer and distributor network throughout India in our sanitaryware business. Big sales data are being generated everyday. Speed is my favorite thing about Databricks. Whenever we use simple excel or old software before, it is always hanging. And now our company data team is churning through the millions of rows in a short time. As a Senior Sales Specialist, I am making sure that I get my territory dashboard and forecasting reports at least daily in the morning. It is bringing all disperse data together in a good manner.

**O que você não gosta em Databricks?**

Worst thing is that it is highly technical software. As a sales person, I cannot apply it in locating data directly. I need to request data engineering or IT team to code or make query every time I desire some new custom report. User-non technical interface is becoming very complicated. And my management is continually saying this costs a great deal.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

We are solving target tracking and inventory matching problem. We have a wide range of products, such as tiles, faucets, and washbasins, in Cera. Databricks is assisting our company to understand what region is selling what product more and the trend in the market. My advantage is due to this, because I can advise my local dealers accordingly, as to next month order. It is providing highly precise sales forecast and saving me my manual reporting time and I am closing my sales targets with ease.


## Databricks Discussions
  - [O que é Lakehouse no Databricks?](https://www.g2.com/pt/discussions/what-is-lakehouse-in-databricks) - 4 comments, 2 upvotes
  - [Quais são os recursos do Databricks?](https://www.g2.com/pt/discussions/what-are-the-features-of-databricks) - 4 comments, 2 upvotes
  - [What does Databricks software do?](https://www.g2.com/pt/discussions/what-does-databricks-software-do) - 3 comments
  - [O que é a plataforma de análise unificada da Databricks?](https://www.g2.com/pt/discussions/what-is-databricks-unified-analytics-platform) - 3 comments

- [View Databricks pricing details and edition comparison](https://www.g2.com/pt/products/databricks/reviews?section=pricing&secure%5Bexpires_at%5D=2026-06-02+18%3A50%3A53+-0500&secure%5Bsession_id%5D=bd01ad54-655a-4319-86f3-4f629b8142da&secure%5Btoken%5D=ded5c82d2a2ce4d64891375bd738bb945031f2c55a67722be5da1497ae0eee94&format=llm_user)
## Databricks Integrations
  - [Agentforce 360 Platform (formerly Salesforce Platform)](https://www.g2.com/pt/products/agentforce-360-platform-formerly-salesforce-platform/reviews)
  - [Agentforce Sales (formerly Salesforce Sales Cloud)](https://www.g2.com/pt/products/agentforce-sales-formerly-salesforce-sales-cloud/reviews)
  - [Alation](https://www.g2.com/pt/products/alation/reviews)
  - [Amazon EC2](https://www.g2.com/pt/products/amazon-ec2/reviews)
  - [Amazon Redshift](https://www.g2.com/pt/products/amazon-redshift/reviews)
  - [Amazon Relational Database Service (RDS)](https://www.g2.com/pt/products/amazon-relational-database-service-rds/reviews)
  - [Anaplan](https://www.g2.com/pt/products/anaplan/reviews)
  - [Anomalo](https://www.g2.com/pt/products/anomalo/reviews)
  - [Apache Airflow](https://www.g2.com/pt/products/apache-airflow/reviews)
  - [Apache Kafka](https://www.g2.com/pt/products/apache-kafka/reviews)
  - [Apache NiFi](https://www.g2.com/pt/products/apache-nifi/reviews)
  - [Atlan](https://www.g2.com/pt/products/atlan/reviews)
  - [AWS Glue](https://www.g2.com/pt/products/aws-glue/reviews)
  - [AWS Lambda](https://www.g2.com/pt/products/aws-lambda/reviews)
  - [Azure Blob Storage](https://www.g2.com/pt/products/azure-blob-storage/reviews)
  - [Azure Databricks](https://www.g2.com/pt/products/azure-databricks/reviews)
  - [Azure Data Factory](https://www.g2.com/pt/products/azure-data-factory/reviews)
  - [Azure Data Lake Store](https://www.g2.com/pt/products/azure-data-lake-store/reviews)
  - [Azure Functions](https://www.g2.com/pt/products/azure-functions/reviews)
  - [Azure Logic Apps](https://www.g2.com/pt/products/azure-logic-apps/reviews)
  - [Azure OpenAI Service](https://www.g2.com/pt/products/azure-openai-service/reviews)
  - [Azure Pipelines](https://www.g2.com/pt/products/azure-pipelines/reviews)
  - [Azure Portal](https://www.g2.com/pt/products/azure-portal/reviews)
  - [Azure SQL Database](https://www.g2.com/pt/products/azure-sql-database/reviews)
  - [Claude Code](https://www.g2.com/pt/products/anthropic-claude-code/reviews)
  - [Confluent](https://www.g2.com/pt/products/confluent/reviews)
  - [Crunchbase](https://www.g2.com/pt/products/crunchbase/reviews)
  - [Customer.io](https://www.g2.com/pt/products/customer-io/reviews)
  - [Dash](https://www.g2.com/pt/products/dash-for-brands-ltd-dash/reviews)
  - [data.world](https://www.g2.com/pt/products/data-world/reviews)
  - [DAT iQ](https://www.g2.com/pt/products/dat-iq/reviews)
  - [dbt](https://www.g2.com/pt/products/dbt/reviews)
  - [DigitalOcean](https://www.g2.com/pt/products/digitalocean/reviews)
  - [Fivetran](https://www.g2.com/pt/products/fivetran/reviews)
  - [GEN TDS](https://www.g2.com/pt/products/gen-tds/reviews)
  - [Git](https://www.g2.com/pt/products/git/reviews)
  - [GitHub](https://www.g2.com/pt/products/github/reviews)
  - [GitLab](https://www.g2.com/pt/products/gitlab/reviews)
  - [Google Analytics](https://www.g2.com/pt/products/google-analytics/reviews)
  - [Google Cloud Run](https://www.g2.com/pt/products/google-cloud-run/reviews)
  - [HubSpot Marketing Hub](https://www.g2.com/pt/products/hubspot-marketing-hub/reviews)
  - [Immuta](https://www.g2.com/pt/products/immuta/reviews)
  - [JD Edwards World](https://www.g2.com/pt/products/jd-edwards-world/reviews)
  - [Microsoft Copilot Studio](https://www.g2.com/pt/products/microsoft-microsoft-copilot-studio/reviews)
  - [Microsoft Fabric](https://www.g2.com/pt/products/microsoft-fabric/reviews)
  - [Microsoft Power Apps](https://www.g2.com/pt/products/microsoft-power-apps/reviews)
  - [Microsoft Power Automate](https://www.g2.com/pt/products/microsoft-power-automate/reviews)
  - [Microsoft Power BI](https://www.g2.com/pt/products/microsoft-microsoft-power-bi/reviews)
  - [Microsoft SharePoint](https://www.g2.com/pt/products/microsoft-sharepoint/reviews)
  - [Microsoft SQL Server](https://www.g2.com/pt/products/microsoft-sql-server/reviews)
  - [Microsoft Teams](https://www.g2.com/pt/products/microsoft-teams/reviews)
  - [Monte Carlo](https://www.g2.com/pt/products/monte-carlo/reviews)
  - [MySQL](https://www.g2.com/pt/products/mysql/reviews)
  - [ObjectWay SpA](https://www.g2.com/pt/products/objectway-spa/reviews)
  - [Oracle Database](https://www.g2.com/pt/products/oracle-database/reviews)
  - [Pega Platform](https://www.g2.com/pt/products/pega-platform/reviews)
  - [PostgreSQL](https://www.g2.com/pt/products/postgresql/reviews)
  - [PowerBI Portal](https://www.g2.com/pt/products/powerbi-portal/reviews)
  - [Prophecy](https://www.g2.com/pt/products/prophecy-prophecy/reviews)
  - [Qualtrics Customer Experience](https://www.g2.com/pt/products/qualtrics-customer-experience/reviews)
  - [React Native](https://www.g2.com/pt/products/react-native/reviews)
  - [Salesforce Agentforce](https://www.g2.com/pt/products/salesforce-agentforce/reviews)
  - [SAP Ariba](https://www.g2.com/pt/products/sap-ariba/reviews)
  - [SAP ECC](https://www.g2.com/pt/products/sap-ecc/reviews)
  - [SAS Viya](https://www.g2.com/pt/products/sas-sas-viya/reviews)
  - [Seamless (formally Seamless.AI)](https://www.g2.com/pt/products/seamless-formally-seamless-ai/reviews)
  - [ServiceNow IT Service Management](https://www.g2.com/pt/products/servicenow-it-service-management/reviews)
  - [Sigma](https://www.g2.com/pt/products/sigma-computing-sigma/reviews)
  - [Sisense](https://www.g2.com/pt/products/sisense/reviews)
  - [SnapLogic Intelligent Integration Platform (IIP)](https://www.g2.com/pt/products/snaplogic-intelligent-integration-platform-iip/reviews)
  - [Snowflake](https://www.g2.com/pt/products/snowflake/reviews)
  - [Spark](https://www.g2.com/pt/products/apache-spark/reviews)
  - [Spark SQL](https://www.g2.com/pt/products/spark-sql/reviews)
  - [SplashBI](https://www.g2.com/pt/products/splashbi/reviews)
  - [Spotfire Analytics](https://www.g2.com/pt/products/spotfire-analytics/reviews)
  - [Tableau](https://www.g2.com/pt/products/tableau/reviews)
  - [ThoughtSpot](https://www.g2.com/pt/products/thoughtspot/reviews)
  - [Visual Studio Code](https://www.g2.com/pt/products/visual-studio-code/reviews)
  - [Workday HCM](https://www.g2.com/pt/products/workday-hcm/reviews)

## Databricks Features
**Relatórios**
- Interface de Relatórios
- Passos para responder
- Gráficos e Tabelas
- Cartões de pontuação
- Painéis

**Administração**
- Modelagem de Dados
- Recomendações
- Gerenciamento de fluxo de trabalho
- Painéis e Visualizações

**Gestão**
- Relatórios
- Auditoria

**Implantação**
- Flexibilidade linguística
- Flexibilidade de estrutura
- Controle de versão
- Facilidade de implantação
- Escalabilidade

**Sistema**
- Ingestão de Dados e Disputa

**Preparação de dados**
- Conectores
- Governança de dados

**Gestão de Dados**
- Integração de dados
- Compactação de dados
- Qualidade dos dados
- Análise de dados integrada
- Aprendizado de máquina no banco de dados
- Análise Data Lake

**Gestão**
- Dicionário de dados
- Replicação de dados
- Linguagem de consulta
- Modelagem de dados
- Análise de desempenho

**Gestão**
- Glossário de Negócios
- Descoberta de dados
- Perfil de dados
- Relatórios e visualização
- Linhagem de dados

**Implantação**
- Flexibilidade linguística
- Flexibilidade de estrutura
- Controle de versão
- Facilidade de implantação
- Escalabilidade

**Gestão de Dados**
- Integração de dados
- Metadados
- Auto-serviço
- Fluxos de trabalho automatizados

**Escalabilidade e desempenho - Infraestrutura de IA generativa**
- Alta Disponibilidade
- Escalabilidade de treinamento de modelo
- Velocidade de inferência

**Personalização - Construtores de Agentes de IA**
- Configuração de Linguagem Natural
- Personalização de Tom
- Guardrails de Segurança

**Agente AI - Plataformas de DataOps**
- Execução Autônoma de Tarefas
- Planejamento em várias etapas
- Integração entre sistemas
- Aprendizagem Adaptativa
- Tomada de Decisão

**Gestão de Tráfego e Desempenho - Portais de IA**
- Limitação de Taxa Ciente de Token
- Cache Semântico
- Roteamento Multi-Modelo e Alternativas

**Desenvolvimento de Modelos**
- Suporte a idiomas
- Arrastar e soltar
- Algoritmos pré-construídos
- Treinamento de modelo

**Base de dados**
- Coleta de dados em tempo real
- Distribuição de dados
- Lagoa de dados

**Transformação de dados**
- Análise em tempo real
- Consulta de dados

**Conformidade**
- Conformidade com dados confidenciais
- Treinamentos e Diretrizes
- Aplicação de políticas
- Monitoramento de conformidade

**Funcionalidade**
- Extração
- Transformação
- A carregar
- Automação
- Escalabilidade

**Gestão**
- Catalogação
- Monitoramento
- Diretor
- Modelo de Registro

**Desenvolvimento de Modelos**
- Engenharia de Recursos

**Modelagem e mistura de dados**
- Consulta de dados
- Filtragem de dados
- Combinação de dados

**Integração**
- Integração AI/ML
- Integração de ferramentas de BI
- Integração de data lake

**Manutenção**
- Migração de dados
- Backup e recuperação
- Ambiente Multiusuário

**Segurança**
- Controle de acesso
- Gerenciamento de Funções
- Gestão de Compliance

**Operações**
- Métricas
- Gerenciamento de Infraestrutura
- Colaboração

**Analytics**
- Recursos de análise
- Visualizações Dasboard

**Custo e Eficiência - Infraestrutura de IA Gerativa**
- Custo por chamada de API
- Flexibilidade de alocação de recursos
- Eficiência Energética

**Funcionalidade - Construtores de Agentes de IA**
- Suporte Omnicanal
- Agente de Marca
- Capacidades de Resposta Proativa
- Escalação Humana Sem Interrupções

**Governança e Observabilidade - Portais de IA**
- Privacidade de Dados
- Rastreamento de Custos
- Segurança Centralizada de Chave de API

**Serviços de Máquina/Deep Learning**
- Visão computacional
- Processamento de Linguagem Natural
- Geração de Linguagem Natural
- Redes Neurais Artificiais

**Integrações**
- Integração com Hadoop
- Integração com o Spark

**Qualidade dos dados**
- Preparação de dados
- Distribuição de dados
- Unificação de dados

**Serviços de Máquina/Deep Learning**
- Compreensão de linguagem natural
- Aprendizado Profundo

**Implantação**
- No local
- Nuvem

**Segurança**
- Criptografia de dados
- Controle de Acesso do Usuário

**Manutenção**
- Gestão da Qualidade de Dados
- Gerenciamento de políticas

**Gestão**
- Catalogação
- Monitoramento
- Diretor

**Monitoramento e Gerenciamento**
- Observabilidade dos dados
- Recursos de teste

**IA generativa**
- Geração de Texto
- Resumo de texto

**Integração e Extensibilidade - Infraestrutura de IA Gerativa**
- Suporte a várias nuvens
- Integração de pipeline de dados
- Suporte e flexibilidade de API

**Dados e Análise - Construtores de Agentes de IA**
- Análise e Relatórios
- Consciência Contextual
- Conformidade com a Privacidade de Dados

**Implantação**
- Serviço Gerenciado
- Aplicativo
- Escalabilidade

**Plataforma**
- Dimensionamento de Máquinas
- Preparação de dados
- Integração com o Spark

**Conectividade**
- Integração com Hadoop
- Integração com o Spark
- Análise de várias fontes
- Lagoa de dados

**Desempenho**
- Escalabilidade

**Implantação na nuvem**
- Suporte a nuvem híbrida
- Recursos de migração para a nuvem

**IA generativa**
- Geração de Texto
- Resumo de texto

**IA generativa**
- Geração de Texto
- Resumo de texto

**Segurança e Conformidade - Infraestrutura de IA generativa**
- GDPR e conformidade regulatória
- Controle de acesso baseado em função
- Criptografia de dados

**Integração - Construtores de Agentes de IA**
- Automação de Fluxo de Trabalho
- Uso da API
- Interoperabilidade de Plataforma
- Integração de Dados de CRM

**Plataformas de Análise - IA Agente**
- Execução Autônoma de Tarefas
- Planejamento em várias etapas
- Integração entre sistemas
- Aprendizagem Adaptativa
- Interação em Linguagem Natural
- Assistência Proativa
- Tomada de Decisão

**Autoatendimento**
- Campos calculados
- Filtragem de colunas de dados
- Descoberta de dados
- Pesquisa
- Colaboração / Fluxo de trabalho
- Automodelagem

**Processamento**
- Processamento na nuvem
- Processamento de carga de trabalho

**Operações**
- Visualização de dados
- Fluxo de trabalho de dados
- Descoberta governada
- Análise incorporada
- Notebooks

**Segurança**
- Governança de dados
- Segurança de dados

**IA generativa**
- Geração de Texto por IA
- Resumo de texto
- Conversão de texto em imagem

**IA generativa**
- Geração de Texto
- Resumo de texto

**Usabilidade e Suporte - Infraestrutura de IA generativa**
- Qualidade da Documentação
- Atividade Comunitária

**IA Agente - Governança de Dados**
- Execução Autônoma de Tarefas
- Planejamento em várias etapas
- Integração entre sistemas
- Aprendizagem Adaptativa
- Interação em Linguagem Natural
- Tomada de Decisão

**Implantação e Integração - Plataformas de Análise**
- Construtor de Painel Sem Código
- Agendamento e Automação de Relatórios
- Análise Embutida e Rotulagem Branca
- Conectividade da Fonte de Dados

**Análises avançadas**
- Análise preditiva
- Visualização de dados
- Serviços de Big Data

**IA generativa**
- Geração de Texto
- Resumo de texto

**Agente AI - Plataformas de Ciência de Dados e Aprendizado de Máquina**
- Execução Autônoma de Tarefas
- Planejamento em várias etapas
- Integração entre sistemas
- Aprendizagem Adaptativa
- Interação em Linguagem Natural
- Assistência Proativa
- Tomada de Decisão

**Desempenho e Escalabilidade - Plataformas de Análise**
- Manipulação de grandes volumes de dados e velocidade de consulta
- Suporte a Usuários Concomitantes

**Plataformas de Análise Avançada e Modelagem - Análise**
- Modelagem e Governança de Dados
- Integração de Notebook e Script
- Modelos Preditivos e Estatísticos Integrados

**Capacidades de IA Agente - Plataformas de Análise**
- Insights e Narrativas Geradas Automaticamente
- Consultas em Linguagem Natural
- Monitoramento Proativo de KPI e Alertas
- Agentes de IA para Acompanhamentos Analíticos

**Inteligência Personalizada - Plataformas de Análise**
- Aprendizado Comportamental para Refinamento de Consulta Contextual
- Personalização de Insights Baseada em Funções
- Análise Conversacional e Baseada em Prompt

**Construindo relatórios**
- Transformação de dados
- Modelagem de dados
- Design do relatório WYSIWYG
- APIs de integração

**Plataforma**
- Suporte ao usuário móvel
- Personalização
- Gerenciamento de usuários, funções e acessos
- Internacionalização
- Sandbox / Ambientes de Teste
- Desempenho e Confiabilidade
- Abrangência de aplicativos de parceiros

## Top Databricks Alternatives
  - [Cloudera Data Platform](https://www.g2.com/pt/products/cloudera-cloudera-data-platform/reviews) - 4.1/5.0 (131 reviews)
  - [Snowflake](https://www.g2.com/pt/products/snowflake/reviews) - 4.5/5.0 (706 reviews)
  - [Teradata Vantage](https://www.g2.com/pt/products/teradata-teradata-vantage/reviews) - 4.3/5.0 (355 reviews)

