# Databricks Reviews
**Vendor:** Databricks Inc.  
**Category:** [Sistemas de Processamento e Distribuição de Big Data](https://www.g2.com/pt/categories/big-data-processing-and-distribution)  
**Average Rating:** 4.6/5.0  
**Total Reviews:** 783
## About Databricks
Databricks é uma plataforma unificada de dados e IA que ajuda as organizações a construir, governar e escalar pipelines de dados, análises, aprendizado de máquina, aplicações de IA e agentes. Mais de 20.000 organizações em todo o mundo — incluindo adidas, AT&amp;T, Bayer, Block, Mastercard, Rivian, Unilever e 70% das empresas da Fortune 500 — confiam no Databricks para trabalhar com dados empresariais e IA em escala. Com sede em São Francisco e mais de 30 escritórios ao redor do mundo, o Databricks oferece uma plataforma unificada que inclui Agent Bricks, Lakeflow, Lakehouse, Lakebase, Genie e Unity Catalog. Fundado em 2013 pelos criadores originais do Apache Spark™, Delta Lake, MLflow e Unity Catalog, o Databricks é construído em uma arquitetura de lakehouse aberta que reúne dados, análises e IA. A plataforma é usada por engenheiros de dados, cientistas de dados, analistas, desenvolvedores, equipes de aprendizado de máquina, equipes de IA e usuários de negócios para colaborar em todo o ciclo de vida de dados e IA. As principais capacidades do Databricks incluem: - Engenharia de dados: Construa, automatize e gerencie pipelines de dados em lote, streaming e em tempo real de forma confiável. - Análise e inteligência de negócios: Execute análises SQL, crie dashboards e permita que as equipes de negócios explorem dados. - Governança de dados: Descubra, proteja e gerencie dados e ativos de IA entre equipes, nuvens e cargas de trabalho. - Aprendizado de máquina e IA: Desenvolva modelos, construa aplicações de IA generativa e crie agentes de IA em nível de produção. - Aplicações de dados: Construa e implante aplicações orientadas a dados usando dados empresariais governados. Disponível em AWS, Azure e Google Cloud, o Databricks ajuda as organizações a trabalhar entre nuvens, reduzir silos de dados e simplificar a colaboração entre equipes e ferramentas. Os clientes usam o Databricks para casos de uso como personalização de clientes, detecção de fraudes, manutenção preditiva, análises em tempo real, cibersegurança, pesquisa em saúde, gestão de risco financeiro, otimização da cadeia de suprimentos e tomada de decisão impulsionada por IA. O Databricks é usado em diversos setores, incluindo serviços financeiros, saúde e ciências da vida, varejo, manufatura, energia e setor público. As organizações usam a plataforma para modernizar a infraestrutura de dados, acelerar a adoção de IA e transformar dados empresariais em valor de negócios.



## Databricks Pros & Cons
**What users like:**

- Os usuários valorizam os **recursos de IA e a segurança robusta de dados** do Databricks, melhorando a usabilidade e a integração em processos de big data. (192 reviews)
- Os usuários acham que o Databricks tem uma **facilidade de uso** excepcional, facilitando o hospedagem eficiente de modelos e a gestão de dados. (155 reviews)
- Os usuários valorizam as **integrações perfeitas** do Databricks, permitindo um processamento de dados eficiente e colaboração entre ferramentas. (141 reviews)
- Os usuários valorizam a **excelente colaboração** que o Databricks promove, permitindo o trabalho em equipe em tempo real entre engenheiros de dados e analistas. (114 reviews)
- Análise (113 reviews)
- Escalabilidade (111 reviews)
- Integração de ML (106 reviews)
- Os usuários apreciam as **integrações fáceis** do Databricks, conectando-se perfeitamente com a infraestrutura de nuvem e aprimorando o gerenciamento de dados. (102 reviews)
- Aprendizado de Máquina (97 reviews)
- Os usuários adoram os **recursos eficazes de gerenciamento de dados** do Databricks, simplificando fluxos de trabalho e aprimorando as capacidades de tomada de decisão. (87 reviews)

**What users dislike:**

- Os usuários acham a **curva de aprendizado acentuada** desafiadora, complicando a adoção organizacional e o uso inicial do Databricks. (78 reviews)
- Os usuários acham que os **custos do Databricks são altos** , especialmente ao trabalhar com grandes conjuntos de dados e operações complexas. (71 reviews)
- Os usuários acham uma **curva de aprendizado acentuada** desafiadora, tornando a adoção inicial e o gerenciamento de recursos mais complexos. (64 reviews)
- Os usuários acham a **complexidade** do Databricks desafiadora, especialmente em relação à curva de aprendizado e às limitações de integração. (45 reviews)
- Configuração Complexa (35 reviews)
- Problemas de Desempenho (34 reviews)
- Os usuários enfrentam **problemas de interface não intuitiva** que levam a erros aleatórios e complicam a experiência para usuários não técnicos. (34 reviews)
- Design de UI ruim (33 reviews)
- Os usuários acham que os **recursos ausentes** no Databricks são limitantes, prejudicando a produtividade e complicando a experiência geral. (31 reviews)
- Custo (29 reviews)

## Databricks Reviews
  ### 1. Databricks no meu caso: Múltiplas Integrações, Interface Intuitiva e Desempenho Confiável

**Rating:** 4.0/5.0 stars

**Reviewed by:** Yelnur K. | Schedule Manager, Linhas Aéreas/Aviação, Médio Porte (51-1000 emp.)

**Reviewed Date:** May 19, 2026

**O que você mais gosta em Databricks?**

O que mais gosto no Databricks é a parte de Integrações. No ambiente de trabalho, integramos o Banco de Dados com várias fontes de dados. Além disso, não posso completar minha avaliação sem mencionar o design de UX e UI, que torna o fluxo de trabalho geral intuitivo e genuinamente amigável. Quando se trata da velocidade dos processos, nunca nos decepcionou. Funciona como esperado. Comparativamente ao preço de mercado, o preço do serviço é bastante confiável para nós. Existe um centro de ajuda do Databricks, se você não conseguir encontrar respostas para suas perguntas, há especialistas que podem ajudá-lo com suas dúvidas. Como exemplo, posso lembrar de um caso em que tivemos um problema durante o processo de exame, eles nos ajudaram a resolver esse problema.

**O que você não gosta em Databricks?**

A qualidade da IA do Genie não é apreciada. Pessoal, isso poderia ser melhorado, especialmente a parte de raciocínio. Além disso, posso mencionar o caso em que tivemos um problema com o processo de exame. Especialistas nos ajudaram, mas nos causou um pouco de desconforto. Bem,

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Na aviação, utilizamos este software para análise de dados. Automatizamos muitos processos que ferramentas simples de trabalho não conseguem lidar. Também integramos com várias ferramentas (nomes que não posso mencionar por motivos de segurança). Particularmente, ele nos ajuda a analisar a demanda de passageiros por rota e estação. Combinamos e analisamos grandes conjuntos de dados usando este software. No geral, uma boa ferramenta. Nossa equipe está satisfeita.

**Official Response from Jess Darnell:**

> Obrigado pelo seu feedback detalhado. Estamos satisfeitos em saber que o Databricks tem sido fundamental na automação de processos e análise de grandes conjuntos de dados para suas necessidades de aviação. Levamos a sério seu feedback sobre o Genie AI e os processos de suporte e estamos dedicados a fazer melhorias nessas áreas.

  ### 2. Lakebase - Boa Opção para Servir Dados com Baixa Latência com Integração Databricks

**Rating:** 4.5/5.0 stars

**Reviewed by:** Senthil K. | Associate Director, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 25, 2026

**O que você mais gosta em Databricks?**

Configurei o Lakebase, que está sincronizado com o Lakehouse para acesso de baixa latência em aplicações empresariais, e ativamos as opções abaixo:

- Lakebase usando Postgres 17, a API de Dados HTTPS está ajudando a acessar o banco de dados de maneira mais fácil a partir de aplicativos Databricks

- Sincronização de integração entre Lakehouse e Lakebase para acesso via API

- Possui opção de ramificação para manter mudanças de esquema ou funcionalidades

- Restauração de ponto/histórico anterior - ajuda a reduzir o esforço de recuperação - Suporte a snapshots e backup

- Opção de escalonamento automático de computação e suspensão

- Monitoramento, logs e métricas de consulta estão proporcionando visibilidade sobre consultas ativas, desempenho e saúde do banco de dados

- Acesso OAuth e conexão baseada em funções do Postgres estão ajudando a melhorar a segurança e o acesso controlado

Modelo de precificação do Lakebase com opção de escalonamento automático e redução de escala com base na precificação de computação disponível

**O que você não gosta em Databricks?**

Lakebase não possui todos os recursos do Postgres, então não podemos migrar diretamente nenhum Postgres existente para o Lakebase.

Reduzir a escala para zero não acontece instantaneamente, enfrentamos alguns problemas como desconexão do aplicativo por um curto período, pausas temporárias.

Operações administrativas personalizadas no banco de dados Postgres são limitadas e não são possíveis.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Lakebase ajuda a fornecer dados de inventário quase em tempo real, rastreamento de disponibilidade e redução de situações de falta de estoque.

Os dados processados do Lakehouse podem ser servidos através do Lakebase para padrões de compra de clientes, recomendação de produtos e eficácia de promoções.

Os dados de vendas transacionais podem estar disponíveis rapidamente para painéis de nível de loja, ajudando as equipes de negócios a monitorar tendências de vendas usando aplicativos web.

Disponibilidade de dados operacionais quase em tempo real
aplicativos acessam dados de baixa latência para preços, promoções para integrações TPO-TPM.

Também integramos a IA para incluir o contexto em tempo real.

Baixa latência

**Official Response from Janelle Glover:**

> Obrigado por compartilhar suas experiências positivas com o Genie, incluindo sua capacidade de preencher a lacuna entre as equipes de negócios e de dados, eliminar silos de dados e melhorar a visibilidade de custos e desempenho. Entendemos suas preocupações sobre as limitações do Modo Agente e a necessidade de maior autonomia. Trabalharemos para abordar essas áreas e melhorar sua experiência geral.

  ### 3. Plataforma Delta Lake Tudo-em-Um que Torna o ETL Rápido e Econômico

**Rating:** 5.0/5.0 stars

**Reviewed by:** Kavipriya S. | Data Engineer, Tecnologia da Informação e Serviços, Médio Porte (51-1000 emp.)

**Reviewed Date:** May 27, 2026

**O que você mais gosta em Databricks?**

Delta Lake + Workflows + Unity Catalog em uma única plataforma eliminou a necessidade de juntar ferramentas separadas de ingestão, transformação e governança. Como engenheiro de dados, passo mais tempo construindo pipelines e menos tempo gerenciando infraestrutura. A experiência com notebooks e o auto-escalonamento de clusters tornam a iteração em ETL complexos rápida e econômica.

**O que você não gosta em Databricks?**

Os tempos de inicialização de clusters e a previsibilidade de custos ainda são os maiores pontos de atrito para mim. Inícios a frio podem realmente atrasar o trabalho ad-hoc, e os custos de DBU precisam ser monitorados de perto para evitar surpresas desagradáveis. A interface do Workflows melhorou muito ao longo do tempo, mas ainda não parece tão flexível quanto orquestradores dedicados quando se lida com DAGs mais complexos. Mesmo assim, vejo isso principalmente como itens de acabamento—o valor central da plataforma supera facilmente esses pontos.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Databricks resolve um grande problema de fragmentação em nossa pilha de engenharia de dados. Anteriormente, dependíamos de ferramentas separadas para ingestão, transformação, orquestração e governança—cada uma com sua própria curva de aprendizado, sobrecarga de manutenção e potenciais pontos de falha. Agora, está tudo consolidado em uma única plataforma.

Na prática, isso nos ajuda a executar pipelines ETL em larga escala que processam milhões de registros diariamente, com o Delta Lake melhorando a confiabilidade através de transações ACID, imposição de esquemas e "time travel" para depuração. Também fecha a lacuna de colaboração entre engenheiros de dados e cientistas de dados: nós construímos os pipelines, e eles podem consumir as mesmas tabelas diretamente em notebooks sem duplicação de dados ou problemas de sincronização.

O Unity Catalog resolveu um antigo problema de governança centralizando o controle de acesso em todos os workspaces. No geral, o resultado é um desenvolvimento de pipelines mais rápido, menos incidentes de produção ligados a problemas de qualidade de dados e muito menos código "glue" para manter. O que costumava levar semanas para construir e estabilizar agora leva dias.

**Official Response from Jess Darnell:**

> Estamos encantados em saber que o Databricks consolidou sua pilha de engenharia de dados e melhorou a confiabilidade de seus pipelines ETL. Entendemos seu feedback sobre os tempos de inicialização de clusters e a previsibilidade de custos, e estamos trabalhando ativamente para otimizar esses aspectos de nossa plataforma para proporcionar uma melhor experiência ao usuário.

  ### 4. Poderosos Pipelines de Telemetria de Baixa Latência com Tabelas de Streaming e Visões Materializadas

**Rating:** 4.0/5.0 stars

**Reviewed by:** Jose P. | Head of Network Strategy, Telecomunicações, Empresa (> 1000 emp.)

**Reviewed Date:** May 26, 2026

**O que você mais gosta em Databricks?**

Em um ambiente de telecomunicações lidando com volumes massivos de dados de redes fixas e móveis (GPON, núcleo 4g/5g e RAN) ingerindo telemetria de frequência não estruturada ou semi-estruturada de forma incremental a partir de nossas funções virtualizadas como vEPC, vCPE ou VHGW) com configuração mínima.

Minha equipe trabalha em estreita colaboração com funções de rede virtualizadas e Computação de Borda de Acesso Múltiplo. Recursos como Tabelas de Streaming e Visões Materializadas nos ajudam a construir pipelines de baixa latência que processam métricas de desempenho de rede quase em tempo real, ajudando-nos a monitorar KPIs de rede e eficiência de QoS.

Como a principal expertise da minha equipe está no design de rede e virtualização de sistemas, em vez de administração de banco de dados, a Otimização Preditiva e o Agrupamento Líquido são altamente benéficos. Eles lidam autonomamente com a manutenção de tabelas, compactação de arquivos e otimização de layout de dados, liberando nossos recursos para focar na arquitetura de rede.

**O que você não gosta em Databricks?**

Funções de rede virtualizadas, roteadores e hardware desagregado frequentemente passam por atualizações de software, que muitas vezes introduzem mudanças sutis nos esquemas de saída de telemetria. Ao usar streaming estruturado ou carregador automático, essas derivações de esquema fazem com que nossas consultas de streaming falhem, exigindo uma reinicialização manual do fluxo para replanejar o esquema.

Quando precisamos atualizar a lógica de um KPI de rede complexo definido dentro de uma visão materializada, qualquer alteração na consulta aciona um recálculo completo da visão. Dada a escala massiva dos conjuntos de dados de transações de telecomunicações, isso pode resultar em custos computacionais notáveis.

Dependemos de uma variedade de ferramentas de dados dentro do nosso ecossistema de TIC, nem todas as soluções apresentadas no Partner Connect suportam nativamente o Unity Catalog. Isso pode criar obstáculos de integração e governança quando tentamos conectar certas ferramentas de análise e preparação de dados de terceiros ao nosso data lake seguro.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Ingerimos fluxos contínuos de dados de desempenho de funções de rede virtualizadas e camadas de transporte tradicionais. Ao construir pipelines de streaming, podemos monitorar núcleos virtualizados e roteadores para identificar anomalias ou degradações no tráfego de rede.

Alinhando com meu interesse em IA de Rede e Aprendizado de Máquina, nossos cientistas de dados usam a plataforma para desenvolver modelos preditivos. Treinamos modelos em falhas históricas de linhas GPON/DSL, cargas de torres de celular móveis e padrões de uso de clientes para prever congestionamento de rede, agendar manutenção proativa e mitigar a rotatividade de clientes em diferentes segmentos.

Como evangelista da evolução tecnológica, uso a plataforma para preencher a lacuna entre nossas equipes de engenharia de rede principais e as unidades de negócios. Ao conectar semânticas de negócios e estabelecer protocolos seguros de Delta Sharing, fornecemos aos analistas de negócios e tomadores de decisão acesso autônomo e governado a insights de rede sem comprometer a conformidade de segurança.

**Official Response from Jess Darnell:**

> É fantástico ouvir como o Databricks está ajudando você a ingerir e processar fluxos contínuos de dados de desempenho, desenvolver modelos preditivos e preencher a lacuna entre as equipes de engenharia de rede e as unidades de negócios. Estamos comprometidos em fornecer soluções que beneficiem nossos usuários em vários aspectos de seu trabalho.

  ### 5. Tornando os sistemas de dados menos confusos com uma abordagem unificada de Lakehouse

**Rating:** 5.0/5.0 stars

**Reviewed by:** Hunar M. | Data Analyst, Geospatial Intelligence - Data &amp; Analytics, Empresa (> 1000 emp.)

**Reviewed Date:** May 21, 2026

**O que você mais gosta em Databricks?**

O ecossistema. O que eu mais gosto no Databricks é como ele elimina grande parte da confusão habitual que você encontra ao trabalhar com dados. Em vez de lidar com ferramentas separadas para engenharia, análise e ML — e depois gastar tempo extra para fazê-las se comunicarem — ele traz tudo para um só lugar. Isso por si só reduz muito a fricção e economiza tempo.

Também gosto da ideia do Lakehouse porque parece genuinamente prática: você não precisa escolher entre um data lake e um data warehouse. Você pode trabalhar com uma configuração unificada e ainda obter desempenho quando precisar.

No dia a dia, também é bom que diferentes equipes possam colaborar no mesmo ambiente sem precisar copiar dados constantemente ou reconstruir pipelines. No geral, isso mantém as coisas mais simples e rápidas, especialmente quando você está iterando.

**O que você não gosta em Databricks?**

O que eu não gosto no Databricks é que ele pode parecer um pouco pesado quando você está apenas tentando fazer algo simples. Há muita coisa acontecendo nos bastidores, e embora isso seja ótimo para escalabilidade, também vem com uma curva de aprendizado. Coisas como clusters, configurações e configuração de tarefas levam algum tempo para se acostumar.

O custo é outra preocupação. O uso pode aumentar rapidamente se você não estiver monitorando ativamente, especialmente quando as equipes podem iniciar computação livremente. E, às vezes, a experiência geral parece um pouco fragmentada entre notebooks, tarefas e repositórios, em vez de ser um fluxo suave e unificado.

Então, sim—é poderoso, mas definitivamente requer disciplina para manter as coisas limpas, eficientes e sob controle.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O que o Databricks realmente resolve para mim é o atrito usual que aparece quando os sistemas de dados estão espalhados por muitas ferramentas.

Em vez de executar um sistema para ingestão, outro para armazenamento, algo diferente para transformação e, em seguida, configurações separadas novamente para análises e ML, ele traz a maior parte disso para um só lugar. Isso significa que não preciso ficar movendo dados ou me preocupar constantemente com coisas saindo de sincronia.

Do ponto de vista da arquitetura de soluções, isso é uma grande vitória porque simplifica o design geral. Em vez de costurar um monte de sistemas, você pode construir em torno de uma única configuração de Lakehouse que suporta múltiplos casos de uso. É mais fácil de escalar, mais fácil de governar e, no geral, mais fácil de entender.

No dia a dia, isso também significa que passo menos tempo em infraestrutura e encanamento e mais tempo pensando em como projetar bons modelos de dados e pipelines. E como todos estão trabalhando a partir dos mesmos dados, há muito menos confusão e retrabalho entre as equipes.

No geral, isso remove muito do ruído e me permite focar em construir soluções de dados sólidas e escaláveis.

**Official Response from Jess Darnell:**

> Estamos felizes em saber que você considera nosso ecossistema e abordagem Lakehouse benéficos para simplificar e unificar seu trabalho com dados. Entendemos suas preocupações sobre a curva de aprendizado e custo, e estamos continuamente trabalhando para melhorar a experiência do usuário e fornecer soluções econômicas. Obrigado por compartilhar seu feedback detalhado conosco.

  ### 6. Databricks centraliza dados, analytics e IA

**Rating:** 5.0/5.0 stars

**Reviewed by:** Leonardo Q. | RPA Developer, Médio Porte (51-1000 emp.)

**Reviewed Date:** May 16, 2026

**O que você mais gosta em Databricks?**

O que mais gosto no Databricks é como ele centraliza engenharia de dados, analytics e IA em uma única plataforma, o que facilita muito o fluxo de trabalho no dia a dia. A integração entre notebooks, pipelines e processamento distribuído deixa o desenvolvimento mais rápido e organizado, especialmente em projetos com grande volume de dados e automações.

Outro ponto que considero muito forte é a experiência com o Apache Spark, integrada de forma simplificada. Mesmo em cenários mais complexos, o desempenho costuma ser excelente, permitindo processar dados em larga escala com boa estabilidade e escalabilidade. Isso ajuda bastante em integrações, ETLs e análises que, em outras soluções, exigiriam bem mais esforço.

**O que você não gosta em Databricks?**

Apesar de eu gostar bastante da plataforma, alguns pontos do Databricks ainda podem ser desafiadores. O principal deles é o custo, especialmente em ambientes com processamento intenso ou quando os clusters não estão bem otimizados. Sem um controle de uso mais rigoroso, os gastos podem aumentar rapidamente.

Outro aspecto é a curva de aprendizado, que pode ser alta para equipes que estão começando no ecossistema de dados distribuídos. Conceitos ligados a Spark, clusters, otimização e gerenciamento de recursos exigem tempo de adaptação, principalmente para quem vem de ferramentas mais tradicionais.

Em UI/UX, embora a interface seja boa no geral, alguns processos administrativos e configurações mais avançadas podem parecer confusos no início. Em certos cenários, identificar problemas de performance ou de permissões também pode exigir um conhecimento mais técnico.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Databricks tem ajudado principalmente a resolver problemas relacionados à centralização, ao processamento e à análise de grandes volumes de dados. Antes, muitos processos ficavam distribuídos entre diferentes ferramentas, o que dificultava integrações, manutenção e governança. Com o Databricks, grande parte do fluxo de engenharia de dados, analytics e IA pode ser concentrada em uma única plataforma, trazendo mais consistência para o trabalho do dia a dia.

**Official Response from Jess Darnell:**

> Estamos felizes em saber que você considera a centralização de dados, análises e IA do Databricks benéfica para o seu fluxo de trabalho. Entendemos a importância da integração e simplificação, e estamos comprometidos em fornecer uma plataforma que atenda às suas necessidades.

  ### 7. Databricks Simplifica o Processamento de Big Data e a Colaboração em Equipe

**Rating:** 4.5/5.0 stars

**Reviewed by:** Praveen M. | Associate Data Engineer, Tecnologia da Informação e Serviços, Médio Porte (51-1000 emp.)

**Reviewed Date:** May 07, 2026

**O que você mais gosta em Databricks?**

O que eu mais gosto no Databricks é como ele simplifica o processamento de dados em grande escala e a colaboração em uma única plataforma. A integração com o Spark e serviços de nuvem torna o manuseio de big data muito mais eficiente. Também gosto do ambiente de notebooks, que facilita para as equipes trabalharem juntas em tarefas de análise e aprendizado de máquina.

**O que você não gosta em Databricks?**

Uma coisa que não gosto no Databricks é que a plataforma pode parecer complexa para novos usuários, especialmente ao gerenciar clusters e configurações. O preço também pode se tornar caro com cargas de trabalho maiores se os recursos não forem otimizados cuidadosamente. Embora as integrações e os recursos de IA sejam poderosos, o processo de integração e a documentação de suporte poderiam ser mais amigáveis para iniciantes.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Databricks ajuda a resolver o desafio de processar e analisar grandes quantidades de dados de forma eficiente em uma única plataforma. Ele combina engenharia de dados, análises e fluxos de trabalho de IA, o que reduz a necessidade de múltiplas ferramentas separadas. Isso melhora a colaboração, acelera o processamento de dados e ajuda a gerar insights muito mais rapidamente.

**Official Response from Jess Darnell:**

> Estamos felizes em saber que você acha o Databricks útil para simplificar o processamento de dados em grande escala e a colaboração. Nossa integração com o Spark e serviços em nuvem é projetada para tornar o manuseio de big data mais eficiente.

  ### 8. Perfeito para Colaboração entre Equipes e Aplicações Intensivas de Dados

**Rating:** 5.0/5.0 stars

**Reviewed by:** Artemij V. | Data Science Lead, Pequena Empresa (50 ou menos emp.)

**Reviewed Date:** May 04, 2026

**O que você mais gosta em Databricks?**

A experiência do usuário é uma das partes mais fortes. A experiência com o notebook é limpa e intuitiva, a colaboração é direta, e mover-se entre exploração, experimentação e fluxos de trabalho de produção parece ser contínuo. Tem flexibilidade suficiente para usuários avançados, enquanto ainda é acessível o bastante para que a integração de novos membros da equipe seja rápida. As pessoas geralmente conseguem se tornar produtivas rapidamente sem gastar semanas aprendendo peculiaridades específicas da plataforma.

As integrações também são excelentes. Funciona suavemente com o ecossistema de nuvem mais amplo e se conecta bem com fontes de dados, ferramentas de orquestração, infraestrutura de serviço de modelos e sistemas externos. Essa interoperabilidade torna muito mais fácil passar de protótipo para pipeline implantado sem precisar reconstruir constantemente conectores ou gerenciar código de "cola".

O desempenho tem sido consistentemente forte, especialmente ao trabalhar com cargas de trabalho distribuídas e engenharia de características em larga escala. A otimização do Spark, o gerenciamento de clusters e a infraestrutura gerenciada reduzem significativamente a sobrecarga operacional, o que me permite focar mais no desenvolvimento e análise de modelos em vez de ajuste de ambiente. Para experimentação iterativa, os tempos de inicialização e a capacidade de resposta geral são notavelmente melhores do que muitas plataformas gerenciadas alternativas.

**O que você não gosta em Databricks?**

Uma área onde a Databricks poderia melhorar é na precificação. A plataforma oferece capacidades robustas, mas os custos podem escalar rapidamente para cargas de trabalho de alta frequência ou em tempo real. Para casos de uso que envolvem pipelines de ticks de baixa latência em execução contínua, transmissão de dados de mercado ou re-treinamento iterativo de modelos, a precificação pode se tornar bastante elevada em relação à infraestrutura consumida. Às vezes, parece haver um prêmio significativo pela conveniência e orquestração gerenciada, o que pode tornar a otimização de custos uma consideração constante.

A integração de IA é outra área que ainda parece um pouco desigual. Embora haja um claro esforço para posicionar a plataforma como um ambiente de IA/ML de ponta a ponta, alguns dos recursos mais novos focados em IA parecem mais adições ao ecossistema do que melhorias profundamente integradas ao fluxo de trabalho. Na prática, ainda há casos em que ferramentas personalizadas ou frameworks externos oferecem mais flexibilidade e transparência, particularmente para desenvolvimento de modelos especializados, experimentação e casos de uso de inferência em tempo real.

Também pode haver alguma complexidade em torno do ajuste de clusters e do gerenciamento eficiente de custos em escala. Embora as abstrações sejam úteis, obter a melhor relação desempenho-custo às vezes requer um conhecimento mais profundo da plataforma do que o posicionamento "totalmente gerenciado" pode sugerir.

No geral, a plataforma é muito forte tecnicamente, mas a precificação para cargas de trabalho intensivas em dados sempre ativas e a maturidade de algumas capacidades nativas de IA são as duas maiores áreas onde eu gostaria de ver melhorias.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

O Databricks resolve um dos maiores desafios no trabalho moderno com dados: reunir acesso a dados, processamento em larga escala e desenvolvimento colaborativo em um único ambiente.

Para o meu trabalho, o maior benefício é a colaboração em tempo real. Isso permite que várias pessoas trabalhem nos mesmos conjuntos de dados, notebooks e pipelines sem a fricção usual de ferramentas fragmentadas ou inconsistências de ambiente. Isso acelera significativamente a experimentação, iteração e compartilhamento de conhecimento entre projetos, especialmente ao avançar rapidamente no desenvolvimento de modelos ou na análise de dados que mudam rapidamente.

Ele também resolve o desafio do acesso e processamento escalável de dados. Trabalhar com conjuntos de dados transacionais e de séries temporais de alto volume requer uma infraestrutura que possa processar grandes quantidades de dados de forma eficiente, sem a sobrecarga operacional constante. O Databricks abstrai grande parte dessa complexidade, tornando possível focar na análise, engenharia de características e desenvolvimento de modelos, em vez de gastar tempo gerenciando a infraestrutura.

O benefício prático é ciclos de iteração mais rápidos. Posso passar da exploração de dados brutos para a experimentação e implantação de modelos muito mais rapidamente, o que é especialmente valioso ao trabalhar em análises em tempo real, pipelines de previsão e sistemas de ML voltados para produção, onde a velocidade de iteração impacta diretamente os resultados.

No geral, reduz a fricção de engenharia e torna o trabalho colaborativo com dados em larga escala significativamente mais eficiente, o que se traduz em desenvolvimento mais rápido, melhor experimentação e implantação mais confiável de produtos de dados.

**Official Response from Jess Darnell:**

> Agradecemos sua análise detalhada do Databricks e ficamos satisfeitos em saber que a plataforma tem sido fundamental para viabilizar a colaboração entre equipes e aplicações intensivas de dados para o seu trabalho. Seu feedback sobre preços e integração de IA é valioso, e estamos continuamente nos esforçando para aprimorar esses aspectos para proporcionar uma experiência mais fluida para nossos usuários.

  ### 9. O Genie Code e o Assistente Inline aumentaram drasticamente minha produtividade de depuração.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Shyam s. | Data Engineer, Médio Porte (51-1000 emp.)

**Reviewed Date:** March 27, 2026

**O que você mais gosta em Databricks?**

O código Genie e o Assistente inline foram as ferramentas mais úteis para mim no meu projeto. Eles me ajudaram a depurar uma base de código de 2 mil linhas e explicaram claramente por que eu não estava obtendo dados precisos. Também forneceu uma consulta para executar no meu sistema de origem (SQLMI). Ao executar o script de discrepância em paralelo na origem e no destino, consegui depurar todo o código muito mais rápido e melhorar minha produtividade. No geral, reduziu meu tempo de trabalho de cerca de 8 horas para cerca de 1 hora.

**O que você não gosta em Databricks?**

No Delta Sharing, não há permissão de SELECT a nível de catálogo, e às vezes acho que ter isso seria útil. Além disso, quando uso o código Genie dentro de uma VM, ele pode tornar o site não responsivo às vezes. Estas são áreas que poderiam ser melhoradas.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Em um dos nossos projetos de migração de processamento de sinistros, o cliente precisava de disponibilidade de dados quase em tempo real para aplicações a jusante. Anteriormente, a arquitetura utilizava o Amazon Redshift como o data warehouse, com o Jasper e o Sisense consumindo os dados para relatórios e análises. No entanto, essa configuração não suportava de forma eficiente o streaming em tempo real ou quase em tempo real, o que levava a atrasos na disponibilidade de dados para os sistemas a jusante.

Após migrar a plataforma para o Databricks, conseguimos melhorar substancialmente a arquitetura do pipeline de dados. Implementamos streaming junto com pipelines ETL otimizados, reduzindo o ciclo de atualização de dados para cerca de 30 minutos. Também criamos uma visualização dedicada que retém dados da execução anterior, para que os sistemas a jusante sempre tenham um conjunto de dados consistente disponível enquanto a próxima execução do pipeline ainda está em andamento.

Antes, enfrentávamos dificuldades com ciclos de atualização atrasados e uma capacidade limitada de atender às necessidades de dados quase em tempo real em nossa arquitetura baseada no Redshift. Após a mudança para o Databricks, habilitamos um processamento ETL mais rápido e melhoramos a disponibilidade de dados quase em tempo real.

Como resultado, reduzimos o tempo de atualização do ETL para cerca de 30 minutos e habilitamos o acesso quase em tempo real para ferramentas a jusante como o Jasper e o Sisense. A confiabilidade também melhorou porque a visualização estável continua a servir os dados da execução anterior durante as atualizações do pipeline. Finalmente, a arquitetura geral tornou-se mais simples ao consolidar as capacidades de processamento e análise dentro do Databricks.

No geral, o Databricks nos ajudou a construir uma plataforma de processamento de dados quase em tempo real mais escalável e eficiente, melhorando significativamente a pontualidade e a confiabilidade das análises para o fluxo de trabalho de processamento de sinistros.

**Official Response from Janelle Glover:**

> Obrigado por compartilhar como a arquitetura do Databricks está beneficiando você. Nós projetamos nossa plataforma para enfrentar os desafios de gerenciar dados estruturados e não estruturados, e é ótimo saber que está tendo um impacto positivo em seus fluxos de trabalho de análise e aprendizado de máquina.

  ### 10. A Plataforma de Dados Unificada Que Realmente Entrega

**Rating:** 5.0/5.0 stars

**Reviewed by:** Janakiraman K. | Data Engineer, Empresa (> 1000 emp.)

**Reviewed Date:** March 27, 2026

**O que você mais gosta em Databricks?**

Databricks transformou a forma como nossa equipe lida com fluxos de trabalho de dados de ponta a ponta. Alguns destaques:

UI/UX: A interface do notebook é intuitiva, e o editor SQL parece refinado, o que alternar entre Python, SQL e Scala no mesmo espaço de trabalho economiza trocas constantes de contexto.

Integrações: Conectores nativos para Azure, Unity Catalog e Delta Sharing significam que passamos menos tempo em encanamentos. Lakehouse Federation nos permite consultar fontes externas sem mover dados, o que foi uma vitória inesperada.

Desempenho: A auto-otimização do Delta Lake e o agrupamento líquido reduziram visivelmente nossos tempos de consulta. O motor Photon em agregações pesadas é um divisor de águas para dashboards quase em tempo real.

Preço/ROI: O modelo DBU leva um tempo para se acostumar, mas consolidar nosso data warehouse, ETL e ferramentas de ML em uma única plataforma reduziu significativamente nossos gastos gerais com infraestrutura.

Suporte/Integração: A Databricks Academy e a documentação embutida tornaram a integração de novos engenheiros mais rápida. O fórum da comunidade é surpreendentemente ativo para perguntas de nicho.

IA/Inteligência: O Genie (AI/BI) permite que usuários de negócios façam perguntas em inglês simples e obtenham resultados precisos, reduzindo solicitações ad hoc para nossa equipe de dados por uma margem notável. O Databricks Assistant dentro dos notebooks também acelera a geração de código e a depuração.

**O que você não gosta em Databricks?**

Embora o Databricks seja poderoso, existem pontos de atrito reais que vale a pena mencionar:

UI/UX: A interface pode parecer opressiva para novos usuários, pois a navegação entre Workspaces, Catálogos e SQL Warehouses nem sempre é intuitiva. A organização de pastas e notebooks poderia ser mais estruturada desde o início.

Integrações: Alguns conectores de terceiros ainda exigem configuração manual e código personalizado. O Lakehouse Federation é promissor, mas ocasionalmente inconsistente com certos sistemas de origem, necessitando de solução de problemas adicional.

Desempenho: Os tempos de inicialização de clusters continuam sendo um ponto problemático; inícios a frio em clusters interativos podem interromper fluxos de trabalho rápidos. A computação serverless ajuda, mas ainda não está disponível universalmente em todos os recursos.

Preço/ROI: O modelo de preços baseado em DBU carece de transparência para equipes mais novas. É fácil acumular custos inesperados sem políticas de cluster cuidadosas e monitoramento em vigor. Um estimador de custos mais direto ajudaria significativamente.

Suporte/Integração: Os tempos de resposta do suporte empresarial podem ser lentos para tickets não críticos. Para questões arquitetônicas complexas, chegar ao especialista certo muitas vezes requer múltiplas escalonamentos.

IA/Inteligência: O Genie funciona bem para consultas padrão, mas tem dificuldades com lógica complexa de múltiplas tabelas ou terminologia específica de domínio sem ajustes significativos. O Assistente do Databricks dentro dos notebooks ocasionalmente gera sugestões de API desatualizadas ou incorretas.

**Que problemas Databricks está resolvendo e como isso está beneficiando você?**

Antes do Databricks, nosso cenário de dados era fragmentado e ferramentas separadas para ETL, armazenamento de dados e ML significavam pipelines duplicados, definições de dados inconsistentes e um grande esforço de engenharia apenas para manter a infraestrutura.

Unificação de Dados: Lutávamos com dados isolados em vários sistemas de origem. Agora, com o Unity Catalog e a arquitetura Medallion (Bronze/Prata/Ouro), temos uma camada única e governada que todas as equipes confiam, reduzindo o esforço de reconciliação de dados em quase 40%.

Confiabilidade de Pipeline: Construir e manter pipelines orientados por metadados costumava exigir frameworks personalizados. O Lakeflow e o Delta Live Tables do Databricks nos deram capacidades de carga incremental e completa prontas para uso, reduzindo significativamente o tempo de desenvolvimento de pipelines.

Análise de Autoatendimento: As equipes de negócios dependiam constantemente dos engenheiros para consultas ad hoc. Com o Genie (AI/BI), as partes interessadas agora podem fazer perguntas em inglês simples contra tabelas de ouro curadas, reduzindo notavelmente as solicitações de dados ad hoc para nossa equipe semana após semana.

Controle de Custos na Nuvem: Anteriormente, executávamos clusters sempre ativos sem visibilidade sobre os gastos. A computação sem servidor e as políticas de cluster agora nos permitem dimensionar corretamente as cargas de trabalho, resultando em uma redução mensurável nos custos de infraestrutura.

Integração Mais Rápida: Novos engenheiros anteriormente levavam semanas para se tornarem produtivos. Com o Databricks Assistant, modelos de notebooks e documentação centralizada do Unity Catalog, o tempo de integração caiu consideravelmente.

No geral: O Databricks essencialmente substituiu 3-4 ferramentas separadas por uma plataforma coesa. O ROI não está apenas na economia de custos, mas na velocidade e confiança com que agora entregamos produtos de dados para o negócio.

**Official Response from Janelle Glover:**

> Estamos felizes em saber que você considera o Databricks valioso para engenharia de dados, análises e aprendizado de máquina. Obrigado por compartilhar seu feedback!


## Databricks Discussions
  - [O que é Lakehouse no Databricks?](https://www.g2.com/pt/discussions/what-is-lakehouse-in-databricks) - 4 comments, 2 upvotes
  - [Quais são os recursos do Databricks?](https://www.g2.com/pt/discussions/what-are-the-features-of-databricks) - 4 comments, 2 upvotes
  - [What does Databricks software do?](https://www.g2.com/pt/discussions/what-does-databricks-software-do) - 3 comments
  - [O que é a plataforma de análise unificada da Databricks?](https://www.g2.com/pt/discussions/what-is-databricks-unified-analytics-platform) - 3 comments

- [View Databricks pricing details and edition comparison](https://www.g2.com/pt/products/databricks/reviews/databricks-review-12876994?section=pricing&secure%5Bexpires_at%5D=2026-05-31+11%3A53%3A31+-0500&secure%5Bsession_id%5D=53274100-f758-46df-a52f-611120555860&secure%5Btoken%5D=740cd19336436a0fad4bfde0c539d8333d1f80f7e185f735a99847aaf780f8d5&format=llm_user)
## Databricks Integrations
  - [Agentforce 360 Platform (formerly Salesforce Platform)](https://www.g2.com/pt/products/agentforce-360-platform-formerly-salesforce-platform/reviews)
  - [Agentforce Sales (formerly Salesforce Sales Cloud)](https://www.g2.com/pt/products/agentforce-sales-formerly-salesforce-sales-cloud/reviews)
  - [Alation](https://www.g2.com/pt/products/alation/reviews)
  - [Amazon EC2](https://www.g2.com/pt/products/amazon-ec2/reviews)
  - [Amazon Relational Database Service (RDS)](https://www.g2.com/pt/products/amazon-relational-database-service-rds/reviews)
  - [Anaplan](https://www.g2.com/pt/products/anaplan/reviews)
  - [Anomalo](https://www.g2.com/pt/products/anomalo/reviews)
  - [Apache Kafka](https://www.g2.com/pt/products/apache-kafka/reviews)
  - [Apache NiFi](https://www.g2.com/pt/products/apache-nifi/reviews)
  - [Atlan](https://www.g2.com/pt/products/atlan/reviews)
  - [AWS CloudFormation](https://www.g2.com/pt/products/aws-aws-cloudformation/reviews)
  - [AWS Glue](https://www.g2.com/pt/products/aws-glue/reviews)
  - [AWS Lambda](https://www.g2.com/pt/products/aws-lambda/reviews)
  - [Azure Blob Storage](https://www.g2.com/pt/products/azure-blob-storage/reviews)
  - [Azure Databricks](https://www.g2.com/pt/products/azure-databricks/reviews)
  - [Azure Data Factory](https://www.g2.com/pt/products/azure-data-factory/reviews)
  - [Azure Data Lake Store](https://www.g2.com/pt/products/azure-data-lake-store/reviews)
  - [Azure Functions](https://www.g2.com/pt/products/azure-functions/reviews)
  - [Azure Logic Apps](https://www.g2.com/pt/products/azure-logic-apps/reviews)
  - [Azure OpenAI Service](https://www.g2.com/pt/products/azure-openai-service/reviews)
  - [Azure Pipelines](https://www.g2.com/pt/products/azure-pipelines/reviews)
  - [Azure Portal](https://www.g2.com/pt/products/azure-portal/reviews)
  - [Azure SQL Database](https://www.g2.com/pt/products/azure-sql-database/reviews)
  - [Claude Code](https://www.g2.com/pt/products/anthropic-claude-code/reviews)
  - [Confluent](https://www.g2.com/pt/products/confluent/reviews)
  - [Customer.io](https://www.g2.com/pt/products/customer-io/reviews)
  - [Dash](https://www.g2.com/pt/products/dash-for-brands-ltd-dash/reviews)
  - [data.world](https://www.g2.com/pt/products/data-world/reviews)
  - [DAT iQ](https://www.g2.com/pt/products/dat-iq/reviews)
  - [dbt](https://www.g2.com/pt/products/dbt/reviews)
  - [DigitalOcean](https://www.g2.com/pt/products/digitalocean/reviews)
  - [Fivetran](https://www.g2.com/pt/products/fivetran/reviews)
  - [GEN TDS](https://www.g2.com/pt/products/gen-tds/reviews)
  - [Git](https://www.g2.com/pt/products/git/reviews)
  - [GitHub](https://www.g2.com/pt/products/github/reviews)
  - [Google Analytics](https://www.g2.com/pt/products/google-analytics/reviews)
  - [Google Cloud BigQuery](https://www.g2.com/pt/products/google-cloud-bigquery/reviews)
  - [Google Cloud Console](https://www.g2.com/pt/products/google-cloud-console/reviews)
  - [Google Cloud Run](https://www.g2.com/pt/products/google-cloud-run/reviews)
  - [HubSpot Marketing Hub](https://www.g2.com/pt/products/hubspot-marketing-hub/reviews)
  - [Immuta](https://www.g2.com/pt/products/immuta/reviews)
  - [Informatica Data Quality](https://www.g2.com/pt/products/informatica-informatica-data-quality/reviews)
  - [JD Edwards World](https://www.g2.com/pt/products/jd-edwards-world/reviews)
  - [Microsoft Copilot Studio](https://www.g2.com/pt/products/microsoft-microsoft-copilot-studio/reviews)
  - [Microsoft Fabric](https://www.g2.com/pt/products/microsoft-fabric/reviews)
  - [Microsoft Power Apps](https://www.g2.com/pt/products/microsoft-power-apps/reviews)
  - [Microsoft Power Automate](https://www.g2.com/pt/products/microsoft-power-automate/reviews)
  - [Microsoft Power BI](https://www.g2.com/pt/products/microsoft-microsoft-power-bi/reviews)
  - [Microsoft SharePoint](https://www.g2.com/pt/products/microsoft-sharepoint/reviews)
  - [Microsoft SQL Server](https://www.g2.com/pt/products/microsoft-sql-server/reviews)
  - [Microsoft Teams](https://www.g2.com/pt/products/microsoft-teams/reviews)
  - [Monte Carlo](https://www.g2.com/pt/products/monte-carlo/reviews)
  - [MySQL](https://www.g2.com/pt/products/mysql/reviews)
  - [ObjectWay SpA](https://www.g2.com/pt/products/objectway-spa/reviews)
  - [Oracle Database](https://www.g2.com/pt/products/oracle-database/reviews)
  - [Pega Platform](https://www.g2.com/pt/products/pega-platform/reviews)
  - [PostgreSQL](https://www.g2.com/pt/products/postgresql/reviews)
  - [PowerBI Portal](https://www.g2.com/pt/products/powerbi-portal/reviews)
  - [Qualtrics Customer Experience](https://www.g2.com/pt/products/qualtrics-customer-experience/reviews)
  - [React Native](https://www.g2.com/pt/products/react-native/reviews)
  - [Salesforce Agentforce](https://www.g2.com/pt/products/salesforce-agentforce/reviews)
  - [SAP Ariba](https://www.g2.com/pt/products/sap-ariba/reviews)
  - [SAP ECC](https://www.g2.com/pt/products/sap-ecc/reviews)
  - [SAS Viya](https://www.g2.com/pt/products/sas-sas-viya/reviews)
  - [Seamless (formally Seamless.AI)](https://www.g2.com/pt/products/seamless-formally-seamless-ai/reviews)
  - [ServiceNow IT Service Management](https://www.g2.com/pt/products/servicenow-it-service-management/reviews)
  - [Sigma](https://www.g2.com/pt/products/sigma-computing-sigma/reviews)
  - [Sisense](https://www.g2.com/pt/products/sisense/reviews)
  - [SnapLogic Intelligent Integration Platform (IIP)](https://www.g2.com/pt/products/snaplogic-intelligent-integration-platform-iip/reviews)
  - [Snowflake](https://www.g2.com/pt/products/snowflake/reviews)
  - [Spark](https://www.g2.com/pt/products/apache-spark/reviews)
  - [Spark](https://www.g2.com/pt/products/openclassrooms-spark/reviews)
  - [Spark SQL](https://www.g2.com/pt/products/spark-sql/reviews)
  - [SplashBI](https://www.g2.com/pt/products/splashbi/reviews)
  - [Spotfire Analytics](https://www.g2.com/pt/products/spotfire-analytics/reviews)
  - [Tableau](https://www.g2.com/pt/products/tableau/reviews)
  - [ThoughtSpot](https://www.g2.com/pt/products/thoughtspot/reviews)
  - [Visual Studio Code](https://www.g2.com/pt/products/visual-studio-code/reviews)
  - [Workday HCM](https://www.g2.com/pt/products/workday-hcm/reviews)

## Databricks Features
**Relatórios**
- Interface de Relatórios
- Passos para responder
- Gráficos e Tabelas
- Cartões de pontuação
- Painéis

**Administração**
- Modelagem de Dados
- Recomendações
- Gerenciamento de fluxo de trabalho
- Painéis e Visualizações

**Gestão**
- Relatórios
- Auditoria

**Implantação**
- Flexibilidade linguística
- Flexibilidade de estrutura
- Controle de versão
- Facilidade de implantação
- Escalabilidade

**Sistema**
- Ingestão de Dados e Disputa

**Preparação de dados**
- Conectores
- Governança de dados

**Gestão de Dados**
- Integração de dados
- Compactação de dados
- Qualidade dos dados
- Análise de dados integrada
- Aprendizado de máquina no banco de dados
- Análise Data Lake

**Gestão**
- Dicionário de dados
- Replicação de dados
- Linguagem de consulta
- Modelagem de dados
- Análise de desempenho

**Gestão**
- Glossário de Negócios
- Descoberta de dados
- Perfil de dados
- Relatórios e visualização
- Linhagem de dados

**Implantação**
- Flexibilidade linguística
- Flexibilidade de estrutura
- Controle de versão
- Facilidade de implantação
- Escalabilidade

**Gestão de Dados**
- Integração de dados
- Metadados
- Auto-serviço
- Fluxos de trabalho automatizados

**Escalabilidade e desempenho - Infraestrutura de IA generativa**
- Alta Disponibilidade
- Escalabilidade de treinamento de modelo
- Velocidade de inferência

**Personalização - Construtores de Agentes de IA**
- Configuração de Linguagem Natural
- Personalização de Tom
- Guardrails de Segurança

**Agente AI - Plataformas de DataOps**
- Execução Autônoma de Tarefas
- Planejamento em várias etapas
- Integração entre sistemas
- Aprendizagem Adaptativa
- Tomada de Decisão

**Gestão de Tráfego e Desempenho - Portais de IA**
- Limitação de Taxa Ciente de Token
- Cache Semântico
- Roteamento Multi-Modelo e Alternativas

**Desenvolvimento de Modelos**
- Suporte a idiomas
- Arrastar e soltar
- Algoritmos pré-construídos
- Treinamento de modelo

**Base de dados**
- Coleta de dados em tempo real
- Distribuição de dados
- Lagoa de dados

**Transformação de dados**
- Análise em tempo real
- Consulta de dados

**Conformidade**
- Conformidade com dados confidenciais
- Treinamentos e Diretrizes
- Aplicação de políticas
- Monitoramento de conformidade

**Funcionalidade**
- Extração
- Transformação
- A carregar
- Automação
- Escalabilidade

**Gestão**
- Catalogação
- Monitoramento
- Diretor
- Modelo de Registro

**Desenvolvimento de Modelos**
- Engenharia de Recursos

**Modelagem e mistura de dados**
- Consulta de dados
- Filtragem de dados
- Combinação de dados

**Integração**
- Integração AI/ML
- Integração de ferramentas de BI
- Integração de data lake

**Manutenção**
- Migração de dados
- Backup e recuperação
- Ambiente Multiusuário

**Segurança**
- Controle de acesso
- Gerenciamento de Funções
- Gestão de Compliance

**Operações**
- Métricas
- Gerenciamento de Infraestrutura
- Colaboração

**Analytics**
- Recursos de análise
- Visualizações Dasboard

**Custo e Eficiência - Infraestrutura de IA Gerativa**
- Custo por chamada de API
- Flexibilidade de alocação de recursos
- Eficiência Energética

**Funcionalidade - Construtores de Agentes de IA**
- Suporte Omnicanal
- Agente de Marca
- Capacidades de Resposta Proativa
- Escalação Humana Sem Interrupções

**Governança e Observabilidade - Portais de IA**
- Privacidade de Dados
- Rastreamento de Custos
- Segurança Centralizada de Chave de API

**Serviços de Máquina/Deep Learning**
- Visão computacional
- Processamento de Linguagem Natural
- Geração de Linguagem Natural
- Redes Neurais Artificiais

**Integrações**
- Integração com Hadoop
- Integração com o Spark

**Qualidade dos dados**
- Preparação de dados
- Distribuição de dados
- Unificação de dados

**Serviços de Máquina/Deep Learning**
- Compreensão de linguagem natural
- Aprendizado Profundo

**Implantação**
- No local
- Nuvem

**Segurança**
- Criptografia de dados
- Controle de Acesso do Usuário

**Manutenção**
- Gestão da Qualidade de Dados
- Gerenciamento de políticas

**Gestão**
- Catalogação
- Monitoramento
- Diretor

**Monitoramento e Gerenciamento**
- Observabilidade dos dados
- Recursos de teste

**IA generativa**
- Geração de Texto
- Resumo de texto

**Integração e Extensibilidade - Infraestrutura de IA Gerativa**
- Suporte a várias nuvens
- Integração de pipeline de dados
- Suporte e flexibilidade de API

**Dados e Análise - Construtores de Agentes de IA**
- Análise e Relatórios
- Consciência Contextual
- Conformidade com a Privacidade de Dados

**Implantação**
- Serviço Gerenciado
- Aplicativo
- Escalabilidade

**Plataforma**
- Dimensionamento de Máquinas
- Preparação de dados
- Integração com o Spark

**Conectividade**
- Integração com Hadoop
- Integração com o Spark
- Análise de várias fontes
- Lagoa de dados

**Desempenho**
- Escalabilidade

**Implantação na nuvem**
- Suporte a nuvem híbrida
- Recursos de migração para a nuvem

**IA generativa**
- Geração de Texto
- Resumo de texto

**IA generativa**
- Geração de Texto
- Resumo de texto

**Segurança e Conformidade - Infraestrutura de IA generativa**
- GDPR e conformidade regulatória
- Controle de acesso baseado em função
- Criptografia de dados

**Integração - Construtores de Agentes de IA**
- Automação de Fluxo de Trabalho
- Uso da API
- Interoperabilidade de Plataforma
- Integração de Dados de CRM

**Plataformas de Análise - IA Agente**
- Execução Autônoma de Tarefas
- Planejamento em várias etapas
- Integração entre sistemas
- Aprendizagem Adaptativa
- Interação em Linguagem Natural
- Assistência Proativa
- Tomada de Decisão

**Autoatendimento**
- Campos calculados
- Filtragem de colunas de dados
- Descoberta de dados
- Pesquisa
- Colaboração / Fluxo de trabalho
- Automodelagem

**Processamento**
- Processamento na nuvem
- Processamento de carga de trabalho

**Operações**
- Visualização de dados
- Fluxo de trabalho de dados
- Descoberta governada
- Análise incorporada
- Notebooks

**Segurança**
- Governança de dados
- Segurança de dados

**IA generativa**
- Geração de Texto por IA
- Resumo de texto
- Conversão de texto em imagem

**IA generativa**
- Geração de Texto
- Resumo de texto

**Usabilidade e Suporte - Infraestrutura de IA generativa**
- Qualidade da Documentação
- Atividade Comunitária

**IA Agente - Governança de Dados**
- Execução Autônoma de Tarefas
- Planejamento em várias etapas
- Integração entre sistemas
- Aprendizagem Adaptativa
- Interação em Linguagem Natural
- Tomada de Decisão

**Implantação e Integração - Plataformas de Análise**
- Construtor de Painel Sem Código
- Agendamento e Automação de Relatórios
- Análise Embutida e Rotulagem Branca
- Conectividade da Fonte de Dados

**Análises avançadas**
- Análise preditiva
- Visualização de dados
- Serviços de Big Data

**IA generativa**
- Geração de Texto
- Resumo de texto

**Agente AI - Plataformas de Ciência de Dados e Aprendizado de Máquina**
- Execução Autônoma de Tarefas
- Planejamento em várias etapas
- Integração entre sistemas
- Aprendizagem Adaptativa
- Interação em Linguagem Natural
- Assistência Proativa
- Tomada de Decisão

**Desempenho e Escalabilidade - Plataformas de Análise**
- Manipulação de grandes volumes de dados e velocidade de consulta
- Suporte a Usuários Concomitantes

**Plataformas de Análise Avançada e Modelagem - Análise**
- Modelagem e Governança de Dados
- Integração de Notebook e Script
- Modelos Preditivos e Estatísticos Integrados

**Capacidades de IA Agente - Plataformas de Análise**
- Insights e Narrativas Geradas Automaticamente
- Consultas em Linguagem Natural
- Monitoramento Proativo de KPI e Alertas
- Agentes de IA para Acompanhamentos Analíticos

**Inteligência Personalizada - Plataformas de Análise**
- Aprendizado Comportamental para Refinamento de Consulta Contextual
- Personalização de Insights Baseada em Funções
- Análise Conversacional e Baseada em Prompt

**Construindo relatórios**
- Transformação de dados
- Modelagem de dados
- Design do relatório WYSIWYG
- APIs de integração

**Plataforma**
- Suporte ao usuário móvel
- Personalização
- Gerenciamento de usuários, funções e acessos
- Internacionalização
- Sandbox / Ambientes de Teste
- Desempenho e Confiabilidade
- Abrangência de aplicativos de parceiros

## Top Databricks Alternatives
  - [Cloudera Data Platform](https://www.g2.com/pt/products/cloudera-cloudera-data-platform/reviews) - 4.1/5.0 (131 reviews)
  - [Snowflake](https://www.g2.com/pt/products/snowflake/reviews) - 4.6/5.0 (705 reviews)
  - [Teradata Vantage](https://www.g2.com/pt/products/teradata-teradata-vantage/reviews) - 4.3/5.0 (355 reviews)

