# Databricks Reviews
**Vendor:** Databricks Inc.  
**Category:** [Sistemas de Procesamiento y Distribución de Grandes Datos](https://www.g2.com/es/categories/big-data-processing-and-distribution)  
**Average Rating:** 4.6/5.0  
**Total Reviews:** 790
## About Databricks
Databricks es una plataforma unificada de datos e inteligencia artificial que ayuda a las organizaciones a construir, gobernar y escalar canalizaciones de datos, análisis, aprendizaje automático, aplicaciones de IA y agentes. Más de 20,000 organizaciones en todo el mundo, incluidas adidas, AT&amp;T, Bayer, Block, Mastercard, Rivian, Unilever y el 70% de las empresas Fortune 500, confían en Databricks para trabajar con datos empresariales e inteligencia artificial a gran escala. Con sede en San Francisco y más de 30 oficinas en todo el mundo, Databricks ofrece una plataforma unificada que incluye Agent Bricks, Lakeflow, Lakehouse, Lakebase, Genie y Unity Catalog. Fundada en 2013 por los creadores originales de Apache Spark™, Delta Lake, MLflow y Unity Catalog, Databricks está construida sobre una arquitectura de lakehouse abierta que reúne datos, análisis e inteligencia artificial. La plataforma es utilizada por ingenieros de datos, científicos de datos, analistas, desarrolladores, equipos de aprendizaje automático, equipos de inteligencia artificial y usuarios de negocios para colaborar a lo largo de todo el ciclo de vida de los datos y la inteligencia artificial. Las capacidades clave de Databricks incluyen: - Ingeniería de datos: Construir, automatizar y gestionar canalizaciones de datos por lotes, en streaming y en tiempo real de manera confiable. - Análisis e inteligencia empresarial: Ejecutar análisis SQL, crear paneles de control y permitir que los equipos de negocios exploren datos. - Gobernanza de datos: Descubrir, asegurar y gestionar activos de datos e inteligencia artificial a través de equipos, nubes y cargas de trabajo. - Aprendizaje automático e inteligencia artificial: Desarrollar modelos, construir aplicaciones de inteligencia artificial generativa y crear agentes de inteligencia artificial de grado de producción. - Aplicaciones de datos: Construir y desplegar aplicaciones impulsadas por datos utilizando datos empresariales gobernados. Disponible en AWS, Azure y Google Cloud, Databricks ayuda a las organizaciones a trabajar a través de nubes, reducir silos de datos y simplificar la colaboración entre equipos y herramientas. Los clientes utilizan Databricks para casos de uso como personalización del cliente, detección de fraude, mantenimiento predictivo, análisis en tiempo real, ciberseguridad, investigación en salud, gestión de riesgos financieros, optimización de la cadena de suministro y toma de decisiones impulsada por inteligencia artificial. Databricks se utiliza en industrias como servicios financieros, salud y ciencias de la vida, comercio minorista, manufactura, energía y el sector público. Las organizaciones utilizan la plataforma para modernizar la infraestructura de datos, acelerar la adopción de inteligencia artificial y convertir los datos empresariales en valor de negocio.


## Databricks Pros & Cons
**What users like:**

- Los usuarios elogian la **facilidad de uso y las numerosas características** de Databricks, mejorando sus tareas de procesamiento de datos y aprendizaje automático. (192 reviews)
- Los usuarios elogian la **facilidad de uso** de Databricks, mejorando su experiencia general con su interfaz intuitiva. (155 reviews)
- Los usuarios aprecian las **integraciones fluidas** de Databricks, mejorando el procesamiento en tiempo real y apoyando varios lenguajes de desarrollo. (141 reviews)
- Los usuarios valoran la **colaboración fluida** que ofrece Databricks, mejorando el trabajo en equipo en proyectos de datos con información en tiempo real. (114 reviews)
- Los usuarios valoran las **funciones analíticas integradas** de Databricks, mejorando las operaciones y proporcionando información completa sobre la tecnología. (113 reviews)
- Escalabilidad (111 reviews)
- Integración de ML (106 reviews)
- Los usuarios aprecian las **fáciles integraciones** de Databricks, conectándose sin problemas con la infraestructura en la nube y mejorando la gestión de datos. (102 reviews)
- Aprendizaje Automático (97 reviews)
- A los usuarios les encantan las **características efectivas de gestión de datos** de Databricks, que simplifican los flujos de trabajo y mejoran las capacidades de toma de decisiones. (87 reviews)

**What users dislike:**

- Los usuarios notan una **curva de aprendizaje** significativa con Databricks, particularmente debido a sus complejos permisos y modos de computación. (78 reviews)
- Los usuarios encuentran que Databricks es **caro** , especialmente al manejar grandes cantidades de datos, lo que limita su accesibilidad para algunos clientes. (71 reviews)
- Los usuarios encuentran el **empinado aprendizaje** de Databricks desafiante, especialmente para aquellos que son nuevos en las herramientas de big data. (64 reviews)
- Los usuarios encuentran la **complejidad** de Databricks desafiante, especialmente con las características avanzadas y los requisitos de configuración inicial. (45 reviews)
- Los usuarios experimentan un **proceso de configuración complejo** inicialmente, pero el soporte ayuda a simplificar la experiencia con el tiempo. (35 reviews)
- Problemas de rendimiento (34 reviews)
- Los usuarios enfrentan **problemas de interfaz de usuario poco intuitiva** que conducen a errores aleatorios y complican la experiencia para los usuarios no técnicos. (34 reviews)
- Diseño de interfaz de usuario deficiente (33 reviews)
- Los usuarios encuentran que las **características faltantes** en Databricks son limitantes, obstaculizan la productividad y complican la experiencia general. (31 reviews)
- Costo (29 reviews)

## Databricks Reviews
  ### 1. Databricks en mi caso: múltiples integraciones, interfaz intuitiva y rendimiento confiable

**Rating:** 4.0/5.0 stars

**Reviewed by:** Yelnur K. | Schedule Manager, Aerolíneas/Aviación, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** May 19, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es su parte de Integraciones. En el lugar de trabajo, integramos la base de datos con múltiples fuentes de datos. Además, no puedo completar mi reseña sin mencionar el diseño de UX y UI, que hace que el flujo de trabajo general se sienta intuitivo y realmente fácil de usar. En cuanto a la velocidad de los procesos, nunca nos ha decepcionado. Funciona como se espera. Comparativamente con los precios del mercado, el precio del servicio es bastante confiable para nosotros. Hay un centro de ayuda de Databricks, si no puedes encontrar respuestas a tus preguntas, hay especialistas que pueden asistirte con tus consultas. Por ejemplo, recuerdo un caso en el que tuvimos un problema durante el proceso de examen, nos ayudaron a resolver este problema.

**¿Qué es lo que no le gusta de Databricks?**

A algunos no les gusta la calidad de la IA de Genie. Chicos, podría mejorarse, especialmente la parte de razonamiento. También, puedo mencionar el caso cuando tuvimos un problema con el proceso de examen. Los especialistas nos ayudaron, pero nos causó algunas incomodidades. Bueno,

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

En aviación, utilizamos este software para el análisis de datos. Automatizamos muchos procesos que las herramientas de trabajo simples no pueden manejar. También, nos integramos con múltiples herramientas (cuyos nombres no puedo mencionar por razones de seguridad). En particular, nos ayuda a analizar la demanda de pasajeros por ruta y temporada. Combinamos y analizamos grandes conjuntos de datos usando este software. En general, es una buena herramienta. Nuestro equipo está satisfecho.

**Official Response from Sara Steffen:**

> Gracias por sus comentarios detallados. Nos complace saber que Databricks ha sido fundamental en la automatización de procesos y el análisis de grandes conjuntos de datos para sus necesidades de aviación. Tomamos en serio sus comentarios sobre Genie AI y los procesos de soporte y estamos dedicados a realizar mejoras en estas áreas.

  ### 2. Lakebase - Good Option for Low Latency Data Serving with Databricks Integration

**Rating:** 4.5/5.0 stars

**Reviewed by:** Senthil K. | Associate Director, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 25, 2026

**¿Qué es lo que más le gusta de Databricks?**

I have setup the lakebase which is in sync with lakehouse for enterpise application low latency access, we have enabled the below options

- Lakebase using Postgres 17,HTTPS Data API is helping to access database in easier way from Databricks Apps

- Integration sync between Lakehouse and Lakebase for API access

- It has branching option to maintain schema or feature changes

- Restore from previous point/time history - helps reducing recovery effort - Snapshots and backup support

 - Autoscaling compute and suspend option

- Monitoring, logs and query metrics are giving visibility on active queries, performance and database health

- OAuth access and postgres role based connection is helping better security and controlled access

Lakebase pricing model with autoscaling and scale down option based on available compute pricing

**¿Qué es lo que no le gusta de Databricks?**

Lakebase all postgress features not available, so we can't directly migrate any existing postgres directly to lakebase

Scale down to zero not happens instantly faced some issues like disconnect from app for short time temporary pauses

Custom admin operations in database postgres are limited and not posisble

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Lakebase helps serve near real-time inventory data,availability tracking and reducing out-of-stock situation

Processed Lakehouse data can be served through Lakebase for customer buying pattern, product recommendation and promotion effectiveness

Transactional sales data can be made available quickly for store level dashboards, helping business teams monitor sales trend usings web apps

Near real-time operational data availability
applications access low latency data for pricing, promotions for TPO-TPM integrations

Also we integrated the AI to include the real time context 

Low latency

**Official Response from Janelle Glover:**

> Gracias por compartir sus experiencias positivas con Genie, incluyendo su capacidad para cerrar la brecha entre los equipos de negocio y de datos, eliminar los silos de datos y mejorar la visibilidad de costos y rendimiento. Entendemos sus preocupaciones sobre las limitaciones del Modo Agente y la necesidad de mayor autonomía. Trabajaremos en abordar estas áreas para mejorar su experiencia general.

  ### 3. Plataforma Delta Lake Todo en Uno que Hace el ETL Rápido y Rentable

**Rating:** 5.0/5.0 stars

**Reviewed by:** Kavipriya S. | Data Engineer, Tecnología de la información y servicios, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** May 27, 2026

**¿Qué es lo que más le gusta de Databricks?**

Delta Lake + Workflows + Unity Catalog en una sola plataforma eliminó la necesidad de unir herramientas separadas de ingestión, transformación y gobernanza. Como ingeniero de datos, paso más tiempo construyendo pipelines y menos tiempo gestionando infraestructura. La experiencia en el notebook y el autoescalado de clústeres hacen que iterar en ETL complejos sea rápido y rentable.

**¿Qué es lo que no le gusta de Databricks?**

Los tiempos de arranque de clústeres y la previsibilidad de costos siguen siendo los mayores puntos de fricción para mí. Los arranques en frío pueden realmente ralentizar el trabajo ad-hoc, y los costos de DBU necesitan un monitoreo cercano para evitar sorpresas desagradables. La interfaz de usuario de Workflows ha mejorado mucho con el tiempo, pero aún no se siente tan flexible como los orquestadores dedicados cuando se trata de manejar DAGs más complejos. Aun así, veo estos como elementos principalmente de pulido: el valor central de la plataforma fácilmente los supera.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks aborda un importante problema de fragmentación en nuestra pila de ingeniería de datos. Anteriormente, dependíamos de herramientas separadas para la ingestión, transformación, orquestación y gobernanza, cada una con su propia curva de aprendizaje, sobrecarga de mantenimiento y posibles puntos de fallo. Ahora, está consolidado en una sola plataforma.

En la práctica, nos ayuda a ejecutar pipelines ETL a gran escala que procesan millones de registros diariamente, con Delta Lake mejorando la fiabilidad a través de transacciones ACID, aplicación de esquemas y viaje en el tiempo para depuración. También cierra la brecha de colaboración entre ingenieros de datos y científicos de datos: nosotros construimos los pipelines, y ellos pueden consumir las mismas tablas directamente en notebooks sin duplicación de datos o problemas de sincronización.

Unity Catalog resolvió un problema de gobernanza de larga data al centralizar el control de acceso en todos los espacios de trabajo. En general, el resultado es un desarrollo de pipelines más rápido, menos incidentes de producción relacionados con problemas de calidad de datos y mucho menos código de integración que mantener. Lo que solía llevar semanas construir y estabilizar ahora lleva días.

**Official Response from Jess Darnell:**

> Nos complace saber que Databricks ha consolidado su pila de ingeniería de datos y mejorado la fiabilidad de sus canalizaciones ETL. Entendemos sus comentarios sobre los tiempos de inicio de los clústeres y la previsibilidad de los costos, y estamos trabajando activamente para optimizar estos aspectos de nuestra plataforma para ofrecer una mejor experiencia de usuario.

  ### 4. Análisis de autoservicio y fuerte rendimiento del piloto automático

**Rating:** 4.0/5.0 stars

**Reviewed by:** Bob K. | Data and Analytics Leader, Tecnología de la información y servicios, Empresa (> 1000 empleados)

**Reviewed Date:** May 27, 2026

**¿Qué es lo que más le gusta de Databricks?**

La gestión de permisos a través de diversos equipos de ventas y marketing se simplificó. El catálogo nos permitió asegurar datos sensibles fácilmente mientras seguíamos permitiendo que nuestro equipo y analistas se sirvieran por sí mismos. El linaje automatizado a nivel de columna fue muy útil para rastrear cómo se calculaban nuestras métricas de pronóstico de pipeline.

Me gusta el rendimiento del piloto automático. Mi equipo pasó menos tiempo en el mantenimiento manual de bases de datos. La optimización predictiva manejó automáticamente la compactación de archivos (Optimizar) y limpió archivos antiguos (Vacuum). Además, el Clustering Líquido mantuvo nuestras tablas de transacciones de ventas de rápido crecimiento funcionando eficientemente sin requerir que diseñáramos y mantuviéramos manualmente estrategias de particionamiento complejas.

El soporte para formatos abiertos como Delta Lake y Apache Iceberg aseguró que nuestros datos permanecieran portátiles. A través de APIs abiertas y Delta sharing, pudimos compartir de manera segura conocimientos con socios comerciales externos sin tener que replicar y mover conjuntos de datos masivos.

Una cosa más, la plataforma permitió que nuestro equipo de ingeniería de datos y analistas colaboraran en un solo lugar. Esta alineación entre la arquitectura técnica y la estrategia comercial facilitó la conversión de modelos técnicos de pipeline en valor comercial.

**¿Qué es lo que no le gusta de Databricks?**

Como sabemos, las herramientas de Ventas y Marketing cambian frecuentemente sus esquemas de datos, por ejemplo, añadiendo o renombrando campos personalizados en Salesforce. Cuando ocurrían estas actualizaciones, nuestros flujos de ingesta que utilizaban auto loader o streaming estructurado fallaban y requerían reinicios manuales para adaptarse. Esto ocasionalmente causaba retrasos temporales en la actualización de nuestros paneles operativos.

Rastrear la atribución de marketing compleja y de múltiples toques y los recorridos de los clientes requería operaciones de streaming con estado (como uniones y agregaciones). Gestionar registros de eventos fuera de orden y datos que llegaban tarde en estos flujos resultó ser altamente complejo y requirió una ingeniería personalizada significativa para asegurar que los resultados permanecieran precisos.

Debido a que las tablas gestionadas por Unity Catalog no soportan el acceso basado en rutas, tuvimos que asegurar que todo el código heredado y los sistemas externos se trasladaran a utilizar convenciones de nomenclatura de espacio de nombres de tres niveles adecuadas, lo que requirió un esfuerzo inicial de refactorización para evitar errores de acceso a los datos.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

En Basware, mi enfoque principal fue habilitar a los equipos globales de ventas y marketing para optimizar su rendimiento, construir pronósticos de pipeline precisos y asegurar una gobernanza robusta en torno a nuestros datos de clientes. Databricks sirvió como una plataforma fundamental para ayudarnos a lograr esos objetivos.

Utilizamos Lakeflow Connect, específicamente el Conector de Salesforce junto con otros métodos de ingestión para extraer datos de nuestro CRM, sistemas de automatización de marketing y archivos locales en el lakehouse. Esto nos permitió construir una vista consolidada y única del cliente.

Lakeflow Spark Declarative Pipelines nos ayudó a organizar nuestros datos brutos de marketing y ventas en una arquitectura Medallion. Esto significa que pudimos transformar registros de eventos de marketing semiestructurados y registros de CRM en conjuntos de datos estructurados listos para inteligencia de negocios y pronósticos.

Para apoyar al VP de Operaciones de Ventas y Marketing y otros líderes senior, desplegamos espacios de genio de AI/BI. Esto permitió a los ejecutivos consultar métricas de pipeline y tendencias de pronóstico usando lenguaje natural. Para los informes estándar, utilizamos Partner connect para vincular nuestras tablas Gold limpias directamente a herramientas externas de BI.

**Official Response from Jess Darnell:**

> It's great to hear how Databricks has helped you optimize sales and marketing performance, build accurate pipeline forecasts, and ensure robust governance around customer data. We're committed to providing a platform that supports your business goals and enables efficient data management and analysis. Thank you for sharing your use case with us.

  ### 5. Potentes tuberías de telemetría de baja latencia con tablas de transmisión y vistas materializadas

**Rating:** 4.0/5.0 stars

**Reviewed by:** Jose P. | Head of Network Strategy, Telecomunicaciones, Empresa (> 1000 empleados)

**Reviewed Date:** May 26, 2026

**¿Qué es lo que más le gusta de Databricks?**

En un entorno de telecomunicaciones que maneja volúmenes masivos de datos de redes fijas y móviles (GPON, núcleo 4g/5g y RAN) ingiriendo telemetría de frecuencia no estructurada o semiestructurada de manera incremental desde nuestras funciones virtualizadas como vEPC, vCPE o VHGW) con una configuración mínima.

Mi equipo trabaja estrechamente con funciones de red virtualizadas y Computación en el Borde de Acceso Múltiple. Características como Tablas de Transmisión y Vistas Materializadas nos ayudan a construir canalizaciones de baja latencia que procesan métricas de rendimiento de la red casi en tiempo real, ayudándonos a monitorear los KPI de la red y la eficiencia de QoS.

Debido a que la experiencia principal de mi equipo radica en el diseño de redes y la virtualización de sistemas en lugar de la administración de bases de datos, la Optimización Predictiva y el Clustering Líquido son altamente beneficiosos. Manejan de manera autónoma el mantenimiento de tablas, la compactación de archivos y la optimización del diseño de datos, liberando nuestros recursos para centrarnos en la arquitectura de la red.

**¿Qué es lo que no le gusta de Databricks?**

Las funciones de red virtualizadas, los enrutadores y el hardware desagregado con frecuencia se someten a actualizaciones de software, que a menudo introducen cambios sutiles en los esquemas de salida de telemetría. Al usar transmisión estructurada o cargadores automáticos, estas desviaciones de esquema hacen que nuestras consultas de transmisión fallen, lo que requiere un reinicio manual del flujo para volver a planificar el esquema.

Cuando necesitamos actualizar la lógica de un KPI de red complejo definido dentro de una vista materializada, cualquier cambio en la consulta desencadena un recálculo completo de la vista. Dada la escala masiva de los conjuntos de datos de transacciones de telecomunicaciones, esto puede resultar en costos de cómputo notables.

Dependemos de una variedad de herramientas de datos dentro de nuestro ecosistema de TIC, no todas las soluciones presentadas en Partner Connect soportan nativamente Unity Catalog. Esto puede crear obstáculos de integración y gobernanza cuando intentamos conectar ciertas herramientas de análisis y preparación de datos de terceros a nuestro lago de datos seguro.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Ingerimos flujos continuos de datos de rendimiento de funciones de red virtualizadas y capas de transporte tradicionales. Al construir canalizaciones de transmisión, podemos monitorear núcleos virtualizados y enrutadores para identificar anomalías o degradaciones en el tráfico de red.

Alineándome con mi interés en la IA de redes y el aprendizaje automático, nuestros científicos de datos utilizan la plataforma para desarrollar modelos predictivos. Entrenamos modelos en fallos históricos de líneas GPON/DSL, cargas de torres de telefonía móvil y patrones de uso de clientes para predecir la congestión de la red, programar mantenimiento proactivo y mitigar la pérdida de clientes en diferentes segmentos.

Como evangelista de la evolución tecnológica, utilizo la plataforma para cerrar la brecha entre nuestros equipos de ingeniería de red central y las unidades de negocio. Al conectar la semántica empresarial y establecer protocolos seguros de Delta Sharing, proporcionamos a los analistas de negocio y a los responsables de la toma de decisiones acceso autogestionado y regulado a los conocimientos de la red sin comprometer el cumplimiento de la seguridad.

**Official Response from Jess Darnell:**

> Es fantástico escuchar cómo Databricks te está ayudando a ingerir y procesar flujos continuos de datos de rendimiento, desarrollar modelos predictivos y cerrar la brecha entre los equipos de ingeniería de redes y las unidades de negocio. Estamos comprometidos a proporcionar soluciones que beneficien a nuestros usuarios en varios aspectos de su trabajo.

  ### 6. Hacer que los sistemas de datos sean menos desordenados con un enfoque unificado de Lakehouse

**Rating:** 5.0/5.0 stars

**Reviewed by:** Hunar M. | Data Analyst, Geospatial Intelligence - Data &amp; Analytics, Empresa (> 1000 empleados)

**Reviewed Date:** May 21, 2026

**¿Qué es lo que más le gusta de Databricks?**

El ecosistema. Lo que más me gusta de Databricks es cómo elimina gran parte del desorden habitual que encuentras en el trabajo con datos. En lugar de tener que manejar herramientas separadas para ingeniería, análisis y ML, y luego gastar tiempo extra en hacer que se comuniquen entre sí, lo reúne todo en un solo lugar. Eso por sí solo reduce mucha fricción y ahorra tiempo.

También me gusta la idea de Lakehouse porque se siente genuinamente práctica: no tienes que elegir entre un lago de datos y un almacén. Puedes trabajar con una configuración unificada y aún así obtener rendimiento cuando lo necesitas.

A nivel diario, también es agradable que diferentes equipos puedan colaborar en el mismo entorno sin tener que copiar datos constantemente o reconstruir pipelines. En general, mantiene las cosas más simples y rápidas, especialmente cuando estás iterando.

**¿Qué es lo que no le gusta de Databricks?**

Lo que no me gusta de Databricks es que puede sentirse un poco pesado cuando solo intentas hacer algo simple. Hay mucho sucediendo bajo el capó, y aunque eso es genial para escalar, también viene con una curva de aprendizaje. Cosas como los clústeres, configuraciones y la configuración de trabajos toman algo de tiempo para sentirse cómodo.

El costo es otra preocupación. El uso puede aumentar rápidamente si no lo estás monitoreando activamente, especialmente cuando los equipos pueden activar el cómputo libremente. Y a veces, la experiencia general se siente un poco fragmentada entre cuadernos, trabajos y repositorios, en lugar de ser un flujo suave y unificado.

Así que, sí, es poderoso, pero definitivamente se necesita disciplina para mantener las cosas limpias, eficientes y bajo control.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Lo que Databricks realmente resuelve para mí es la fricción habitual que aparece cuando los sistemas de datos están repartidos en demasiadas herramientas.

En lugar de ejecutar un sistema para la ingesta, otro para el almacenamiento, otro más para la transformación, y luego configuraciones separadas nuevamente para análisis y ML, reúne la mayoría de eso en un solo lugar. Eso significa que no tengo que estar moviendo datos constantemente o preocuparme de que las cosas se desincronicen.

Desde una perspectiva de arquitectura de soluciones, eso es una gran ventaja porque simplifica el diseño general. En lugar de unir un montón de sistemas, puedes construir alrededor de una configuración de Lakehouse única que soporte múltiples casos de uso. Es más fácil de escalar, más fácil de gobernar y, en general, simplemente más fácil de razonar.

En el día a día, también significa que paso menos tiempo en infraestructura y fontanería y más tiempo pensando en cómo diseñar buenos modelos de datos y pipelines. Y como todos están trabajando con los mismos datos, hay mucha menos confusión y retrabajo entre equipos.

En general, elimina mucho del ruido y me permite centrarme en construir soluciones de datos sólidas y escalables.

**Official Response from Jess Darnell:**

> Nos alegra saber que encuentras beneficioso nuestro ecosistema y el enfoque de Lakehouse para simplificar y unificar tu trabajo con datos. Entendemos tus preocupaciones sobre la curva de aprendizaje y el costo, y estamos trabajando continuamente para mejorar la experiencia del usuario y ofrecer soluciones rentables. Gracias por compartir tus comentarios detallados con nosotros.

  ### 7. Databricks centraliza datos, análisis e IA

**Rating:** 5.0/5.0 stars

**Reviewed by:** Leonardo Q. | RPA Developer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** May 16, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es cómo centraliza la ingeniería de datos, analítica e IA en una única plataforma, lo que facilita mucho el flujo de trabajo en el día a día. La integración entre notebooks, pipelines y procesamiento distribuido hace que el desarrollo sea más rápido y organizado, especialmente en proyectos con gran volumen de datos y automatizaciones.

Otro punto que considero muy fuerte es la experiencia con Apache Spark, integrada de forma simplificada. Incluso en escenarios más complejos, el rendimiento suele ser excelente, permitiendo procesar datos a gran escala con buena estabilidad y escalabilidad. Esto ayuda bastante en integraciones, ETLs y análisis que, en otras soluciones, requerirían mucho más esfuerzo.

**¿Qué es lo que no le gusta de Databricks?**

A pesar de que me gusta bastante la plataforma, algunos puntos de Databricks aún pueden ser desafiantes. El principal de ellos es el costo, especialmente en entornos con procesamiento intenso o cuando los clústeres no están bien optimizados. Sin un control de uso más riguroso, los gastos pueden aumentar rápidamente.

Otro aspecto es la curva de aprendizaje, que puede ser alta para equipos que están comenzando en el ecosistema de datos distribuidos. Conceptos ligados a Spark, clústeres, optimización y gestión de recursos requieren tiempo de adaptación, principalmente para quienes vienen de herramientas más tradicionales.

En UI/UX, aunque la interfaz es buena en general, algunos procesos administrativos y configuraciones más avanzadas pueden parecer confusos al principio. En ciertos escenarios, identificar problemas de rendimiento o de permisos también puede requerir un conocimiento más técnico.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks ha ayudado principalmente a resolver problemas relacionados con la centralización, el procesamiento y el análisis de grandes volúmenes de datos. Antes, muchos procesos estaban distribuidos entre diferentes herramientas, lo que dificultaba las integraciones, el mantenimiento y la gobernanza. Con Databricks, gran parte del flujo de ingeniería de datos, analytics e IA puede concentrarse en una única plataforma, aportando más consistencia al trabajo diario.

**Official Response from Jess Darnell:**

> Nos alegra saber que consideras beneficiosa la centralización de datos, análisis e inteligencia artificial de Databricks para tu flujo de trabajo. Entendemos la importancia de la integración y simplificación, y estamos comprometidos a proporcionar una plataforma que satisfaga tus necesidades.

  ### 8. Databricks simplifica el procesamiento de grandes datos y la colaboración en equipo.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Praveen M. | Associate Data Engineer, Tecnología de la información y servicios, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** May 07, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es cómo simplifica el procesamiento de datos a gran escala y la colaboración en una sola plataforma. La integración con Spark y el servicio en la nube hace que el manejo de grandes volúmenes de datos sea mucho más eficiente. También me gusta el entorno de cuadernos, que facilita a los equipos trabajar juntos en tareas de análisis y aprendizaje automático.

**¿Qué es lo que no le gusta de Databricks?**

Una cosa que no me gusta de Databricks es que la plataforma puede parecer compleja para los nuevos usuarios, especialmente al gestionar clústeres y configuraciones. Los precios también pueden volverse caros con cargas de trabajo más grandes si los recursos no se optimizan cuidadosamente. Aunque las integraciones y las funciones de IA son potentes, el proceso de incorporación y la documentación de soporte podrían ser más amigables para principiantes.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks ayuda a resolver el desafío de procesar y analizar grandes cantidades de datos de manera eficiente en una sola plataforma. Combina la ingeniería de datos, la analítica y los flujos de trabajo de IA, lo que reduce la necesidad de múltiples herramientas separadas. Esto mejora la colaboración, acelera el procesamiento de datos y ayuda a generar insights mucho más rápido.

**Official Response from Jess Darnell:**

> Nos alegra saber que encuentras Databricks útil para simplificar el procesamiento de datos a gran escala y la colaboración. Nuestra integración con Spark y servicios en la nube está diseñada para hacer que el manejo de grandes volúmenes de datos sea más eficiente.

  ### 9. Perfecto para la colaboración entre equipos y aplicaciones intensivas de datos

**Rating:** 5.0/5.0 stars

**Reviewed by:** Artemij V. | Data Science Lead, Pequeña Empresa (50 o menos empleados)

**Reviewed Date:** May 04, 2026

**¿Qué es lo que más le gusta de Databricks?**

La experiencia de usuario es una de las partes más fuertes. La experiencia con el cuaderno es limpia e intuitiva, la colaboración es sencilla, y moverse entre la exploración, la experimentación y los flujos de trabajo de producción se siente sin problemas. Tiene suficiente flexibilidad para usuarios avanzados, mientras que sigue siendo lo suficientemente accesible para que la incorporación de nuevos miembros del equipo sea rápida. Las personas generalmente pueden volverse productivas rápidamente sin pasar semanas aprendiendo peculiaridades específicas de la plataforma.

Las integraciones también son excelentes. Funciona sin problemas con el ecosistema de la nube más amplio y se conecta bien con fuentes de datos, herramientas de orquestación, infraestructura de servicio de modelos y sistemas externos. Esa interoperabilidad hace que sea mucho más fácil pasar de un prototipo a una tubería desplegada sin tener que reconstruir constantemente conectores o gestionar código de integración.

El rendimiento ha sido consistentemente fuerte, especialmente al trabajar con cargas de trabajo distribuidas y la ingeniería de características a gran escala. La optimización de Spark, la gestión de clústeres y la infraestructura gestionada reducen significativamente la sobrecarga operativa, lo que me permite centrarme más en el desarrollo y análisis de modelos en lugar de en el ajuste del entorno. Para la experimentación iterativa, los tiempos de inicio y la capacidad de respuesta general son notablemente mejores que en muchas plataformas gestionadas alternativas.

**¿Qué es lo que no le gusta de Databricks?**

Un área donde Databricks podría mejorar es en los precios. La plataforma ofrece capacidades sólidas, pero los costos pueden escalar rápidamente para cargas de trabajo de alta frecuencia o en tiempo real. Para casos de uso que involucran pipelines de ticks de baja latencia que se ejecutan continuamente, transmisión de datos de mercado o reentrenamiento iterativo de modelos, el precio puede volverse bastante elevado en relación con la infraestructura que se consume. A veces parece que hay una prima significativa por la conveniencia y la orquestación gestionada, lo que puede hacer que la optimización de costos sea una consideración constante.

La integración de IA es otra área que aún se siente algo desigual. Aunque hay un claro impulso hacia posicionar la plataforma como un entorno integral de IA/ML, algunas de las características más nuevas enfocadas en IA se sienten más como adiciones al ecosistema que como mejoras profundamente integradas en el flujo de trabajo. En la práctica, todavía hay casos donde herramientas personalizadas o marcos externos ofrecen más flexibilidad y transparencia, particularmente para el desarrollo especializado de modelos, la experimentación y los casos de uso de inferencia en tiempo real.

También puede haber cierta complejidad en torno a la optimización de clústeres y la gestión eficiente de costos a escala. Aunque las abstracciones son útiles, obtener la mejor relación rendimiento-costo a veces requiere un conocimiento más profundo de la plataforma de lo que la posición de "totalmente gestionado" podría implicar.

En general, la plataforma es muy fuerte técnicamente, pero los precios para cargas de trabajo intensivas en datos siempre activas y la madurez de algunas capacidades nativas de IA son las dos áreas más grandes donde me gustaría ver mejoras.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks resuelve uno de los mayores desafíos en el trabajo moderno con datos: reunir el acceso a los datos, el procesamiento a gran escala y el desarrollo colaborativo en un solo entorno.

Para mi trabajo, el mayor beneficio es la colaboración en tiempo real. Permite que varias personas trabajen con los mismos conjuntos de datos, cuadernos y flujos de trabajo sin la fricción habitual de herramientas fragmentadas o inconsistencias en el entorno. Eso acelera significativamente la experimentación, la iteración y el intercambio de conocimientos entre proyectos, especialmente cuando se avanza rápidamente en el desarrollo de modelos o en el análisis de datos que cambian rápidamente.

También resuelve el desafío del acceso y procesamiento de datos escalables. Trabajar con conjuntos de datos transaccionales y de series temporales de alto volumen requiere una infraestructura que pueda procesar grandes cantidades de datos de manera eficiente sin una sobrecarga operativa constante. Databricks abstrae gran parte de esa complejidad, haciendo posible centrarse en el análisis, la ingeniería de características y el desarrollo de modelos en lugar de gastar tiempo gestionando la infraestructura.

El beneficio práctico es ciclos de iteración más rápidos. Puedo pasar de la exploración de datos en bruto a la experimentación y el despliegue de modelos mucho más rápidamente, lo cual es especialmente valioso cuando se trabaja en análisis en tiempo real, flujos de trabajo de pronóstico y sistemas de ML orientados a la producción donde la velocidad de iteración impacta directamente en los resultados.

En general, reduce la fricción de ingeniería y hace que el trabajo colaborativo con datos a gran escala sea significativamente más eficiente, lo que se traduce en un desarrollo más rápido, mejor experimentación y un despliegue más confiable de productos de datos.

**Official Response from Jess Darnell:**

> Agradecemos su exhaustiva revisión de Databricks y nos complace saber que la plataforma ha sido fundamental para habilitar la colaboración entre equipos y aplicaciones intensivas de datos en su trabajo. Sus comentarios sobre los precios y la integración de IA son valiosos, y estamos continuamente esforzándonos por mejorar estos aspectos para ofrecer una experiencia más fluida a nuestros usuarios.

  ### 10. El Código Genie y el Asistente en Línea Aumentaron Dramáticamente Mi Productividad en la Depuración

**Rating:** 4.5/5.0 stars

**Reviewed by:** Shyam s. | Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 27, 2026

**¿Qué es lo que más le gusta de Databricks?**

El código Genie y el Asistente en línea fueron las herramientas más útiles para mí en mi proyecto. Me ayudaron a depurar una base de código de 2,000 líneas y explicaron claramente por qué no estaba obteniendo datos precisos. También proporcionó una consulta para ejecutar en mi sistema fuente (SQLMI). Al ejecutar el script de discrepancia en paralelo en la fuente y el destino, pude depurar todo el código mucho más rápido y mejorar mi productividad. En general, redujo mi tiempo de trabajo de aproximadamente 8 horas a alrededor de 1 hora.

**¿Qué es lo que no le gusta de Databricks?**

En Delta Sharing, no existe un permiso de SELECT a nivel de catálogo, y a veces pienso que tenerlo sería útil. Además, cuando uso el código de Genie dentro de una máquina virtual, puede hacer que el sitio web no responda en ocasiones. Estas son áreas que podrían mejorarse.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

En uno de nuestros proyectos de migración de procesamiento de reclamaciones, el cliente necesitaba disponibilidad de datos casi en tiempo real para aplicaciones posteriores. Anteriormente, la arquitectura utilizaba Amazon Redshift como el almacén de datos, con Jasper y Sisense consumiendo los datos para informes y análisis. Sin embargo, esa configuración no soportaba de manera eficiente la transmisión en tiempo real o casi en tiempo real, lo que provocaba retrasos en la disponibilidad de datos para los sistemas posteriores.

Después de migrar la plataforma a Databricks, pudimos mejorar sustancialmente la arquitectura del pipeline de datos. Implementamos transmisión junto con pipelines ETL optimizados, reduciendo el ciclo de actualización de datos a unos 30 minutos. También creamos una vista dedicada que retiene los datos de la ejecución anterior, de modo que los sistemas posteriores siempre tienen un conjunto de datos consistente disponible mientras la siguiente ejecución del pipeline aún está en progreso.

Antes, teníamos dificultades con ciclos de actualización retrasados y una capacidad limitada para satisfacer las necesidades de datos casi en tiempo real en nuestra arquitectura basada en Redshift. Después de mudarnos a Databricks, habilitamos un procesamiento ETL más rápido y mejoramos la disponibilidad de datos casi en tiempo real.

Como resultado, redujimos el tiempo de actualización de ETL a aproximadamente 30 minutos y habilitamos el acceso casi en tiempo real para herramientas posteriores como Jasper y Sisense. La fiabilidad también mejoró porque la vista estable continúa sirviendo los datos de la ejecución anterior durante las actualizaciones del pipeline. Finalmente, la arquitectura general se simplificó al consolidar las capacidades de procesamiento y análisis dentro de Databricks.

En general, Databricks nos ayudó a construir una plataforma de procesamiento de datos casi en tiempo real más escalable y eficiente, mejorando significativamente la puntualidad y fiabilidad de los análisis para el flujo de trabajo de procesamiento de reclamaciones.

**Official Response from Janelle Glover:**

> Gracias por compartir cómo la arquitectura de Databricks te está beneficiando. Diseñamos nuestra plataforma para abordar los desafíos de gestionar datos estructurados y no estructurados, y es genial escuchar que está teniendo un impacto positivo en tus flujos de trabajo de análisis y aprendizaje automático.

  ### 11. La Plataforma de Datos Unificada que Realmente Cumple

**Rating:** 5.0/5.0 stars

**Reviewed by:** Janakiraman K. | Data Engineer, Empresa (> 1000 empleados)

**Reviewed Date:** March 27, 2026

**¿Qué es lo que más le gusta de Databricks?**

Databricks ha transformado cómo nuestro equipo maneja los flujos de trabajo de datos de extremo a extremo. Algunos aspectos destacados:

UI/UX: La interfaz del cuaderno es intuitiva, y el editor de SQL se siente pulido, lo que al cambiar entre Python, SQL y Scala en el mismo espacio de trabajo ahorra cambios constantes de contexto.

Integraciones: Los conectores nativos a Azure, Unity Catalog y Delta Sharing significan que pasamos menos tiempo en la infraestructura. Lakehouse Federation nos permite consultar fuentes externas sin mover datos, lo cual fue una ganancia inesperada.

Rendimiento: La auto-optimización y el agrupamiento líquido de Delta Lake redujeron notablemente nuestros tiempos de consulta. El motor Photon en agregaciones pesadas es un cambio de juego para los paneles de control casi en tiempo real.

Precios/ROI: El modelo DBU requiere acostumbrarse, pero consolidar nuestro almacén de datos, ETL y herramientas de ML en una sola plataforma redujo significativamente nuestro gasto total en infraestructura.

Soporte/Integración: Databricks Academy y la documentación incorporada hicieron que la integración de nuevos ingenieros fuera más rápida. El foro de la comunidad es sorprendentemente activo para preguntas específicas.

IA/Inteligencia: Genie (AI/BI) permite a los usuarios de negocios hacer preguntas en inglés simple y obtener resultados precisos, reduciendo las solicitudes ad hoc a nuestro equipo de datos de manera notable. Databricks Assistant dentro de los cuadernos también acelera la generación de código y la depuración.

**¿Qué es lo que no le gusta de Databricks?**

Aunque Databricks es potente, hay puntos de fricción reales que vale la pena mencionar:

UI/UX: La interfaz puede resultar abrumadora para los nuevos usuarios, ya que la navegación entre Workspaces, Catálogos y SQL Warehouses no siempre es intuitiva. La organización de carpetas y cuadernos podría estar más estructurada desde el principio.

Integraciones: Algunos conectores de terceros aún requieren configuración manual y código personalizado. Lakehouse Federation es prometedor pero ocasionalmente inconsistente con ciertos sistemas de origen, necesitando resolución de problemas adicional.

Rendimiento: Los tiempos de inicio de los clústeres siguen siendo un punto problemático; los arranques en frío en clústeres interactivos pueden interrumpir flujos de trabajo rápidos. La computación sin servidor ayuda, pero aún no está disponible universalmente en todas las funciones.

Precios/ROI: El modelo de precios basado en DBU carece de transparencia para los equipos nuevos. Es fácil acumular costos inesperados sin políticas de clúster cuidadosas y monitoreo en su lugar. Un estimador de costos más sencillo ayudaría significativamente.

Soporte/Integración: Los tiempos de respuesta del soporte empresarial pueden ser lentos para tickets no críticos. Para problemas arquitectónicos complejos, llegar al experto adecuado a menudo requiere múltiples escalaciones.

IA/Inteligencia: Genie funciona bien para consultas estándar pero tiene dificultades con lógica compleja de múltiples tablas o terminología específica de dominio sin un ajuste significativo. El Asistente de Databricks dentro de los cuadernos ocasionalmente genera sugerencias de API desactualizadas o incorrectas.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Aquí tienes una respuesta natural y orientada a la historia siguiendo el formato "antes/después/resultado":

Antes de Databricks, nuestro panorama de datos estaba fragmentado y las herramientas separadas para ETL, almacenamiento y ML significaban duplicación de flujos de trabajo, definiciones de datos inconsistentes y un esfuerzo significativo de ingeniería solo para mantener la infraestructura.

Unificación de Datos: Luchábamos con datos aislados en múltiples sistemas de origen. Ahora, con Unity Catalog y la arquitectura Medallion (Bronce/Plata/Oro), tenemos una capa única y gobernada en la que confían todos los equipos, reduciendo el esfuerzo de reconciliación de datos en casi un 40%.

Confiabilidad de Flujos de Trabajo: Construir y mantener flujos de trabajo impulsados por metadatos solía requerir marcos personalizados. Lakeflow y Delta Live Tables de Databricks nos proporcionaron capacidades de carga incremental y completa de manera predeterminada, reduciendo significativamente el tiempo de desarrollo de flujos de trabajo.

Analítica de Autoservicio: Los equipos de negocio dependían constantemente de los ingenieros para consultas ad hoc. Con Genie (AI/BI), los interesados ahora pueden hacer preguntas en inglés sencillo sobre tablas de oro curadas, reduciendo notablemente las solicitudes de datos ad hoc a nuestro equipo semana tras semana.

Control de Costos en la Nube: Anteriormente ejecutábamos clústeres siempre activos sin visibilidad en el gasto. El cómputo sin servidor y las políticas de clúster ahora nos permiten dimensionar adecuadamente las cargas de trabajo, resultando en una reducción medible de costos de infraestructura.

Incorporación Más Rápida: Los nuevos ingenieros anteriormente tardaban semanas en ser productivos. Con Databricks Assistant, plantillas de cuadernos y documentación centralizada de Unity Catalog, el tiempo de adaptación ha disminuido considerablemente.

En general: Databricks esencialmente reemplazó 3-4 herramientas separadas con una plataforma cohesiva; el ROI no solo está en el ahorro de costos, sino en la velocidad y confianza con la que ahora entregamos productos de datos al negocio.

**Official Response from Janelle Glover:**

> Nos alegra saber que encuentras Databricks valioso para la ingeniería de datos, análisis y aprendizaje automático. ¡Gracias por compartir tus comentarios!

  ### 12. Entorno escalable y todo en uno con cierta curva de aprendizaje

**Rating:** 5.0/5.0 stars

**Reviewed by:** Antonio V. | Data &amp; AI Consultant, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** April 28, 2026

**¿Qué es lo que más le gusta de Databricks?**

Me gusta Databricks por su escalabilidad y su entorno todo en uno para la ingeniería de datos, análisis y aprendizaje automático. Me permite procesar grandes conjuntos de datos de manera eficiente mientras mantengo los flujos de trabajo organizados en una sola plataforma. La escalabilidad es muy valiosa porque me permite manejar volúmenes de datos crecientes y cargas de trabajo complejas sin problemas de rendimiento. A medida que los proyectos se expanden, la plataforma puede escalar los recursos de manera eficiente.

**¿Qué es lo que no le gusta de Databricks?**

Algunas características pueden tener una curva de aprendizaje, especialmente para los nuevos usuarios que trabajan con configuraciones avanzadas o gestión de clústeres. La interfaz también podría ser más intuitiva en ciertas áreas. La configuración fue relativamente sencilla para las funciones principales, pero algunos ajustes avanzados como la optimización de clústeres, permisos e integraciones requirieron más tiempo y conocimientos técnicos.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks resuelve los principales desafíos de gestión y análisis de datos al manejar eficientemente grandes conjuntos de datos, simplificar los procesos ETL y centralizar los flujos de trabajo. Su escalabilidad me permite gestionar volúmenes de datos crecientes sin problemas de rendimiento, asegurando que los recursos escalen eficientemente a medida que los proyectos se expanden.

**Official Response from Jess Darnell:**

> Nos alegra saber que encuentras Databricks escalable y aprecias su entorno todo en uno para ingeniería de datos, análisis y aprendizaje automático. Entendemos que algunas características pueden tener una curva de aprendizaje, y estamos trabajando continuamente para mejorar la usabilidad e intuitividad de la plataforma.

  ### 13. Rendimiento con Spark y cuadernos colaborativos que hacen el flujo de datos más eficiente

**Rating:** 5.0/5.0 stars

**Reviewed by:** Homero F. | Professor particular, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** April 19, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta es el rendimiento en el procesamiento de grandes volúmenes de datos con Spark, los cuadernos colaborativos que facilitan el trabajo en equipo y las integraciones con AWS y herramientas de BI, que hacen todo el flujo de datos más eficiente.

**¿Qué es lo que no le gusta de Databricks?**

El costo puede ser alto dependiendo del uso y algunas partes de la interfaz, como la configuración de clústeres y trabajos, no son tan intuitivas al principio. Además, la curva de aprendizaje puede ser un poco elevada para nuevos usuarios.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks resuelve problemas de procesamiento de grandes volúmenes de datos, integración de diferentes fuentes y desarrollo de modelos de IA en un solo entorno. Esto mejora nuestro flujo de trabajo, reduce el tiempo de procesamiento y centraliza todo en la plataforma. Las integraciones con AWS y otras herramientas facilitan la implementación, y el soporte junto con la documentación ayudan en la adaptación. Además, los recursos de IA permiten crear, entrenar y probar modelos de forma más rápida y eficiente.

**Official Response from Jess Darnell:**

> ¡Gracias por tus comentarios positivos!

  ### 14. Analítica Unificada Potente con Gobernanza Sin Fisuras y Escalado Sin Esfuerzo

**Rating:** 4.5/5.0 stars

**Reviewed by:** Akhil S. | Senior Data Engineer, Empresa (> 1000 empleados)

**Reviewed Date:** April 16, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es su poderoso y unificado ecosistema de análisis. Funciones como Unity Catalog y Metastore hacen que la gobernanza de datos y el control de acceso sean fluidos, mientras que la arquitectura Lakehouse combina lo mejor de los lagos de datos y los almacenes de datos. El soporte de PySpark, dbutils y los espacios de trabajo colaborativos hacen que el desarrollo sea eficiente, y la computación sin servidor simplifica el escalado sin la sobrecarga de infraestructura.

**¿Qué es lo que no le gusta de Databricks?**

Lo que no me gusta de Databricks es el tiempo de inicio lento de los clústeres de propósito general, lo que puede interrumpir el flujo de trabajo y reducir la productividad. Además, la integración con Git puede sentirse un poco lenta a veces, especialmente durante los commits o la sincronización, haciendo que el control de versiones sea menos fluido de lo esperado.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks resuelve el desafío de gestionar flujos de trabajo de datos de extremo a extremo al proporcionar una plataforma unificada para la ingeniería de datos, la ciencia de datos y el análisis. Permite un procesamiento de datos, transformación y desarrollo de modelos sin problemas dentro de un solo entorno.

Esto me beneficia al simplificar mi flujo de trabajo tanto como ingeniero de datos como científico de datos, reduciendo la necesidad de cambiar entre herramientas. Además, su integración con Azure Data Factory permite una orquestación y activación de trabajos fluida para entornos superiores, haciendo que los despliegues sean más eficientes y confiables.

**Official Response from Jess Darnell:**

> Nos complace saber que Databricks está simplificando sus flujos de trabajo de datos y proporcionando una integración perfecta con Azure Data Factory. Tomamos nota de sus preocupaciones sobre los tiempos de inicio lentos y la integración con Git, y estamos comprometidos a optimizar estos aspectos para garantizar una experiencia más fluida para nuestros usuarios. Sus comentarios nos ayudan a priorizar mejoras que se alineen con las necesidades de nuestros usuarios.

  ### 15. Plataforma colaborativa y fluida que escala para ingeniería de datos y ML

**Rating:** 4.0/5.0 stars

**Reviewed by:** Krish G. | student, Pequeña Empresa (50 o menos empleados)

**Reviewed Date:** April 15, 2026

**¿Qué es lo que más le gusta de Databricks?**

La capacidad de Databricks para integrar todo sin problemas es lo que encuentro más atractivo. Al trabajar en proyectos reales, realmente marca una gran diferencia el no tener que cambiar entre varias herramientas para la ingeniería de datos, el análisis y el aprendizaje automático.

El elemento colaborativo es muy notable. Los equipos pueden colaborar fácilmente sin que las cosas se vuelvan confusas gracias a la sensación fluida y dinámica de los cuadernos. Para trabajos significativos con datos, se asemeja casi exactamente a Google Docs.

También me gusta mucho cómo gestiona eficientemente grandes cantidades de datos sin que parezca complicado. Incluso al trabajar con grandes conjuntos de datos, la plataforma se siente amigable para el usuario y puede escalarse cuando sea necesario.

Además, tiene mucho sentido desde un punto de vista de IA/ML. Puedes construir,

**¿Qué es lo que no le gusta de Databricks?**

Databricks puede parecer un poco abrumador al principio, lo cual es algo que no me gusta. Clústeres, cuadernos, trabajos, flujos de trabajo: hay mucho en marcha, y si eres nuevo, lleva un tiempo comprender realmente cómo funciona todo junto.

El control de costos es otro inconveniente. Es indudablemente potente, pero los gastos pueden aumentar rápidamente si no tienes cuidado con el uso de clústeres o la configuración de autoescalado. Para mantener todo bajo control, necesitas ejercer algo de autocontrol y vigilar las cosas.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

El problema de fragmentación en el flujo de trabajo de datos e inteligencia artificial se resuelve principalmente con Databricks. En el pasado, el almacenamiento de datos, el procesamiento, el análisis y el aprendizaje automático se realizaban generalmente con diferentes herramientas, y lograr que todas cooperaran era frecuentemente difícil y requería mucho tiempo. Databricks elimina gran parte de la fricción al combinar todo en una sola plataforma.
Eso hace que el proceso de desarrollo sea mucho más fluido para mí. No tengo que preocuparme por problemas de compatibilidad ni perder tiempo cambiando entre entornos. Puedo realizar transformaciones, limpiar datos y crear modelos todo en un solo lugar, lo que reduce el tiempo de configuración y mantiene la organización.
También aborda la dificultad de manejar grandes cantidades de datos.
Puedo confiar en sus capacidades de computación distribuida para gestionar cargas de trabajo exigentes en lugar de preocuparme por la infraestructura o la optimización del rendimiento desde cero. Esto me permite concentrarme menos en la gestión de recursos y más en encontrar una solución al problema real.
La colaboración es otro problema importante que resuelve. Compartir código, hallazgos y experimentos puede volverse desorganizado en entornos de equipo. Debido a que todo está consolidado con Databricks, es más sencillo trabajar juntos, monitorear cambios y mantener la alineación.
En resumen, me ayuda al reducir la complejidad, ahorrar tiempo y permitirme concentrarme más en desarrollar soluciones, ya sean analíticas, modelos de aprendizaje automático o flujos de datos, en lugar de manejar la sobrecarga de mantener numerosas herramientas y plataformas.

**Official Response from Jess Darnell:**

> Nos alegra saber que encuentras atractiva la integración fluida y las características colaborativas de Databricks. Entendemos que la plataforma puede parecer abrumadora al principio, pero ofrecemos recursos y soporte integrales para ayudar a los usuarios a ponerse al día. En cuanto al control de costos, recomendamos aprovechar nuestra documentación y las mejores prácticas para optimizar el uso de clústeres y la configuración de autoescalado. Agradecemos tus comentarios y estamos comprometidos a mejorar continuamente la experiencia del usuario.

  ### 16. Databricks como un Ingeniero de Datos Práctico: Resolviendo Desafíos Reales de ETL, Gobernanza y Lakehouse

**Rating:** 5.0/5.0 stars

**Reviewed by:** KAVIN P. | Data Engineer, Tecnología de la información y servicios, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** April 08, 2026

**¿Qué es lo que más le gusta de Databricks?**

Creo que lo más atractivo de Databricks radica en su naturaleza todo en uno, lo que facilita la gestión de datos. Anteriormente, cuando usaba varias herramientas para actividades relacionadas con datos, la experiencia no era buena, pero aquí todo parece estar interconectado y ser sencillo.

La capacidad de utilizar notebooks, especialmente cuando se trabaja con PySpark, es otra ventaja de Databricks que me gusta en el núcleo. La herramienta permite ejecutar cambios y modificaciones rápidamente sin preparación excesiva. También impacta positivamente en el proceso de colaboración entre mi equipo, que puede trabajar simultáneamente en sus proyectos y monitorear el progreso general. Sin embargo, el control de versiones a veces puede parecer un poco confuso en mi opinión.

En cuanto al rendimiento, Databricks me parece eficiente para manejar grandes volúmenes de datos y operar sin problemas ni retrasos. El escalado de clústeres ocurre automáticamente, permitiéndome a mí y a mi equipo ahorrar tiempo a nivel de infraestructura. Por lo tanto, es fácil ya que no se requiere planificación y ajustes adicionales.

Hay problemas menores con la interfaz de usuario, que a veces funciona lentamente, pero en general, debido a otros aspectos superiores como los métodos fáciles para implementar e integrar cosas, me anima a utilizar Databricks con frecuencia.

**¿Qué es lo que no le gusta de Databricks?**

Un aspecto de Databricks que no me gusta es su interfaz de usuario. A medida que pasas más tiempo usando la herramienta, moverse entre cuadernos y clústeres se vuelve molesto a veces.

El otro problema son los costos que pueden acumularse rápidamente si no somos cautelosos. Clústeres innecesarios pueden estar funcionando por un período más largo del necesario y sin que yo o mi equipo lo sepamos, aumentando así los costos en nuestros proyectos.

También existe la complejidad de depurar los errores, que a veces es difícil ya que implica dedicar un esfuerzo extra tratando de averiguar dónde podrían haber estado los errores, principalmente al tratar con tuberías complejas.

A veces, hay algunas discrepancias con respecto al servicio al cliente que nos llevan a lugares donde no necesitamos estar.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

El problema más importante que Databricks resuelve es el de trabajar con grandes volúmenes de datos y mantener la consistencia. Anteriormente, había procesos separados para la ingeniería de datos, la analítica y las operaciones de aprendizaje automático, lo que requería herramientas separadas y me dificultaba el manejo, pero ahora todo está en un solo lugar. Otro problema crítico resuelto por Databricks es el procesamiento de grandes volúmenes de datos. Utilizando Spark y la computación distribuida, permite realizar tareas que eran extremadamente lentas en los sistemas heredados con los que trabajaba. Esto ha ayudado a acelerar mi pipeline, aunque a veces ocurren retrasos. La colaboración es también otro problema que Databricks aborda. Múltiples usuarios pueden colaborar en el mismo cuaderno o conjuntos de datos. La colaboración anteriormente era confusa, y ahora es fácil, buena y fácilmente comprensible, y principalmente fácil compartir cuadernos y activos. La escalabilidad es otro problema resuelto por Databricks; no es necesario prestar atención a la gestión de la infraestructura. El escalado de clústeres depende de los requisitos del usuario, ahorrando tiempo. Anteriormente, era necesario prestar más atención a la configuración de la infraestructura.

**Official Response from Jess Darnell:**

> Nos alegra saber que encuentras beneficiosa la naturaleza todo en uno y la interconexión de Databricks para la gestión de datos, ayudando a tu equipo a ahorrar tiempo. Agradecemos tus comentarios sobre las ventajas de utilizar notebooks y la eficiencia en el manejo de grandes volúmenes de datos.

  ### 17. Espacio de trabajo unificado de Databricks que agiliza la colaboración y los flujos de trabajo de datos complejos

**Rating:** 4.0/5.0 stars

**Reviewed by:** Neeraj Kumar N. | AI Data Specialist | Transcription &amp; Annotation Expert | AI Model Training at Sigma AI, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** April 12, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es cómo reúne la ingeniería de datos, la analítica y el aprendizaje automático en un espacio de trabajo unificado. Encuentro que la colaboración es mucho más fácil con los cuadernos compartidos, y la integración perfecta con herramientas de big data me ahorra tiempo. Simplifica los flujos de trabajo complejos mientras sigue ofreciendo capacidades poderosas cuando las necesito.

**¿Qué es lo que no le gusta de Databricks?**

Una cosa que no me gusta de Databricks es que puede parecer caro, especialmente para proyectos o equipos más pequeños. También encuentro que la configuración de clústeres y la gestión de costos son un poco complejas a veces. La interfaz, aunque poderosa, puede ser abrumadora para los principiantes, y depurar trabajos distribuidos no siempre es tan sencillo como me gustaría.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks resuelve el desafío de manejar el procesamiento de datos a gran escala, análisis y aprendizaje automático en un solo lugar. Para mí, elimina la molestia de gestionar herramientas e infraestructuras separadas. Me beneficio al trabajar de manera más eficiente, colaborar fácilmente con mi equipo y convertir datos complejos en información útil más rápido, con menos carga operativa en general.

**Official Response from Jess Darnell:**

> Nos alegra saber que encuentras valioso el espacio de trabajo unificado y las funciones de colaboración de Databricks para tu trabajo. Entendemos tus preocupaciones sobre el costo y la complejidad, y estamos trabajando continuamente para mejorar en estas áreas.

  ### 18. Plataforma de datos confiable con soporte potente para canalizaciones

**Rating:** 4.5/5.0 stars

**Reviewed by:** Chandhuru B. | Data Engineer, Tecnología de la información y servicios, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** April 06, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es cómo reúne la ingeniería de datos, la analítica y el aprendizaje automático en un espacio de trabajo limpio. Ahorra tiempo, facilita la colaboración y ayuda a los equipos a avanzar más rápido con grandes volúmenes de datos.

**¿Qué es lo que no le gusta de Databricks?**

Lo que no me gusta de Databricks es que Auto Loader puede volverse frustrante cuando los datos de origen cambian con frecuencia, especialmente si los nombres de las columnas o los tipos de datos cambian sin previo aviso.

Por ejemplo, un campo como customer_id puede de repente llegar como cust_id, o una columna que anteriormente era una cadena puede comenzar a llegar como un entero, lo que puede causar desviación de esquema y romper el procesamiento posterior.

También me resulta inconveniente cuando la inferencia de esquema no es completamente precisa, como cuando se lee incorrectamente JSON anidado o datos semiestructurados, porque entonces requiere arreglos manuales adicionales y mantenimiento para mantener las canalizaciones funcionando sin problemas.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks está resolviendo el problema de construir y gestionar canalizaciones de datos a gran escala sin tanto esfuerzo manual. Ayuda con la ingesta confiable, la evolución del esquema y la orquestación, para que los equipos puedan procesar datos más rápido y mantener las canalizaciones más estables incluso cuando los archivos de origen cambian.

Para mí, eso significa menos tiempo dedicado a arreglar trabajos rotos y más tiempo enfocado en transformar y usar los datos. También me beneficia al hacer que los flujos de trabajo por lotes y en streaming sean más fáciles de gestionar en una sola plataforma, lo cual es especialmente útil cuando los datos siguen cambiando.

**Official Response from Janelle Glover:**

> Nos alegra saber que consideras Databricks una plataforma confiable para la ingeniería de datos, análisis y aprendizaje automático. Entendemos la frustración con Auto Loader al tratar con datos de origen que cambian con frecuencia. Continuamente estamos trabajando para mejorar la precisión de la inferencia de esquemas y el manejo de JSON anidados o datos semiestructurados para minimizar las correcciones manuales y el mantenimiento para nuestros usuarios.

  ### 19. Me encanta Databricks y sus características y el Unity Catalog para una gobernanza simplificada.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Prashant N. | Data Engineer, Empresa (> 1000 empleados)

**Reviewed Date:** May 26, 2026

**¿Qué es lo que más le gusta de Databricks?**

En Databricks, realmente me gustan las características más nuevas como Gennie, el Asistente de Databricks, los agentes y el mecanismo de activación de eventos.

Además, la función de Unity Catalog es increíble. Tener un solo lugar para todas las fuentes facilita mucho las cosas, y UC ayuda a gobernar las tablas de una manera más organizada.

**¿Qué es lo que no le gusta de Databricks?**

Nada especial que no me guste, pero hay una función para saltar a un comando en particular. La función en sí está bien, pero está colocada justo al lado del cuaderno, lo que hace que sea fácil hacer clic accidentalmente, y eso interrumpe mi flujo de trabajo.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Estoy usándolo en mi proyecto para el procesamiento de datos y el análisis de calidad de datos. Con Databricks y su funcionalidad, estoy construyendo agentes en el espacio Genie. Usando UC, estoy gestionando todas las tablas gestionadas y externas en un solo lugar.

**Official Response from Jess Darnell:**

> Nos alegra saber que estás disfrutando de las nuevas funciones como Gennie, Databricks Assistant, agentes y el mecanismo de activación de eventos, así como la función del Catálogo de Unity. ¡Agradecemos tus comentarios!

  ### 20. Databricks: Plataforma Unificada para el Procesamiento y Análisis de Datos

**Rating:** 5.0/5.0 stars

**Reviewed by:** Banu Prakash M. | Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** April 02, 2026

**¿Qué es lo que más le gusta de Databricks?**

Me gusta que Databricks reúna todo en un solo lugar, haciendo innecesario usar diferentes herramientas para el procesamiento de datos, análisis y trabajo de canalización. Maneja bien grandes volúmenes de datos, y no tenemos que preocuparnos por gestionar clústeres manualmente. Además, Databricks maneja bien la colaboración y la experimentación, facilitando probar cosas nuevas.

**¿Qué es lo que no le gusta de Databricks?**

Desde mi punto de vista, el área que se puede mejorar es la gestión de costos. Si los clústeres no se monitorean cuidadosamente, los costos pueden aumentar más rápido de lo esperado. Una mejora que ayudaría es tener una mejor visibilidad de los costos a un nivel más detallado. Más alertas integradas o recomendaciones cuando los costos comiencen a aumentar inesperadamente también serían útiles.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks nos ayuda a manejar grandes conjuntos de datos y construir canalizaciones de datos. Simplifica el procesamiento, la transformación y el análisis de datos utilizando Spark y SQL, todo en un solo lugar. Resuelve el problema del procesamiento de datos lento distribuido en sistemas, gestionando la infraestructura automáticamente y facilitando la colaboración y la experimentación.

**Official Response from Janelle Glover:**

> Estamos encantados de saber que Databricks ha sido beneficioso para manejar grandes conjuntos de datos y simplificar el procesamiento y análisis de datos para usted. Agradecemos sus comentarios sobre la gestión de costos y exploraremos formas de mejorar la visibilidad de costos y proporcionar mejores herramientas de monitoreo.

  ### 21. Un caballo de batalla confiable para la ingeniería de datos y el análisis

**Rating:** 5.0/5.0 stars

**Reviewed by:** Supriya  M. | Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 31, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más aprecio es el enfoque de plataforma unificada. Tener cuadernos, canalizaciones de ingeniería de datos, flujos de trabajo de ML y análisis SQL todo en un solo lugar ahorra mucho tiempo en lugar de estar manejando múltiples herramientas. Los cuadernos colaborativos facilitan compartir el trabajo con los compañeros de equipo, y la gestión de clústeres se ha vuelto mucho más fluida con el tiempo. La integración de Delta Lake también es una gran ventaja para mantener nuestros datos fiables y consistentes.

**¿Qué es lo que no le gusta de Databricks?**

El costo puede salirse de control bastante rápido si no tienes cuidado con el tamaño del clúster y el tiempo de actividad. No siempre es obvio cómo optimizar el gasto, y el modelo de precios parece complejo. La curva de aprendizaje para los nuevos miembros del equipo también es más pronunciada de lo que me gustaría, especialmente para las personas que no están ya familiarizadas con Spark. A veces, la interfaz de usuario puede sentirse lenta al trabajar con cuadernos más grandes, y la depuración de fallos en los trabajos podría ser más sencilla.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks me ayuda a resolver fallos complejos en las canalizaciones ETL y problemas persistentes de calidad de datos en el análisis de la cadena de suministro al unificar el procesamiento por lotes y en streaming desde sistemas SAP con Delta Live Tables. También elimina muchos de los dolores de cabeza de la gestión de infraestructura gracias a los clústeres de escalado automático, por lo que puedo concentrarme en escribir código para cargas de trabajo de varios terabytes en lugar de preocuparme constantemente por el dimensionamiento de los clústeres.

Para mis proyectos de datos de manufactura, Databricks acelera los ciclos de desarrollo de semanas a días a través de cuadernos colaborativos y canalizaciones DLT, lo que permite una generación de informes más rápida en Power BI y decisiones de los interesados. Unity Catalog centraliza la gobernanza a través de fuentes de Azure y SAP, previniendo la deriva de esquemas que plagó a los lagos basados en Hive anteriormente.

**Official Response from Janelle Glover:**

> Gracias por destacar los beneficios del enfoque de plataforma unificada y las características que ahorran tiempo de Databricks. Entendemos sus preocupaciones sobre la gestión de costos y la curva de aprendizaje, y estamos trabajando continuamente para simplificar nuestro modelo de precios y mejorar la experiencia de incorporación para los nuevos miembros del equipo. Es genial escuchar cómo Databricks está ayudando a resolver fallos complejos en las canalizaciones ETL y a acelerar los ciclos de desarrollo para sus proyectos de datos de manufactura.

  ### 22. Potencia todo en uno con espacio para claridad en precios

**Rating:** 4.5/5.0 stars

**Reviewed by:** Thoufeeq A. | DevOps Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** April 02, 2026

**¿Qué es lo que más le gusta de Databricks?**

Me gusta que Databricks sea una potencia todo en uno donde puedo realizar múltiples trabajos en un solo lugar. Es potente para gestionar datos de múltiples fuentes y tenerlos en un solo UC para gestionar permisos con seguridad a nivel de fila. También aprecio que puedo crear experimentos, ejecutar múltiples modelos y seleccionar el mejor a partir de los registros, lo cual era difícil en otras plataformas. Una vez que aprendí la configuración, ha sido fácil y cómodo trabajar con ella.

**¿Qué es lo que no le gusta de Databricks?**

Me resulta difícil usar la calculadora para determinar los precios de los puntos de servicio de CPU porque la documentación no lo explica explícitamente. Solo menciona que 1 concurrencia equivale a 1 DBU en la página de Azure, lo cual no es claro. La calculadora de precios tiene una única opción para puntos de servicio, etiquetada como mediana con cuatro DBU, pero carece de opciones separadas para GPU o CPU y su concurrencia, lo que hace difícil entender cómo funciona correctamente. Inicialmente, también sentí que era muy difícil aprender Databricks y gestionar los despliegues de espacios de trabajo, aunque con el tiempo se volvió más fácil.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks consolida múltiples herramientas en una sola plataforma, haciéndola poderosa y conveniente. Puedo gestionar permisos con seguridad a nivel de fila y ejecutar experimentos fácilmente para seleccionar los mejores modelos, todo en un solo lugar.

**Official Response from Janelle Glover:**

> Gracias por compartir su experiencia positiva con Databricks. Entendemos sus preocupaciones sobre la calculadora de precios y tomaremos en cuenta sus comentarios para mejorar la claridad de nuestra documentación.

  ### 23. Potencia de Databricks Lakehouse con Unity Catalog y Fast Photon SQL

**Rating:** 4.0/5.0 stars

**Reviewed by:** Vidhyadar R. | Data Engineer, Empresa (> 1000 empleados)

**Reviewed Date:** April 01, 2026

**¿Qué es lo que más le gusta de Databricks?**

Realmente valoro cómo la plataforma reúne lagos de datos y almacenes en un solo lugar. Hace que la gestión de datos sea mucho más fácil, y el rendimiento de SQL es muy rápido gracias al motor Photon. También me gustan los cuadernos colaborativos porque me permiten trabajar con SQL y Python sin problemas en un solo entorno.

**¿Qué es lo que no le gusta de Databricks?**

El costo puede ser alto, y el sistema de facturación de DBU es bastante complejo de seguir. También encontré que hay una curva de aprendizaje significativa cuando se trata de Spark y la configuración de clústeres. Para tareas pequeñas y rápidas, el tiempo de configuración y la sobrecarga técnica a veces pueden parecer un poco excesivos.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Resuelve el problema de tener datos dispersos por todas partes. Me encanta que puedo cambiar entre SQL y Python en el mismo lugar, y la velocidad de procesamiento es de primera categoría. Ha sido un cambio radical para desarrollar nuestros modelos financieros rápidamente sin el retraso habitual.

**Official Response from Janelle Glover:**

> Agradecemos tus comentarios sobre los beneficios de Databricks, como la gestión centralizada de datos y la capacidad de trabajar con SQL y Python en un solo entorno. Entendemos tus preocupaciones sobre el costo y la curva de aprendizaje, y estamos trabajando activamente para mejorar la plataforma y satisfacer mejor tus necesidades.

  ### 24. Ingeniería de Datos, Ciencia y Análisis Unificados en Una Plataforma Colaborativa

**Rating:** 4.5/5.0 stars

**Reviewed by:** Sivabalan A. | Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** April 02, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más aprecio de Databricks es su capacidad para unificar la ingeniería de datos, la ciencia de datos y la analítica en una sola plataforma. El entorno colaborativo, especialmente los cuadernos y los flujos de trabajo integrados, facilita mucho que equipos con diferentes niveles de habilidad trabajen juntos sin cambiar constantemente de contexto.

Otro aspecto destacado es la integración con herramientas populares y servicios en la nube que se utilizan ampliamente en el mercado hoy en día, lo que facilita el movimiento de datos entre ellos. Las funciones de monitoreo de rendimiento y programación de trabajos ayudan a mantener la visibilidad sobre las canalizaciones, y el soporte de Delta Lake para la gestión confiable de datos también ha sido muy útil.

**¿Qué es lo que no le gusta de Databricks?**

La gestión de costos es un área que podría mejorarse. Aunque Databricks ofrece opciones de escalado automático y clústeres flexibles, es fácil que el uso de recursos se dispare inesperadamente, especialmente con conjuntos de datos grandes y trabajos de larga duración. Mantener los costos predecibles a menudo requiere una supervisión cuidadosa y una sólida comprensión del modelo de precios de la plataforma.

Además, algunas de las características más avanzadas, como los controles de acceso detallados y la orquestación de trabajos más compleja, pueden parecer menos intuitivas. La documentación es extensa, pero ocasionalmente deja lagunas que terminan requiriendo prueba y error.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks aborda varios desafíos clave en los flujos de trabajo de datos modernos, particularmente en torno a la escalabilidad, la fiabilidad de los datos y la analítica colaborativa. Un problema importante que resuelve es la gestión y el procesamiento de conjuntos de datos a gran escala de manera eficiente. Al aprovechar el marco de computación distribuida de Apache Spark, Databricks permite canalizaciones ETL paralelizadas y transformaciones de datos a gran escala que serían impracticables en infraestructuras tradicionales.

Otro desafío es garantizar la consistencia y fiabilidad de los datos a través de las canalizaciones. Con Delta Lake, Databricks proporciona almacenamiento compatible con ACID, tablas versionadas y aplicación de esquemas, lo que reduce los errores de datos y simplifica la gobernanza de datos. Esto es especialmente beneficioso cuando varios equipos están trabajando en diferentes etapas de las canalizaciones de datos al mismo tiempo.

Databricks también ayuda a resolver el problema de los flujos de trabajo fragmentados para científicos de datos e ingenieros. Su entorno unificado admite múltiples lenguajes (Python, SQL, R, Scala) e incluye aprendizaje automático integrado con MLFlow, lo que facilita la colaboración y el paso de la preparación de datos a la analítica y el aprendizaje automático en un solo lugar.

**Official Response from Janelle Glover:**

> Es genial escuchar cómo Databricks está ayudando a abordar los desafíos de escalabilidad, fiabilidad de datos y análisis colaborativo para tu equipo. Agradecemos tus comentarios sobre la gestión de costos y la usabilidad de funciones avanzadas. Estamos trabajando continuamente para mejorar la transparencia de nuestros precios y mejorar la experiencia del usuario para todas nuestras funciones.

  ### 25. Plataforma todo en uno que nos ayuda a iterar rápidamente y desplegar con confianza

**Rating:** 5.0/5.0 stars

**Reviewed by:** Vijayaramuprawin V. | Sr. Cloud and DevOps Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** April 01, 2026

**¿Qué es lo que más le gusta de Databricks?**

Usamos Databricks diariamente como nuestra plataforma de datos principal para construir y ejecutar pipelines a través de una arquitectura de medallón, desde la extracción de datos de SAP y Arkieva hasta conjuntos de datos listos para informes. La experiencia con los notebooks es intuitiva, el conjunto de características es enorme, y los Asset Bundles han hecho que nuestra historia de CI/CD con Azure DevOps sea realmente sólida. La integración con los servicios en la nube fue fluida, y una vez que las cosas están configuradas, simplemente funcionan. La curva de aprendizaje puede ser pronunciada para los miembros más nuevos del equipo, especialmente en torno a cosas como Unity Catalog y DABs, y los costos pueden aumentar si no se está al tanto de las configuraciones de los clústeres. El soporte es decente y la documentación es lo suficientemente fuerte como para que rara vez necesitemos abrir un ticket. En general, es una plataforma poderosa que hace mucho bajo un mismo techo, y es difícil imaginar nuestro flujo de trabajo de ingeniería de datos sin ella.

**¿Qué es lo que no le gusta de Databricks?**

El costo puede aumentar rápidamente si no tienes cuidado con el tamaño del clúster y las configuraciones de trabajo, por lo que se necesita algo de esfuerzo para mantener las cosas optimizadas. Además, la curva de aprendizaje para los nuevos miembros del equipo puede ser pronunciada, especialmente en aspectos como Asset Bundles, Unity Catalog y configurar correctamente las piezas de CI/CD.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks está resolviendo el problema de tener datos fragmentados distribuidos en múltiples sistemas como SAP y Arkieva al proporcionarnos una plataforma unificada para extraer, transformar y servir todo. Eso significa que nuestros equipos de negocio obtienen datos limpios, confiables y listos para informes sin que tengamos que manejar un montón de herramientas separadas, y podemos implementar y gestionar todo de manera consistente a través de los entornos con confianza.

**Official Response from Janelle Glover:**

> Nos alegra saber que Databricks ha sido fundamental para agilizar su flujo de trabajo de ingeniería de datos y proporcionar una plataforma poderosa para sus necesidades. Agradecemos sus comentarios sobre la curva de aprendizaje y las consideraciones de costos, y estamos trabajando continuamente para mejorar en estas áreas.

  ### 26. Flujos de trabajo de datos optimizados y colaborativos con un rendimiento potente

**Rating:** 5.0/5.0 stars

**Reviewed by:** Dharun T. | Senior Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** April 01, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es cómo simplifica todo el flujo de trabajo de datos al integrar el procesamiento, análisis y aprendizaje automático en una sola plataforma. El entorno colaborativo de cuadernos facilita compartir código, contexto y razonamiento con los compañeros de equipo, lo que ayuda a que todos se mantengan alineados. También tiene un buen rendimiento con grandes conjuntos de datos mientras abstrae la mayor parte de la gestión de clústeres, por lo que puedo centrarme en resolver el problema en lugar de lidiar con la infraestructura. Además, el control de acceso centralizado y la visibilidad clara en el uso de datos apoyan una gobernanza de datos responsable, ofreciendo un equilibrio sólido entre potencia y facilidad de uso.

**¿Qué es lo que no le gusta de Databricks?**

Databricks tiene algunas desventajas, aunque muchas de ellas se sienten más como compensaciones que como aspectos negativos absolutos. Mi mayor preocupación es el costo: si los clústeres no se gestionan cuidadosamente, los gastos pueden aumentar rápidamente, aunque la plataforma puede escalar de manera muy eficiente cuando está bien ajustada. También hay una verdadera curva de aprendizaje con Spark y los conceptos de computación distribuida, y la depuración o ajuste de rendimiento puede ser más complicado que con herramientas más simples. Por último, debido a que es un servicio gestionado, se renuncia a cierto control de bajo nivel en comparación con los sistemas autoalojados, pero la ventaja es que elimina gran parte del trabajo operativo y de infraestructura de tu responsabilidad.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Debido a que mi cliente necesita código seguro y reutilizable, Databricks nos ayuda a escribir Python de manera eficiente mientras aplicamos principios de POO y patrones de diseño. También facilita la extensión de la funcionalidad con el tiempo y la creación de código personalizado que interactúa con APIs y bases de datos.

**Official Response from Janelle Glover:**

> Nos alegra saber que considera que Databricks es una plataforma poderosa y optimizada para flujos de trabajo colaborativos de datos. Entendemos las preocupaciones sobre la gestión de costos y la curva de aprendizaje asociada con los conceptos de computación distribuida. Trabajamos continuamente para mejorar nuestra plataforma y proporcionar recursos que ayuden a los usuarios a optimizar su uso y superar desafíos.

  ### 27. Databricks: Solución Todo-en-Uno para Datos y Analítica

**Rating:** 5.0/5.0 stars

**Reviewed by:** FABIN P. | Senior Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** April 01, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es que reúne todo en un solo lugar, lo que facilita trabajar con datos, construir modelos y gestionar flujos de trabajo. Ayuda a los equipos a colaborar fácilmente en tiempo real. También funciona muy rápido con grandes volúmenes de datos utilizando Apache Spark, y características como la automatización y Delta Lake hacen que manejar grandes datos sea mucho más sencillo.

**¿Qué es lo que no le gusta de Databricks?**

Una cosa que no me gusta de Databricks es que puede ser caro, especialmente para cargas de trabajo grandes. A veces, la interfaz y la configuración pueden parecer complejas para los principiantes. Además, gestionar clústeres y configuraciones puede requerir cierto esfuerzo si no estás muy familiarizado con ello.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks resuelve el problema de manejar grandes cantidades de datos de manera eficiente. Reúne la ingeniería de datos, el análisis y el aprendizaje automático en una sola plataforma. Esto elimina la necesidad de usar múltiples herramientas. Ayuda en el procesamiento más rápido de datos utilizando Apache Spark. Facilita la colaboración para los equipos. Simplifica la construcción y gestión de flujos de datos. Mejora la fiabilidad de los datos con características como Delta Lake. Reduce el trabajo manual a través de la automatización. Ahorra tiempo y esfuerzo en las tareas diarias. En general, me ayuda a trabajar más rápido y de manera más eficiente con los datos.

**Official Response from Janelle Glover:**

> Nos alegra saber que Databricks ha sido fundamental para agilizar su flujo de trabajo de ingeniería de datos y proporcionar una plataforma poderosa para sus necesidades. Agradecemos sus comentarios sobre la curva de aprendizaje y las consideraciones de costos, y estamos trabajando continuamente para mejorar en estas áreas.

  ### 28. De Hive Chaos a Unity Catalog - Vale cada DBU

**Rating:** 5.0/5.0 stars

**Reviewed by:** Balakumaran R. | Data Team Lead, Empresa (> 1000 empleados)

**Reviewed Date:** March 31, 2026

**¿Qué es lo que más le gusta de Databricks?**

Unity Catalog ha sido el mayor valor añadido para nuestra migración empresarial. Nos movimos de una arquitectura de Hive Metastore a Unity Catalog y obtuvimos gobernanza centralizada, seguimiento de linaje y control de acceso detallado en todos nuestros activos de datos sin añadir herramientas de terceros. Para una organización multidominio (finanzas, manufactura, cadena de suministro, adquisiciones), tener un catálogo que impone una nomenclatura y permisos consistentes a través de las capas de bronce, plata, oro y platino nos ahorró semanas de trabajo manual en políticas.

UI/UX: La experiencia en el notebook con Spark SQL y PySpark en línea, combinada con el navegador de archivos del espacio de trabajo, hace que sea sencillo para nuestro equipo desarrollar y probar transformaciones de manera iterativa. El editor SQL para consultas ad-hoc contra tablas de Unity Catalog es limpio y receptivo.

Integraciones: El soporte nativo de Delta Lake significa que no gestionamos conversiones de formato. La integración de Azure Key Vault a través de secret scopes (dbutils.secrets.get) mantiene las credenciales fuera del código. La integración de ADF para la orquestación en nuestro entorno V1 fue perfecta, y los Databricks Asset Bundles (DAB) para el despliegue V2 nos proporcionan un camino limpio de CI/CD con configuraciones databricks.yml dirigidas a dev/qa/prod sin necesidad de scripts personalizados.

Rendimiento: Cambiar a CTEs sobre vistas temporales en nuestros notebooks Gold redujo notablemente la presión de memoria del clúster. La capacidad de dimensionar adecuadamente los clústeres por entorno (1 trabajador para desarrollo, 3 para producción) con nodos Standard_D4ds_v5 mantiene los costos predecibles mientras se mantiene el rendimiento para nuestras cargas de trabajo ETL por lotes.

Precios/ROI: El modelo de computación de pago por uso combinado con clústeres en modo de seguridad de un solo usuario significa que no estamos sobreaprovisionando. Consolidar nuestra capa de ETL, gobernanza y servicio de BI en una sola plataforma eliminó la necesidad de licencias para herramientas separadas de catálogo, orquestación y calidad de datos.

AI/Inteligencia (Genie): Genie Spaces ha sido un éxito inesperado. Nuestros analistas de negocios en finanzas y cadena de suministro pueden hacer preguntas en lenguaje natural contra tablas Gold/Platinum curadas sin escribir SQL. Esto redujo el número de solicitudes de informes ad-hoc que llegaban al equipo de datos al proporcionar a los usuarios de dominio un camino de autoservicio que aún respeta los permisos de Unity Catalog.

Soporte/Integración: La documentación es exhaustiva, y el enfoque basado en habilidades para el aprendizaje (bundles, Unity Catalog, jobs, SQL) se adapta bien a cómo trabaja realmente nuestro equipo. Integrar nuevos ingenieros a la arquitectura V2 tomó aproximadamente la mitad del tiempo en comparación con V1 porque las convenciones de la plataforma (arquitectura medallion, asset bundles, nomenclatura de catálogo) están bien documentadas y son consistentes.

**¿Qué es lo que no le gusta de Databricks?**

UI/UX: El editor de cuadernos aún se siente atrasado en comparación con los IDE dedicados. No hay búsqueda nativa en múltiples archivos, soporte limitado para refactorización, y la interfaz de integración de git es torpe para equipos que gestionan docenas de cuadernos en paquetes de flujo de trabajo. Terminamos haciendo todo el desarrollo real en VS Code y tratando el espacio de trabajo de Databricks como un objetivo de implementación, lo que añade fricción. El navegador de archivos del espacio de trabajo tampoco maneja bien las estructuras de carpetas cuando tienes más de 50 cuadernos organizados por dominio, no hay filtrado, etiquetado o favoritos.

Integraciones: Los Databricks Asset Bundles (DAB) son un paso adelante, pero la documentación tiene lagunas para implementaciones complejas de múltiples paquetes. Ejecutamos un paquete compartido Global_Utilities del que dependen otros paquetes de flujo de trabajo, y lograr que las referencias entre paquetes funcionen de manera confiable en los objetivos de desarrollo/calidad/producción requirió mucho ensayo y error. La integración de ADF a Databricks funciona, pero depurar ejecuciones fallidas de pipelines significa saltar entre la interfaz de monitoreo de ADF y las ejecuciones de trabajos de Databricks sin una vista unificada. Un enlace más estrecho entre la orquestación y el monitoreo de cómputo ahorraría horas de solución de problemas.

Rendimiento: Los tiempos de inicio en frío de los clústeres siguen siendo un punto problemático para los flujos de trabajo de desarrollo. Iniciar un clúster de un solo nodo Standard_D4ds_v5 toma de 4 a 7 minutos, lo que rompe el flujo cuando estás iterando en la lógica del cuaderno. El cómputo sin servidor ayuda, pero aún no está disponible para todos los tipos de carga de trabajo, y la prima de costo es difícil de justificar para entornos de desarrollo/prueba.

Precios/ROI: El modelo de precios DBU es opaco para la planificación de capacidad. Estimar los costos mensuales para un proyecto con más de 30 trabajos programados, clústeres de desarrollo interactivo y consultas de almacén SQL requiere construir hojas de cálculo personalizadas porque las herramientas de gestión de costos integradas no te dan un pronóstico claro por flujo de trabajo o dominio. Nos hemos sorprendido por picos de costos de trabajos que duraron más de lo esperado sin una forma fácil de establecer alertas de presupuesto por trabajo.

Soporte/Integración: Los tiempos de respuesta del soporte empresarial son inconsistentes. Problemas críticos con los permisos de Unity Catalog durante nuestra migración tomaron de 3 a 5 días hábiles para el triaje inicial, lo que detuvo nuestra línea de tiempo de implementación. Los foros comunitarios son útiles para patrones comunes, pero para casos límite de Unity Catalog (linaje entre catálogos, herencia de permisos compleja), la base de conocimiento es escasa.

AI/Inteligencia: Genie es prometedor pero aún está en bruto para uso en producción. Tiene dificultades con uniones de más de 3-4 tablas, a veces genera SQL incorrecto contra nuestra capa Gold, y no hay una manera fácil de curar o corregir sus respuestas para mejorar la precisión con el tiempo. Nuestros usuarios empresariales se entusiasmaron, lo probaron, encontraron respuestas incorrectas en preguntas moderadamente complejas y perdieron confianza. Un bucle de retroalimentación donde los expertos en el dominio puedan marcar y corregir las salidas de Genie lo haría genuinamente listo para producción.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Fragmentación de Gobernanza de Datos → Catálogo Unificado

Luchábamos con un entorno de Hive Metastore donde la propiedad de las tablas, el control de acceso y el linaje se gestionaban a través de un mosaico de documentación manual y scripts personalizados. Después de implementar Unity Catalog, ahora tenemos una gobernanza centralizada a través de 4 capas de catálogo (bronce, plata, oro, platino) que abarcan 6 dominios de negocio. Lo que solía requerir un administrador de datos a tiempo completo para rastrear manualmente ahora se aplica automáticamente a través de permisos a nivel de catálogo y linaje. Esto redujo nuestro tiempo de provisión de acceso de días a menos de una hora por solicitud.

Lógica ETL Aislada → Arquitectura Medallion Estandarizada

Antes de Databricks, nuestras canalizaciones ETL eran inconsistentes: diferentes equipos escribían transformaciones de manera diferente, sin utilidades o patrones compartidos. Construimos un marco estandarizado (Batch_Utilities.py) con funciones reutilizables para validación de esquemas, operaciones de fusión, verificaciones de calidad de datos y gestión de columnas de auditoría. Cada notebook en todos los dominios ahora sigue la misma estructura de 7 celdas. Esto redujo el tiempo de desarrollo de nuevos notebooks de 2-3 días a aproximadamente 4 horas, y la incorporación de un nuevo desarrollador al patrón toma una sola tarde en lugar de una semana.

Fallos Costosos en la Actualización de Informes → Orquestación de Canalizaciones Confiable

Teníamos problemas recurrentes con informes de Power BI que extraían datos obsoletos o incompletos porque los trabajos previos fallaban silenciosamente. Con Databricks Jobs y el seguimiento de canalizaciones impulsado por metadatos (estado de la canalización, marcas de tiempo de inicio/fin registradas por ejecución), ahora detectamos fallos en la capa de transformación antes de que se propaguen a los informes. Los problemas de frescura de datos en los informes disminuyeron aproximadamente un 80%, y nuestro equipo de finanzas dejó de programar reuniones de "verificación de datos" que solían consumir 3-4 horas por semana.

Caos en el Despliegue Multi-Entorno → Paquetes de Activos

Desplegar notebooks a través de desarrollo, QA y producción solía implicar copias manuales de archivos y ediciones de configuración específicas del entorno, lo cual era propenso a errores y lento. Los Paquetes de Activos de Databricks nos dieron configuraciones declarativas databricks.yml con sustitución de variables por objetivo. Un despliegue que tomaba 45 minutos de pasos manuales ahora se ejecuta en menos de 5 minutos a través de CLI. Desplegamos con confianza porque la misma definición de paquete se valida antes de llegar a producción.

Brecha en Análisis de Autoservicio → Genie + Capa Platino

Los analistas de negocio en la cadena de suministro y finanzas dependían completamente del equipo de datos para cualquier análisis ad-hoc. Al construir tablas Platino desnormalizadas optimizadas para informes y exponerlas a través de Genie Spaces, habilitamos consultas de autoservicio en lenguaje natural. La adopción temprana ha reducido las solicitudes de informes ad-hoc al equipo de datos en aproximadamente un 30%, liberando capacidad de ingeniería para el desarrollo de nuevas características.

Visibilidad de Costos → Computación Dimensionada Correctamente

Estábamos sobreaprovisionando clústeres porque no teníamos una visión clara de la utilización real. Al estandarizar en nodos Standard_D4ds_v5 con conteos de trabajadores específicos por entorno (1 para desarrollo/QA, 3 para producción) y modo de seguridad de usuario único, redujimos nuestro gasto mensual en computación aproximadamente un 25% en comparación con el modelo de clúster compartido que ejecutábamos en V1.

**Official Response from Janelle Glover:**

> Agradecemos sus comentarios detallados sobre su experiencia con Databricks. Es genial saber que Unity Catalog, UI/UX, integraciones, rendimiento, Genie y soporte/incorporación han impactado positivamente en la migración de su empresa. Entendemos las áreas de mejora que ha mencionado y las tomaremos en consideración para futuras mejoras.

  ### 29. Databricks: Plataforma intuitiva y unificada con integraciones fluidas y soporte rápido

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sabareeswar K. | Data Engineer, Empresa (> 1000 empleados)

**Reviewed Date:** April 01, 2026

**¿Qué es lo que más le gusta de Databricks?**

Como ingeniero de datos, Databricks se ha convertido en mi plataforma preferida para el trabajo de datos de principio a fin. La facilidad de uso es sobresaliente: los cuadernos, Delta Live Tables y Genie tienen interfaces intuitivas que reducen significativamente el tiempo de adaptación. La implementación fue fluida gracias a la excelente documentación y al soporte al cliente receptivo que realmente resuelve los problemas rápidamente. Lo uso a diario, y la gran cantidad de características, desde Unity Catalog hasta AI/BI Genie, sigue creciendo. La integración con el almacenamiento en la nube, las herramientas de BI y los marcos de ML es perfecta, lo que lo convierte en una verdadera plataforma unificada.

**¿Qué es lo que no le gusta de Databricks?**

Un desafío es la falta de transparencia de costos a nivel granular de trabajo; es difícil identificar exactamente qué pipeline o notebook está aumentando el consumo de DBU sin invertir en monitoreo personalizado. Los clústeres de escalado automático, aunque poderosos, pueden aumentar los costos silenciosamente de la noche a la mañana si no se configuran cuidadosamente con límites adecuados. Además, los niveles del almacén SQL pueden ser confusos para elegir desde el principio, lo que hace que la planificación del presupuesto sea complicada para los equipos. Un panel de asignación de costos incorporado por trabajo o usuario sería una gran mejora para la gestión diaria de costos.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks ha eliminado los silos entre nuestros equipos de ingeniería de datos, análisis y ML. Anteriormente, manejábamos múltiples herramientas para la ingestión, transformación e informes. Ahora todo vive en un solo "lakehouse". Genie, específicamente, ha sido un cambio radical: los interesados en el negocio pueden hacer preguntas en lenguaje natural directamente sobre nuestros datos sin escribir SQL, lo que reduce drásticamente los cuellos de botella de solicitudes ad-hoc para nuestro equipo de ingeniería. La toma de decisiones es más rápida, los datos están más democratizados y hemos reducido significativamente los costos generales de nuestra canalización de informes.

**Official Response from Janelle Glover:**

> Es genial saber que Databricks ha ayudado a eliminar los silos entre tus equipos de ingeniería de datos, análisis y ML. Nos complace que Genie haya sido un cambio de juego para tus partes interesadas del negocio. También entendemos los desafíos que has mencionado con respecto a la transparencia de costos y la autoescalación de clústeres. Continuamente estamos trabajando para mejorar nuestra plataforma y tomaremos en cuenta tus sugerencias para futuras mejoras.

  ### 30. Databricks hace que los flujos de trabajo de datos de extremo a extremo sean rápidos, colaborativos y fáciles.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Karuppusamy V. | Technical Lead, Empresa (> 1000 empleados)

**Reviewed Date:** March 31, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es cómo simplifica todo el flujo de trabajo de datos. En lugar de cambiar entre múltiples herramientas para el procesamiento de datos, análisis y aprendizaje automático, todo está disponible en un solo lugar. El entorno de cuadernos hace que la colaboración sea realmente fluida, se siente natural trabajar con compañeros de equipo, compartir código y explicar la lógica sin esfuerzo adicional.

Otra cosa que aprecio es el rendimiento. Trabajar con grandes conjuntos de datos suele ser doloroso, pero Databricks lo maneja eficientemente en segundo plano. No tienes que preocuparte mucho por gestionar clústeres u optimizar todo manualmente, simplemente funciona la mayor parte del tiempo, lo que te permite concentrarte más en resolver el problema real en lugar de lidiar con la infraestructura.

Lo que también destaca es la forma en que maneja la gobernanza y organización de datos. Con características como el control de acceso centralizado y una mejor visibilidad del uso de datos, se vuelve mucho más fácil gestionar los datos de manera responsable, especialmente en proyectos más grandes. En general, ofrece un buen equilibrio entre potencia y facilidad de uso, por lo que disfruto trabajar con él.

**¿Qué es lo que no le gusta de Databricks?**

Una cosa que no me gusta particularmente de Databricks es que puede volverse caro bastante rápido, especialmente si los clústeres no se gestionan adecuadamente. Si olvidas terminar los clústeres o ejecutas cargas de trabajo pesadas sin optimización, los costos pueden aumentar sin mucha visibilidad al principio. Para los equipos que aún están aprendiendo o experimentando, esto puede convertirse en una preocupación.

Otro inconveniente es que la depuración a veces puede parecer un poco complicada, particularmente cuando se trabaja con trabajos distribuidos. Los errores no siempre son directos, y rastrear problemas a través de múltiples nodos puede llevar más tiempo en comparación con trabajar en un entorno local más simple. Requiere un cierto nivel de experiencia para entender y solucionar problemas rápidamente.

Además, aunque la plataforma es poderosa, tiene una curva de aprendizaje para los principiantes. Conceptos como la configuración de clústeres, la programación de trabajos y la gobernanza de datos no siempre son muy intuitivos al principio. Se necesita algo de tiempo práctico antes de sentirse completamente cómodo navegando y usando todo de manera eficiente.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Lo que Databricks realmente resuelve es el problema de manejar datos a gran escala sin hacer que el proceso sea demasiado complejo. Anteriormente, trabajar con big data significaba lidiar con múltiples herramientas, gestionar infraestructura y gastar mucho tiempo solo en configurar las cosas. Databricks simplifica todo eso al reunir la ingeniería de datos, la analítica y el aprendizaje automático en un solo lugar, por lo que el enfoque se desplaza más hacia resolver problemas de negocio reales en lugar de gestionar sistemas.

También aborda problemas de rendimiento y escalabilidad. Al trabajar con grandes volúmenes de datos, los sistemas tradicionales a menudo tienen dificultades o se ralentizan. Databricks maneja esto de manera eficiente en segundo plano, permitiendo que las cargas de trabajo escalen sin mucho esfuerzo manual. Para mí, esto significa que puedo procesar grandes conjuntos de datos más rápido y ejecutar transformaciones o consultas sin preocuparme constantemente por la optimización del rendimiento.

Otro gran problema que resuelve es la colaboración y gestión de datos. En muchos proyectos, los equipos luchan con el control de versiones, la gestión de accesos y mantener los datos consistentes. Databricks facilita la colaboración, el seguimiento de cambios y el control de quién puede acceder a qué. Esto me ayuda a trabajar más fluidamente con otros, reduce errores y asegura que los datos que estoy usando sean confiables y estén bien gestionados.

**Official Response from Janelle Glover:**

> Nos alegra saber que considera que Databricks es una plataforma completa y eficiente para gestionar flujos de trabajo de datos. Entendemos sus preocupaciones sobre la gestión de costos y la curva de aprendizaje para principiantes, y compartiremos sus comentarios con nuestro equipo para una revisión más detallada.

  ### 31. Databricks unifica datos, análisis y ML para flujos de trabajo escalables en Lakehouse

**Rating:** 5.0/5.0 stars

**Reviewed by:** Harshavarthini G. | Data Architect, Empresa (> 1000 empleados)

**Reviewed Date:** March 31, 2026

**¿Qué es lo que más le gusta de Databricks?**

Databricks es especialmente útil porque reúne la ingeniería de datos, la analítica y el aprendizaje automático en una única plataforma unificada, lo que reduce la necesidad de gestionar múltiples herramientas separadas. Construido sobre Apache Spark, puede procesar conjuntos de datos masivos rápidamente y escalar sin problemas a medida que crecen las cargas de trabajo, lo que lo convierte en una opción sólida para casos de uso de big data. También admite cuadernos colaborativos donde los equipos pueden trabajar juntos en lenguajes como Python y SQL, lo que facilita la colaboración efectiva entre científicos de datos e ingenieros.

Con su arquitectura de lakehouse impulsada por Delta Lake, Databricks combina la flexibilidad de los data lakes con la fiabilidad de los data warehouses, ayudando a garantizar una mejor consistencia y rendimiento de los datos. Además, se integra con herramientas como MLflow para agilizar el ciclo de vida del aprendizaje automático de principio a fin, desde la experimentación hasta el despliegue. En general, Databricks simplifica los flujos de trabajo de datos complejos, mejora el rendimiento y ayuda a las organizaciones a construir soluciones escalables de datos e inteligencia artificial de manera más eficiente.

**¿Qué es lo que no le gusta de Databricks?**

Databricks sí tiene algunas limitaciones, aunque muchas de ellas se sienten más como compensaciones que como aspectos negativos absolutos. Un inconveniente frecuentemente citado es el costo: aunque la plataforma es flexible y escalable, los gastos pueden aumentar rápidamente si los clústeres no se gestionan con cuidado. Al mismo tiempo, ese costo a menudo refleja su capacidad para manejar cargas de trabajo muy grandes de manera eficiente cuando está debidamente optimizada.

Otra consideración es la curva de aprendizaje, especialmente para los principiantes que no están familiarizados con Apache Spark o los sistemas distribuidos. Esa complejidad puede ser un desafío al principio, pero también viene con el beneficio de capacidades poderosas una vez que te sientes cómodo con ella. Algunos usuarios también encuentran que la depuración y la optimización del rendimiento son menos directas que con herramientas más simples; sin embargo, Databricks ofrece características detalladas de monitoreo y optimización que pueden facilitar estas tareas con el tiempo.

Finalmente, debido a que es una plataforma gestionada, puede haber una sensación de control reducido en comparación con los sistemas completamente autogestionados. A cambio, elimina gran parte de la carga operativa que conlleva la gestión de infraestructura. En general, aunque estas áreas pueden ser vistas como los aspectos "menos útiles", a menudo se equilibran con la escalabilidad, integración y ganancias de productividad de la plataforma.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks ayuda a resolver el desafío de los datos fragmentados y los flujos de trabajo desconectados a través de múltiples verticales de negocio al proporcionar una plataforma unificada de lakehouse. En mi rol como ingeniero de datos, esto me permite consolidar datos de diferentes fuentes en un sistema único y confiable utilizando Apache Spark para un procesamiento escalable y Delta Lake para asegurar la calidad y consistencia de los datos. Esto reduce significativamente la complejidad de las canalizaciones, mejora la fiabilidad y permite una entrega más rápida de datos limpios y gobernados a los equipos posteriores. Como resultado, puedo apoyar casos de uso de análisis y aprendizaje automático de manera más eficiente mientras minimizo la sobrecarga operativa y mejoro la productividad general en toda la organización.

**Official Response from Janelle Glover:**

> Gracias por compartir sus experiencias positivas con Databricks. Es genial escuchar que la capacidad de la plataforma para reunir ingeniería de datos, análisis y aprendizaje automático en una única plataforma unificada está beneficiando a su organización. Entendemos las compensaciones y desafíos que ha mencionado, y estamos trabajando continuamente en estas partes de nuestra plataforma.

  ### 32. Databricks simplifica el ETL de extremo a extremo con Unity Catalog y depuración impulsada por IA.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Dinesh Sundar S. | Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 30, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que me llama la atención es cómo Databricks simplifica el ciclo de vida ETL de principio a fin. La integración constante de nuevas funciones en la plataforma ha reducido notablemente la fricción de ingerir datos de una amplia gama de sistemas fuente.

Unity Catalog (UC) también ha sido un cambio radical para la administración de datos. Ofrece una capa de gobernanza centralizada y robusta que hace que gestionar entornos complejos se sienta mucho más intuitivo y fácil de controlar.

Estoy especialmente impresionado por las recientes actualizaciones impulsadas por IA. Genie Code se ha convertido en una parte esencial de mi flujo de trabajo; ha mejorado drásticamente mi velocidad de depuración y ya está demostrando ser un activo valioso en mi proyecto actual de migración de UC. En general, la forma en que Databricks combina la ingeniería de datos tradicional con la inteligencia asistida se siente genuinamente innovadora.

**¿Qué es lo que no le gusta de Databricks?**

Aunque Auto Loader es potente, todavía existen brechas notables en el Lakehouse Data Pipeline (LDP) en torno a la inferencia de esquemas. Actualmente, cuando se habilita inferSchema, el esquema inferido solo se aplica al primer nivel de la jerarquía. En conjuntos de datos complejos con campos multinivel, la falta de inferencia de esquemas profundos crea una carga manual y hace que las canalizaciones de CDC en streaming sean más difíciles de construir y mantener.

Lakeflow Connect parece un paso en la dirección correcta, pero la biblioteca de conectores nativos aún parece incompleta en comparación con algunos competidores. Y aunque las características de IA (como Genie) son prometedoras y realmente interesantes, todavía parecen estar en una etapa de "desarrollo", a veces careciendo de la consistencia necesaria para entornos de producción de alto riesgo. Me gustaría ver que estas capacidades evolucionen de "extras innovadores" a herramientas endurecidas y listas para producción.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

El Problema: Silos de Datos y Operaciones de Soporte Ineficientes
En muchas organizaciones, el conocimiento institucional crítico termina disperso en sistemas desconectados como MySQL (estructurado), Jira (transaccional) y Confluence (no estructurado). Cuando la información está fragmentada de esta manera, los equipos de soporte luchan por encontrar respuestas rápidas y precisas para los tickets entrantes. El resultado es un MTTR (Tiempo Medio de Resolución) más alto y mucho esfuerzo manual y repetitivo.

La Solución: Una "Plataforma de Inteligencia" Unificada
Databricks aborda esto sirviendo como un tejido único que conecta estos silos. En mi trabajo, me enfoco en usar el Pipeline de Datos Lakehouse (LDP) para ingerir y unificar estas diferentes fuentes en un entorno gobernado.

Cómo beneficia esto a mi proyecto:
Uso Databricks para una ingesta sin problemas, centralizando datos de MySQL, Jira y Confluence para construir una "Base de Conocimiento" integral sin tener que gestionar múltiples herramientas ETL dispares.

También confío en la integración nativa de IA. Con la Búsqueda Vectorial de Mosaic AI, puedo convertir los datos unificados en incrustaciones directamente dentro de la plataforma, lo que me permite construir un Agente de Automatización de IA para nuestro sistema de tickets.

Finalmente, soporta la solución automatizada. El agente puede ejecutar coincidencias vectoriales en los tickets recién creados contra toda la base de conocimiento histórica y luego proponer soluciones precisas y conscientes del contexto a los ingenieros de inmediato.

El Impacto
El mayor beneficio para nosotros es la velocidad operativa. Databricks ha transformado nuestros datos de un archivo pasivo a un motor "inteligente" activo. Reduce el tiempo dedicado a la investigación manual y nos ayuda a automatizar la primera línea de soporte, mejorando la precisión de las resoluciones de tickets mientras disminuye la carga sobre nuestros equipos técnicos.

**Official Response from Janelle Glover:**

> ¡Gracias por compartir su experiencia positiva con Databricks! Nos alegra saber que la simplificación del ciclo de vida ETL de extremo a extremo de nuestra plataforma y el Unity Catalog han sido revolucionarios para su administración de datos. Agradecemos sus comentarios sobre las actualizaciones impulsadas por IA y estamos encantados de escuchar que Genie ha mejorado su flujo de trabajo. Estamos comprometidos a mejorar continuamente nuestra plataforma para ofrecer una experiencia innovadora a nuestros usuarios.

  ### 33. Rápido, sin interrupciones, Databricks para canalizaciones de Big Data y análisis en un solo lugar

**Rating:** 4.5/5.0 stars

**Reviewed by:** Demetrius A. | Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 31, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es lo rápido y conectado que está todo. Comparado con otras plataformas, maneja grandes flujos de datos sin esfuerzo. Pero la mejor parte es lo fácil que es usar esos datos una vez procesados. Ya sea que necesite construir un panel de análisis rápido o entrenar modelos de aprendizaje automático personalizados específicos para nuestros datos, todo se conecta sin problemas. Simplemente elimina el dolor de cabeza de mover datos y te permite hacer todo en un solo lugar.

**¿Qué es lo que no le gusta de Databricks?**

Si tuviera que elegir lo que no me gusta, principalmente se reduce al costo y a lo complejo que puede ser.

Primero, puede volverse caro muy rápidamente. Si no tienes cuidado al gestionar tus clústeres de computación y apagarlos cuando terminas, las facturas pueden acumularse.

Segundo, a veces puede parecer excesivo para tareas más simples. Dado que está diseñado para manejar grandes cantidades de datos, tener que revisar complicados registros de errores cuando algo falla puede ser un verdadero dolor de cabeza en comparación con usar herramientas más ligeras.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

El principal problema que Databricks me ayuda a resolver en mi negocio es el rendimiento. Solíamos esperar horas para que las canalizaciones se ejecutaran en ADF, y ahora podemos terminarlas en minutos.

**Official Response from Janelle Glover:**

> Estamos encantados de saber que encuentras Databricks rápido y fluido para manejar grandes flujos de datos y análisis. Entendemos tus preocupaciones sobre el costo y la complejidad, y estamos trabajando continuamente para optimizar estos aspectos de nuestra plataforma para abordar estos desafíos.

  ### 34. Plataforma unificada de ML que elimina la fricción de infraestructura

**Rating:** 5.0/5.0 stars

**Reviewed by:** Hirlekha M. | AI/ ML Technical Lead, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 30, 2026

**¿Qué es lo que más le gusta de Databricks?**

La experiencia de plataforma unificada es realmente difícil de superar: tener MLflow para el seguimiento de experimentos, Unity Catalog para la gobernanza, búsqueda vectorial y endpoints sin servidor, todo en un solo lugar, elimina mucha fricción de infraestructura. Las canalizaciones de ingeniería de características y el despliegue de modelos se sienten cohesivos en lugar de estar ensamblados. El flujo de trabajo híbrido de almacén SQL + cuaderno también facilita la transferencia entre el trabajo de ingeniería de datos y ML sin cambiar de herramientas de contexto.

**¿Qué es lo que no le gusta de Databricks?**

Los endpoints sin servidor tienen algunos bordes afilados: la inicialización del contexto de Spark se comporta de manera diferente que en los clústeres interactivos, lo que puede causar fallos silenciosos si no tienes cuidado sobre dónde inicializas las cosas. La latencia de inicio en frío en los servicios sin servidor también es notable para los endpoints de producción con poco tráfico. La documentación sobre algunas de las características más nuevas (como las configuraciones de índices de búsqueda vectorial) tiende a quedarse atrás respecto al comportamiento real del producto, por lo que terminas haciendo muchas pruebas y errores.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Utilizamos Databricks para consolidar el desarrollo de modelos de ML, la ingeniería de características y el despliegue para una plataforma de tarjetas y pagos, trabajo que anteriormente requería manejar herramientas separadas para el procesamiento de datos, el entrenamiento y el servicio. El entorno unificado significa que nuestros ingenieros de ML pueden pasar de datos de transacciones en bruto a un modelo de predicción de abandono desplegado sin salir de la plataforma. El seguimiento de MLflow mantiene los experimentos reproducibles, y Unity Catalog nos proporciona la historia de gobernanza de datos que nuestro cliente bancario necesita. Ha reducido una cantidad significativa de la coordinación adicional que viene con las canalizaciones de ML de múltiples herramientas.

**Official Response from Janelle Glover:**

> Es genial escuchar cómo Databricks ha optimizado tus flujos de trabajo de ML y reducido la sobrecarga de coordinación. Agradecemos tus comentarios sobre los endpoints sin servidor y la documentación, y nos esforzaremos por abordar estos problemas para mejorar tu experiencia con nuestra plataforma.

  ### 35. Lakebase: Impulsando los datos y la inteligencia artificial juntos

**Rating:** 5.0/5.0 stars

**Reviewed by:** Ajay P. | Manager - Data, AI &amp; Automation, Pequeña Empresa (50 o menos empleados)

**Reviewed Date:** September 08, 2024

**¿Qué es lo que más le gusta de Databricks?**

Utilizo Lakebase dentro de Databricks como la base para nuestras soluciones de IA, donde los modelos de datos y las aplicaciones funcionan juntos sin problemas. Lakebase proporciona una única base de datos unificada para construir IA directamente sobre datos consistentes y en tiempo real. También me gusta Agent Bricks en Databricks porque nos ayuda a construir rápidamente agentes de IA inteligentes y automatizar flujos de trabajo utilizando esos datos. La facilidad de configuración fue una gran ventaja para nosotros, ya que fue muy fácil comenzar.

**¿Qué es lo que no le gusta de Databricks?**

Agentbricks necesita más integración nativa para reducir la configuración manual y acelerar la automatización del flujo de trabajo.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks - Lakebase nos ayuda a unir datos e inteligencia artificial en una sola plataforma, reduciendo la complejidad y evitando movimientos de datos. Agent Bricks nos permite construir rápidamente agentes de inteligencia artificial inteligentes y automatizar flujos de trabajo utilizando datos en tiempo real.

**Official Response from Jess Darnell:**

> Estamos encantados de saber que encuentras Lakebase fácil de usar y lleno de características para desarrollar pipelines de datos e inteligencia artificial. Es genial saber que ha sido útil en la implementación de GenAI y en la integración con diferentes fuentes a través de LakeFlow.

  ### 36. De 1 Hora a 10 Minutos: Cómo Databricks Modernizó Nuestro Flujo de Trabajo

**Rating:** 4.5/5.0 stars

**Reviewed by:** Mukundan R. | Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 30, 2026

**¿Qué es lo que más le gusta de Databricks?**

Solíamos usar ADF para obtener datos de SQL Server y luego trabajarlos en Databricks antes de ponerlos en Salesforce. Todo el proceso tomaba más de una hora porque ADF añadía trabajo extra. 
Ahora todo sucede dentro de Databricks. Transformamos los datos en bruto en Databricks y los ponemos en Salesforce todo en un solo lugar. Esto ha hecho que todo el proceso sea mucho más rápido, ahora toma 10 minutos. Eso es una mejora respecto a lo que teníamos con ADF.
Delta Lake también ha sido realmente útil. Nos ayuda a llevar un registro de los cambios y volver atrás si algo sale mal. Podemos ver qué pasó antes. Corregir errores fácilmente.
Delta Lake también se asegura de que los datos sean buenos antes de entrar en la canalización. Evita que los datos entren y causen problemas más adelante en Salesforce. Esto hace que todo el proceso sea más confiable y fácil de manejar.

**¿Qué es lo que no le gusta de Databricks?**

Databricks es realmente bueno en lo que hace. A veces lleva un tiempo poner en marcha el clúster. La interfaz de usuario es lenta a veces. Esto puede ser molesto cuando tenemos prisa por hacer las cosas para Salesforce. Los conectores de Salesforce en Databricks pueden ser un poco complicados de manejar. A menudo necesitan ser configurados correctamente y no funcionan como esperamos. Esto significa que tenemos que trabajar cuando intentamos resolver problemas o vigilar las canalizaciones en Databricks para Salesforce.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Está resolviendo nuestros problemas de rendimiento y fiabilidad, permitiéndonos extraer, transformar y cargar los datos en Salesforce todo en un solo lugar sin ADF. Este flujo de trabajo unificado ha reducido nuestro tiempo de ejecución de 1 hora a 10 minutos, dándonos una finalización de trabajos más rápida y actualizaciones de datos de Salesforce a tiempo. Con características de delta lake como transacciones ACID y viaje en el tiempo, nuestros datos son más precisos y más fáciles de recuperar cuando algo sale mal.

**Official Response from Janelle Glover:**

> Nos alegra saber que Databricks ha podido mejorar significativamente su flujo de trabajo al reducir el tiempo de ejecución. Es genial saber que Delta Lake ha sido útil para mantener la precisión de los datos y proporcionar opciones de recuperación más fáciles. Entendemos sus preocupaciones sobre el tiempo de configuración del clúster y la velocidad de la interfaz de usuario, así como los desafíos con los conectores de Salesforce. Agradecemos sus comentarios y los compartiremos con nuestro equipo para futuras mejoras.

  ### 37. Databricks: Rico en funciones, fácil de usar y mantiene todo en una sola plataforma

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sivabalan A. | Technical Lead - Data Engineering, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 27, 2026

**¿Qué es lo que más le gusta de Databricks?**

Entre las diversas plataformas con las que he trabajado, Databricks destaca como un entorno genuinamente cohesivo. Se siente menos como un conjunto de características desconectadas y más como un espacio de trabajo unificado, uno que puede evolucionar junto con los equipos que lo utilizan. La interfaz es lo suficientemente intuitiva como para reducir la barrera de entrada, al tiempo que ofrece la profundidad y el poder necesarios para la ingeniería de alto rendimiento.

Una de sus mayores fortalezas es cómo consolida el ciclo de vida de los datos. Al reunir la ingeniería, la ciencia de datos y la analítica SQL bajo un mismo techo, ayuda a disolver los silos que a menudo conducen a la "deriva de datos" y la falta de comunicación entre departamentos. En la práctica, también simplifica la infraestructura subyacente, reemplazando una docena de herramientas especializadas (y a veces conflictivas) con una única y más clara fuente de verdad.

Más allá de simplemente "mantener las cosas limpias", la plataforma también brilla cuando se trata de transparencia colaborativa. Con cuadernos y experimentos compartidos en tiempo real, la brecha entre una idea inicial de datos y un modelo listo para producción puede acortarse drásticamente. Además, su compromiso con estándares abiertos como Delta Lake significa que no estás encerrado en una caja negra propietaria, sino que estás construyendo sobre una base que se alinea con la dirección de la comunidad de datos en general. En general, logra un equilibrio raro: un envoltorio pulido y fácil de usar alrededor de algunos de los motores de computación distribuida más poderosos disponibles hoy en día.

**¿Qué es lo que no le gusta de Databricks?**

Desglose de la "Gran Tarea"

Cuando Genie procesa un gran volumen de datos, a menudo termina enviando una gran cantidad de JSON de vuelta al navegador para que pueda renderizar esas tablas y visualizaciones.

Sobrecarga de memoria: Los navegadores (y especialmente Chrome) pueden ser verdaderos devoradores de memoria. Si una respuesta de Genie incluye un conjunto de resultados muy grande o un plan de ejecución masivo, el uso de RAM puede aumentar rápidamente, lo que puede llevar a ese familiar "No responde".

El retraso del "DOM": Cada fila en una tabla y cada línea de código se convierte en un elemento que el navegador tiene que seguir. A medida que desplazas o escribes, el navegador tiene que repintar miles de estos elementos. Cuando la tarea es demasiado grande, el hilo principal del navegador puede quedar ocupado renderizando, y tu escritura comienza a sentirse como si estuviera retrasada por unos segundos.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Has captado la razón principal por la que Databricks está ganando a tantos equipos de datos: están reduciendo el "impuesto de integración". En la mayoría de las empresas, puedes perder fácilmente alrededor del 30% de tu tiempo solo moviendo datos entre la herramienta de "almacenamiento", la herramienta de "procesamiento" y la herramienta de "BI".

El Panel de Control de AI/BI es un gran ejemplo de este cambio más amplio: de una "colección de herramientas" a una plataforma más unificada.

Lo que comenzó como una capa básica de visualización ha evolucionado en un sistema de "AI Compuesta". Así es como se ha vuelto tan útil:

La integración "Ask Genie": Ya no estás limitado a mirar un gráfico estático. A partir de 2026, cada panel publicado incluye un botón "Ask Genie" por defecto. Si un interesado nota un pico en un gráfico de líneas, no tiene que llamarte; puede hacer clic derecho en el gráfico y preguntar, "Genie, ¿por qué bajó esto el martes?" y usará el modo Agente para rastrear la causa.

Velocidad directa al almacén: Como vive dentro de Databricks, no hay necesidad de "extraer" datos a un servidor BI separado. Consulta los datos donde ya viven (Unity Catalog), lo que significa que el panel se mantiene tan fresco como tu última ejecución de ETL.

Creación asistida por AI: Puedes construir widgets enteros solo describiendo lo que quieres. En lugar de arrastrar campos, puedes escribir, "Muéstrame un gráfico de embudo de nuestra conversión de ventas por región," y genera el SQL y la visualización por ti.

Gobernanza profunda: Dado que está integrado, tus políticas de seguridad (seguridad a nivel de fila, etiquetas) siguen automáticamente los datos. No tienes que recrear permisos en una herramienta separada como Tableau o Power BI.

**Official Response from Janelle Glover:**

> Gracias por destacar los beneficios de Databricks en la reducción del 'impuesto de integración' y la optimización del movimiento de datos entre herramientas de almacenamiento, procesamiento y BI. Nos complace escuchar cómo el Panel de Control de AI/BI y Genie han sido valiosos al proporcionar velocidad directa al almacén y autoría asistida por IA.

  ### 38. Código Genie de Databricks - IA Aplicada Agente para el ciclo de vida SDL de extremo a extremo

**Rating:** 4.5/5.0 stars

**Reviewed by:** Senthil K. | Senior Cloud Solution Architect - Accenture Data &amp; AI (Applied Intelligence), Empresa (> 1000 empleados)

**Reviewed Date:** October 03, 2023

**¿Qué es lo que más le gusta de Databricks?**

Código Genie

1) El Código Genie automatizó nuestros procesos ETL, reduciendo el esfuerzo manual y aumentando la eficiencia. Con el SDL de Agentic, implementamos pipelines de CI/CD para actualizaciones y despliegues más rápidos y fluidos.

2) El Código Genie simplificó los complejos mapeos STTM, mejorando la precisión y la velocidad. Las actualizaciones en tiempo real de Agentic aseguraron que los ajustes de mapeo se realizaran dinámicamente para alinearse con los datos de transacciones cambiantes.

3) Definimos pruebas unitarias automatizadas usando SKILL.md, asegurando que las transformaciones de datos se validen antes del despliegue. Esto redujo errores y aseguró la calidad de los datos, aumentando la confianza en nuestros análisis.

4) Usando Skills.md, añadimos extensiones personalizadas al Código Genie, como la integración de datos de terceros para informes enriquecidos. Esta agilidad nos permitió adaptarnos rápidamente a las necesidades del negocio y ofrecer nuevas capacidades.

5) El SDL de Agentic permitió el procesamiento de datos en tiempo real, proporcionando análisis inmediatos para la toma de decisiones. Nuestros equipos de marketing y ventas ahora actúan sobre datos frescos al instante, mejorando los tiempos de respuesta y la eficiencia general.

**¿Qué es lo que no le gusta de Databricks?**

Espero que pueda mejorarse en la próxima actualización -

La depuración de problemas en flujos de trabajo complejos puede consumir mucho tiempo debido a la visibilidad limitada en las transformaciones de datos intermedias.

Genie Code carece de mecanismos avanzados de recuperación de errores, lo que dificulta la gestión de fallos en tuberías de datos a gran escala.

A medida que aumenta el volumen de datos, el rendimiento de Genie Code puede degradarse, requiriendo ajustes manuales significativos para asegurar un funcionamiento fluido a gran escala.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

1) Procesamiento escalable: Construido sobre la arquitectura basada en Spark de Databricks, Genie Code maneja y escala eficientemente el procesamiento de conjuntos de datos masivos, asegurando el rendimiento incluso con volúmenes de datos crecientes.

2) Genie Code automatiza los flujos de trabajo ETL de extremo a extremo, desde la extracción de datos hasta la transformación y carga, agilizando las operaciones de datos y eliminando tareas manuales.

3) Colaboración en tiempo real: Genie Code permite la colaboración en tiempo real entre equipos mediante el uso de cuadernos compartidos, facilitando que los profesionales de datos construyan y refinen flujos de trabajo colectivamente.

**Official Response from Aunalisa Arellano:**

> Es genial saber que la Plataforma de Inteligencia de Datos de Databricks te está ayudando con la plataforma unificada de lakehouse, la orquestación de flujos de trabajo, las integraciones y el intercambio de datos. Estamos comprometidos a proporcionar soluciones que satisfagan las necesidades de tu negocio.

  ### 39. Plataforma Unificada de Databricks: SQL Rápido, Canalizaciones Simplificadas y IA Consciente del Contexto

**Rating:** 5.0/5.0 stars

**Reviewed by:** Deeraj R. | Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 27, 2026

**¿Qué es lo que más le gusta de Databricks?**

La experiencia de plataforma unificada es lo que me mantiene en Databricks. Tener cuadernos, pipelines, almacenes SQL, ML y gobernanza todo en un solo lugar bajo Unity Catalog significa que no estoy constantemente uniendo cinco herramientas diferentes solo para hacer el trabajo.

Lakeflow Pipelines (anteriormente DLT) hace que sea sencillo construir pipelines de arquitectura medallón, y el motor Photon ofrece verdaderas mejoras de rendimiento en cargas de trabajo SQL sin requerir cambios de código. Incorporaciones recientes como Genie Code y agentes en segundo plano también demuestran que se toman en serio la IA agentiva; no se siente como un copiloto añadido, porque realmente puede entender el contexto de tus datos a través de Unity Catalog. La computación sin servidor ha sido otra gran mejora en la calidad de vida también, ya que ya no tengo que esperar a que se inicie un clúster cuando solo quiero ejecutar consultas rápidas y ad hoc.

**¿Qué es lo que no le gusta de Databricks?**

La gestión de costos puede ser complicada: los DBUs se acumulan rápidamente si no tienes cuidado con el tamaño de los clústeres y la autoescalación del almacén. El modelo de precios tampoco siempre es transparente, especialmente cuando mezclas computación sin servidor y clásica.

Unity Catalog es poderoso, pero la configuración inicial y la migración desde el HMS heredado pueden ser dolorosas, particularmente para organizaciones grandes con años de objetos de metastore de Hive existentes. La documentación generalmente es buena, aunque a veces va por detrás de los nuevos lanzamientos de funciones. Además, la interfaz de usuario del espacio de trabajo puede sentirse lenta a veces, especialmente cuando trabajas con un gran número de activos.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Antes de Databricks, nuestra pila de datos estaba fragmentada: herramientas separadas para ETL, análisis, ML y gobernanza. Eso significaba cambios constantes de contexto, datos duplicados y brechas en la gobernanza. Databricks consolida todo eso en una sola plataforma de lakehouse. Delta Lake nos ofrece transacciones ACID confiables en el lago de datos, Unity Catalog maneja el linaje y el control de acceso en toda la plataforma, y los almacenes SQL permiten que nuestros analistas se sirvan por sí mismos sin necesidad de un producto de almacén de datos separado. Ha reducido significativamente nuestro tiempo de desarrollo de pipelines y ha hecho que la gobernanza de datos sea algo que realmente podemos hacer cumplir de manera consistente en lugar de esperar lo mejor.

**Official Response from Janelle Glover:**

> Nos alegra saber que estás disfrutando de la experiencia de la plataforma unificada y encontrando valor en Lakeflow Pipelines, el motor Photon y el Código Genie. Entendemos tus preocupaciones sobre la gestión de costos y la transparencia en los precios, así como los desafíos con la configuración inicial y la interfaz de usuario del espacio de trabajo. Tus comentarios son valiosos y se compartirán con nuestro equipo para futuras mejoras.

  ### 40. Plataforma Todo-en-Uno de Databricks con Gobernanza Fuerte, Rendimiento Rápido de Spark y Genie

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sabareeswara S. | Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 27, 2026

**¿Qué es lo que más le gusta de Databricks?**

La plataforma todo en uno elimina la dispersión de herramientas. Unity Catalog te ofrece gobernanza, linaje y capacidad de descubrimiento sin tener que añadir un catálogo separado. La interfaz de usuario del cuaderno es limpia y facilita la iteración en PySpark rápidamente. Genie es la característica destacada de IA que convierte tablas curadas en interfaces de lenguaje natural para usuarios de negocios, y el SDK te permite configurarlo programáticamente para que se mantenga sostenible. DLT maneja bien la orquestación de pipelines. El rendimiento en cargas de trabajo de Spark es sólido, especialmente con Photon. Las integraciones con Airflow, S3 y el ecosistema en general son sencillas. En cuanto al ROI, consolidar lo que antes requería múltiples herramientas en una sola plataforma se paga solo en la reducción de la complejidad.

**¿Qué es lo que no le gusta de Databricks?**

Predecir los precios puede ser difícil. Los costos de cómputo escalan rápidamente si no tienes cuidado con el tamaño del clúster y la selección de SKU, y no siempre es obvio qué nivel de carga de trabajo realmente necesitas hasta que ves la factura. El IDE de cuadernos, aunque funcional, todavía se queda atrás de un editor real para la refactorización, la navegación entre múltiples archivos y los flujos de trabajo de revisión de código.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

La consolidación de herramientas es la más importante. Antes, necesitarías sistemas separados para la ingestión, transformación, almacenamiento, gobernanza y servicio, cada uno con su propia curva de aprendizaje, sobrecarga de mantenimiento y problemas de integración. Databricks colapsa eso en una sola plataforma. Unity Catalog resuelve el problema de la gobernanza de datos al proporcionarte linaje, control de acceso y capacidad de descubrimiento en un solo lugar en lugar de gestionar permisos a través de sistemas desconectados.

**Official Response from Janelle Glover:**

> ¡Gracias por compartir su experiencia positiva con Databricks! Nos alegra saber que encuentra útiles Delta Live Tables, Unity Catalog y Genie. También agradecemos sus comentarios sobre los precios y compartiremos sus observaciones con nuestro equipo.

  ### 41. Databricks sigue eliminando fricciones con una gobernanza sólida y herramientas de IA intuitivas.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Praveenkumar S. | Solutions Architect, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 27, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es cómo sus características han coincidido consistentemente con las necesidades cambiantes de los equipos de ingeniería. A lo largo de los años, lo he visto crecer de una sólida plataforma de datos a un espacio de trabajo que realmente simplifica cómo construimos y gestionamos soluciones de datos e inteligencia artificial. Unity Catalog ha sido una de las mayores mejoras para nosotros, tener un solo lugar para gestionar permisos y linaje ha eliminado muchos pasos manuales que solíamos manejar por separado en diferentes sistemas. Genie AI y BI también se han convertido en parte de mi flujo de trabajo regular; poder generar SQL o explorar conjuntos de datos a través de conversaciones naturales ayuda a los equipos a obtener respuestas más rápido, especialmente cuando estamos bajo presión de tiempo. La capacidad de Apps ha añadido un valor inesperado al permitirnos crear y compartir herramientas internas simplificadas directamente dentro de la plataforma, eliminando la necesidad de establecer infraestructura adicional. Y con Lakebase, hemos podido apoyar más casos de uso de estilo transaccional sin perder la flexibilidad de un lago, lo que ha hecho que ciertas canalizaciones sean mucho más fáciles de mantener. En conjunto, estas mejoras han eliminado mucha fricción del trabajo diario y han hecho que la plataforma sea algo que realmente disfruto usar mientras continúa evolucionando.

**¿Qué es lo que no le gusta de Databricks?**

Lo que no me gusta de Databricks es que algunas de las experiencias de IA más nuevas, especialmente Genie para la generación de código, pueden sentirse inestables a veces y pueden perder el contexto durante sesiones de desarrollo más largas. Interrumpe mi flujo de trabajo cuando el asistente no puede retener la lógica anterior o mantener la continuidad a través de múltiples iteraciones.

También he notado una brecha en los conectores nativos para ciertos sistemas empresariales como DFS, comparticiones SMB o sistemas de origen basados en Windows, y plataformas como DB2 en AS/400, de las cuales muchos clientes todavía dependen. Aunque Databricks continúa expandiendo su ecosistema, la falta de conectividad directa en estas áreas a menudo significa que necesitamos middleware adicional o pipelines personalizados para cerrar la brecha.

Ninguno de estos es un factor decisivo, pero son áreas donde la experiencia generalmente fluida de la plataforma aún puede sentirse un poco incompleta.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks nos ha ayudado a abordar varios desafíos de larga data en cómo gestionamos y entregamos datos e inteligencia artificial. Antes de adoptar sus capacidades más nuevas, estábamos lidiando con una gobernanza fragmentada, conjuntos de datos duplicados y mucho esfuerzo manual para mantener permisos y linajes consistentes a través de diferentes sistemas. Unity Catalog mejoró esto al darnos un único lugar para gestionar la seguridad y la propiedad, lo que redujo la confusión entre los equipos y disminuyó notablemente el retrabajo durante las auditorías.

También solíamos dedicar una cantidad significativa de tiempo a ayudar a los equipos a explorar datos o redactar consultas. Con Genie AI y BI, ahora pueden generar SQL, resúmenes e insights visuales de manera más independiente. Como resultado, el tiempo desde una pregunta hasta una respuesta utilizable se ha acortado, especialmente cuando trabajamos bajo ciclos de entrega ajustados.

Otro punto problemático era construir pequeñas herramientas internas alrededor de nuestros datos. Configurar infraestructuras separadas o entornos de alojamiento creaba una sobrecarga innecesaria. Con Databricks Apps, ahora podemos construir y compartir estas herramientas dentro de la propia plataforma, lo que ahorra tiempo de configuración y reduce el mantenimiento continuo.

Finalmente, luchábamos por soportar cargas de trabajo que necesitaban tanto la flexibilidad de un lago como la fiabilidad de una base de datos. Lakebase ayudó a cerrar esa brecha al permitir operaciones de estilo transaccional directamente en nuestros datos del lago, lo que simplificó varios pipelines y redujo el número de sistemas que tenemos que mantener.

En general, Databricks nos ha movido de manejar múltiples herramientas desconectadas a trabajar en un entorno más unificado y predecible. Ese cambio ha acelerado la entrega, reducido la sobrecarga operativa y mejorado la claridad de nuestros flujos de trabajo.

**Official Response from Janelle Glover:**

> ¡Gracias por compartir su experiencia positiva con Databricks! Estamos encantados de saber que nuestra plataforma ha podido satisfacer constantemente las necesidades cambiantes de sus equipos de ingeniería y agilizar sus soluciones de datos e inteligencia artificial. Agradecemos sus comentarios sobre Unity Catalog, Genie y Lakebase, y estamos comprometidos a mejorar y evolucionar continuamente nuestra plataforma para ofrecer una experiencia de usuario fluida y agradable.

  ### 42. Exploración de datos rápida y gobernada con autoservicio usando Databricks Genie

**Rating:** 3.5/5.0 stars

**Reviewed by:** Yuvashree M. | Senior Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 27, 2026

**¿Qué es lo que más le gusta de Databricks?**

Como ingeniero de datos, utilizo Databricks Genie para interactuar con los datos en lenguaje natural, mientras sigo confiando en las mismas tablas gobernadas, métricas y modelos semánticos que mi equipo ha construido. En lugar de saltar directamente a los cuadernos de SQL para cada consulta exploratoria, yo o los usuarios de negocio podemos formular preguntas en lenguaje sencillo y dejar que Genie las traduzca en consultas estructuradas y conscientes del catálogo. Esto mantiene el autoservicio rápido, pero también seguro y gobernado.

**¿Qué es lo que no le gusta de Databricks?**

Estabilidad del portátil al realizar múltiples tareas
Mi portátil puede colgarse o volverse notablemente lento cuando estoy trabajando con múltiples pestañas y paneles de control de Genie al mismo tiempo, especialmente durante consultas más pesadas o visualizaciones más exigentes. Esto afecta la experiencia general del usuario y puede ralentizar el desarrollo iterativo y el análisis.

Latencia con modelos de datos complejos
Con esquemas muy amplios o modelos semánticos más complejos, Genie a veces selecciona uniones subóptimas o un nivel de granularidad demasiado amplio o estrecho. Como resultado, todavía necesito revisar el SQL generado y optimizarlo yo mismo. En ese sentido, sigue siendo un asistente útil en lugar de un motor de consultas completamente autónomo.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

En un proyecto reciente, la empresa quería entender una disminución en el valor de vida del cliente (CLV) en una región específica. Un gerente de producto utilizó Genie para explorar las tendencias de CLV por región y cohorte, excluyendo reembolsos, directamente desde un panel de control de IA/BI. De esa conversación, capturé la lógica central, la envolví en una tubería de Delta Live Table y la programé como un trabajo recurrente. Esto redujo las solicitudes ad hoc en aproximadamente un 30-40% y permitió el acceso continuo y autoservicio a los conocimientos de CLV mientras me concentraba en ajustar el rendimiento y las reglas de calidad de datos.

En general, Genie me ayuda a hablar con mis datos en lenguaje natural, mejora la rapidez con la que descubrimos conocimientos y apoya mejores prácticas de calidad de datos, aunque trabajar a través de muchas pestañas respaldadas por Genie puede sobrecargar el hardware local y a veces ralentizar el flujo de trabajo.

**Official Response from Janelle Glover:**

> Gracias por compartir su experiencia positiva al usar Genie para la exploración de datos de autoservicio. Pedimos disculpas por los problemas que ha notado con la estabilidad y la latencia. Nuestro equipo está trabajando activamente para abordar estas preocupaciones y mejorar la experiencia del usuario.

  ### 43. Databricks Genie Clava las Migraciones de Unity Catalog con Guía Contextual

**Rating:** 4.0/5.0 stars

**Reviewed by:** Nandhini E. | Senior Data Architect, Empresa (> 1000 empleados)

**Reviewed Date:** March 27, 2026

**¿Qué es lo que más le gusta de Databricks?**

La comprensión contextual de Unity Catalog por parte de Databricks Genie es realmente impresionante. Mientras trabajaba en una compleja migración de UC, navegando por espacios de nombres de tres niveles, rutas de volumen, modos de seguridad y ejecución de SQL impulsada por widgets, Genie razonó a través de los detalles en lugar de recurrir a respuestas genéricas. Realmente habla el lenguaje de la migración de UC, lo que reduce mucho el ida y vuelta y hace que la resolución de problemas sea más directa. En general, la plataforma es poderosa para gestionar trabajos de ingeniería de datos a gran escala en Python, Scala y pipelines basados en notebooks, todo en un solo lugar.

**¿Qué es lo que no le gusta de Databricks?**

Mi mayor frustración con Genie es la falta de memoria de sesión persistente. En un proyecto de migración de larga duración con más de 60 casos de prueba y múltiples componentes interconectados, tener que restablecer el contexto en cada sesión crea un verdadero sobrecarga. Genie también tiene dificultades con el razonamiento entre componentes: maneja bien los cuadernos individuales, pero rastrear problemas a través de múltiples capas de un marco sigue siendo en gran medida un esfuerzo manual. Ocasionalmente, las respuestas se sienten demasiado cautelosas cuando lo que se necesita es una respuesta más directa y confiada.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Estamos utilizando Databricks para llevar a cabo una migración completa de Unity Catalog para un marco de ingesta automatizado grande, trasladándonos del antiguo Hive Metastore mientras también actualizamos el entorno de ejecución. Databricks proporciona una plataforma unificada donde el trabajo de migración, las pruebas y la validación pueden realizarse en un solo lugar. Durante las pruebas, Genie en particular ayudó a acelerar el análisis de la causa raíz, por ejemplo, identificó por qué un cuaderno de extracción de datos no podía resolver referencias de tablas gestionadas por UC y señaló que agregar una declaración USE CATALOG era la solución. Ese tipo de asistencia específica y consciente del contexto reduce directamente el tiempo de investigación durante migraciones complejas.

**Official Response from Janelle Glover:**

> Es fantástico escuchar que Databricks está ayudando a agilizar tus procesos de migración y prueba de Unity Catalog. Agradecemos tu ejemplo específico de cómo la asistencia contextual de Genie ha reducido directamente el tiempo de investigación durante migraciones complejas. También agradecemos tus comentarios sobre la eficiencia y tomaremos en cuenta tus observaciones para futuras mejoras.

  ### 44. Impulsando la Innovación en IA y Datos con una Plataforma Unificada de Databricks

**Rating:** 4.5/5.0 stars

**Reviewed by:** Ajay Kumar P. | Associate Consultant-Data Engineer, Pequeña Empresa (50 o menos empleados)

**Reviewed Date:** August 09, 2023

**¿Qué es lo que más le gusta de Databricks?**

Utilizo Databricks para ETL, informes e inteligencia artificial, y aprecio que funcione como una solución unificada para todas las necesidades de datos e inteligencia artificial. Facilita el seguimiento de datos y la creación de insights, ayudándonos a lidiar con los silos de datos. Me gusta el Unity Catalog ya que nos ayuda a gestionar y gobernar los datos en un solo lugar. También me gusta usar AgentBricks como un sistema multiagente para crear aplicaciones de inteligencia artificial a partir de PDFs y otros documentos. Encuentro Genie valioso ya que permite a los usuarios de negocios hacer preguntas en lenguaje natural y obtener respuestas exactas. La configuración inicial de Databricks fue muy fácil, haciendo la transición suave.

**¿Qué es lo que no le gusta de Databricks?**

Creo que el flujo de trabajo podría mejorarse añadiendo múltiples desencadenantes al mismo pipeline, ya que por ahora, si queremos programar el mismo pipeline varias veces al día, tenemos que clonarlo para cada ocasión.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Utilizo Databricks para eliminar los silos de datos y facilitar el seguimiento de datos y la creación de insights. Unity Catalog gestiona la gobernanza de datos, AgentBricks desarrolla aplicaciones de IA, y Genie proporciona respuestas utilizando lenguaje natural sobre datos estructurados.

**Official Response from Aunalisa Arellano:**

> Estamos encantados de saber que la Plataforma de Inteligencia de Databricks está proporcionando valor al abordar problemas de gobernanza de datos y agilizar la gestión de datos. Hemos tomado nota de sus comentarios sobre la necesidad de flujos de trabajo más robustos, y estamos comprometidos a mejorar continuamente nuestra plataforma para satisfacer mejor las necesidades de los Ingenieros de Datos, Ingenieros de ML y Analistas.

  ### 45. El modo de agente de Genie Code hizo que nuestra migración a Databricks fuera rápida y precisa.

**Rating:** 4.0/5.0 stars

**Reviewed by:** Dharun T. | Senior Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 26, 2026

**¿Qué es lo que más le gusta de Databricks?**

Genie Code (Agente Asistente de Databricks) — Actualmente estoy trabajando en la migración de cargas de trabajo existentes de ADF y SQLMI a Databricks. Como parte de eso, necesito convertir procedimientos almacenados y flujos de datos de ADF en notebooks de Databricks. Inicialmente, refactorizamos todo el código manualmente, pero una vez que el Modo Agente estuvo disponible en vista previa, intentamos usarlo para convertir los procedimientos almacenados y flujos de datos en código PySpark de Databricks. Me impresionó la precisión: manejó alrededor del 90% de la conversión de código sin errores, aparte de algunos ajustes de manejo de casos y similares.

Además, Lakeflow Connect me ayudó a conectar datos de SharePoint y SFTP a Databricks más fácilmente.

**¿Qué es lo que no le gusta de Databricks?**

No es un problema mayor, pero en mi proyecto el cliente nos pidió generar descripciones de tablas y columnas usando IA en Unity Catalog. Para cada entorno, estas descripciones varían, y tengo alrededor de 300 tablas solo en la zona Bronze. Tener que hacer clic en cada tabla y generar descripciones de IA una por una consume mucho tiempo, y los resultados no son consistentes entre los entornos.

Sería mucho más eficiente si tuviéramos una opción para generar descripciones a nivel de esquema, y si hubiera un esquema de información o tablas del sistema que almacenaran descripciones de tablas y columnas como metadatos. De esa manera, podríamos replicarlas fácilmente entre entornos. En algunos casos, los clientes también tienen documentación del sistema fuente que podríamos aprovechar para generar descripciones de tablas y columnas más precisas.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Uno de mis principales escenarios fue migrar todos los procedimientos almacenados existentes y los flujos de datos de ADF a cuadernos de Databricks. Hacer esto manualmente tomó más de 6 horas para completar tanto el desarrollo como la validación. Más tarde, utilizamos Agent Mode Preview y convertimos más de 80 procedimientos almacenados de complejidad media/alta y más de 20 flujos de datos de ADF en cuadernos de Databricks. Esto ahorró más de 100 horas y también generó scripts de validación para cada tabla para cerrar las pruebas unitarias.

Además del Asistente de Agente, también utilizamos volumen externo. Anteriormente, dependíamos de la biblioteca de Azure para el procesamiento de archivos en el almacenamiento ADLS, pero nos encontramos con problemas de límite de tasa, no podíamos procesar en paralelo y, a veces, el trabajo se abortaba. Después de crear un volumen externo apuntando al contenedor ADLS requerido, logramos procesamiento en paralelo y lecturas y escrituras más rápidas, en lugar de usar código Python personalizado.

**Official Response from Janelle Glover:**

> ¡Gracias por compartir tu experiencia positiva con Genie y Lakeflow Connect en Databricks! Nos alegra saber que ha hecho que tu proceso de migración sea rápido y preciso.

  ### 46. Databricks: Una verdadera plataforma unificada de análisis e inteligencia artificial que aumenta la velocidad y la fiabilidad

**Rating:** 5.0/5.0 stars

**Reviewed by:** Amit D. | Data Architect, Empresa (> 1000 empleados)

**Reviewed Date:** March 26, 2026

**¿Qué es lo que más le gusta de Databricks?**

Lo que más me gusta de Databricks es cómo finalmente entregó lo que todo ingeniero de datos/profesional de datos ha estado deseando: una verdadera plataforma unificada de análisis y AI.
Recuerdo trabajar con cinco herramientas diferentes solo para obtener un único pipeline desde la ingesta hasta el reporte. Databricks colapsó todo eso en un solo entorno, y eso cambió todo para mí.
Delta Lake fue el primer gran avance. Cuando llegó alrededor de 2020, las transacciones ACID y el "time-travel" eliminaron inmediatamente el dolor operativo que solíamos considerar "normal". Si un trabajo corrompía una tabla, podía revertir a una versión anterior en segundos en lugar de pasar horas restaurando copias de seguridad. Esa fiabilidad por sí sola evitó múltiples fallos posteriores.
Antes de que existiera Delta, nuestros pipelines dependían en gran medida de patrones de sobrescritura porque no había una forma confiable de aplicar actualizaciones o manejar datos que llegaban tarde de manera segura. Las sobrescrituras eran lentas, costosas y arriesgadas, especialmente para tablas grandes. Un solo fallo durante la sobrescritura podía dejar la tabla en un estado medio escrito e inconsistente. El procesamiento tomaba más tiempo, los costos de cómputo se disparaban, y la recuperación a menudo significaba reconstruir manualmente las particiones desde cero.
El ROI se hizo obvio tan pronto como usamos Databricks de extremo a extremo. Debido a que una plataforma maneja la ingesta → transformación → ML → BI → gobernanza, retiramos categorías enteras de herramientas heredadas y redujimos drásticamente la sobrecarga operativa.
Luego llegó Genie, y realmente transformó mi trabajo diario.
Una vez necesité un módulo PySpark para verificaciones de calidad de datos. Genie generó toda la lógica — verificaciones de nulos, validación de esquemas, agregaciones — en segundos. En lugar de pasar 30 minutos escribiendo código repetitivo, pasé 3 minutos refinando la lógica. Cambió mi enfoque de la sintaxis a las decisiones.
Las integraciones son otra fortaleza. Conectar Databricks a S3, SQL Server y especialmente Power BI ha sido sin problemas. Publicar tablas Delta directamente en modelos de BI eliminó la necesidad de extractos frágiles y aceleró las actualizaciones. Unity Catalog hizo todo aún más limpio con permisos y linajes consistentes.
El rendimiento es consistentemente fuerte cuando importa: uniones pesadas, funciones de ventana, pipelines de múltiples etapas o cargas de trabajo de streaming. El cómputo sin servidor comienza instantáneamente, y las cargas de trabajo escalan de manera predecible incluso bajo presión.
Finalmente, el proceso de incorporación me sorprendió. Características como el cómputo sin servidor, consultas en lenguaje natural, sugerencias de código generadas por AI y comentarios automáticos hacen que Databricks sea intuitivo incluso para ingenieros nuevos en Spark. Se siente como si la plataforma activamente te ayudara a aprender.
En resumen: Databricks me permite trabajar más rápido, recuperarme instantáneamente, integrarme sin problemas y escalar con confianza, todo en un solo lugar. Es la rara plataforma que mejora tanto la velocidad como la fiabilidad al mismo tiempo.

**¿Qué es lo que no le gusta de Databricks?**

Lo que más me disgusta de Databricks es la visibilidad y previsibilidad de los costos. Incluso como ingeniero experimentado, puede ser difícil obtener una visión clara y en tiempo real de cuánto costará un flujo de trabajo antes de ejecutarlo. Photon vs. tiempo de ejecución estándar, comportamiento de escalado automático, operaciones con mucho intercambio, DBUs: estos pueden acumularse rápidamente, y las sorpresas de costos ocurren a menos que monitorees y ajustes activamente todo. Una simple mala configuración de una canalización puede duplicar silenciosamente tu gasto.
Otro desafío es el ritmo rápido de nuevas características y cambios. Databricks innova increíblemente rápido, lo cual es genial, pero también significa que las características pueden llegar antes de que la documentación, las mejores prácticas o los patrones de gobernanza estén completamente maduros. A veces, la funcionalidad se comporta de manera diferente entre tiempos de ejecución o proveedores de nube, y mantenerse al tanto de todo requiere aprendizaje continuo y reestructuración. Esto puede crear fricciones en el equipo y deuda técnica.

En resumen: Databricks es excepcional, pero el modelo de costos no siempre es transparente, y el rápido despliegue de características puede introducir una complejidad operativa que los equipos deben gestionar activamente.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Negocios: Antes de adoptar Databricks, nuestro entorno de análisis aeroespacial, particularmente en torno al monitoreo de la salud de los motores de los clientes, sufría de los mismos desafíos que enfrentan muchas organizaciones de ingeniería tradicionales.
Teníamos múltiples sistemas desconectados manejando la ingestión de telemetría, el procesamiento de códigos de fallos, la analítica de flotas y la predicción de mantenimiento. Los datos de los sensores de los motores (FADEC, vibración, térmicos, sistemas de aceite) llegaban en diferentes formatos y requerían mucho trabajo manual solo para normalizar. Las canalizaciones dependían de sobrescrituras completas porque nuestra configuración heredada no soportaba actualizaciones o datos que llegaban tarde, lo que hacía que el procesamiento fuera lento y costoso.
Luchábamos con la lenta ingestión de telemetría de motores, conjuntos de datos inconsistentes entre los equipos de ingeniería y largos tiempos de respuesta para los modelos de detección de anomalías.

Desafío de arquitectura: Antes de usar Databricks, operábamos en un paisaje de datos fragmentado.
Teníamos múltiples sistemas, capas de almacenamiento desconectadas y una gran dependencia de trabajos ETL basados en sobrescritura porque nuestra antigua plataforma de datos no podía soportar actualizaciones, datos que llegaban tarde o garantías ACID. Esto significaba que las canalizaciones eran lentas, propensas a errores y costosas. Revertir datos incorrectos podía tomar horas, y las inconsistencias de datos entre equipos eran comunes.
Luchábamos con sistemas aislados, canalizaciones lentas, datos poco fiables y altos costos operativos.

Luchábamos con sobrescrituras manuales y datos inconsistentes, pero ahora podemos usar Delta Lake con ACID y viaje en el tiempo,
lo que ha resultado en:

Reversión instantánea de escenarios de corrupción de datos
Procesamiento incremental confiable en lugar de sobrescrituras completas
Datos consistentes consumidos por equipos de ingeniería, BI y ML

Esto redujo nuestra ventana de procesamiento de canalización de telemetría de horas a menos de 30 minutos para un lote diario a nivel de flota.

Luchábamos con múltiples herramientas y arquitecturas duplicadas, pero ahora tenemos un único Lakehouse unificado,
lo que ha resultado en:

Una plataforma única para ingestión → transformación → ML → BI → gobernanza
Eliminación de 3–5 herramientas heredadas (programadores ETL, extracciones BI, infraestructura ML heredada)
Menor mantenimiento y costos de licencias

Luchábamos con ciclos de desarrollo lentos, pero ahora podemos aprovechar Genie para ingeniería asistida por IA,
lo que ha resultado en:

Creación de módulos PySpark un 70–80% más rápida
Generación automática de verificaciones de esquemas, verificaciones de nulos y lógica de calidad de datos
Más tiempo dedicado a decisiones, menos a código repetitivo

Por ejemplo, un módulo de calidad de datos que solía tomar 30 minutos ahora toma 2–3 minutos para estructurarse.

Luchábamos con gobernanza inconsistente, pero ahora Unity Catalog nos da visibilidad de extremo a extremo,
lo que ha resultado en:

Incorporación más rápida (reducida de días a minutos)
Permisos centralizados, linaje y registros de auditoría
Mayor alineación con el cumplimiento

Luchábamos para escalar canalizaciones y cargas de trabajo de ML, pero ahora usamos computación distribuida + Photon,
lo que ha resultado en:

Uniones grandes y operaciones de ventana ejecutándose hasta 10 veces más rápido
Manejo estable de conjuntos de datos a escala de terabytes
Rendimiento predecible incluso bajo cargas de trabajo pesadas

**Official Response from Janelle Glover:**

> ¡Gracias por compartir su experiencia positiva con Databricks! Nos alegra saber cómo nuestra plataforma ha mejorado su flujo de trabajo y proporcionado fiabilidad y velocidad. Agradecemos sus comentarios y estamos comprometidos a mejorar continuamente nuestra plataforma para servir mejor a sus necesidades.

  ### 47. En cuanto a nosotros: De la Prueba de Concepto de ML a Aplicaciones de Producción Seguras—Rápidas, Sin Servidor y Bien Gobernadas

**Rating:** 4.0/5.0 stars

**Reviewed by:** Luis V. | Partner, Servicios de información, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** May 24, 2026

**¿Qué es lo que más le gusta de Databricks?**

Personalmente, me gusta usar esta aplicación por la capacidad de convertir rápidamente un concepto de prueba de aprendizaje automático o generación aumentada por recuperación en una aplicación segura y lista para producción utilizando marcos de Python familiares como Streamlit, Gradio o Dash. Ejecutarse en computación sin servidor significa que nuestro equipo puede demostrar valor a los clientes rápidamente sin esperar la provisión de infraestructura separada.

También nos gusta Unity Catalog, que proporciona gobernanza unificada a través de datos estructurados y no estructurados, modelos de ML y métricas de negocio. Funciones como el Linaje Automatizado simplifican las auditorías de cumplimiento del cliente.

**¿Qué es lo que no le gusta de Databricks?**

Sí, hay algo que mejorar. En la transmisión estructurada y el cargador automático, un cambio de esquema a mitad de ejecución provoca que la consulta falle y requiere un reinicio manual. Para entornos de producción de clientes con SLAs estrictos, estas interrupciones pueden aumentar la carga de mantenimiento.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Para los clientes que buscan análisis inmediatos sin una costosa migración de varios meses, implementamos la federación de Lakehouse. Esta característica ayuda a nuestro equipo a consultar y gobernar datos en su lugar a través de sistemas dispares directamente desde la interfaz de Databricks, acelerando la entrega de insights estratégicos.

También estamos aprovechando herramientas integradas como la búsqueda vectorial de Mosaic AI para construir aplicaciones RAG, y utilizando aplicaciones de Databricks para ofrecer interfaces de análisis predictivo interactivo a los clientes. En general, así es como utilizamos este software.

**Official Response from Jess Darnell:**

> Nos complace saber que la aplicación ha sido fundamental para demostrar valor a los clientes rápidamente y proporcionar una gobernanza unificada a través de datos estructurados y no estructurados, modelos de ML y métricas de negocio. Entendemos los desafíos con los cambios de esquema a mitad de ejecución y trabajaremos para mejorar este aspecto para una experiencia más fluida. Es genial saber que Databricks está ayudando a su equipo a implementar la federación de Lakehouse y aprovechar herramientas integradas como la búsqueda vectorial de Mosaic AI. ¡Gracias por sus comentarios detallados sobre su experiencia y gracias por elegir Databricks!

  ### 48. Una plataforma unificada para cargas de trabajo escalables de datos e inteligencia artificial

**Rating:** 4.5/5.0 stars

**Reviewed by:** Janani D. | Senior Data Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 27, 2026

**¿Qué es lo que más le gusta de Databricks?**

Databricks es genial porque reúne todo lo que necesitas para datos e inteligencia artificial en un solo lugar. En lugar de cambiar entre diferentes herramientas para ingeniería de datos, limpieza de datos, análisis y aprendizaje automático, puedes hacerlo todo en un solo entorno. Eso hace la vida mucho más fácil.

**¿Qué es lo que no le gusta de Databricks?**

Databricks no es amigable para principiantes. A menudo necesitas sólidas habilidades en ingeniería de datos para usarlo de manera efectiva. Las reseñas señalan que, aunque Databricks es extremadamente capaz, es "un taller de alta gama" que requiere experiencia y no es fácil para equipos menos técnicos. Databricks utiliza unidades de costo (DBUs), que muchas personas encuentran difíciles de estimar y gestionar. Incluso las reseñas de expertos destacan que su precio es notoriamente complicado y puede ocultar costos inesperados.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Databricks utiliza la arquitectura Lakehouse para combinar las fortalezas de los lagos de datos y los almacenes de datos en una plataforma unificada. Esto significa que los datos estructurados y no estructurados conviven y están listos para análisis o aprendizaje automático.

**Official Response from Janelle Glover:**

> Gracias por compartir cómo la arquitectura de Databricks te está beneficiando. Diseñamos nuestra plataforma para abordar los desafíos de gestionar datos estructurados y no estructurados, y es genial escuchar que está teniendo un impacto positivo en tus flujos de trabajo de análisis y aprendizaje automático.

  ### 49. Los cuadernos de Databricks hacen que la colaboración sea fluida entre Python, SQL y Scala.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Joseph F. | Cloud Engineer, Mediana Empresa (51-1000 empleados)

**Reviewed Date:** March 25, 2026

**¿Qué es lo que más le gusta de Databricks?**

Los cuadernos colaborativos de Databricks son realmente útiles y me permiten trabajar en cualquier lenguaje que necesite para cumplir con mis requisitos de manera efectiva. La capacidad de mezclar Python, SQL e incluso Scala dentro de un panel hace que la colaboración y el trabajo en equipo sean mucho más fluidos. También aprecio lo fácil que se integra con otras herramientas y plataformas en la nube, por lo que se adapta a mis flujos de trabajo existentes con muy poca fricción.

**¿Qué es lo que no le gusta de Databricks?**

Me gusta su atención al cliente y las actualizaciones frecuentes son una gran razón por la que esto se ha convertido en mi favorito para la gestión de datos. También aprecio lo bien que se integra con herramientas externas como Power BI para la elaboración de informes, es realmente bueno.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

Simplifica la colaboración entre equipos y nos ayuda a trabajar con grandes conjuntos de datos sin tener que preocuparnos demasiado por la infraestructura o la sobrecarga analítica. Los cálculos y los informes son rápidos, lo que ha mejorado nuestros ciclos de desarrollo y reducido el ida y vuelta entre los equipos de ingeniería y análisis.

**Official Response from Janelle Glover:**

> Es genial escuchar que Databricks está simplificando la colaboración entre equipos y mejorando los ciclos de desarrollo para ti. Nos esforzamos por proporcionar una plataforma que reduzca la sobrecarga de infraestructura y análisis, permitiendo a los equipos centrarse en sus objetivos principales.

  ### 50. Best tool to work with big dealer data, but requires technical team.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Dilkash N. | Assistant Sales Manager (Institutional Sales), Empresa (> 1000 empleados)

**Reviewed Date:** June 02, 2026

**¿Qué es lo que más le gusta de Databricks?**

We have a very big dealer and distributor network throughout India in our sanitaryware business. Big sales data are being generated everyday. Speed is my favorite thing about Databricks. Whenever we use simple excel or old software before, it is always hanging. And now our company data team is churning through the millions of rows in a short time. As a Senior Sales Specialist, I am making sure that I get my territory dashboard and forecasting reports at least daily in the morning. It is bringing all disperse data together in a good manner.

**¿Qué es lo que no le gusta de Databricks?**

Worst thing is that it is highly technical software. As a sales person, I cannot apply it in locating data directly. I need to request data engineering or IT team to code or make query every time I desire some new custom report. User-non technical interface is becoming very complicated. And my management is continually saying this costs a great deal.

**¿Qué problemas resuelve Databricks y cómo le beneficia eso?**

We are solving target tracking and inventory matching problem. We have a wide range of products, such as tiles, faucets, and washbasins, in Cera. Databricks is assisting our company to understand what region is selling what product more and the trend in the market. My advantage is due to this, because I can advise my local dealers accordingly, as to next month order. It is providing highly precise sales forecast and saving me my manual reporting time and I am closing my sales targets with ease.


## Databricks Discussions
  - [¿Qué es Lakehouse en Databricks?](https://www.g2.com/es/discussions/what-is-lakehouse-in-databricks) - 4 comments, 2 upvotes
  - [¿Cuáles son las características de Databricks?](https://www.g2.com/es/discussions/what-are-the-features-of-databricks) - 4 comments, 2 upvotes
  - [What does Databricks software do?](https://www.g2.com/es/discussions/what-does-databricks-software-do) - 3 comments
  - [¿Qué es la plataforma de análisis unificada de Databricks?](https://www.g2.com/es/discussions/what-is-databricks-unified-analytics-platform) - 3 comments

- [View Databricks pricing details and edition comparison](https://www.g2.com/es/products/databricks/reviews?section=pricing&secure%5Bexpires_at%5D=2026-06-02+22%3A20%3A19+-0500&secure%5Bsession_id%5D=0592b121-24dd-48ac-882a-5facc84f0c05&secure%5Btoken%5D=75b82bf7ebdb2c88cdd95906b09cf9005ef56d298b1353e40adaba0c0f61062b&format=llm_user)
## Databricks Integrations
  - [Agentforce 360 Platform (formerly Salesforce Platform)](https://www.g2.com/es/products/agentforce-360-platform-formerly-salesforce-platform/reviews)
  - [Agentforce Sales (formerly Salesforce Sales Cloud)](https://www.g2.com/es/products/agentforce-sales-formerly-salesforce-sales-cloud/reviews)
  - [Alation](https://www.g2.com/es/products/alation/reviews)
  - [Amazon EC2](https://www.g2.com/es/products/amazon-ec2/reviews)
  - [Amazon Redshift](https://www.g2.com/es/products/amazon-redshift/reviews)
  - [Amazon Relational Database Service (RDS)](https://www.g2.com/es/products/amazon-relational-database-service-rds/reviews)
  - [Anaplan](https://www.g2.com/es/products/anaplan/reviews)
  - [Anomalo](https://www.g2.com/es/products/anomalo/reviews)
  - [Apache Airflow](https://www.g2.com/es/products/apache-airflow/reviews)
  - [Apache Kafka](https://www.g2.com/es/products/apache-kafka/reviews)
  - [Apache NiFi](https://www.g2.com/es/products/apache-nifi/reviews)
  - [Atlan](https://www.g2.com/es/products/atlan/reviews)
  - [AWS Glue](https://www.g2.com/es/products/aws-glue/reviews)
  - [AWS Lambda](https://www.g2.com/es/products/aws-lambda/reviews)
  - [Azure Blob Storage](https://www.g2.com/es/products/azure-blob-storage/reviews)
  - [Azure Databricks](https://www.g2.com/es/products/azure-databricks/reviews)
  - [Azure Data Factory](https://www.g2.com/es/products/azure-data-factory/reviews)
  - [Azure Data Lake Store](https://www.g2.com/es/products/azure-data-lake-store/reviews)
  - [Azure Functions](https://www.g2.com/es/products/azure-functions/reviews)
  - [Azure Logic Apps](https://www.g2.com/es/products/azure-logic-apps/reviews)
  - [Azure OpenAI Service](https://www.g2.com/es/products/azure-openai-service/reviews)
  - [Azure Pipelines](https://www.g2.com/es/products/azure-pipelines/reviews)
  - [Azure Portal](https://www.g2.com/es/products/azure-portal/reviews)
  - [Azure SQL Database](https://www.g2.com/es/products/azure-sql-database/reviews)
  - [Claude Code](https://www.g2.com/es/products/anthropic-claude-code/reviews)
  - [Confluent](https://www.g2.com/es/products/confluent/reviews)
  - [Crunchbase](https://www.g2.com/es/products/crunchbase/reviews)
  - [Customer.io](https://www.g2.com/es/products/customer-io/reviews)
  - [Dash](https://www.g2.com/es/products/dash-for-brands-ltd-dash/reviews)
  - [data.world](https://www.g2.com/es/products/data-world/reviews)
  - [DAT iQ](https://www.g2.com/es/products/dat-iq/reviews)
  - [dbt](https://www.g2.com/es/products/dbt/reviews)
  - [DigitalOcean](https://www.g2.com/es/products/digitalocean/reviews)
  - [Fivetran](https://www.g2.com/es/products/fivetran/reviews)
  - [GEN TDS](https://www.g2.com/es/products/gen-tds/reviews)
  - [Git](https://www.g2.com/es/products/git/reviews)
  - [GitHub](https://www.g2.com/es/products/github/reviews)
  - [GitLab](https://www.g2.com/es/products/gitlab/reviews)
  - [Google Analytics](https://www.g2.com/es/products/google-analytics/reviews)
  - [Google Cloud Run](https://www.g2.com/es/products/google-cloud-run/reviews)
  - [HubSpot Marketing Hub](https://www.g2.com/es/products/hubspot-marketing-hub/reviews)
  - [Immuta](https://www.g2.com/es/products/immuta/reviews)
  - [JD Edwards World](https://www.g2.com/es/products/jd-edwards-world/reviews)
  - [Microsoft Copilot Studio](https://www.g2.com/es/products/microsoft-microsoft-copilot-studio/reviews)
  - [Microsoft Fabric](https://www.g2.com/es/products/microsoft-fabric/reviews)
  - [Microsoft Power Apps](https://www.g2.com/es/products/microsoft-power-apps/reviews)
  - [Microsoft Power Automate](https://www.g2.com/es/products/microsoft-power-automate/reviews)
  - [Microsoft Power BI](https://www.g2.com/es/products/microsoft-microsoft-power-bi/reviews)
  - [Microsoft SharePoint](https://www.g2.com/es/products/microsoft-sharepoint/reviews)
  - [Microsoft SQL Server](https://www.g2.com/es/products/microsoft-sql-server/reviews)
  - [Microsoft Teams](https://www.g2.com/es/products/microsoft-teams/reviews)
  - [Monte Carlo](https://www.g2.com/es/products/monte-carlo/reviews)
  - [MySQL](https://www.g2.com/es/products/mysql/reviews)
  - [ObjectWay SpA](https://www.g2.com/es/products/objectway-spa/reviews)
  - [Oracle Database](https://www.g2.com/es/products/oracle-database/reviews)
  - [Pega Platform](https://www.g2.com/es/products/pega-platform/reviews)
  - [PostgreSQL](https://www.g2.com/es/products/postgresql/reviews)
  - [PowerBI Portal](https://www.g2.com/es/products/powerbi-portal/reviews)
  - [Prophecy](https://www.g2.com/es/products/prophecy-prophecy/reviews)
  - [Qualtrics Customer Experience](https://www.g2.com/es/products/qualtrics-customer-experience/reviews)
  - [React Native](https://www.g2.com/es/products/react-native/reviews)
  - [Salesforce Agentforce](https://www.g2.com/es/products/salesforce-agentforce/reviews)
  - [SAP Ariba](https://www.g2.com/es/products/sap-ariba/reviews)
  - [SAP ECC](https://www.g2.com/es/products/sap-ecc/reviews)
  - [SAS Viya](https://www.g2.com/es/products/sas-sas-viya/reviews)
  - [Seamless (formally Seamless.AI)](https://www.g2.com/es/products/seamless-formally-seamless-ai/reviews)
  - [ServiceNow IT Service Management](https://www.g2.com/es/products/servicenow-it-service-management/reviews)
  - [Sigma](https://www.g2.com/es/products/sigma-computing-sigma/reviews)
  - [Sisense](https://www.g2.com/es/products/sisense/reviews)
  - [SnapLogic Intelligent Integration Platform (IIP)](https://www.g2.com/es/products/snaplogic-intelligent-integration-platform-iip/reviews)
  - [Snowflake](https://www.g2.com/es/products/snowflake/reviews)
  - [Spark](https://www.g2.com/es/products/apache-spark/reviews)
  - [Spark SQL](https://www.g2.com/es/products/spark-sql/reviews)
  - [SplashBI](https://www.g2.com/es/products/splashbi/reviews)
  - [Spotfire Analytics](https://www.g2.com/es/products/spotfire-analytics/reviews)
  - [Tableau](https://www.g2.com/es/products/tableau/reviews)
  - [ThoughtSpot](https://www.g2.com/es/products/thoughtspot/reviews)
  - [Visual Studio Code](https://www.g2.com/es/products/visual-studio-code/reviews)
  - [Workday HCM](https://www.g2.com/es/products/workday-hcm/reviews)

## Databricks Features
**Informes**
- Interfaz de informes
- Pasos para responder
- Gráficos y tablas
- Tarjetas de puntuación
- Paneles

**Administración**
- Modelado de datos
- Recomendaciones
- Gestión del flujo de trabajo
- Tableros y Visualizaciones

**Gestión**
- Informes
- Auditoría

**Despliegue**
- Flexibilidad lingüística
- Flexibilidad del marco
- Control de versiones
- Facilidad de implementación
- Escalabilidad

**Sistema**
- Ingesta de datos y disputas

**Preparación de datos**
- Conectores
- Gobierno de datos

**Gestión de datos**
- Integración de datos
- Compresión de datos
- Calidad de los datos
- Análisis de datos integrado
- Aprendizaje automático en la base de datos
- Análisis de Data Lake

**Gestión**
- Diccionario de datos
- Replicación de datos
- Lenguaje de consulta
- Modelado de datos
- Análisis de rendimiento

**Gestión**
- Glosario de Negocios
- Descubrimiento de datos
- Perfilado de datos
- Informes y visualización
- Linaje de datos

**Despliegue**
- Flexibilidad lingüística
- Flexibilidad del marco
- Control de versiones
- Facilidad de implementación
- Escalabilidad

**Gestión de datos**
- Integración de datos
- Metadatos
- Autoservicio
- Flujos de trabajo automatizados

**Escalabilidad y rendimiento: infraestructura de IA generativa**
- Alta disponibilidad
- Escalabilidad del entrenamiento de modelos
- Velocidad de inferencia

**Personalización - Constructores de Agentes de IA**
- Configuración de Lenguaje Natural
- Personalización de tono
- Guardias de Seguridad

**Plataformas de DataOps de IA Agente**
- Ejecución Autónoma de Tareas
- Planificación en múltiples pasos
- Integración entre sistemas
- Aprendizaje Adaptativo
- Toma de decisiones

**Gestión del Tráfico y Rendimiento - Puertas de Enlace de IA**
- Limitación de tasa consciente de tokens
- Caché Semántico
- Enrutamiento multi-modelo y alternativas

**Desarrollo de modelos**
- Soporte de idiomas
- Arrastra y suelta
- Algoritmos preconstruidos
- Entrenamiento de modelos

**base de datos**
- Recopilación de datos en tiempo real
- Distribución de datos
- Lago de datos

**Transformación de datos**
- Análisis en tiempo real
- Consulta de datos

**conformidad**
- Cumplimiento de datos confidenciales
- Capacitación y directrices
- Aplicación de políticas
- Supervisión del cumplimiento

**Funcionalidad**
- Extracción
- Transformación
- Carga
- Automatización
- Escalabilidad

**Gestión**
- Catalogación
- Monitoreo
- Gobernante
- Registro de modelos

**Desarrollo de modelos**
- Ingeniería de características

**Modelado y mezcla de datos**
- Consulta de datos
- Filtrado de datos
- Combinación de datos

**Integración**
- Integración AI/ML
- Integración de herramientas de BI
- Integración de Data Lake

**Mantenimiento**
- Migración de datos
- Copia de seguridad y recuperación
- Entorno multiusuario

**Seguridad**
- Control de acceso
- Administración de roles
- Gestión del cumplimiento

**Operaciones**
- Métricas
- Gestión de infraestructuras
- Colaboración

**Analytics**
- Capacidades analíticas
- Visualizaciones de Dasboard

**Costo y eficiencia: infraestructura de IA generativa**
- Costo por llamada a la API
- Flexibilidad en la asignación de recursos
- Eficiencia Energética

**Funcionalidad - Constructores de Agentes de IA**
- Soporte Multicanal
- Agente Branding
- Capacidades de Respuesta Proactiva
- Escalación Humana Sin Interrupciones

**Gobernanza y Observabilidad - Puertas de enlace de IA**
- Privacidad de Datos
- Seguimiento de costos
- Seguridad Centralizada de Claves API

**Servicios de aprendizaje automático/profundo**
- Visión computarizada
- Procesamiento del lenguaje natural
- Generación de lenguaje natural
- Redes neuronales artificiales

**Integraciones**
- Integración con Hadoop
- Integración con Spark

**Calidad de los datos**
- Preparación de datos
- Distribución de datos
- Unificación de datos

**Servicios de aprendizaje automático/profundo**
- Comprensión del lenguaje natural
- Aprendizaje profundo

**Despliegue**
- On-Premise
- Nube

**Seguridad**
- Cifrado de datos
- Control de acceso de usuarios

**Mantenimiento**
- Gestión de la calidad de los datos
- Gestión de políticas

**Gestión**
- Catalogación
- Monitoreo
- Gobernante

**Monitoreo y Gestión**
- Observabilidad de datos
- Capacidades de prueba

**IA generativa**
- Generación de texto
- Resumen de texto

**Integración y extensibilidad - Infraestructura de IA generativa**
- Compatibilidad con múltiples nubes
- Integración de canalización de datos
- Compatibilidad y flexibilidad de la API

**Datos y Análisis - Constructores de Agentes de IA**
- Analítica y Reportes
- Conciencia Contextual
- Cumplimiento de la Privacidad de Datos

**Despliegue**
- Servicio Gestionado
- Aplicación
- Escalabilidad

**Plataforma**
- Escalado de máquinas
- Preparación de datos
- Integración con Spark

**Conectividad**
- Integración con Hadoop
- Integración con Spark
- Análisis de múltiples fuentes
- Lago de datos

**Rendimiento**
- Escalabilidad

**Implementación en la nube**
- Soporte de nube híbrida
- Capacidades de migración a la nube

**IA generativa**
- Generación de texto
- Resumen de texto

**IA generativa**
- Generación de texto
- Resumen de texto

**Seguridad y cumplimiento: infraestructura de IA generativa**
- GDPR y cumplimiento normativo
- Control de acceso basado en roles
- Cifrado de datos

**Integración - Constructores de Agentes de IA**
- Automatización del flujo de trabajo
- Uso de API
- Interoperabilidad de la Plataforma
- Integración de Datos CRM

**Plataformas de Analítica de IA Agente**
- Ejecución Autónoma de Tareas
- Planificación en varios pasos
- Integración entre sistemas
- Aprendizaje Adaptativo
- Interacción en Lenguaje Natural
- Asistencia proactiva
- Toma de decisiones

**Autoservicio**
- Campos calculados
- Filtrado de columnas de datos
- Descubrimiento de datos
- Buscar
- Colaboración / Flujo de trabajo
- Automodelado

**Tratamiento**
- Procesamiento en la nube
- Procesamiento de cargas de trabajo

**Operaciones**
- Visualización de datos
- Flujo de trabajo de datos
- Descubrimiento gobernado
- Análisis integrados
- Cuadernos

**Seguridad**
- Gobierno de datos
- Seguridad de los datos

**IA generativa**
- Generación de texto por IA
- Resumen de texto
- Texto a imagen

**IA generativa**
- Generación de texto
- Resumen de texto

**Usabilidad y soporte - Infraestructura de IA generativa**
- Calidad de la documentación
- Actividad comunitaria

**IA Agente - Gobernanza de Datos**
- Ejecución Autónoma de Tareas
- Planificación en múltiples pasos
- Integración entre sistemas
- Aprendizaje adaptativo
- Interacción en Lenguaje Natural
- Toma de decisiones

**Despliegue e Integración - Plataformas de Analítica**
- Constructor de Tableros sin Código
- Programación y automatización de informes
- Analítica integrada y etiquetado blanco
- Conectividad de Fuente de Datos

**Análisis avanzado**
- Análisis predictivo
- Visualización de datos
- Servicios de Big Data

**IA generativa**
- Generación de texto
- Resumen de texto

**Agente AI - Plataformas de Ciencia de Datos y Aprendizaje Automático**
- Ejecución Autónoma de Tareas
- Planificación en varios pasos
- Integración entre sistemas
- Aprendizaje adaptativo
- Interacción en Lenguaje Natural
- Asistencia proactiva
- Toma de decisiones

**Rendimiento y escalabilidad - Plataformas de análisis**
- Manejo de grandes datos y velocidad de consulta
- Soporte Concurrente de Usuarios

**Análisis Avanzado y Modelado - Plataformas de Análisis**
- Modelado de Datos y Gobernanza
- Integración de cuaderno y script
- Modelos Predictivos y Estadísticos Integrados

**Capacidades de IA Agente - Plataformas de Análisis**
- Información y narrativas generadas automáticamente
- Consultas en lenguaje natural
- Monitoreo proactivo de KPI y alertas
- Agentes de IA para seguimientos analíticos

**Inteligencia Personalizada - Plataformas de Análisis**
- Aprendizaje conductual para el refinamiento contextual de consultas
- Personalización de Información Basada en Roles
- Analítica conversacional y basada en indicaciones

**Creación de informes**
- Transformación de datos
- Modelado de datos
- Diseño de informes WYSIWYG
- API de integración

**Plataforma**
- Soporte para usuarios móviles
- Personalización
- Administración de usuarios, roles y accesos
- Internacionalización
- Sandbox / Entornos de prueba
- Rendimiento y fiabilidad
- Amplitud de las aplicaciones de los socios

## Top Databricks Alternatives
  - [Cloudera Data Platform](https://www.g2.com/es/products/cloudera-cloudera-data-platform/reviews) - 4.1/5.0 (131 reviews)
  - [Snowflake](https://www.g2.com/es/products/snowflake/reviews) - 4.5/5.0 (706 reviews)
  - [Teradata Vantage](https://www.g2.com/es/products/teradata-teradata-vantage/reviews) - 4.3/5.0 (355 reviews)