# Databricks Reviews
**Vendor:** Databricks Inc.  
**Category:** [Großdatenverarbeitung und Verteilungssysteme](https://www.g2.com/de/categories/big-data-processing-and-distribution)  
**Average Rating:** 4.6/5.0  
**Total Reviews:** 785
## About Databricks
Databricks ist eine einheitliche Daten- und KI-Plattform, die Organisationen dabei hilft, Datenpipelines, Analysen, maschinelles Lernen, KI-Anwendungen und -Agenten zu erstellen, zu verwalten und zu skalieren. Mehr als 20.000 Organisationen weltweit – darunter adidas, AT&amp;T, Bayer, Block, Mastercard, Rivian, Unilever und 70 % der Fortune 500 – verlassen sich auf Databricks, um mit Unternehmensdaten und KI im großen Maßstab zu arbeiten. Mit Hauptsitz in San Francisco und über 30 Büros weltweit bietet Databricks eine einheitliche Plattform, die Agent Bricks, Lakeflow, Lakehouse, Lakebase, Genie und Unity Catalog umfasst. Databricks wurde 2013 von den ursprünglichen Entwicklern von Apache Spark™, Delta Lake, MLflow und Unity Catalog gegründet und basiert auf einer offenen Lakehouse-Architektur, die Daten, Analysen und KI zusammenführt. Die Plattform wird von Dateningenieuren, Datenwissenschaftlern, Analysten, Entwicklern, Teams für maschinelles Lernen, KI-Teams und Geschäftsanwendern genutzt, um über den gesamten Daten- und KI-Lebenszyklus hinweg zusammenzuarbeiten. Zu den wichtigsten Fähigkeiten von Databricks gehören: - Datenengineering: Erstellen, automatisieren und verwalten Sie zuverlässige Batch-, Streaming- und Echtzeit-Datenpipelines. - Analytik und Business Intelligence: Führen Sie SQL-Analysen durch, erstellen Sie Dashboards und ermöglichen Sie Geschäftsteams, Daten zu erkunden. - Datenverwaltung: Entdecken, sichern und verwalten Sie Daten- und KI-Ressourcen über Teams, Clouds und Workloads hinweg. - Maschinelles Lernen und KI: Entwickeln Sie Modelle, erstellen Sie generative KI-Anwendungen und erstellen Sie produktionsreife KI-Agenten. - Datenanwendungen: Erstellen und implementieren Sie datengesteuerte Anwendungen unter Verwendung von verwalteten Unternehmensdaten. Verfügbar über AWS, Azure und Google Cloud, hilft Databricks Organisationen, über Clouds hinweg zu arbeiten, Datensilos zu reduzieren und die Zusammenarbeit über Teams und Tools hinweg zu vereinfachen. Kunden nutzen Databricks für Anwendungsfälle wie Kundenpersonalisierung, Betrugserkennung, vorausschauende Wartung, Echtzeitanalysen, Cybersicherheit, Gesundheitsforschung, Finanzrisikomanagement, Lieferkettenoptimierung und KI-gestützte Entscheidungsfindung. Databricks wird in verschiedenen Branchen eingesetzt, darunter Finanzdienstleistungen, Gesundheitswesen und Biowissenschaften, Einzelhandel, Fertigung, Energie und der öffentliche Sektor. Organisationen nutzen die Plattform, um die Dateninfrastruktur zu modernisieren, die KI-Einführung zu beschleunigen und Unternehmensdaten in Geschäftswert umzuwandeln.



## Databricks Pros & Cons
**What users like:**

- Benutzer loben die **Benutzerfreundlichkeit und die zahlreichen Funktionen** von Databricks, die ihre Datenverarbeitungs- und maschinellen Lernaufgaben verbessern. (192 reviews)
- Benutzer loben die **Benutzerfreundlichkeit** von Databricks, was ihre Gesamterfahrung mit der intuitiven Benutzeroberfläche verbessert. (155 reviews)
- Benutzer schätzen die **nahtlosen Integrationen** von Databricks, die eine effiziente Datenverarbeitung und Zusammenarbeit über verschiedene Tools hinweg ermöglichen. (141 reviews)
- Benutzer schätzen die **hervorragende Zusammenarbeit** , die Databricks fördert und die Echtzeit-Teamarbeit zwischen Dateningenieuren und Analysten ermöglicht. (114 reviews)
- Benutzer schätzen die **integrierten Analysefunktionen** von Databricks, die die Abläufe verbessern und umfassende Einblicke in die Technologie bieten. (113 reviews)
- Skalierbarkeit (111 reviews)
- ML-Integration (106 reviews)
- Benutzer schätzen die **einfachen Integrationen** von Databricks, die nahtlos mit der Cloud-Infrastruktur verbunden sind und das Datenmanagement verbessern. (102 reviews)
- Maschinelles Lernen (97 reviews)
- Benutzer lieben die **effektiven Datenverwaltungsfunktionen** von Databricks, die Arbeitsabläufe vereinfachen und die Entscheidungsfindung verbessern. (87 reviews)

**What users dislike:**

- Benutzer bemerken eine signifikante **Lernkurve** bei Databricks, insbesondere aufgrund seiner komplexen Berechtigungen und Berechnungsmodi. (78 reviews)
- Benutzer finden die **Kosten für Databricks hoch** , insbesondere bei der Arbeit mit großen Datensätzen und komplexen Operationen. (71 reviews)
- Benutzer finden die **steile Lernkurve** von Databricks herausfordernd, insbesondere für diejenigen, die neu in Big-Data-Tools sind. (64 reviews)
- Benutzer finden die **Komplexität** von Databricks herausfordernd, insbesondere bei fortgeschrittenen Funktionen und den anfänglichen Einrichtungserfordernissen. (45 reviews)
- Benutzer erleben anfangs einen **komplexen Einrichtungsprozess** , aber der Support hilft, die Erfahrung im Laufe der Zeit zu vereinfachen. (35 reviews)
- Leistungsprobleme (34 reviews)
- Benutzer stehen vor **unintuitiven UI-Problemen** , die zu zufälligen Fehlern führen und die Erfahrung für nicht-technische Benutzer erschweren. (34 reviews)
- Schlechtes UI-Design (33 reviews)
- Benutzer finden die **fehlenden Funktionen** in Databricks einschränkend, was die Produktivität behindert und das Gesamterlebnis kompliziert macht. (31 reviews)
- Kosten (29 reviews)

## Databricks Reviews
  ### 1. Databricks in meinem Fall: Mehrere Integrationen, Intuitive Benutzeroberfläche und Zuverlässige Leistung

**Rating:** 4.0/5.0 stars

**Reviewed by:** Yelnur K. | Schedule Manager, Luftfahrt, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** May 19, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir an Databricks am meisten gefällt, ist der Integrationsbereich. Am Arbeitsplatz integrieren wir Datenbanken in mehrere Datenquellen. Außerdem kann ich meine Bewertung nicht abschließen, ohne das UX- und UI-Design zu erwähnen, das den gesamten Arbeitsablauf intuitiv und wirklich benutzerfreundlich erscheinen lässt. Was die Geschwindigkeit der Prozesse betrifft, hat es uns nie enttäuscht. Es funktioniert wie erwartet. Im Vergleich zu den Marktpreisen ist der Preis des Dienstes für uns recht zuverlässig. Es gibt ein Help Center von Databricks, wenn Sie keine Antworten auf Ihre Fragen finden, gibt es Spezialisten, die Ihnen bei Ihren Anfragen helfen können. Zum Beispiel erinnere ich mich an einen Fall, bei dem wir ein Problem im Prüfungsprozess hatten, und sie halfen uns, dieses Problem zu lösen.

**Was gefällt Ihnen an Databricks nicht?**

Von den Abneigungen gegenüber der KI-Qualität von Genie. Leute, es könnte verbessert werden, besonders der Teil mit der Argumentation. Außerdem kann ich den Fall erwähnen, als wir ein Problem mit dem Prüfungsprozess hatten. Spezialisten haben uns geholfen, aber es hat uns ein wenig Unannehmlichkeiten bereitet. Nun,

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

In der Luftfahrt nutzen wir diese Software zur Datenanalyse. Wir haben viele Prozesse automatisiert, die einfache Arbeitsplatzwerkzeuge nicht bewältigen können. Wir integrieren uns auch mit mehreren Tools (Namen, die ich aus Sicherheitsgründen nicht nennen kann). Insbesondere hilft es uns, die Passagiernachfrage nach Route und Saison zu analysieren. Wir kombinieren und analysieren große Datensätze mit dieser Software. Insgesamt ein gutes Werkzeug. Unser Team ist zufrieden.

**Official Response from Sara Steffen:**

> Vielen Dank für Ihr ausführliches Feedback. Wir freuen uns zu hören, dass Databricks bei der Automatisierung von Prozessen und der Analyse großer Datensätze für Ihre Luftfahrtbedürfnisse eine wichtige Rolle gespielt hat. Wir nehmen Ihr Feedback zu Genie AI und den Support-Prozessen ernst und sind bestrebt, in diesen Bereichen Verbesserungen vorzunehmen.

  ### 2. Lakebase - Gute Option für die Bereitstellung von Daten mit niedriger Latenz und Integration in Databricks

**Rating:** 4.5/5.0 stars

**Reviewed by:** Senthil K. | Associate Director, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 25, 2026

**Was gefällt Ihnen an Databricks am besten?**

Ich habe die Lakebase eingerichtet, die mit dem Lakehouse für den Zugriff auf Unternehmensanwendungen mit niedriger Latenz synchronisiert ist. Wir haben die folgenden Optionen aktiviert:

- Lakebase verwendet Postgres 17, die HTTPS Data API erleichtert den Zugriff auf die Datenbank von Databricks Apps.

- Integrationssynchronisation zwischen Lakehouse und Lakebase für den API-Zugriff.

- Es gibt eine Verzweigungsoption, um Schema- oder Funktionsänderungen zu verwalten.

- Wiederherstellung von einem früheren Punkt/Zeitverlauf - hilft, den Wiederherstellungsaufwand zu reduzieren - Unterstützung für Snapshots und Backups.

- Autoskalierung der Rechenleistung und Aussetzungsoption.

- Überwachung, Protokolle und Abfragemetriken bieten Einblick in aktive Abfragen, Leistung und Datenbankgesundheit.

- OAuth-Zugriff und Postgres rollenbasierte Verbindung bieten bessere Sicherheit und kontrollierten Zugriff.

Lakebase-Preismodell mit Autoskalierung und Skalierungsoption basierend auf verfügbaren Rechenpreisen.

**Was gefällt Ihnen an Databricks nicht?**

Lakebase bietet nicht alle PostgreSQL-Funktionen, daher können wir keine vorhandene PostgreSQL-Datenbank direkt auf Lakebase migrieren.

Das Herunterskalieren auf Null erfolgt nicht sofort, es traten einige Probleme auf, wie z.B. eine kurzfristige Trennung von der App und temporäre Pausen.

Benutzerdefinierte Administratoroperationen in der PostgreSQL-Datenbank sind begrenzt und nicht möglich.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Lakebase hilft dabei, nahezu Echtzeit-Inventardaten bereitzustellen, die Verfügbarkeit zu verfolgen und Out-of-Stock-Situationen zu reduzieren.

Verarbeitete Lakehouse-Daten können über Lakebase für Kundenkaufmuster, Produktempfehlungen und die Effektivität von Werbeaktionen bereitgestellt werden.

Transaktionsverkaufsdaten können schnell für Dashboards auf Filialebene verfügbar gemacht werden, um Geschäftsteams dabei zu helfen, Verkaufstrends mit Web-Apps zu überwachen.

Nahezu Echtzeit-Verfügbarkeit von Betriebsdaten
Anwendungen greifen auf Daten mit niedriger Latenz für Preisgestaltung und Werbeaktionen für TPO-TPM-Integrationen zu.

Außerdem haben wir die KI integriert, um den Echtzeit-Kontext einzubeziehen.

Niedrige Latenz

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie Ihre positiven Erfahrungen mit Genie geteilt haben, einschließlich seiner Fähigkeit, die Lücke zwischen Geschäfts- und Datenteams zu überbrücken, Datensilos zu beseitigen und die Kosten- und Leistungsübersicht zu verbessern. Wir verstehen Ihre Bedenken hinsichtlich der Einschränkungen des Agentenmodus und des Bedarfs an weiterer Autonomie. Wir werden daran arbeiten, diese Bereiche zu adressieren, um Ihr Gesamterlebnis zu verbessern.

  ### 3. All-in-One Delta Lake Plattform, die ETL schnell und kosteneffizient macht

**Rating:** 5.0/5.0 stars

**Reviewed by:** Kavipriya S. | Data Engineer, Informationstechnologie und Dienstleistungen, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** May 27, 2026

**Was gefällt Ihnen an Databricks am besten?**

Delta Lake + Workflows + Unity Catalog in einer Plattform haben die Notwendigkeit beseitigt, separate Tools für die Datenaufnahme, -transformation und -verwaltung zusammenzuführen. Als Dateningenieur verbringe ich mehr Zeit mit dem Erstellen von Pipelines und weniger Zeit mit dem Verwalten der Infrastruktur. Die Notebook-Erfahrung und das automatische Skalieren von Clustern machen das Iterieren an komplexen ETL-Prozessen schnell und kosteneffizient.

**Was gefällt Ihnen an Databricks nicht?**

Cluster-Startzeiten und Kostenprognosen sind immer noch die größten Reibungspunkte für mich. Kaltstarts können Ad-hoc-Arbeiten wirklich verlangsamen, und die DBU-Kosten müssen genau überwacht werden, um unangenehme Überraschungen zu vermeiden. Die Workflows-Benutzeroberfläche hat sich im Laufe der Zeit stark verbessert, aber sie fühlt sich immer noch nicht so flexibel an wie dedizierte Orchestratoren, wenn man mit komplexeren DAGs zu tun hat. Trotzdem sehe ich diese hauptsächlich als Feinschliffpunkte – der Kernwert der Plattform überwiegt sie bei weitem.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks adressiert ein großes Fragmentierungsproblem in unserem Data-Engineering-Stack. Früher haben wir auf separate Tools für Ingestion, Transformation, Orchestrierung und Governance gesetzt – jedes mit seiner eigenen Lernkurve, Wartungsaufwand und potenziellen Fehlerquellen. Jetzt ist alles in einer einzigen Plattform konsolidiert.

In der Praxis hilft es uns, groß angelegte ETL-Pipelines zu betreiben, die täglich Millionen von Datensätzen verarbeiten, wobei Delta Lake die Zuverlässigkeit durch ACID-Transaktionen, Schema-Durchsetzung und Zeitreisen für Debugging verbessert. Es schließt auch die Kollaborationslücke zwischen Dateningenieuren und Datenwissenschaftlern: Wir bauen die Pipelines, und sie können dieselben Tabellen direkt in Notebooks nutzen, ohne Daten duplizieren oder Synchronisierungsprobleme haben zu müssen.

Unity Catalog hat ein langjähriges Governance-Problem gelöst, indem es die Zugriffskontrolle über Arbeitsbereiche hinweg zentralisiert hat. Insgesamt führt dies zu einer schnelleren Pipeline-Entwicklung, weniger Produktionsvorfällen, die mit Datenqualitätsproblemen verbunden sind, und deutlich weniger zu wartendem Glue-Code. Was früher Wochen dauerte, um aufgebaut und stabilisiert zu werden, dauert jetzt Tage.

**Official Response from Jess Darnell:**

> Wir freuen uns zu hören, dass Databricks Ihren Data-Engineering-Stack konsolidiert und die Zuverlässigkeit Ihrer ETL-Pipelines verbessert hat. Wir verstehen Ihr Feedback zu den Cluster-Startzeiten und der Kostenprognose und arbeiten aktiv daran, diese Aspekte unserer Plattform zu optimieren, um ein besseres Benutzererlebnis zu bieten.

  ### 4. Self-Service-Analytik und starke Autopilot-Leistung

**Rating:** 4.0/5.0 stars

**Reviewed by:** Bob K. | Data and Analytics Leader, Informationstechnologie und Dienstleistungen, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** May 27, 2026

**Was gefällt Ihnen an Databricks am besten?**

Die Verwaltung von Berechtigungen über diverse Vertriebs- und Marketingteams hinweg wurde vereinfacht. Der Katalog ermöglichte es uns, sensible Daten einfach zu sichern, während unser Team und Analysten weiterhin selbstständig arbeiten konnten. Die automatisierte Spaltenebenen-Abstammung war äußerst nützlich, um nachzuvollziehen, wie unsere Pipeline-Prognosemetriken berechnet wurden.

Ich mag die Autopilot-Leistung. Mein Team verbrachte weniger Zeit mit der manuellen Datenbankwartung. Die prädiktive Optimierung übernahm automatisch die Dateikompaktierung (Optimieren) und bereinigte alte Dateien (Vakuum). Zusätzlich hielt Liquid Clustering unsere schnell wachsenden Verkaufstransaktionstabellen effizient, ohne dass wir komplexe Partitionierungsstrategien manuell entwerfen und pflegen mussten.

Die Unterstützung für offene Formate wie Delta Lake und Apache Iceberg stellte sicher, dass unsere Daten portabel blieben. Durch offene APIs und Delta Sharing konnten wir Erkenntnisse sicher mit externen Geschäftspartnern teilen, ohne massive Datensätze replizieren und verschieben zu müssen.

Noch etwas: Die Plattform ermöglichte es unserem Data-Engineering-Team und Analysten, an einem Ort zusammenzuarbeiten. Diese Ausrichtung zwischen technischer Architektur und Geschäftsstrategie erleichterte es, technische Pipeline-Modelle in kommerziellen Wert umzuwandeln.

**Was gefällt Ihnen an Databricks nicht?**

Wie wir wissen, ändern sich die Datenschemata von Vertriebs- und Marketing-Tools häufig, z.B. durch das Hinzufügen oder Umbenennen von benutzerdefinierten Feldern in Salesforce. Wenn diese Updates auftraten, scheiterten unsere Ingestionsströme, die Auto Loader oder strukturiertes Streaming verwenden, und erforderten manuelle Neustarts, um sich anzupassen. Dies führte gelegentlich zu vorübergehenden Verzögerungen bei der Aktualisierung unserer operativen Dashboards.

Das Verfolgen komplexer, mehrstufiger Marketing-Attributionen und Kundenreisen erforderte zustandsbehaftete Streaming-Operationen (wie Joins und Aggregationen). Das Verwalten von ungeordneten Ereignisprotokollen und spät eintreffenden Daten in diesen Streams erwies sich als hochkomplex und erforderte erhebliche kundenspezifische Ingenieurarbeit, um sicherzustellen, dass die Ergebnisse genau blieben.

Da von Unity Catalog verwaltete Tabellen keinen pfadbasierten Zugriff unterstützen, mussten wir sicherstellen, dass alle Altsysteme und externen Systeme auf die Verwendung ordnungsgemäßer dreistufiger Namenskonventionen umgestellt wurden, was anfängliche Refactoring-Bemühungen erforderte, um Datenzugriffsfehler zu vermeiden.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Bei Basware lag mein Hauptaugenmerk darauf, die globalen Vertriebs- und Marketingteams dabei zu unterstützen, ihre Leistung zu optimieren, genaue Pipeline-Prognosen zu erstellen und eine robuste Governance unserer Kundendaten sicherzustellen. Databricks diente als grundlegende Plattform, um diese Ziele zu erreichen.

Wir nutzten Lakeflow Connect, insbesondere den Salesforce Connector, zusammen mit anderen Ingestionsmethoden, um Daten aus unserem CRM, Marketing-Automatisierungssystemen und lokalen Dateien in das Lakehouse zu ziehen. Dies ermöglichte es uns, eine konsolidierte, einheitliche Sicht auf den Kunden zu erstellen.

Lakeflow Spark Deklarative Pipelines halfen uns, unsere rohen Marketing- und Vertriebsdaten in eine Medaillon-Architektur zu organisieren. Das bedeutet, dass wir semi-strukturierte Marketing-Ereignisprotokolle und CRM-Datensätze in strukturierte Datensätze umwandeln konnten, die für Business Intelligence und Prognosen bereit sind.

Um den VP of Sales & Marketing Operations und andere Führungskräfte zu unterstützen, setzten wir AI/BI-Genie-Räume ein. Dies ermöglichte es Führungskräften, Pipeline-Metriken und Prognosetrends in natürlicher Sprache abzufragen. Für Standardberichte nutzten wir Partner Connect, um unsere sauberen Gold-Tabellen direkt mit externen BI-Tools zu verknüpfen.

**Official Response from Jess Darnell:**

> It's great to hear how Databricks has helped you optimize sales and marketing performance, build accurate pipeline forecasts, and ensure robust governance around customer data. We're committed to providing a platform that supports your business goals and enables efficient data management and analysis. Thank you for sharing your use case with us.

  ### 5. Leistungsstarke Telemetrie-Pipelines mit niedriger Latenz durch Streaming-Tabellen und materialisierte Ansichten

**Rating:** 4.0/5.0 stars

**Reviewed by:** Jose P. | Head of Network Strategy, Telekommunikation, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** May 26, 2026

**Was gefällt Ihnen an Databricks am besten?**

In einer Telekommunikationsumgebung, die riesige Datenmengen aus Festnetz- und Mobilfunknetzen (GPON, 4g/5g Core und RAN) verarbeitet, werden unstrukturierte oder halbstrukturierte Frequenztelemetriedaten schrittweise von unseren virtualisierten Funktionen wie vEPC, vCPE oder VHGW mit minimalem Aufwand aufgenommen.

Mein Team arbeitet eng mit virtualisierten Netzwerkfunktionen und Multi-access Edge Computing zusammen. Funktionen wie Streaming Tables und Materialized Views helfen uns, latenzarme Pipelines zu erstellen, die Netzwerkleistungsmetriken nahezu in Echtzeit verarbeiten und uns dabei unterstützen, Netzwerk-KPIs und die Effizienz der Dienstqualität zu überwachen.

Da die Kernkompetenz meines Teams eher im Netzwerkdesign und der Systemvirtualisierung als in der Datenbankverwaltung liegt, sind Predictive Optimization und Liquid Clustering äußerst vorteilhaft. Sie übernehmen autonom die Tabellenwartung, Dateikompaktierung und Datenlayout-Optimierung, sodass unsere Ressourcen für den Fokus auf die Netzwerkarchitektur frei werden.

**Was gefällt Ihnen an Databricks nicht?**

Virtualisierte Netzwerkfunktionen, Router und disaggregierte Hardware unterliegen häufig Software-Upgrades, die oft subtile Änderungen in den Telemetrie-Ausgabeschemata einführen. Bei der Verwendung von strukturiertem Streaming oder Auto Loader führen diese Schemaabweichungen dazu, dass unsere Streaming-Abfragen fehlschlagen, was einen manuellen Neustart des Streams erfordert, um das Schema neu zu planen.

Wenn wir die Logik eines komplexen Netzwerk-KPIs aktualisieren müssen, der innerhalb einer materialisierten Ansicht definiert ist, löst jede Änderung der Abfrage eine vollständige Neuberechnung der Ansicht aus. Angesichts des massiven Umfangs der Telekom-Transaktionsdatensätze kann dies zu spürbaren Rechenkosten führen.

Wir verlassen uns auf eine Vielzahl von Datenwerkzeugen innerhalb unseres IKT-Ökosystems, aber nicht alle Lösungen, die in Partner Connect enthalten sind, unterstützen nativ den Unity-Katalog. Dies kann Integrations- und Governance-Hürden schaffen, wenn wir versuchen, bestimmte Drittanbieter-Analyse- und Datenvorbereitungstools mit unserem gesicherten Data Lake zu verbinden.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Wir erfassen kontinuierliche Datenströme von Leistungsdaten aus virtualisierten Netzwerkfunktionen und traditionellen Transportschichten. Durch den Aufbau von Streaming-Pipelines können wir virtualisierte Kerne und Router überwachen, um Anomalien oder Verschlechterungen im Netzwerkverkehr zu identifizieren.

In Übereinstimmung mit meinem Interesse an Netzwerk-KI und maschinellem Lernen nutzen unsere Datenwissenschaftler die Plattform, um prädiktive Modelle zu entwickeln. Wir trainieren Modelle auf historischen GPON/DSL-Leitungsausfällen, Mobilfunkmastbelastungen und Nutzungsmustern von Kunden, um Netzwerkkongestionen vorherzusagen, proaktive Wartung zu planen und Kundenabwanderung in verschiedenen Kundensegmenten zu mindern.

Als Evangelist für technologische Evolution nutze ich die Plattform, um die Lücke zwischen unseren Kernnetzwerkteams und den Geschäftseinheiten zu überbrücken. Durch die Verbindung von Geschäftsbedeutungen und die Etablierung sicherer Delta-Sharing-Protokolle bieten wir Geschäftsanalysten und Entscheidungsträgern einen geregelten, selbstbedienten Zugang zu Netzwerkeinblicken, ohne die Einhaltung von Sicherheitsvorschriften zu gefährden.

**Official Response from Jess Darnell:**

> Es ist fantastisch zu hören, wie Databricks Ihnen hilft, kontinuierliche Datenströme von Leistungsdaten zu erfassen und zu verarbeiten, prädiktive Modelle zu entwickeln und die Lücke zwischen Netzwerktechnik-Teams und Geschäftseinheiten zu schließen. Wir sind bestrebt, Lösungen bereitzustellen, die unseren Nutzern in verschiedenen Aspekten ihrer Arbeit zugutekommen.

  ### 6. Datenverwaltungssysteme mit einem einheitlichen Lakehouse-Ansatz weniger chaotisch gestalten

**Rating:** 5.0/5.0 stars

**Reviewed by:** Hunar M. | Data Analyst, Geospatial Intelligence - Data &amp; Analytics, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** May 21, 2026

**Was gefällt Ihnen an Databricks am besten?**

Das Ökosystem. Was mir an Databricks am meisten gefällt, ist, wie es viel von dem üblichen Chaos beseitigt, auf das man bei der Datenarbeit stößt. Anstatt separate Tools für Engineering, Analytik und ML zu jonglieren und dann zusätzliche Zeit damit zu verbringen, sie miteinander kommunizieren zu lassen, bringt es alles an einen Ort. Allein das reduziert viel Reibung und spart Zeit.

Ich mag auch die Lakehouse-Idee, weil sie sich wirklich praktisch anfühlt: Man muss sich nicht zwischen einem Data Lake und einem Warehouse entscheiden. Man kann mit einem einheitlichen Setup arbeiten und trotzdem Leistung erhalten, wenn man sie braucht.

Auf täglicher Ebene ist es auch schön, dass verschiedene Teams in derselben Umgebung zusammenarbeiten können, ohne ständig Daten kopieren oder Pipelines neu erstellen zu müssen. Insgesamt hält es die Dinge einfacher und schneller, besonders wenn man iteriert.

**Was gefällt Ihnen an Databricks nicht?**

Was ich an Databricks nicht mag, ist, dass es sich ein wenig schwerfällig anfühlen kann, wenn man nur etwas Einfaches machen möchte. Es passiert viel im Hintergrund, und obwohl das für die Skalierung großartig ist, bringt es auch eine Lernkurve mit sich. Dinge wie Cluster, Konfigurationen und die Einrichtung von Jobs benötigen einige Zeit, um sich damit wohlzufühlen.

Kosten sind ein weiteres Anliegen. Der Verbrauch kann schnell ansteigen, wenn man ihn nicht aktiv überwacht, besonders wenn Teams frei Rechenleistung hochfahren können. Und manchmal fühlt sich das Gesamterlebnis ein wenig fragmentiert an zwischen Notebooks, Jobs und Repos, anstatt ein reibungsloser, einheitlicher Ablauf zu sein.

Also ja – es ist mächtig, aber es erfordert definitiv Disziplin, um die Dinge sauber, effizient und unter Kontrolle zu halten.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Was Databricks für mich wirklich löst, ist die übliche Reibung, die auftritt, wenn Datensysteme über zu viele Tools verteilt sind.

Anstatt ein System für die Erfassung, ein anderes für die Speicherung, ein weiteres für die Transformation und dann wieder separate Setups für Analytik und ML zu betreiben, bringt es das meiste davon an einen Ort. Das bedeutet, dass ich die Daten nicht ständig verschieben oder mir ständig Sorgen machen muss, dass Dinge aus dem Gleichgewicht geraten.

Aus einer Lösungsperspektive ist das ein großer Gewinn, weil es das Gesamtdesign vereinfacht. Anstatt eine Vielzahl von Systemen zusammenzufügen, kann man um ein einziges Lakehouse-Setup herum aufbauen, das mehrere Anwendungsfälle unterstützt. Es ist einfacher zu skalieren, einfacher zu verwalten und insgesamt einfach leichter zu verstehen.

Im Alltag bedeutet es auch, dass ich weniger Zeit mit Infrastruktur und Technik verbringe und mehr Zeit damit, darüber nachzudenken, wie man gute Datenmodelle und Pipelines entwirft. Und weil alle mit denselben Daten arbeiten, gibt es viel weniger Verwirrung und Nacharbeit zwischen den Teams.

Insgesamt entfernt es viel Lärm und lässt mich darauf konzentrieren, solide, skalierbare Datenlösungen zu bauen.

**Official Response from Jess Darnell:**

> Wir freuen uns zu hören, dass Sie unser Ökosystem und den Lakehouse-Ansatz als vorteilhaft für die Vereinfachung und Vereinheitlichung Ihrer Datenarbeit empfinden. Wir verstehen Ihre Bedenken hinsichtlich der Lernkurve und der Kosten und arbeiten kontinuierlich daran, die Benutzererfahrung zu verbessern und kostengünstige Lösungen anzubieten. Vielen Dank, dass Sie uns Ihr ausführliches Feedback mitgeteilt haben.

  ### 7. Databricks zentralisiert Daten, Analysen und KI

**Rating:** 5.0/5.0 stars

**Reviewed by:** Leonardo Q. | RPA Developer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** May 16, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir an Databricks am meisten gefällt, ist, wie es Datenengineering, Analytics und KI auf einer einzigen Plattform zentralisiert, was den Arbeitsablauf im Alltag erheblich erleichtert. Die Integration zwischen Notebooks, Pipelines und verteiltem Processing macht die Entwicklung schneller und organisierter, insbesondere bei Projekten mit großem Datenvolumen und Automatisierungen.

Ein weiterer Punkt, den ich als sehr stark empfinde, ist die Erfahrung mit Apache Spark, die auf vereinfachte Weise integriert ist. Selbst in komplexeren Szenarien ist die Leistung in der Regel ausgezeichnet, was es ermöglicht, Daten in großem Maßstab mit guter Stabilität und Skalierbarkeit zu verarbeiten. Das hilft erheblich bei Integrationen, ETLs und Analysen, die in anderen Lösungen deutlich mehr Aufwand erfordern würden.

**Was gefällt Ihnen an Databricks nicht?**

Obwohl ich die Plattform sehr mag, können einige Aspekte von Databricks immer noch herausfordernd sein. Der Hauptpunkt ist die Kosten, insbesondere in Umgebungen mit intensiver Verarbeitung oder wenn die Cluster nicht gut optimiert sind. Ohne eine strengere Nutzungskontrolle können die Ausgaben schnell steigen.

Ein weiterer Aspekt ist die Lernkurve, die für Teams, die neu im Ökosystem verteilter Daten sind, hoch sein kann. Konzepte im Zusammenhang mit Spark, Clustern, Optimierung und Ressourcenmanagement erfordern eine gewisse Anpassungszeit, insbesondere für diejenigen, die von traditionelleren Werkzeugen kommen.

In Bezug auf UI/UX, obwohl die Benutzeroberfläche im Allgemeinen gut ist, können einige administrative Prozesse und fortgeschrittene Konfigurationen anfangs verwirrend erscheinen. In bestimmten Szenarien kann es auch ein tieferes technisches Wissen erfordern, um Leistungs- oder Berechtigungsprobleme zu identifizieren.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks hat hauptsächlich dabei geholfen, Probleme im Zusammenhang mit der Zentralisierung, Verarbeitung und Analyse großer Datenmengen zu lösen. Früher waren viele Prozesse auf verschiedene Werkzeuge verteilt, was Integrationen, Wartung und Governance erschwerte. Mit Databricks kann ein Großteil des Dateningenieur-, Analytics- und KI-Workflows auf einer einzigen Plattform konzentriert werden, was mehr Konsistenz in die tägliche Arbeit bringt.

**Official Response from Jess Darnell:**

> Wir freuen uns zu hören, dass Sie die Zentralisierung von Daten, Analysen und KI durch Databricks als vorteilhaft für Ihren Arbeitsablauf empfinden. Wir verstehen die Bedeutung von Integration und Vereinfachung und sind bestrebt, eine Plattform bereitzustellen, die Ihren Anforderungen entspricht.

  ### 8. Databricks vereinfacht die Verarbeitung von Big Data und die Zusammenarbeit im Team

**Rating:** 4.5/5.0 stars

**Reviewed by:** Praveen M. | Associate Data Engineer, Informationstechnologie und Dienstleistungen, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** May 07, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir an Databricks am besten gefällt, ist, wie es die Verarbeitung und Zusammenarbeit mit großen Datenmengen auf einer Plattform vereinfacht. Die Integration mit Spark und Cloud-Diensten macht den Umgang mit Big Data viel effizienter. Ich mag auch die Notebook-Umgebung, die es Teams erleichtert, gemeinsam an Analyse- und Machine-Learning-Aufgaben zu arbeiten.

**Was gefällt Ihnen an Databricks nicht?**

Eine Sache, die ich an Databricks nicht mag, ist, dass die Plattform für neue Benutzer komplex wirken kann, insbesondere bei der Verwaltung von Clustern und Konfigurationen. Die Preisgestaltung kann auch bei größeren Arbeitslasten teuer werden, wenn die Ressourcen nicht sorgfältig optimiert werden. Obwohl die Integrationen und KI-Funktionen leistungsstark sind, könnte der Onboarding-Prozess und die Unterstützungsdokumentation benutzerfreundlicher für Anfänger sein.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks hilft dabei, die Herausforderung zu lösen, große Datenmengen effizient in einer Plattform zu verarbeiten und zu analysieren. Es kombiniert Datenengineering, Analytik und KI-Workflows, wodurch der Bedarf an mehreren separaten Tools reduziert wird. Dies verbessert die Zusammenarbeit, beschleunigt die Datenverarbeitung und hilft, Erkenntnisse viel schneller zu gewinnen.

**Official Response from Jess Darnell:**

> Wir freuen uns zu hören, dass Sie Databricks hilfreich finden, um die Verarbeitung und Zusammenarbeit bei großen Datenmengen zu vereinfachen. Unsere Integration mit Spark und Cloud-Diensten ist darauf ausgelegt, den Umgang mit Big Data effizienter zu gestalten.

  ### 9. Perfekt für die Zusammenarbeit zwischen Teams und intensive Datenanwendungen

**Rating:** 5.0/5.0 stars

**Reviewed by:** Artemij V. | Data Science Lead, Kleinunternehmen (50 oder weniger Mitarbeiter)

**Reviewed Date:** May 04, 2026

**Was gefällt Ihnen an Databricks am besten?**

Die Benutzererfahrung ist einer der stärksten Teile. Die Notebook-Erfahrung ist sauber und intuitiv, die Zusammenarbeit ist unkompliziert, und der Übergang zwischen Erkundung, Experimentieren und Produktions-Workflows fühlt sich nahtlos an. Es bietet genug Flexibilität für fortgeschrittene Benutzer, ist aber dennoch so zugänglich, dass die Einarbeitung neuer Teammitglieder schnell geht. Die Leute können normalerweise schnell produktiv werden, ohne Wochen damit zu verbringen, plattformspezifische Eigenheiten zu lernen.

Die Integrationen sind ebenfalls ausgezeichnet. Es funktioniert reibungslos mit dem breiteren Cloud-Ökosystem und verbindet sich gut mit Datenquellen, Orchestrierungswerkzeugen, Modellbereitstellungsinfrastruktur und externen Systemen. Diese Interoperabilität macht es viel einfacher, von einem Prototyp zu einer bereitgestellten Pipeline zu wechseln, ohne ständig Konnektoren neu zu erstellen oder Klebecode zu verwalten.

Die Leistung war durchweg stark, insbesondere bei der Arbeit mit verteilten Workloads und groß angelegtem Feature Engineering. Spark-Optimierung, Cluster-Management und verwaltete Infrastruktur reduzieren den betrieblichen Aufwand erheblich, was es mir ermöglicht, mich mehr auf die Modellentwicklung und Analyse zu konzentrieren, anstatt auf die Feinabstimmung der Umgebung. Für iterative Experimente sind die Startzeiten und die allgemeine Reaktionsfähigkeit spürbar besser als bei vielen alternativen verwalteten Plattformen.

**Was gefällt Ihnen an Databricks nicht?**

Ein Bereich, in dem sich Databricks verbessern könnte, ist die Preisgestaltung. Die Plattform bietet starke Fähigkeiten, aber die Kosten können bei hochfrequenten oder Echtzeit-Workloads schnell ansteigen. Bei Anwendungsfällen, die kontinuierlich laufende, latenzarme Tick-Pipelines, Streaming-Marktdaten oder iterative Modell-Neutrainings umfassen, können die Preise im Verhältnis zur genutzten Infrastruktur ziemlich hoch werden. Es fühlt sich manchmal so an, als gäbe es einen bedeutenden Aufpreis für Bequemlichkeit und verwaltete Orchestrierung, was die Kostenoptimierung zu einer ständigen Überlegung macht.

Die KI-Integration ist ein weiterer Bereich, der sich noch etwas unausgewogen anfühlt. Obwohl es einen klaren Vorstoß gibt, die Plattform als eine umfassende AI/ML-Umgebung zu positionieren, fühlen sich einige der neueren KI-fokussierten Funktionen eher wie Ergänzungen des Ökosystems an als tief integrierte Workflow-Verbesserungen. In der Praxis gibt es immer noch Fälle, in denen benutzerdefinierte Tools oder externe Frameworks mehr Flexibilität und Transparenz bieten, insbesondere für spezialisierte Modellentwicklung, Experimente und Echtzeit-Inferenz-Anwendungsfälle.

Es kann auch einige Komplexität bei der Feinabstimmung von Clustern und der effizienten Verwaltung von Kosten im großen Maßstab geben. Obwohl die Abstraktionen hilfreich sind, erfordert das Erreichen des besten Leistungs-Kosten-Verhältnisses manchmal tiefere Plattformkenntnisse, als die Positionierung als „vollständig verwaltet“ vermuten lässt.

Insgesamt ist die Plattform technisch sehr stark, aber die Preisgestaltung für ständig laufende datenintensive Workloads und die Reife einiger KI-nativer Fähigkeiten sind die beiden größten Bereiche, in denen ich Verbesserungen sehen möchte.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks löst eine der größten Herausforderungen in der modernen Datenarbeit: die Zusammenführung von Datenzugriff, großskaliger Verarbeitung und kollaborativer Entwicklung in einer einzigen Umgebung.

Für meine Arbeit ist der größte Vorteil die Echtzeit-Zusammenarbeit. Sie ermöglicht es mehreren Personen, mit denselben Datensätzen, Notebooks und Pipelines zu arbeiten, ohne die üblichen Reibungen durch fragmentierte Tools oder Inkonsistenzen in der Umgebung. Das beschleunigt die Experimentation, Iteration und den Wissensaustausch über Projekte hinweg erheblich, insbesondere wenn man schnell an der Modellentwicklung arbeitet oder sich mit sich schnell ändernden Daten befasst.

Es löst auch die Herausforderung des skalierbaren Datenzugriffs und der Verarbeitung. Die Arbeit mit hochvolumigen Zeitreihen- und Transaktionsdatensätzen erfordert eine Infrastruktur, die große Datenmengen effizient verarbeiten kann, ohne ständigen operativen Aufwand. Databricks abstrahiert viel von dieser Komplexität, sodass man sich auf Analyse, Feature Engineering und Modellentwicklung konzentrieren kann, anstatt Zeit mit dem Management der Infrastruktur zu verbringen.

Der praktische Vorteil sind schnellere Iterationszyklen. Ich kann viel schneller von der Rohdatenerkundung zur Modellentwicklung und -bereitstellung übergehen, was besonders wertvoll ist, wenn man an Echtzeitanalysen, Prognosepipelines und produktionsorientierten ML-Systemen arbeitet, bei denen die Geschwindigkeit der Iteration direkt die Ergebnisse beeinflusst.

Insgesamt reduziert es den technischen Aufwand und macht die großskalige kollaborative Datenarbeit erheblich effizienter, was zu schnellerer Entwicklung, besserer Experimentation und zuverlässigerer Bereitstellung von Datenprodukten führt.

**Official Response from Jess Darnell:**

> Wir schätzen Ihre gründliche Überprüfung von Databricks und freuen uns zu hören, dass die Plattform bei der Ermöglichung der Zusammenarbeit zwischen Teams und intensiven Datenanwendungen für Ihre Arbeit eine wichtige Rolle gespielt hat. Ihr Feedback zu Preisgestaltung und KI-Integration ist wertvoll, und wir bemühen uns kontinuierlich, diese Aspekte zu verbessern, um unseren Nutzern ein nahtloseres Erlebnis zu bieten.

  ### 10. Genie-Code und Inline-Assistent haben meine Debugging-Produktivität dramatisch gesteigert.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Shyam s. | Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 27, 2026

**Was gefällt Ihnen an Databricks am besten?**

Genie-Code und der Inline-Assistent waren die hilfreichsten Werkzeuge für mein Projekt. Sie halfen mir, eine 2.000-Zeilen-Codebasis zu debuggen und erklärten klar, warum ich keine genauen Daten erhielt. Es stellte auch eine Abfrage zur Verfügung, die ich in meinem Quellsystem (SQLMI) ausführen konnte. Durch das parallele Ausführen des Diskrepanzen-Skripts auf der Quelle und dem Ziel konnte ich den gesamten Code viel schneller debuggen und meine Produktivität verbessern. Insgesamt reduzierte es meine Arbeitszeit von etwa 8 Stunden auf etwa 1 Stunde.

**Was gefällt Ihnen an Databricks nicht?**

In Delta Sharing gibt es keine Katalogebene-SELECT-Berechtigung, und ich denke manchmal, dass es hilfreich wäre, diese zu haben. Außerdem kann die Verwendung des Genie-Codes innerhalb einer VM die Website manchmal unresponsive machen. Dies sind Bereiche, die verbessert werden könnten.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

In einem unserer Migrationsprojekte zur Schadensbearbeitung benötigte der Kunde nahezu Echtzeit-Datenverfügbarkeit für nachgelagerte Anwendungen. Zuvor nutzte die Architektur Amazon Redshift als Data Warehouse, wobei Jasper und Sisense die Daten für Berichterstattung und Analysen konsumierten. Diese Konfiguration unterstützte jedoch kein effizientes Echtzeit- oder nahezu Echtzeit-Streaming, was zu Verzögerungen bei der Datenverfügbarkeit für nachgelagerte Systeme führte.

Nach der Migration der Plattform zu Databricks konnten wir die Datenpipeline-Architektur erheblich verbessern. Wir implementierten Streaming zusammen mit optimierten ETL-Pipelines, wodurch der Datenaktualisierungszyklus auf etwa 30 Minuten reduziert wurde. Wir erstellten auch eine dedizierte Ansicht, die Daten aus dem vorherigen Lauf beibehält, sodass nachgelagerte Systeme immer einen konsistenten Datensatz zur Verfügung haben, während die nächste Pipeline-Ausführung noch im Gange ist.

Zuvor hatten wir mit verzögerten Aktualisierungszyklen und einer begrenzten Fähigkeit zu kämpfen, nahezu Echtzeit-Datenanforderungen in unserer auf Redshift basierenden Architektur zu erfüllen. Nach dem Umstieg auf Databricks ermöglichten wir schnellere ETL-Verarbeitung und verbesserten die nahezu Echtzeit-Datenverfügbarkeit.

Als Ergebnis reduzierten wir die ETL-Aktualisierungszeit auf etwa 30 Minuten und ermöglichten nahezu Echtzeitzugriff für nachgelagerte Tools wie Jasper und Sisense. Die Zuverlässigkeit verbesserte sich ebenfalls, da die stabile Ansicht weiterhin die Daten des vorherigen Laufs während der Pipeline-Updates bereitstellt. Schließlich wurde die gesamte Architektur durch die Konsolidierung von Verarbeitungs- und Analysefähigkeiten innerhalb von Databricks einfacher.

Insgesamt half uns Databricks, eine skalierbarere und effizientere Plattform für die nahezu Echtzeit-Datenverarbeitung aufzubauen, was die Aktualität und Zuverlässigkeit der Analysen für den Schadensbearbeitungs-Workflow erheblich verbesserte.

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie uns mitgeteilt haben, wie die Architektur von Databricks Ihnen zugutekommt. Wir haben unsere Plattform entwickelt, um die Herausforderungen bei der Verwaltung von strukturierten und unstrukturierten Daten zu bewältigen, und es ist großartig zu hören, dass sie sich positiv auf Ihre Analyse- und Machine-Learning-Workflows auswirkt.

  ### 11. Die einheitliche Datenplattform, die tatsächlich liefert

**Rating:** 5.0/5.0 stars

**Reviewed by:** Janakiraman K. | Data Engineer, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** March 27, 2026

**Was gefällt Ihnen an Databricks am besten?**

Databricks hat die Art und Weise, wie unser Team End-to-End-Daten-Workflows handhabt, revolutioniert. Einige Highlights:

UI/UX: Die Notebook-Oberfläche ist intuitiv, und der SQL-Editor wirkt ausgereift, was das Umschalten zwischen Python, SQL und Scala im selben Arbeitsbereich erleichtert und ständiges Kontextwechseln spart.

Integrationen: Native Konnektoren zu Azure, Unity Catalog und Delta Sharing bedeuten, dass wir weniger Zeit mit der Infrastruktur verbringen. Lakehouse Federation ermöglicht es uns, externe Quellen abzufragen, ohne Daten zu verschieben, was ein unerwarteter Gewinn war.

Leistung: Die Auto-Optimierung und das Liquid Clustering von Delta Lake haben unsere Abfragezeiten spürbar reduziert. Die Photon-Engine bei schweren Aggregationen ist ein Game-Changer für nahezu Echtzeit-Dashboards.

Preisgestaltung/ROI: Das DBU-Modell erfordert etwas Eingewöhnung, aber die Konsolidierung unseres Data Warehouses, ETL und ML-Tools in einer Plattform hat unsere gesamten Infrastrukturkosten erheblich gesenkt.

Support/Onboarding: Die Databricks Academy und die integrierte Dokumentation haben das Onboarding neuer Ingenieure beschleunigt. Das Community-Forum ist überraschend aktiv für Nischenfragen.

KI/Intelligenz: Genie (AI/BI) ermöglicht es Geschäftsanwendern, Fragen in einfachem Englisch zu stellen und genaue Ergebnisse zu erhalten, was die Ad-hoc-Anfragen an unser Datenteam spürbar reduziert. Der Databricks Assistant in Notebooks beschleunigt auch die Code-Generierung und das Debugging.

**Was gefällt Ihnen an Databricks nicht?**

Obwohl Databricks leistungsstark ist, gibt es einige echte Reibungspunkte, die erwähnenswert sind:

UI/UX: Die Benutzeroberfläche kann für neue Benutzer überwältigend wirken, da die Navigation zwischen Workspaces, Katalogen und SQL-Warehouses nicht immer intuitiv ist. Die Organisation von Ordnern und Notizbüchern könnte von Anfang an strukturierter sein.

Integrationen: Einige Drittanbieter-Connectoren erfordern immer noch manuelle Konfiguration und benutzerdefinierten Code. Lakehouse Federation ist vielversprechend, aber gelegentlich inkonsistent mit bestimmten Quellsystemen, was zusätzliche Fehlersuche erfordert.

Leistung: Die Startzeiten von Clustern bleiben ein Schmerzpunkt; Kaltstarts bei interaktiven Clustern können schnelle Arbeitsabläufe stören. Serverless-Computing hilft, ist aber noch nicht universell für alle Funktionen verfügbar.

Preisgestaltung/ROI: Das auf DBU basierende Preismodell fehlt es an Transparenz für neuere Teams. Es ist leicht, unerwartete Kosten zu verursachen, wenn keine sorgfältigen Cluster-Richtlinien und Überwachungen vorhanden sind. Ein einfacherer Kostenrechner würde erheblich helfen.

Support/Onboarding: Die Reaktionszeiten des Enterprise-Supports können bei nicht kritischen Tickets langsam sein. Bei komplexen Architekturproblemen dauert es oft mehrere Eskalationen, um zum richtigen Experten zu gelangen.

KI/Intelligenz: Genie funktioniert gut für Standardabfragen, hat jedoch Schwierigkeiten mit komplexer Multi-Tabellen-Logik oder domänenspezifischer Terminologie ohne erhebliche Feinabstimmung. Der Databricks-Assistent in Notizbüchern generiert gelegentlich veraltete oder falsche API-Vorschläge.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Hier ist eine natürliche, geschichtengetriebene Antwort im "Vorher/Nachher/Ergebnis"-Format:

Vor Databricks war unsere Datenlandschaft fragmentiert, und separate Tools für ETL, Data Warehousing und ML führten zu doppelten Pipelines, inkonsistenten Datendefinitionen und erheblichem technischen Aufwand, nur um die Infrastruktur zu pflegen.

Datenvereinheitlichung: Wir hatten Schwierigkeiten mit isolierten Daten aus mehreren Quellsystemen. Jetzt, mit Unity Catalog und der Medaillon-Architektur (Bronze/Silber/Gold), haben wir eine einzige, verwaltete Schicht, der alle Teams vertrauen, was den Aufwand für die Datenabstimmung um fast 40 % reduziert.

Pipeline-Zuverlässigkeit: Der Aufbau und die Wartung von metadatengetriebenen Pipelines erforderte früher benutzerdefinierte Frameworks. Databricks' Lakeflow und Delta Live Tables bieten uns inkrementelle und vollständige Ladefähigkeiten direkt aus der Box, was die Entwicklungszeit für Pipelines erheblich verkürzt.

Self-Service-Analytik: Geschäftsteams waren ständig auf Ingenieure für Ad-hoc-Abfragen angewiesen. Mit Genie (AI/BI) können Stakeholder jetzt Fragen in einfacher englischer Sprache an kuratierte Gold-Tabellen stellen, was die Ad-hoc-Datenanfragen an unser Team merklich Woche für Woche reduziert.

Cloud-Kostenkontrolle: Wir betrieben zuvor immer aktive Cluster ohne Einblick in die Ausgaben. Serverless-Computing und Cluster-Richtlinien ermöglichen es uns jetzt, Workloads richtig zu dimensionieren, was zu einer messbaren Reduzierung der Infrastrukturkosten führt.

Schnellere Einarbeitung: Neue Ingenieure benötigten früher Wochen, um produktiv zu werden. Mit Databricks Assistant, Notebook-Vorlagen und zentralisierter Unity Catalog-Dokumentation hat sich die Einarbeitungszeit erheblich verkürzt.

Insgesamt: Databricks hat im Wesentlichen 3-4 separate Tools durch eine kohärente Plattform ersetzt. Der ROI liegt nicht nur in den Kosteneinsparungen, sondern auch in der Geschwindigkeit und dem Vertrauen, mit dem wir jetzt Datenprodukte an das Unternehmen liefern.

**Official Response from Janelle Glover:**

> Wir freuen uns zu hören, dass Sie Databricks für Datenengineering, Analysen und maschinelles Lernen wertvoll finden. Vielen Dank, dass Sie Ihr Feedback mit uns teilen!

  ### 12. Skalierbare All-in-One-Umgebung mit einer gewissen Lernkurve

**Rating:** 5.0/5.0 stars

**Reviewed by:** Antonio V. | Data &amp; AI Consultant, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 28, 2026

**Was gefällt Ihnen an Databricks am besten?**

Ich mag Databricks wegen seiner Skalierbarkeit und der All-in-One-Umgebung für Data Engineering, Analytik und maschinelles Lernen. Es ermöglicht mir, große Datensätze effizient zu verarbeiten und gleichzeitig Arbeitsabläufe auf einer Plattform organisiert zu halten. Die Skalierbarkeit ist sehr wertvoll, da sie es mir ermöglicht, wachsende Datenmengen und komplexe Arbeitslasten ohne Leistungsprobleme zu bewältigen. Wenn Projekte wachsen, kann die Plattform Ressourcen effizient skalieren.

**Was gefällt Ihnen an Databricks nicht?**

Einige Funktionen können eine Lernkurve haben, insbesondere für neue Benutzer, die mit fortgeschrittenen Konfigurationen oder Cluster-Management arbeiten. Die Benutzeroberfläche könnte in bestimmten Bereichen auch intuitiver sein. Die Einrichtung verlief relativ reibungslos für Kernfunktionen, aber einige erweiterte Einstellungen wie Cluster-Optimierung, Berechtigungen und Integrationen erforderten mehr Zeit und technisches Wissen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks löst große Herausforderungen im Bereich Datenmanagement und -analyse, indem es große Datensätze effizient verarbeitet, ETL-Prozesse vereinfacht und Workflows zentralisiert. Seine Skalierbarkeit ermöglicht es mir, wachsende Datenmengen ohne Leistungsprobleme zu verwalten und sicherzustellen, dass die Ressourcen effizient skaliert werden, wenn Projekte wachsen.

**Official Response from Jess Darnell:**

> Wir freuen uns zu hören, dass Sie Databricks als skalierbar empfinden und seine All-in-One-Umgebung für Data Engineering, Analytik und maschinelles Lernen schätzen. Wir verstehen, dass einige Funktionen eine Lernkurve haben können, und arbeiten kontinuierlich daran, die Benutzerfreundlichkeit und Intuitivität der Plattform zu verbessern.

  ### 13. Leistung mit Spark und kollaborativen Notebooks, die den Datenfluss effizienter machen

**Rating:** 5.0/5.0 stars

**Reviewed by:** Homero F. | Professor particular, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 19, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir am meisten gefällt, ist die Leistung bei der Verarbeitung großer Datenmengen mit Spark, die kollaborativen Notebooks, die die Teamarbeit erleichtern, und die Integrationen mit AWS und BI-Tools, die den gesamten Datenfluss effizienter machen.

**Was gefällt Ihnen an Databricks nicht?**

Die Kosten können je nach Nutzung hoch sein, und einige Teile der Benutzeroberfläche, wie die Konfiguration von Clustern und Jobs, sind anfangs nicht so intuitiv. Außerdem kann die Lernkurve für neue Benutzer etwas steil sein.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks löst Probleme bei der Verarbeitung großer Datenmengen, der Integration verschiedener Quellen und der Entwicklung von KI-Modellen in einer einzigen Umgebung. Dies verbessert unseren Arbeitsablauf, verkürzt die Verarbeitungszeit und zentralisiert alles auf der Plattform. Die Integrationen mit AWS und anderen Tools erleichtern die Implementierung, und der Support zusammen mit der Dokumentation helfen bei der Anpassung. Darüber hinaus ermöglichen die KI-Ressourcen das schnellere und effizientere Erstellen, Trainieren und Testen von Modellen.

**Official Response from Jess Darnell:**

> Danke für Ihr positives Feedback!

  ### 14. Leistungsstarke einheitliche Analysen mit nahtloser Governance und mühelosem Skalieren

**Rating:** 4.5/5.0 stars

**Reviewed by:** Akhil S. | Senior Data Engineer, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** April 16, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir an Databricks am besten gefällt, ist sein leistungsstarkes und einheitliches Analyse-Ökosystem. Funktionen wie Unity Catalog und Metastore machen die Datenverwaltung und Zugriffskontrolle nahtlos, während die Lakehouse-Architektur das Beste aus Data Lakes und Data Warehouses vereint. PySpark-Unterstützung, dbutils und kollaborative Arbeitsbereiche machen die Entwicklung effizient, und serverloses Computing vereinfacht das Skalieren ohne Infrastruktur-Overhead.

**Was gefällt Ihnen an Databricks nicht?**

Was ich an Databricks nicht mag, ist die langsame Startzeit von Allzweck-Clustern, die den Arbeitsablauf unterbrechen und die Produktivität verringern können. Außerdem kann sich die Git-Integration manchmal etwas träge anfühlen, insbesondere bei Commits oder beim Synchronisieren, was die Versionskontrolle weniger nahtlos macht als erwartet.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks löst die Herausforderung der Verwaltung von End-to-End-Daten-Workflows, indem es eine einheitliche Plattform für Data Engineering, Data Science und Analytik bereitstellt. Es ermöglicht nahtlose Datenverarbeitung, -transformation und Modellentwicklung innerhalb einer einzigen Umgebung.

Dies kommt mir zugute, indem es meinen Workflow sowohl als Data Engineer als auch als Data Scientist vereinfacht und die Notwendigkeit verringert, zwischen verschiedenen Tools zu wechseln. Darüber hinaus ermöglicht die Integration mit Azure Data Factory eine reibungslose Job-Orchestrierung und -Auslösung für höhere Umgebungen, was die Bereitstellungen effizienter und zuverlässiger macht.

**Official Response from Jess Darnell:**

> Wir freuen uns zu hören, dass Databricks Ihre Daten-Workflows vereinfacht und eine nahtlose Integration mit Azure Data Factory bietet. Wir nehmen Ihre Bedenken bezüglich langsamer Startzeiten und Git-Integration zur Kenntnis und sind bestrebt, diese Aspekte zu optimieren, um unseren Nutzern ein reibungsloseres Erlebnis zu bieten. Ihr Feedback hilft uns, Verbesserungen zu priorisieren, die den Bedürfnissen unserer Nutzer entsprechen.

  ### 15. Nahtlose, kollaborative Plattform, die für Datenengineering und ML skaliert

**Rating:** 4.0/5.0 stars

**Reviewed by:** Krish G. | student, Kleinunternehmen (50 oder weniger Mitarbeiter)

**Reviewed Date:** April 15, 2026

**Was gefällt Ihnen an Databricks am besten?**

Die Fähigkeit von Databricks, alles nahtlos zu integrieren, finde ich am ansprechendsten. Bei der Arbeit an tatsächlichen Projekten macht es wirklich einen großen Unterschied, dass man nicht zwischen mehreren Tools für Datenengineering, Analyse und maschinelles Lernen wechseln muss.

Das kollaborative Element ist sehr bemerkenswert. Teams können problemlos zusammenarbeiten, ohne dass es chaotisch wird, dank des flüssigen und dynamischen Gefühls der Notebooks. Für bedeutende Datenarbeit ähnelt es fast genau Google Docs.

Ich mag auch sehr, wie effizient es große Datenmengen verwaltet, ohne dass es schwierig erscheint. Selbst bei der Arbeit mit großen Datensätzen fühlt sich die Plattform benutzerfreundlich an und kann bei Bedarf skaliert werden.

Zusätzlich macht es aus einer KI/ML-Perspektive vollkommen Sinn. Man kann konstruieren,

**Was gefällt Ihnen an Databricks nicht?**

Databricks kann anfangs etwas überwältigend wirken, was mir nicht gefällt. Cluster, Notebooks, Jobs, Workflows – es gibt viel, was passiert, und wenn man neu ist, braucht es einige Zeit, um wirklich zu verstehen, wie alles zusammenarbeitet.

Kostenkontrolle ist ein weiterer Nachteil. Es ist zweifellos stark, aber die Ausgaben könnten schnell steigen, wenn man unvorsichtig mit der Cluster-Nutzung oder den Auto-Scaling-Einstellungen umgeht. Um alles unter Kontrolle zu halten, muss man etwas Selbstdisziplin üben und die Dinge im Auge behalten.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Das Fragmentierungsproblem im Daten- und KI-Workflow wird hauptsächlich durch Databricks gelöst. In der Vergangenheit wurden Datenspeicherung, -verarbeitung, -analyse und maschinelles Lernen normalerweise mit verschiedenen Tools durchgeführt, und es war häufig schwierig und zeitaufwendig, sie alle zur Zusammenarbeit zu bringen. Databricks beseitigt viel von dieser Reibung, indem es alles in einer einzigen Plattform kombiniert.
Das macht den Entwicklungsprozess für mich viel nahtloser. Ich muss mir keine Sorgen über Kompatibilitätsprobleme machen oder Zeit mit dem Wechsel zwischen Umgebungen verschwenden. Ich kann Transformationen durchführen, Daten bereinigen und Modelle erstellen, alles an einem Ort, was die Einrichtungszeit verkürzt und die Organisation aufrechterhält.
Es adressiert auch die Schwierigkeit, mit großen Datenmengen umzugehen.
Ich kann mich auf seine verteilten Rechenfähigkeiten verlassen, um anspruchsvolle Arbeitslasten zu bewältigen, anstatt mir von Grund auf über Infrastruktur oder Leistungsoptimierung Gedanken zu machen. Dies ermöglicht es mir, weniger auf Ressourcenmanagement zu konzentrieren und mehr darauf, eine Lösung für das eigentliche Problem zu finden.
Zusammenarbeit ist ein weiteres großes Problem, das es löst. Das Teilen von Code, Ergebnissen und Experimenten kann in Teamumgebungen unorganisiert werden. Da alles mit Databricks konsolidiert ist, ist es einfacher, zusammenzuarbeiten, Änderungen zu überwachen und die Ausrichtung beizubehalten.
Alles in allem hilft es mir, indem es die Komplexität reduziert, Zeit spart und es mir ermöglicht, mich mehr auf die Entwicklung von Lösungen zu konzentrieren – sei es Analysen, maschinelle Lernmodelle oder Datenpipelines – anstatt den Aufwand für die Wartung zahlreicher Tools und Plattformen zu bewältigen.

**Official Response from Jess Darnell:**

> Wir freuen uns zu hören, dass Ihnen die nahtlose Integration und die kollaborativen Funktionen von Databricks zusagen. Wir verstehen, dass die Plattform anfangs überwältigend wirken kann, aber wir bieten umfassende Ressourcen und Unterstützung, um den Benutzern zu helfen, sich schnell einzuarbeiten. Bezüglich der Kostenkontrolle empfehlen wir, unsere Dokumentation und Best Practices zu nutzen, um die Cluster-Nutzung und Auto-Scaling-Einstellungen zu optimieren. Ihr Feedback wird geschätzt und wir sind bestrebt, das Benutzererlebnis kontinuierlich zu verbessern!

  ### 16. Databricks als praktischer Dateningenieur: Lösung von realen ETL-, Governance- und Lakehouse-Herausforderungen

**Rating:** 5.0/5.0 stars

**Reviewed by:** KAVIN P. | Data Engineer, Informationstechnologie und Dienstleistungen, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 08, 2026

**Was gefällt Ihnen an Databricks am besten?**

Ich glaube, das Attraktivste an Databricks liegt in seiner All-in-One-Natur, die das Datenmanagement erleichtert. Früher, als ich mehrere Tools für datenbezogene Aktivitäten nutzte, war die Erfahrung nicht großartig, aber hier scheint alles miteinander verbunden und unkompliziert zu sein.

Die Möglichkeit, Notebooks zu nutzen, insbesondere bei der Arbeit mit PySpark, ist ein weiterer Vorteil von Databricks, den ich im Kern mag. Das Tool ermöglicht es, Änderungen und Modifikationen schnell auszuführen, ohne übermäßige Vorbereitung. Es wirkt sich auch positiv auf den Prozess der Zusammenarbeit in meinem Team aus, das gleichzeitig an seinen Projekten arbeiten und den Gesamtfortschritt überwachen kann. Allerdings kann die Versionskontrolle manchmal etwas unklar erscheinen, meiner Meinung nach.

In Bezug auf die Leistung scheint Databricks für mich effizient im Umgang mit Big Data zu sein und läuft reibungslos ohne Verzögerungen. Das Clustering erfolgt automatisch, was mir und meinem Team Zeit auf der Infrastrukturebene spart. Daher ist es einfach, da keine zusätzliche Planung und Anpassungen erforderlich sind.

Es gibt kleinere Probleme mit der Benutzeroberfläche, die manchmal langsam arbeitet. Aber insgesamt, aufgrund anderer hervorragender Aspekte wie einfacher Methoden zur Implementierung und Integration, ermutigt es mich, Databricks häufig zu nutzen.

**Was gefällt Ihnen an Databricks nicht?**

Ein Aspekt von Databricks, den ich nicht mag, ist die Benutzeroberfläche. Wenn man das Tool länger benutzt, wird das Wechseln zwischen Notebooks und Clustern manchmal lästig.

Ein weiteres Problem sind die Kosten, die sich schneller summieren können, wenn wir nicht vorsichtig sind. Unnötige Cluster können länger laufen als nötig und ohne mein oder das Wissen meines Teams, wodurch die Kosten in unseren Projekten steigen.

Es gibt auch die Komplexität der Fehlersuche, die manchmal schwierig ist, da es zusätzlichen Aufwand erfordert, herauszufinden, wo etwas schiefgelaufen sein könnte, insbesondere bei der Arbeit mit komplexen Pipelines.

Manchmal gibt es auch Unstimmigkeiten im Kundenservice, die uns an Orte führen, an denen wir nicht sein müssen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Das wichtigste Problem, das Databricks löst, ist das Arbeiten mit großen Datenmengen und die Aufrechterhaltung der Konsistenz. Früher gab es separate Prozesse für Datenengineering, Analytik und maschinelles Lernen, die separate Werkzeuge erforderten und es mir schwer machten, damit umzugehen, aber jetzt sind all diese in einem einzigen Ort. Ein weiteres kritisches Problem, das von Databricks gelöst wird, ist die Verarbeitung großer Datenmengen. Die Nutzung von Spark und verteiltem Rechnen ermöglicht es, Aufgaben auszuführen, die auf den Altsystemen, mit denen ich gearbeitet habe, extrem langsam waren. Dies hat dazu beigetragen, meine Pipeline zu beschleunigen, obwohl manchmal Verzögerungen auftreten. Zusammenarbeit ist auch ein weiteres Problem, das Databricks anspricht. Mehrere Benutzer können an demselben Notebook oder Datensätzen zusammenarbeiten. Zusammenarbeit war früher verwirrend, und jetzt ist es einfach und gut und leicht verständlich und vor allem einfach, Notebooks und Assets zu teilen. Skalierbarkeit ist ein weiteres Problem, das von Databricks gelöst wird; es ist nicht notwendig, auf das Infrastrukturmanagement zu achten. Die Skalierung der Cluster hängt von den Benutzeranforderungen ab und spart Zeit. Früher war es notwendig, mehr Aufmerksamkeit auf die Konfiguration der Infrastruktur zu richten.

**Official Response from Jess Darnell:**

> Wir freuen uns zu hören, dass Sie die All-in-One-Natur und die Vernetzung von Databricks als vorteilhaft für das Datenmanagement empfinden, um Ihrem Team Zeit zu sparen. Wir schätzen Ihr Feedback zu den Vorteilen der Nutzung von Notebooks und der Effizienz bei der Verarbeitung großer Datenmengen.

  ### 17. Einheitlicher Databricks-Arbeitsbereich, der die Zusammenarbeit und komplexe Daten-Workflows optimiert

**Rating:** 4.0/5.0 stars

**Reviewed by:** Neeraj Kumar N. | AI Data Specialist | Transcription &amp; Annotation Expert | AI Model Training at Sigma AI, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 12, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir an Databricks am besten gefällt, ist, wie es Datenengineering, Analytik und maschinelles Lernen in einem einheitlichen Arbeitsbereich vereint. Ich finde die Zusammenarbeit mit geteilten Notebooks viel einfacher, und die nahtlose Integration mit Big-Data-Tools spart mir Zeit. Es vereinfacht komplexe Arbeitsabläufe, bietet aber dennoch leistungsstarke Funktionen, wenn ich sie benötige.

**Was gefällt Ihnen an Databricks nicht?**

Eine Sache, die ich an Databricks nicht mag, ist, dass es teuer wirken kann, besonders für kleinere Projekte oder Teams. Ich finde auch, dass die Clusterkonfiguration und das Kostenmanagement manchmal etwas komplex sind. Die Benutzeroberfläche, obwohl leistungsstark, kann für Anfänger überwältigend sein, und das Debuggen von verteilten Jobs ist nicht immer so einfach, wie ich es mir wünschen würde.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks löst die Herausforderung der Verarbeitung, Analyse und des maschinellen Lernens von Daten im großen Maßstab an einem Ort. Für mich beseitigt es den Aufwand, separate Tools und Infrastrukturen zu verwalten. Ich profitiere davon, effizienter zu arbeiten, einfach mit meinem Team zusammenzuarbeiten und komplexe Daten schneller in nützliche Erkenntnisse umzuwandeln, mit insgesamt weniger betrieblichem Aufwand.

**Official Response from Jess Darnell:**

> Wir freuen uns zu hören, dass Sie den einheitlichen Arbeitsbereich und die Kollaborationsfunktionen von Databricks als wertvoll für Ihre Arbeit empfinden. Wir verstehen Ihre Bedenken bezüglich der Kosten und Komplexität und arbeiten kontinuierlich daran, uns in diesen Bereichen zu verbessern.

  ### 18. Zuverlässige Datenplattform mit leistungsstarker Pipeline-Unterstützung

**Rating:** 4.5/5.0 stars

**Reviewed by:** Chandhuru B. | Data Engineer, Informationstechnologie und Dienstleistungen, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 06, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir an Databricks am besten gefällt, ist, wie es Datenengineering, Analytik und maschinelles Lernen in einem sauberen Arbeitsbereich zusammenführt. Es spart Zeit, erleichtert die Zusammenarbeit und hilft Teams, schneller mit großen Datenmengen zu arbeiten.

**Was gefällt Ihnen an Databricks nicht?**

Was ich an Databricks nicht mag, ist, dass der Auto Loader frustrierend werden kann, wenn sich die Quelldaten häufig ändern, insbesondere wenn sich Spaltennamen oder Datentypen ohne Vorwarnung ändern.

Zum Beispiel kann ein Feld wie customer_id plötzlich als cust_id erscheinen, oder eine Spalte, die zuvor ein String war, kann plötzlich als Integer ankommen, was zu Schema-Drift führen und die nachgelagerte Verarbeitung stören kann.

Ich finde es auch unpraktisch, wenn die Schema-Erkennung nicht vollständig genau ist, zum Beispiel wenn verschachtelte JSON- oder semi-strukturierte Daten falsch gelesen werden, da dies dann zusätzliche manuelle Korrekturen und Wartung erfordert, um die Pipelines reibungslos am Laufen zu halten.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks löst das Problem, Datenpipelines in großem Maßstab zu erstellen und zu verwalten, ohne so viel manuellen Aufwand. Es hilft bei zuverlässiger Datenaufnahme, Schemaentwicklung und Orchestrierung, sodass Teams Daten schneller verarbeiten und Pipelines stabiler halten können, selbst wenn sich Quelldateien ändern.

Für mich bedeutet das weniger Zeit, die ich mit der Behebung von fehlerhaften Jobs verbringe, und mehr Zeit, mich auf die Transformation und Nutzung der Daten zu konzentrieren. Es kommt mir auch zugute, indem es Batch- und Streaming-Workflows einfacher macht, auf einer Plattform zu verwalten, was besonders nützlich ist, wenn sich Daten ständig ändern.

**Official Response from Janelle Glover:**

> Wir freuen uns zu hören, dass Sie Databricks als zuverlässige Plattform für Data Engineering, Analysen und maschinelles Lernen empfinden. Wir verstehen den Frust mit Auto Loader, wenn es um häufig wechselnde Quelldaten geht. Wir arbeiten kontinuierlich daran, die Genauigkeit der Schemaerkennung und die Handhabung von verschachtelten JSON- oder semi-strukturierten Daten zu verbessern, um manuelle Korrekturen und Wartung für unsere Nutzer zu minimieren.

  ### 19. Liebe die Databricks und ihre Funktionen sowie den Unity-Katalog für eine optimierte Governance

**Rating:** 4.5/5.0 stars

**Reviewed by:** Prashant N. | Data Engineer, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** May 26, 2026

**Was gefällt Ihnen an Databricks am besten?**

In Databricks mag ich wirklich die neueren Funktionen wie Gennie, den Databricks-Assistenten, Agenten und den Ereignis-Auslösemechanismus.

Auch das Unity Catalog-Feature ist erstaunlich. Einen zentralen Ort für alle Quellen zu haben, macht die Dinge viel einfacher, und UC hilft dabei, Tabellen auf eine organisiertere Weise zu verwalten.

**Was gefällt Ihnen an Databricks nicht?**

Nichts Besonderes zu bemängeln, aber es gibt eine Funktion, um zu einem bestimmten Befehl zu springen. Die Funktion an sich ist in Ordnung, aber sie ist direkt neben dem Notizbuch platziert, was es leicht macht, versehentlich darauf zu klicken, und das unterbricht meinen Arbeitsablauf.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Ich verwende es in meinem Projekt zur Datenverarbeitung und Datenqualitätsanalyse. Mit Databricks und seiner Funktionalität baue ich Agenten im Genie-Bereich. Mit UC verwalte ich alle verwalteten und externen Tabellen an einem Ort.

**Official Response from Jess Darnell:**

> Wir freuen uns zu hören, dass Ihnen die neuen Funktionen wie Gennie, Databricks Assistant, Agents und der Ereignis-Auslösemechanismus sowie das Unity Catalog Feature gefallen. Wir schätzen Ihr Feedback!

  ### 20. Databricks: Vereinheitlichte Plattform für Datenverarbeitung und Analytik

**Rating:** 5.0/5.0 stars

**Reviewed by:** Banu Prakash M. | Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 02, 2026

**Was gefällt Ihnen an Databricks am besten?**

Ich mag, dass Databricks alles an einem Ort zusammenführt, sodass es nicht notwendig ist, verschiedene Werkzeuge für Datenverarbeitung, Analysen und Pipeline-Arbeit zu verwenden. Es verarbeitet große Datenmengen gut, und wir müssen uns keine Sorgen machen, Cluster manuell zu verwalten. Außerdem unterstützt Databricks die Zusammenarbeit und das Experimentieren gut, was es einfach macht, neue Dinge auszuprobieren.

**Was gefällt Ihnen an Databricks nicht?**

Aus meiner Sicht ist der Bereich, der verbessert werden kann, das Kostenmanagement. Wenn Cluster nicht sorgfältig überwacht werden, können die Kosten schneller steigen als erwartet. Eine Verbesserung, die helfen würde, ist eine bessere Sichtbarkeit der Kosten auf einer detaillierteren Ebene. Mehr eingebaute Warnungen oder Empfehlungen, wenn die Kosten unerwartet zu steigen beginnen, wären ebenfalls hilfreich.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks hilft uns, große Datensätze zu verwalten und Datenpipelines zu erstellen. Es vereinfacht die Datenverarbeitung, -transformation und -analyse mit Spark und SQL, alles an einem Ort. Es löst das Problem der langsamen Datenverarbeitung, die über verschiedene Systeme verteilt ist, indem es die Infrastruktur automatisch verwaltet und Zusammenarbeit und Experimente erleichtert.

**Official Response from Janelle Glover:**

> Wir freuen uns zu hören, dass Databricks für die Handhabung großer Datensätze und die Vereinfachung der Datenverarbeitung und -analyse für Sie von Vorteil war. Wir schätzen Ihr Feedback zum Kostenmanagement und werden Möglichkeiten erkunden, um die Kostentransparenz zu verbessern und bessere Überwachungstools bereitzustellen.

  ### 21. Ein zuverlässiges Arbeitstier für Datenengineering und Analytik

**Rating:** 5.0/5.0 stars

**Reviewed by:** Supriya  M. | Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 31, 2026

**Was gefällt Ihnen an Databricks am besten?**

Der einheitliche Plattformansatz ist das, was ich am meisten schätze. Notebooks, Datenengineering-Pipelines, ML-Workflows und SQL-Analysen an einem Ort zu haben, spart eine Menge Zeit, anstatt mit mehreren Tools zu jonglieren. Die kollaborativen Notebooks erleichtern das Teilen von Arbeit mit Teamkollegen, und das Clustermanagement ist im Laufe der Zeit viel reibungsloser geworden. Die Integration von Delta Lake ist ebenfalls ein großer Pluspunkt, um unsere Daten zuverlässig und konsistent zu halten.

**Was gefällt Ihnen an Databricks nicht?**

Die Kosten können ziemlich schnell außer Kontrolle geraten, wenn man nicht vorsichtig mit der Clustergröße und der Betriebszeit umgeht. Es ist nicht immer offensichtlich, wie man die Ausgaben optimieren kann, und das Preismodell wirkt komplex. Die Lernkurve für neue Teammitglieder ist auch steiler, als mir lieb ist, besonders für Leute, die nicht bereits mit Spark vertraut sind. Manchmal kann sich die Benutzeroberfläche träge anfühlen, wenn man mit größeren Notebooks arbeitet, und das Debuggen von Jobfehlern könnte einfacher sein.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks hilft mir, komplexe ETL-Pipeline-Ausfälle und anhaltende Datenqualitätsprobleme in der Lieferkettenanalyse zu lösen, indem es Batch- und Streaming-Verarbeitung von SAP-Systemen mit Delta Live Tables vereint. Es beseitigt auch viele der Infrastrukturverwaltungsprobleme dank der automatischen Skalierung von Clustern, sodass ich mich auf das Schreiben von Code für Multi-Terabyte-Workloads konzentrieren kann, anstatt ständig über die Clustergröße nachzudenken.

Für meine Fertigungsdatenprojekte beschleunigt Databricks die Entwicklungszyklen von Wochen auf Tage durch kollaborative Notebooks und DLT-Pipelines, was schnellere Power BI-Berichte und Entscheidungen der Stakeholder ermöglicht. Unity Catalog zentralisiert die Governance über Azure- und SAP-Quellen und verhindert das Schema-Drift, das frühere Hive-basierte Seen geplagt hat.

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie die Vorteile des einheitlichen Plattformansatzes und die zeitsparenden Funktionen von Databricks hervorgehoben haben. Wir verstehen Ihre Bedenken hinsichtlich der Kostenverwaltung und der Lernkurve und arbeiten kontinuierlich daran, unser Preismodell zu vereinfachen und die Einarbeitung neuer Teammitglieder zu verbessern. Es ist großartig zu hören, wie Databricks Ihnen hilft, komplexe ETL-Pipeline-Ausfälle zu beheben und die Entwicklungszyklen für Ihre Fertigungsdatenprojekte zu beschleunigen.

  ### 22. All-in-One-Kraftpaket mit Raum für Preisklarheit

**Rating:** 4.5/5.0 stars

**Reviewed by:** Thoufeeq A. | DevOps Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 02, 2026

**Was gefällt Ihnen an Databricks am besten?**

Ich mag, dass Databricks ein All-in-One-Kraftpaket ist, wo ich mehrere Arbeiten an einem Ort erledigen kann. Es ist leistungsstark, um Daten aus mehreren Quellen zu verwalten und sie in einem einzigen UC zu haben, um Berechtigungen mit Zeilenebensicherheit zu verwalten. Ich schätze auch, dass ich Experimente erstellen, mehrere Modelle ausführen und das beste aus den Protokollen auswählen kann, was auf anderen Plattformen schwierig war. Sobald ich die Einrichtung gelernt hatte, war es einfach und bequem zu arbeiten.

**Was gefällt Ihnen an Databricks nicht?**

Ich finde es schwierig, den Rechner zu benutzen, um die Preise für CPU-Serving-Endpunkte zu bestimmen, da die Dokumentation dies nicht explizit erklärt. Sie erwähnt nur, dass 1 Gleichzeitigkeit 1 DBU auf der Azure-Seite entspricht, was nicht klar ist. Der Preiskalkulator hat eine einzige Option für Serving-Endpunkte, die als mittel mit vier DBU bezeichnet ist, aber es fehlen separate Optionen für GPU oder CPU und deren Gleichzeitigkeit, was es schwer macht zu verstehen, wie es richtig funktioniert. Anfangs fand ich es auch sehr schwierig, Databricks zu lernen und die Bereitstellungen von Arbeitsbereichen zu verwalten, obwohl es mit der Zeit einfacher wurde.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks konsolidiert mehrere Werkzeuge in einer Plattform, was es leistungsstark und praktisch macht. Ich kann Berechtigungen mit Zeilenebenen-Sicherheit verwalten und Experimente durchführen, um die besten Modelle auszuwählen, alles an einem Ort.

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie Ihre positive Erfahrung mit Databricks geteilt haben. Wir verstehen Ihre Bedenken bezüglich des Preisrechners und werden Ihr Feedback berücksichtigen, um die Klarheit unserer Dokumentation zu verbessern.

  ### 23. Databricks Lakehouse Powerhouse mit Unity Catalog und schnellem Photon SQL

**Rating:** 4.0/5.0 stars

**Reviewed by:** Vidhyadar R. | Data Engineer, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** April 01, 2026

**Was gefällt Ihnen an Databricks am besten?**

Ich schätze wirklich, wie die Plattform Datenseen und -lager an einem Ort zusammenführt. Es macht die Verwaltung von Daten viel einfacher, und die SQL-Leistung ist dank der Photon-Engine sehr schnell. Ich mag auch die kollaborativen Notebooks, weil sie es mir ermöglichen, nahtlos in einer einzigen Umgebung mit sowohl SQL als auch Python zu arbeiten.

**Was gefällt Ihnen an Databricks nicht?**

Die Kosten können hoch sein, und das DBU-Abrechnungssystem ist ziemlich komplex zu verfolgen. Ich habe auch festgestellt, dass es eine erhebliche Lernkurve gibt, wenn es um Spark und die Konfiguration von Clustern geht. Für kleinere, schnelle Aufgaben kann die Einrichtungszeit und der technische Aufwand manchmal etwas zu viel erscheinen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Es löst das Problem, dass Daten überall verstreut sind. Ich liebe es, dass ich an derselben Stelle zwischen SQL und Python wechseln kann, und die Verarbeitungsgeschwindigkeit ist erstklassig. Es war ein Wendepunkt beim schnellen Aufbau unserer Finanzmodelle ohne die übliche Verzögerung.

**Official Response from Janelle Glover:**

> Wir schätzen Ihr Feedback zu den Vorteilen von Databricks, wie zum Beispiel das zentrale Datenmanagement und die Möglichkeit, mit SQL und Python in einer einzigen Umgebung zu arbeiten. Wir verstehen Ihre Bedenken bezüglich der Kosten und der Lernkurve und arbeiten aktiv daran, die Plattform zu verbessern, um Ihre Bedürfnisse besser zu erfüllen.

  ### 24. Vereinheitlichte Datenverarbeitung, Wissenschaft und Analytik auf einer kollaborativen Plattform

**Rating:** 4.5/5.0 stars

**Reviewed by:** Sivabalan A. | Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 02, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was ich an Databricks am meisten schätze, ist seine Fähigkeit, Datenengineering, Data Science und Analytik auf einer einzigen Plattform zu vereinen. Die kollaborative Umgebung – insbesondere die Notebooks und integrierten Workflows – erleichtert es Teams mit unterschiedlichen Fähigkeitsniveaus, zusammenzuarbeiten, ohne ständig den Kontext wechseln zu müssen.

Ein weiteres Highlight ist die Integration mit beliebten Tools und Cloud-Diensten, die heute auf dem Markt weit verbreitet sind, was es einfacher macht, Daten zwischen ihnen zu bewegen. Die Leistungsüberwachung und die Job-Planungsfunktionen helfen, die Übersicht über die Pipelines zu behalten, und die Delta Lake-Unterstützung für zuverlässiges Datenmanagement war ebenfalls sehr nützlich.

**Was gefällt Ihnen an Databricks nicht?**

Kostenmanagement ist ein Bereich, der verbessert werden könnte. Während Databricks Autoskalierung und flexible Cluster-Optionen bietet, kann der Ressourcenverbrauch leicht unerwartet ansteigen, insbesondere bei großen Datensätzen und langlaufenden Jobs. Um die Kosten vorhersehbar zu halten, ist oft eine sorgfältige Überwachung und ein solides Verständnis des Preismodells der Plattform erforderlich.

Darüber hinaus können einige der fortgeschritteneren Funktionen – wie feinkörnige Zugriffskontrollen und komplexere Job-Orchestrierung – weniger intuitiv wirken. Die Dokumentation ist umfangreich, lässt jedoch gelegentlich Lücken, die letztendlich Versuch und Irrtum erfordern.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks adressiert mehrere zentrale Herausforderungen in modernen Daten-Workflows, insbesondere in Bezug auf Skalierbarkeit, Datenzuverlässigkeit und kollaborative Analysen. Ein großes Problem, das es löst, ist das effiziente Management und die Verarbeitung von groß angelegten Datensätzen. Durch die Nutzung des verteilten Rechenframeworks von Apache Spark ermöglicht Databricks parallelisierte ETL-Pipelines und groß angelegte Datentransformationen, die auf traditioneller Infrastruktur unpraktisch wären.

Eine weitere Herausforderung ist die Sicherstellung der Datenkonsistenz und -zuverlässigkeit über die Pipelines hinweg. Mit Delta Lake bietet Databricks ACID-konformen Speicher, versionierte Tabellen und Schema-Durchsetzung, was Datenfehler reduziert und die Datenverwaltung vereinfacht. Dies ist besonders vorteilhaft, wenn mehrere Teams gleichzeitig an verschiedenen Phasen der Datenpipelines arbeiten.

Databricks hilft auch, das Problem fragmentierter Workflows für Datenwissenschaftler und Ingenieure zu lösen. Seine einheitliche Umgebung unterstützt mehrere Sprachen (Python, SQL, R, Scala) und beinhaltet integriertes maschinelles Lernen mit MLFlow, was die Zusammenarbeit erleichtert und den Übergang von der Datenvorbereitung zu Analysen und ML an einem Ort ermöglicht.

**Official Response from Janelle Glover:**

> Es ist großartig zu hören, wie Databricks Ihrem Team hilft, Herausforderungen in Bezug auf Skalierbarkeit, Datenzuverlässigkeit und kollaborative Analysen zu bewältigen. Wir schätzen Ihr Feedback zum Kostenmanagement und zur Benutzerfreundlichkeit fortschrittlicher Funktionen. Wir arbeiten kontinuierlich daran, unsere Preistransparenz zu verbessern und das Benutzererlebnis für alle unsere Funktionen zu optimieren.

  ### 25. All-in-One-Plattform, die uns hilft, schnell zu iterieren und mit Vertrauen zu deployen

**Rating:** 5.0/5.0 stars

**Reviewed by:** Vijayaramuprawin V. | Sr. Cloud and DevOps Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 01, 2026

**Was gefällt Ihnen an Databricks am besten?**

Wir nutzen Databricks täglich als unsere zentrale Datenplattform zum Erstellen und Ausführen von Pipelines über eine Medaillon-Architektur hinweg, von der Extraktion von Daten aus SAP und Arkieva bis hin zu berichtsfertigen Datensätzen. Die Notebook-Erfahrung ist intuitiv, der Funktionsumfang ist enorm, und Asset Bundles haben unsere CI/CD-Geschichte mit Azure DevOps wirklich solide gemacht. Die Integration mit Cloud-Diensten verlief reibungslos, und sobald alles eingerichtet ist, funktioniert es einfach. Die Lernkurve kann für neue Teammitglieder steil sein, insbesondere bei Dingen wie Unity Catalog und DABs, und die Kosten können steigen, wenn man die Clusterkonfigurationen nicht im Auge behält. Der Support ist anständig und die Dokumentation ist stark genug, dass wir selten ein Ticket eröffnen müssen. Insgesamt ist es eine leistungsstarke Plattform, die viel unter einem Dach bietet, und es ist schwer, sich unseren Daten-Engineering-Workflow ohne sie vorzustellen.

**Was gefällt Ihnen an Databricks nicht?**

Die Kosten können schnell steigen, wenn man bei der Clustergröße und den Jobkonfigurationen nicht vorsichtig ist, daher erfordert es einige Anstrengungen, um alles optimiert zu halten. Auch die Lernkurve für neue Teammitglieder kann steil sein, insbesondere bei Dingen wie Asset Bundles, Unity Catalog und dem ordnungsgemäßen Einrichten der CI/CD-Komponenten.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks löst das Problem der fragmentierten Daten, die über mehrere Systeme wie SAP und Arkieva verteilt sind, indem es uns eine einheitliche Plattform bietet, um alle Daten zu extrahieren, zu transformieren und bereitzustellen. Das bedeutet, dass unsere Geschäftsteams saubere, zuverlässige und berichtsfertige Daten erhalten, ohne dass wir mit einer Vielzahl von separaten Tools jonglieren müssen, und wir können alles konsistent über verschiedene Umgebungen hinweg mit Vertrauen bereitstellen und verwalten.

**Official Response from Janelle Glover:**

> Wir freuen uns zu hören, dass Databricks eine entscheidende Rolle bei der Optimierung Ihres Daten-Engineering-Workflows gespielt hat und eine leistungsstarke Plattform für Ihre Bedürfnisse bietet. Wir schätzen Ihr Feedback zur Lernkurve und zu den Kostenüberlegungen und arbeiten kontinuierlich daran, uns in diesen Bereichen zu verbessern.

  ### 26. Optimierte, kollaborative Daten-Workflows mit leistungsstarker Performance

**Rating:** 5.0/5.0 stars

**Reviewed by:** Dharun T. | Senior Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 01, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir an Databricks am meisten gefällt, ist, wie es den gesamten Daten-Workflow optimiert, indem es Verarbeitung, Analyse und maschinelles Lernen auf einer Plattform vereint. Die kollaborative Notebook-Umgebung erleichtert das Teilen von Code, Kontext und Überlegungen mit Teamkollegen, was dazu beiträgt, dass alle auf dem gleichen Stand bleiben. Es arbeitet auch bei großen Datensätzen leistungsstark, während es den Großteil des Cluster-Managements abstrahiert, sodass ich mich auf die Problemlösung konzentrieren kann, anstatt mich mit der Infrastruktur zu beschäftigen. Darüber hinaus unterstützen zentralisierte Zugriffskontrollen und klare Einblicke in die Datennutzung eine verantwortungsvolle Datenverwaltung und bieten eine solide Balance zwischen Leistung und Benutzerfreundlichkeit.

**Was gefällt Ihnen an Databricks nicht?**

Databricks hat einige Nachteile, obwohl viele davon eher wie Kompromisse als wie echte Negativpunkte erscheinen. Meine größte Sorge ist der Kostenfaktor: Wenn Cluster nicht sorgfältig verwaltet werden, können die Ausgaben schnell steigen, obwohl die Plattform sehr effizient skalieren kann, wenn sie richtig abgestimmt ist. Es gibt auch eine echte Lernkurve bei Spark und verteilten Rechenkonzepten, und das Debuggen oder die Leistungsoptimierung kann aufwendiger sein als bei einfacheren Tools. Schließlich gibt man, da es sich um einen verwalteten Dienst handelt, im Vergleich zu selbst gehosteten Systemen etwas Kontrolle auf niedriger Ebene auf, aber der Vorteil ist, dass einem viel von der operativen und infrastrukturellen Arbeit abgenommen wird.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Da mein Kunde sicheren, wiederverwendbaren Code benötigt, hilft uns Databricks dabei, Python effizient zu schreiben, während wir OOP-Prinzipien und Designmuster anwenden. Es macht es auch einfach, die Funktionalität im Laufe der Zeit zu erweitern und benutzerdefinierten Code zu erstellen, der mit APIs und Datenbanken interagiert.

**Official Response from Janelle Glover:**

> Wir freuen uns zu hören, dass Sie Databricks als eine leistungsstarke und optimierte Plattform für kollaborative Daten-Workflows empfinden. Wir verstehen die Bedenken hinsichtlich der Kostenverwaltung und der Lernkurve im Zusammenhang mit verteilten Rechenkonzepten. Wir arbeiten kontinuierlich daran, unsere Plattform zu verbessern und Ressourcen bereitzustellen, um den Nutzern zu helfen, ihre Nutzung zu optimieren und Herausforderungen zu überwinden.

  ### 27. Databricks: All-in-One-Lösung für Daten und Analysen

**Rating:** 5.0/5.0 stars

**Reviewed by:** FABIN P. | Senior Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** April 01, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was ich an Databricks am meisten mag, ist, dass es alles an einem Ort zusammenbringt, was die Arbeit mit Daten, das Erstellen von Modellen und das Verwalten von Workflows erleichtert. Es hilft Teams, in Echtzeit einfach zusammenzuarbeiten. Es arbeitet auch sehr schnell mit großen Datenmengen unter Verwendung von Apache Spark, und Funktionen wie Automatisierung und Delta Lake machen den Umgang mit Big Data viel einfacher.

**Was gefällt Ihnen an Databricks nicht?**

Eine Sache, die ich an Databricks nicht mag, ist, dass es teuer sein kann, besonders bei großen Arbeitslasten. Manchmal kann die Benutzeroberfläche und Einrichtung für Anfänger komplex wirken. Auch das Verwalten von Clustern und Konfigurationen kann einige Mühe erfordern, wenn man damit nicht sehr vertraut ist.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks löst das Problem der effizienten Verarbeitung großer Datenmengen.
Es vereint Datenengineering, Analyse und maschinelles Lernen auf einer Plattform.
Dies beseitigt die Notwendigkeit, mehrere Werkzeuge zu verwenden.
Es unterstützt eine schnellere Datenverarbeitung mit Apache Spark.
Es erleichtert die Zusammenarbeit für Teams.
Es vereinfacht den Aufbau und die Verwaltung von Datenpipelines.
Es verbessert die Datenzuverlässigkeit mit Funktionen wie Delta Lake.
Es reduziert manuelle Arbeit durch Automatisierung.
Es spart Zeit und Mühe bei täglichen Aufgaben.
Insgesamt hilft es mir, schneller und effizienter mit Daten zu arbeiten.

**Official Response from Janelle Glover:**

> Wir freuen uns zu hören, dass Databricks eine entscheidende Rolle bei der Optimierung Ihres Daten-Engineering-Workflows gespielt hat und eine leistungsstarke Plattform für Ihre Bedürfnisse bietet. Wir schätzen Ihr Feedback zur Lernkurve und zu den Kostenüberlegungen und arbeiten kontinuierlich daran, uns in diesen Bereichen zu verbessern.

  ### 28. Von Hive Chaos zu Unity Catalog - Jeden DBU wert

**Rating:** 5.0/5.0 stars

**Reviewed by:** Balakumaran R. | Data Team Lead, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** March 31, 2026

**Was gefällt Ihnen an Databricks am besten?**

Unity Catalog war der größte Mehrwert für unsere Unternehmensmigration. Wir sind von einer Hive Metastore-Architektur zu Unity Catalog gewechselt und haben zentrale Governance, Abstammungsverfolgung und feingranulare Zugriffskontrolle über alle unsere Datenressourcen hinweg gewonnen, ohne Drittanbieter-Tools hinzuzufügen. Für eine Organisation mit mehreren Domänen (Finanzen, Fertigung, Lieferkette, Beschaffung) hat ein Katalog, der konsistente Benennungen und Berechtigungen über Bronze-, Silber-, Gold- und Platin-Schichten hinweg durchsetzt, uns Wochen manueller Richtlinienarbeit erspart.

UI/UX: Die Notebook-Erfahrung mit integriertem Spark SQL und PySpark, kombiniert mit dem Datei-Browser des Arbeitsbereichs, macht es unserem Team einfach, Transformationen iterativ zu entwickeln und zu testen. Der SQL-Editor für Ad-hoc-Abfragen gegen Unity Catalog-Tabellen ist sauber und reaktionsschnell.

Integrationen: Die native Delta Lake-Unterstützung bedeutet, dass wir keine Formatkonvertierungen verwalten müssen. Die Azure Key Vault-Integration über geheime Bereiche (dbutils.secrets.get) hält Anmeldeinformationen aus dem Code heraus. Die ADF-Integration für die Orchestrierung in unserer V1-Umgebung war nahtlos, und Databricks Asset Bundles (DAB) für die V2-Bereitstellung bieten uns einen sauberen CI/CD-Pfad mit databricks.yml-Konfigurationen, die auf Entwicklung/QA/Produktion abzielen, ohne benutzerdefinierte Skripte.

Leistung: Der Wechsel zu CTEs über temporäre Ansichten in unseren Gold-Notebooks hat den Speicherbedarf des Clusters spürbar reduziert. Die Möglichkeit, Cluster pro Umgebung (1 Worker für Entwicklung, 3 für Produktion) mit Standard_D4ds_v5-Knoten richtig zu dimensionieren, hält die Kosten vorhersehbar, während die Leistung für unsere Batch-ETL-Workloads erhalten bleibt.

Preisgestaltung/ROI: Das Pay-as-you-go-Computemodell gepaart mit Clustern im Einzelbenutzersicherheitsmodus bedeutet, dass wir nicht überdimensionieren. Die Konsolidierung unserer ETL-, Governance- und BI-Servingschicht in eine Plattform hat die Lizenzierung für separate Katalog-, Orchestrierungs- und Datenqualitätstools eliminiert.

KI/Intelligenz (Genie): Genie Spaces waren ein unerwarteter Gewinn. Unsere Business-Analysten in Finanzen und Lieferkette können natürliche Sprachfragen gegen kuratierte Gold/Platin-Tabellen stellen, ohne SQL zu schreiben. Es hat die Anzahl der Ad-hoc-Berichtsanfragen an das Datenteam reduziert, indem es Domänenbenutzern einen Self-Service-Pfad bietet, der dennoch die Unity Catalog-Berechtigungen respektiert.

Support/Onboarding: Die Dokumentation ist umfassend, und der kompetenzbasierte Ansatz zum Lernen (Bundles, Unity Catalog, Jobs, SQL) passt gut zu der Arbeitsweise unseres Teams. Die Einarbeitung neuer Ingenieure in die V2-Architektur dauerte etwa halb so lange wie bei V1, da die Plattformkonventionen (Medallion-Architektur, Asset-Bundles, Katalogbenennung) gut dokumentiert und konsistent sind.

**Was gefällt Ihnen an Databricks nicht?**

UI/UX: Der Notebook-Editor fühlt sich immer noch hinter dedizierten IDEs zurück. Keine native Mehrdateiensuche, begrenzte Refactoring-Unterstützung und die Git-Integrations-UI ist umständlich für Teams, die Dutzende von Notebooks über Workflow-Bundles verwalten. Wir haben letztendlich die gesamte echte Entwicklung in VS Code durchgeführt und den Databricks-Arbeitsbereich als Bereitstellungsziel behandelt, was Reibung verursacht. Der Datei-Browser des Arbeitsbereichs kann auch keine Ordnerstrukturen gut handhaben, wenn man 50+ Notebooks nach Domänen organisiert hat, gibt es keine Filterung, keine Tags oder Favoriten.

Integrationen: Databricks Asset Bundles (DAB) sind ein Fortschritt, aber die Dokumentation weist Lücken für komplexe Multi-Bundle-Bereitstellungen auf. Wir betreiben ein gemeinsames Global_Utilities-Bundle, von dem andere Workflow-Bundles abhängen, und es erforderte erhebliches Ausprobieren, um Cross-Bundle-Referenzen zuverlässig über Entwicklungs-/QA-/Produktionsziele hinweg zum Laufen zu bringen. Die ADF-zu-Databricks-Integration funktioniert, aber das Debuggen fehlgeschlagener Pipeline-Läufe bedeutet, zwischen der ADF-Überwachungs-UI und Databricks-Jobläufen hin- und herzuspringen, ohne eine einheitliche Ansicht. Ein engerer Handshake zwischen Orchestrierung und Compute-Überwachung würde Stunden der Fehlersuche sparen.

Leistung: Die Kaltstartzeiten von Clustern bleiben ein Schmerzpunkt für Entwicklungs-Workflows. Das Hochfahren eines Single-Node-Standard_D4ds_v5-Clusters dauert 4-7 Minuten, was den Fluss unterbricht, wenn man an der Notebook-Logik arbeitet. Serverless-Computing hilft, ist aber noch nicht für alle Workload-Typen verfügbar, und der Kostenaufschlag ist schwer zu rechtfertigen für Entwicklungs-/Testumgebungen.

Preisgestaltung/ROI: Das DBU-Preismodell ist undurchsichtig für die Kapazitätsplanung. Die monatlichen Kosten für ein Projekt mit 30+ geplanten Jobs, interaktiven Entwicklungsclustern und SQL-Warehouse-Abfragen abzuschätzen, erfordert den Aufbau benutzerdefinierter Tabellenkalkulationen, da die integrierten Kostenmanagement-Tools keine klare Prognose nach Workflow oder Domäne bieten. Wir waren überrascht von Kostenspitzen durch Jobs, die länger als erwartet liefen, ohne einfache Möglichkeit, Budgetwarnungen pro Job festzulegen.

Support/Onboarding: Die Reaktionszeiten des Enterprise-Supports sind inkonsistent. Kritische Probleme mit Unity Catalog-Berechtigungen während unserer Migration dauerten 3-5 Werktage für die erste Triage, was unseren Bereitstellungszeitplan verzögerte. Die Community-Foren sind hilfreich für allgemeine Muster, aber für Unity Catalog-Randfälle (Cross-Catalog-Abstammung, komplexe Berechtigungsvererbung) ist die Wissensbasis dünn.

KI/Intelligenz: Genie ist vielversprechend, aber noch rau für den Produktionseinsatz. Es hat Schwierigkeiten mit Joins über mehr als 3-4 Tabellen, generiert manchmal falsches SQL gegen unsere Gold-Schicht, und es gibt keinen einfachen Weg, seine Antworten zu kuratieren oder zu korrigieren, um die Genauigkeit im Laufe der Zeit zu verbessern. Unsere Geschäftsanwender waren begeistert, probierten es aus, stießen auf falsche Antworten bei mäßig komplexen Fragen und verloren das Vertrauen. Ein Feedback-Loop, in dem Fachexperten Genies Ausgaben markieren und korrigieren können, würde es wirklich produktionsreif machen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Daten-Governance-Fragmentierung → Einheitlicher Katalog Wir hatten Schwierigkeiten mit einer Hive Metastore-Umgebung, in der Tabellenbesitz, Zugriffskontrolle und Abstammung durch ein Flickwerk aus manueller Dokumentation und benutzerdefinierten Skripten verwaltet wurden. Nach der Implementierung des Unity Catalog haben wir nun eine zentrale Governance über 4 Katalogebenen (Bronze, Silber, Gold, Platin), die sich über 6 Geschäftsbereiche erstrecken. Was früher einen Vollzeit-Datenverwalter erforderte, um es manuell zu verfolgen, wird jetzt automatisch durch Katalogebenen-Berechtigungen und Abstammung durchgesetzt. Dies hat unsere Zugriffsbereitstellungszeit von Tagen auf unter eine Stunde pro Anfrage verkürzt.

Isolierte ETL-Logik → Standardisierte Medaillon-Architektur Vor Databricks waren unsere ETL-Pipelines inkonsistent — verschiedene Teams schrieben Transformationen unterschiedlich, ohne gemeinsame Hilfsprogramme oder Muster. Wir haben ein standardisiertes Framework (Batch_Utilities.py) mit wiederverwendbaren Funktionen für Schema-Validierung, Zusammenführungsoperationen, Datenqualitätsprüfungen und Audit-Spaltenverwaltung erstellt. Jedes Notebook in allen Bereichen folgt jetzt derselben 7-Zellen-Struktur. Dies reduzierte die Entwicklungszeit für neue Notebooks von 2-3 Tagen auf etwa 4 Stunden, und die Einarbeitung eines neuen Entwicklers in das Muster dauert einen einzigen Nachmittag statt einer Woche.

Teure Berichtserneuerungsausfälle → Zuverlässige Pipeline-Orchestrierung Wir hatten wiederkehrende Probleme mit Power BI-Berichten, die veraltete oder unvollständige Daten zogen, weil vorgelagerte Jobs stillschweigend fehlschlugen. Mit Databricks Jobs und metadatengetriebener Pipeline-Verfolgung (Pipeline-Status, Start-/Endzeitstempel pro Lauf protokolliert) fangen wir jetzt Fehler auf der Transformationsebene ab, bevor sie sich auf Berichte auswirken. Die Probleme mit der Datenaktualität in Berichten sind um etwa 80 % gesunken, und unser Finanzteam hat aufgehört, "Datenverifizierungs"-Meetings zu planen, die früher 3-4 Stunden pro Woche in Anspruch nahmen.

Chaos bei der Bereitstellung in mehreren Umgebungen → Asset-Bundles Die Bereitstellung von Notebooks über Entwicklung, QA und Produktion hinweg erforderte früher manuelle Dateikopien und umgebungsspezifische Konfigurationsänderungen — fehleranfällig und langsam. Databricks Asset Bundles gaben uns deklarative databricks.yml-Konfigurationen mit Variablensubstitution pro Ziel. Eine Bereitstellung, die 45 Minuten manuelle Schritte erforderte, läuft jetzt in weniger als 5 Minuten über CLI. Wir stellen mit Zuversicht bereit, weil dieselbe Bundle-Definition validiert wird, bevor sie in die Produktion geht.

Lücke bei der Self-Service-Analyse → Genie + Platin-Schicht Geschäftsanalysten in der Lieferkette und im Finanzwesen waren vollständig von dem Datenteam für jede Ad-hoc-Analyse abhängig. Durch den Aufbau von denormalisierten Platin-Tabellen, die für das Reporting optimiert sind, und deren Bereitstellung über Genie Spaces, haben wir Self-Service-Abfragen in natürlicher Sprache ermöglicht. Die frühe Einführung hat die Ad-hoc-Berichtsanfragen an das Datenteam um etwa 30 % reduziert, was die Ingenieurskapazität für die Entwicklung neuer Funktionen freisetzt.

Kostenübersicht → Angepasste Rechenleistung Wir haben Cluster überdimensioniert, weil wir keinen klaren Überblick über die tatsächliche Nutzung hatten. Durch die Standardisierung auf Standard_D4ds_v5-Knoten mit umgebungsspezifischen Worker-Anzahlen (1 für Entwicklung/QA, 3 für Produktion) und Einzelbenutzer-Sicherheitsmodus haben wir unsere monatlichen Rechenausgaben um etwa 25 % im Vergleich zum gemeinsam genutzten Clustermodell, das wir in V1 betrieben haben, reduziert.

**Official Response from Janelle Glover:**

> Wir schätzen Ihr detailliertes Feedback zu Ihrer Erfahrung mit Databricks. Es ist großartig zu hören, dass Unity Catalog, UI/UX, Integrationen, Leistung, Genie und Support/Onboarding Ihre Unternehmensmigration positiv beeinflusst haben. Wir verstehen die von Ihnen erwähnten Verbesserungsbereiche und werden diese für zukünftige Verbesserungen berücksichtigen.

  ### 29. Databricks: Intuitive, einheitliche Plattform mit nahtlosen Integrationen und schnellem Support

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sabareeswar K. | Data Engineer, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** April 01, 2026

**Was gefällt Ihnen an Databricks am besten?**

Als Dateningenieur ist Databricks meine bevorzugte Plattform für End-to-End-Datenarbeit geworden. Die Benutzerfreundlichkeit ist hervorragend – Notebooks, Delta Live Tables und Genie haben alle intuitive Schnittstellen, die die Einarbeitungszeit erheblich verkürzen. Die Implementierung verlief reibungslos dank ausgezeichneter Dokumentation und eines reaktionsschnellen Kundensupports, der Probleme tatsächlich schnell löst. Ich nutze es täglich, und die schiere Anzahl an Funktionen – von Unity Catalog bis AI/BI Genie – wächst ständig. Die Integration mit Cloud-Speicher, BI-Tools und ML-Frameworks ist nahtlos, was es zu einer wirklich einheitlichen Plattform macht.

**Was gefällt Ihnen an Databricks nicht?**

Eine Herausforderung ist der Mangel an Kostentransparenz auf granularer Jobebene. Es ist schwierig, genau zu bestimmen, welche Pipeline oder welches Notebook den DBU-Verbrauch in die Höhe treibt, ohne in benutzerdefinierte Überwachung zu investieren. Auto-skalierende Cluster, obwohl leistungsstark, können die Kosten über Nacht unbemerkt in die Höhe treiben, wenn sie nicht sorgfältig mit den richtigen Grenzen konfiguriert werden. Darüber hinaus können die SQL-Warehouse-Stufen bei der anfänglichen Auswahl verwirrend sein, was die Budgetplanung für Teams erschwert. Ein integriertes Kostenallokations-Dashboard pro Job oder Benutzer wäre eine große Verbesserung für die tägliche Kostenverwaltung.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks hat die Silos zwischen unseren Dateningenieur-, Analyse- und ML-Teams beseitigt. Früher jonglierten wir mit mehreren Tools für Ingestion, Transformation und Reporting. Jetzt befindet sich alles in einem einzigen Lakehouse. Genie war speziell ein Wendepunkt: Geschäftsbeteiligte können natürliche Sprachfragen direkt an unsere Daten stellen, ohne SQL schreiben zu müssen, was die Ad-hoc-Anfrageengpässe für unser Ingenieurteam erheblich reduziert. Die Entscheidungsfindung ist schneller, Daten sind stärker demokratisiert, und wir haben unseren Reporting-Pipeline-Overhead erheblich reduziert.

**Official Response from Janelle Glover:**

> Es ist großartig zu hören, dass Databricks geholfen hat, die Silos zwischen Ihren Dateningenieur-, Analyse- und ML-Teams zu beseitigen. Wir freuen uns, dass Genie ein Wendepunkt für Ihre Geschäftspartner war. Wir verstehen auch die Herausforderungen, die Sie in Bezug auf Kostentransparenz und das automatische Skalieren von Clustern erwähnt haben. Wir arbeiten kontinuierlich daran, unsere Plattform zu verbessern und werden Ihre Vorschläge für zukünftige Verbesserungen berücksichtigen.

  ### 30. Databricks macht End-to-End-Daten-Workflows schnell, kollaborativ und einfach.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Karuppusamy V. | Technical Lead, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** March 31, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir an Databricks am meisten gefällt, ist, wie es den gesamten Daten-Workflow vereinfacht. Anstatt zwischen mehreren Tools für Datenverarbeitung, Analyse und maschinelles Lernen zu wechseln, ist alles an einem Ort verfügbar. Die Notebook-Umgebung macht die Zusammenarbeit wirklich reibungslos, es fühlt sich natürlich an, mit Teamkollegen zu arbeiten, Code zu teilen und Logik zu erklären, ohne zusätzlichen Aufwand.

Ein weiterer Punkt, den ich schätze, ist die Leistung. Mit großen Datensätzen zu arbeiten, kann normalerweise schmerzhaft sein, aber Databricks bewältigt dies effizient im Hintergrund. Man muss sich nicht viel um das Verwalten von Clustern oder das manuelle Optimieren kümmern, es funktioniert einfach meistens, was es einem ermöglicht, sich mehr auf die Lösung des eigentlichen Problems zu konzentrieren, anstatt sich mit der Infrastruktur zu beschäftigen.

Was ebenfalls heraussticht, ist die Art und Weise, wie es Datenverwaltung und -organisation handhabt. Mit Funktionen wie zentralisierter Zugriffskontrolle und besserer Sichtbarkeit der Datennutzung wird es viel einfacher, Daten verantwortungsvoll zu verwalten, insbesondere in größeren Projekten. Insgesamt bietet es eine gute Balance zwischen Leistung und Benutzerfreundlichkeit, weshalb ich gerne damit arbeite.

**Was gefällt Ihnen an Databricks nicht?**

Eine Sache, die mir an Databricks nicht besonders gefällt, ist, dass es ziemlich schnell teuer werden kann, besonders wenn Cluster nicht richtig verwaltet werden. Wenn man vergisst, Cluster zu beenden oder schwere Workloads ohne Optimierung ausführt, können die Kosten ohne viel Sichtbarkeit zunächst in die Höhe schnellen. Für Teams, die noch lernen oder experimentieren, kann dies zu einem Problem werden.

Ein weiterer Nachteil ist, dass das Debuggen manchmal etwas knifflig sein kann, insbesondere wenn man mit verteilten Jobs arbeitet. Fehler sind nicht immer eindeutig, und das Nachverfolgen von Problemen über mehrere Knoten hinweg kann mehr Zeit in Anspruch nehmen als das Arbeiten in einer einfacheren lokalen Umgebung. Es erfordert ein gewisses Maß an Erfahrung, um Probleme schnell zu verstehen und zu beheben.

Außerdem hat die Plattform, obwohl sie leistungsstark ist, eine gewisse Lernkurve für Anfänger. Konzepte wie Clusterkonfiguration, Jobplanung und Datenverwaltung sind am Anfang nicht immer sehr intuitiv. Es braucht einige praktische Zeit, bevor man sich vollständig wohl fühlt, alles effizient zu navigieren und zu nutzen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Was Databricks wirklich löst, ist das Problem der Handhabung von groß angelegten Daten, ohne den Prozess übermäßig komplex zu machen. Früher bedeutete die Arbeit mit Big Data, mit mehreren Tools umzugehen, die Infrastruktur zu verwalten und viel Zeit nur für die Einrichtung aufzuwenden. Databricks vereinfacht all das, indem es Datenengineering, Analytik und maschinelles Lernen an einem Ort zusammenbringt, sodass der Fokus mehr auf der Lösung tatsächlicher Geschäftsprobleme liegt, anstatt Systeme zu verwalten.

Es adressiert auch Leistungs- und Skalierbarkeitsprobleme. Bei der Arbeit mit riesigen Datenmengen kämpfen traditionelle Systeme oft oder werden langsamer. Databricks bewältigt dies effizient im Hintergrund, sodass Arbeitslasten ohne großen manuellen Aufwand skaliert werden können. Für mich bedeutet das, dass ich große Datensätze schneller verarbeiten und Transformationen oder Abfragen ausführen kann, ohne ständig über Leistungsoptimierung nachdenken zu müssen.

Ein weiteres großes Problem, das es löst, ist die Zusammenarbeit und Datenverwaltung. In vielen Projekten kämpfen Teams mit Versionskontrolle, Zugriffsmanagement und der Konsistenz der Daten. Databricks erleichtert die Zusammenarbeit, das Nachverfolgen von Änderungen und die Kontrolle darüber, wer auf was zugreifen kann. Dies hilft mir, reibungsloser mit anderen zu arbeiten, Fehler zu reduzieren und sicherzustellen, dass die Daten, die ich verwende, zuverlässig und gut verwaltet sind.

**Official Response from Janelle Glover:**

> Wir freuen uns zu hören, dass Sie Databricks als umfassende und effiziente Plattform zur Verwaltung von Daten-Workflows empfinden. Wir verstehen Ihre Bedenken bezüglich der Kostenverwaltung und der Lernkurve für Anfänger und werden Ihr Feedback mit unserem Team teilen, um es weiter zu überprüfen.

  ### 31. Databricks vereint Daten, Analysen und ML für skalierbare Lakehouse-Workflows

**Rating:** 5.0/5.0 stars

**Reviewed by:** Harshavarthini G. | Data Architect, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** March 31, 2026

**Was gefällt Ihnen an Databricks am besten?**

Databricks ist besonders hilfreich, weil es Datenengineering, Analytik und maschinelles Lernen in einer einzigen einheitlichen Plattform zusammenführt, was die Notwendigkeit verringert, mehrere separate Tools zu verwalten. Auf Apache Spark aufgebaut, kann es massive Datensätze schnell verarbeiten und sich reibungslos skalieren, wenn die Arbeitslasten wachsen, was es zu einer starken Lösung für Big-Data-Anwendungsfälle macht. Es unterstützt auch kollaborative Notebooks, in denen Teams in Sprachen wie Python und SQL zusammenarbeiten können, was es Datenwissenschaftlern und Ingenieuren erleichtert, effektiv zusammenzuarbeiten.

Mit seiner Lakehouse-Architektur, die von Delta Lake angetrieben wird, kombiniert Databricks die Flexibilität von Data Lakes mit der Zuverlässigkeit von Data Warehouses und trägt dazu bei, eine bessere Datenkonsistenz und Leistung sicherzustellen. Darüber hinaus integriert es sich mit Tools wie MLflow, um den Lebenszyklus des maschinellen Lernens von der Experimentierung bis zur Bereitstellung zu optimieren. Insgesamt vereinfacht Databricks komplexe Daten-Workflows, verbessert die Leistung und hilft Organisationen, skalierbare Daten- und KI-Lösungen effizienter zu entwickeln.

**Was gefällt Ihnen an Databricks nicht?**

Databricks hat zwar einige Einschränkungen, aber viele davon fühlen sich eher wie Kompromisse als wie echte Nachteile an. Ein häufig genanntes Manko sind die Kosten: Obwohl die Plattform flexibel und skalierbar ist, können die Ausgaben schnell steigen, wenn Cluster nicht sorgfältig verwaltet werden. Gleichzeitig spiegeln diese Kosten oft die Fähigkeit wider, sehr große Arbeitslasten effizient zu bewältigen, wenn sie richtig optimiert ist.

Ein weiterer Aspekt ist die Lernkurve, insbesondere für Anfänger, die mit Apache Spark oder verteilten Systemen nicht vertraut sind. Diese Komplexität kann anfangs herausfordernd sein, bringt jedoch auch den Vorteil leistungsstarker Fähigkeiten mit sich, sobald man sich damit vertraut gemacht hat. Einige Benutzer finden auch, dass das Debuggen und die Leistungsoptimierung weniger unkompliziert sind als bei einfacheren Tools; jedoch bietet Databricks detaillierte Überwachungs- und Optimierungsfunktionen, die diese Aufgaben im Laufe der Zeit erleichtern können.

Schließlich kann es, da es sich um eine verwaltete Plattform handelt, ein Gefühl der reduzierten Kontrolle im Vergleich zu vollständig selbstverwalteten Systemen geben. Im Gegenzug nimmt es jedoch einen Großteil der betrieblichen Last ab, die mit dem Infrastrukturmanagement einhergeht. Insgesamt, obwohl diese Bereiche als die „am wenigsten hilfreichen“ Aspekte angesehen werden können, werden sie oft durch die Skalierbarkeit, Integration und Produktivitätsgewinne der Plattform ausgeglichen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks hilft, die Herausforderung fragmentierter Daten und getrennter Workflows über mehrere Geschäftsbereiche hinweg zu lösen, indem es eine einheitliche Lakehouse-Plattform bereitstellt. In meiner Rolle als Dateningenieur ermöglicht mir dies, Daten aus verschiedenen Quellen in ein einziges, zuverlässiges System zu konsolidieren, indem ich Apache Spark für skalierbare Verarbeitung und Delta Lake zur Sicherstellung der Datenqualität und Konsistenz verwende. Dies reduziert die Komplexität der Pipelines erheblich, verbessert die Zuverlässigkeit und ermöglicht eine schnellere Bereitstellung sauberer, verwalteter Daten an nachgelagerte Teams. Dadurch kann ich Analyse- und maschinelle Lernanwendungen effizienter unterstützen, während ich den operativen Aufwand minimiere und die Gesamtproduktivität in der Organisation verbessere.

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie Ihre positiven Erfahrungen mit Databricks geteilt haben. Es ist großartig zu hören, dass die Fähigkeit der Plattform, Datenengineering, Analytik und maschinelles Lernen in einer einzigen einheitlichen Plattform zu vereinen, Ihrer Organisation zugutekommt. Wir verstehen die von Ihnen erwähnten Kompromisse und Herausforderungen und arbeiten kontinuierlich an diesen Teilen unserer Plattform.

  ### 32. Databricks vereinfacht End-to-End ETL mit Unity Catalog und KI-gestütztem Debugging

**Rating:** 4.5/5.0 stars

**Reviewed by:** Dinesh Sundar S. | Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 30, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir besonders auffällt, ist, wie Databricks den gesamten ETL-Lebenszyklus vereinfacht. Die stetige Integration neuer Funktionen in die Plattform hat die Reibung beim Einlesen von Daten aus einer Vielzahl von Quellsystemen spürbar reduziert.

Unity Catalog (UC) war ebenfalls ein Wendepunkt für die Datenverwaltung. Es bietet eine zentrale, robuste Governance-Schicht, die das Management komplexer Umgebungen viel intuitiver und leichter kontrollierbar macht.

Ich bin besonders beeindruckt von den jüngsten KI-gesteuerten Updates. Genie Code ist ein wesentlicher Bestandteil meines Workflows geworden; es hat meine Debugging-Geschwindigkeit erheblich verbessert und erweist sich bereits als wertvolles Asset in meinem aktuellen UC-Migrationsprojekt. Insgesamt fühlt sich die Art und Weise, wie Databricks traditionelle Datenverarbeitung mit unterstützter Intelligenz verbindet, wirklich zukunftsweisend an.

**Was gefällt Ihnen an Databricks nicht?**

Während Auto Loader leistungsstark ist, gibt es immer noch bemerkenswerte Lücken in der Lakehouse Data Pipeline (LDP) in Bezug auf die Schema-Erkennung. Derzeit gilt das erkannte Schema, wenn inferSchema aktiviert ist, nur für die erste Ebene der Hierarchie. In komplexen Datensätzen mit mehrfach verschachtelten Feldern führt das Fehlen einer tiefen Schema-Erkennung zu manuellem Aufwand und erschwert den Aufbau und die Wartung von Streaming-CDC-Pipelines.

Lakeflow Connect fühlt sich wie ein Schritt in die richtige Richtung an, aber die Bibliothek der nativen Konnektoren scheint im Vergleich zu einigen Wettbewerbern immer noch unvollständig zu sein. Und obwohl die KI-Funktionen (wie Genie) vielversprechend und wirklich interessant sind, wirken sie manchmal noch in einem „Entwicklungsstadium“ – manchmal fehlt die Konsistenz, die man für hochkritische Produktionsumgebungen benötigt. Ich würde gerne sehen, dass sich diese Fähigkeiten von „innovativen Extras“ zu robusten, produktionsreifen Werkzeugen entwickeln.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Das Problem: Datensilos & ineffiziente Support-Operationen
In vielen Organisationen endet kritisches institutionelles Wissen verstreut über getrennte Systeme wie MySQL (strukturiert), Jira (transaktional) und Confluence (unstrukturiert). Wenn Informationen auf diese Weise fragmentiert sind, haben Support-Teams Schwierigkeiten, schnelle und genaue Antworten auf eingehende Tickets zu finden. Das Ergebnis ist eine höhere MTTR (Mean Time to Resolution) und viel wiederholte, manuelle Arbeit.

Die Lösung: Eine einheitliche „Intelligence Platform“
Databricks löst dieses Problem, indem es als einheitliches Gewebe dient, das diese Silos verbindet. In meiner Arbeit konzentriere ich mich darauf, die Lakehouse Data Pipeline (LDP) zu nutzen, um diese verschiedenen Quellen in eine einzige, verwaltete Umgebung zu integrieren und zu vereinheitlichen.

Wie dies meinem Projekt zugutekommt:
Ich nutze Databricks für nahtlose Ingestion, zentralisiere Daten aus MySQL, Jira und Confluence, um eine umfassende „Wissensdatenbank“ zu erstellen, ohne mehrere, unterschiedliche ETL-Tools verwalten zu müssen.

Ich verlasse mich auch auf die native KI-Integration. Mit Mosaic AI Vector Search kann ich die vereinheitlichten Daten direkt innerhalb der Plattform in Embeddings umwandeln, was es mir ermöglicht, einen KI-Automatisierungsagenten für unser Ticketsystem zu erstellen.

Schließlich unterstützt es die automatisierte Lösungserstellung. Der Agent kann Vektormatching auf neu erstellten Tickets gegen die vollständige historische Wissensdatenbank durchführen und dann sofort genaue, kontextbewusste Lösungen für Ingenieure vorschlagen.

Die Auswirkung
Der größte Vorteil für uns ist die operative Geschwindigkeit. Databricks hat unsere Daten von einem passiven Archiv in einen aktiven, „intelligenten“ Motor verwandelt. Es reduziert die Zeit, die für manuelle Recherchen aufgewendet wird, und hilft uns, die erste Support-Linie zu automatisieren, wodurch die Genauigkeit der Ticketlösungen verbessert und die Belastung unserer technischen Teams verringert wird.

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie Ihre positive Erfahrung mit Databricks geteilt haben! Wir freuen uns zu hören, dass die Vereinfachung des End-to-End-ETL-Lebenszyklus und der Unity Catalog unserer Plattform für Ihre Datenverwaltung bahnbrechend waren. Wir schätzen Ihr Feedback zu den KI-gesteuerten Updates und sind begeistert zu hören, dass Genie Ihren Arbeitsablauf verbessert hat. Wir sind bestrebt, unsere Plattform kontinuierlich zu verbessern, um unseren Nutzern ein zukunftsorientiertes Erlebnis zu bieten.

  ### 33. Schnelle, nahtlose Databricks für Big Data Pipelines und Analysen an einem Ort

**Rating:** 4.5/5.0 stars

**Reviewed by:** Demetrius A. | Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 31, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was ich an Databricks am meisten liebe, ist, wie schnell und vernetzt alles ist. Im Vergleich zu anderen Plattformen bewältigt es schwere Big-Data-Pipelines ohne Probleme. Aber das Beste daran ist, wie einfach es ist, die Daten zu nutzen, sobald sie verarbeitet sind. Ob ich ein schnelles Analyse-Dashboard erstellen oder maßgeschneiderte maschinelle Lernmodelle spezifisch für unsere Daten trainieren muss, alles verbindet sich nahtlos. Es nimmt einfach den Kopfschmerz aus dem Datenverschieben und ermöglicht es, alles an einem Ort zu erledigen.

**Was gefällt Ihnen an Databricks nicht?**

Wenn ich wählen müsste, was mir nicht gefällt, läuft es hauptsächlich auf die Kosten und die Komplexität hinaus.

Erstens kann es sehr schnell teuer werden. Wenn Sie nicht darauf achten, Ihre Rechencluster zu verwalten und sie abzuschalten, wenn Sie fertig sind, können die Rechnungen unbemerkt in die Höhe schnellen.

Zweitens kann es manchmal übertrieben erscheinen für einfachere Aufgaben. Da es für massive Datenmengen gebaut ist, kann es im Vergleich zu leichteren Werkzeugen wirklich mühsam sein, sich durch komplizierte Fehlerprotokolle zu wühlen, wenn etwas schiefgeht.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Das Hauptproblem, das Databricks in meinem Unternehmen löst, ist die Leistung. Früher mussten wir stundenlang warten, bis Pipelines in ADF ausgeführt wurden, und jetzt können wir sie in Minuten erledigen.

**Official Response from Janelle Glover:**

> Wir freuen uns zu hören, dass Sie Databricks als schnell und nahtlos für die Handhabung von Big-Data-Pipelines und Analysen empfinden. Wir verstehen Ihre Bedenken hinsichtlich der Kosten und Komplexität und arbeiten kontinuierlich daran, diese Aspekte unserer Plattform zu optimieren, um diese Herausforderungen zu bewältigen.

  ### 34. Einheitliche ML-Plattform, die Infrastruktur-Reibungen beseitigt

**Rating:** 5.0/5.0 stars

**Reviewed by:** Hirlekha M. | AI/ ML Technical Lead, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 30, 2026

**Was gefällt Ihnen an Databricks am besten?**

Die einheitliche Plattform-Erfahrung ist wirklich schwer zu übertreffen – MLflow für das Experiment-Tracking, Unity Catalog für die Governance, Vektorsuche und serverlose Endpunkte an einem Ort zu haben, beseitigt so viel Infrastruktur-Reibung. Feature-Engineering-Pipelines und Modellbereitstellung fühlen sich kohärent an, anstatt zusammengeflickt. Der SQL-Warehouse- + Notebook-Hybrid-Workflow erleichtert auch die Übergabe zwischen Datenengineering und ML-Arbeit, ohne die Werkzeuge wechseln zu müssen.

**Was gefällt Ihnen an Databricks nicht?**

Serverlose Endpunkte haben einige scharfe Kanten – die Initialisierung des Spark-Kontexts verhält sich anders als in interaktiven Clustern, was zu stillen Fehlern führen kann, wenn man nicht darauf achtet, wo man Dinge initialisiert. Die Kaltstartlatenz bei serverlosen Diensten ist auch bei Produktionsendpunkten mit geringem Datenverkehr spürbar. Die Dokumentation zu einigen der neueren Funktionen (wie Vektorsuchindex-Konfigurationen) hinkt oft hinter dem tatsächlichen Produktverhalten hinterher, sodass man viel durch Versuch und Irrtum herausfinden muss.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Wir verwenden Databricks, um die Entwicklung von ML-Modellen, Feature Engineering und Bereitstellung für eine Karten- und Zahlungsplattform zu konsolidieren – Arbeiten, die zuvor das Jonglieren mit separaten Tools für Datenverarbeitung, Training und Bereitstellung erforderten. Die einheitliche Umgebung bedeutet, dass unsere ML-Ingenieure vom Rohtransaktionsdaten bis zu einem bereitgestellten Churn-Vorhersagemodell gelangen können, ohne die Plattform zu verlassen. MLflow-Tracking sorgt dafür, dass Experimente reproduzierbar sind, und der Unity-Katalog bietet uns die Datenverwaltungsgeschichte, die unser Bankkunde benötigt. Es hat einen erheblichen Teil des Koordinationsaufwands reduziert, der mit ML-Pipelines mit mehreren Tools einhergeht.

**Official Response from Janelle Glover:**

> Es ist großartig zu hören, wie Databricks Ihre ML-Workflows optimiert und den Koordinationsaufwand reduziert hat. Wir schätzen Ihr Feedback zu den serverlosen Endpunkten und der Dokumentation und werden uns bemühen, diese Probleme zu beheben, um Ihre Erfahrung mit unserer Plattform zu verbessern.

  ### 35. Lakebase: Daten und KI gemeinsam antreiben

**Rating:** 5.0/5.0 stars

**Reviewed by:** Ajay P. | Manager - Data, AI &amp; Automation, Kleinunternehmen (50 oder weniger Mitarbeiter)

**Reviewed Date:** September 08, 2024

**Was gefällt Ihnen an Databricks am besten?**

Ich verwende Lakebase innerhalb von Databricks als Grundlage für unsere KI-Lösungen, wo Datenmodelle und Anwendungen nahtlos zusammenarbeiten. Lakebase bietet eine einheitliche Datenbasis, um KI direkt auf konsistenten, Echtzeitdaten aufzubauen. Ich mag auch Agent Bricks in Databricks, weil es uns hilft, schnell intelligente KI-Agenten zu erstellen und Workflows mit diesen Daten zu automatisieren. Die einfache Einrichtung war ein großer Pluspunkt für uns, da es super einfach war, loszulegen.

**Was gefällt Ihnen an Databricks nicht?**

Agentbricks benötigt mehr native Integration, um den manuellen Aufbau zu reduzieren und die Workflow-Automatisierung zu beschleunigen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks - Lakebase hilft uns, Daten und KI auf einer Plattform zusammenzubringen, die Komplexität zu reduzieren und Datenbewegungen zu vermeiden. Agent Bricks ermöglicht es uns, schnell intelligente KI-Agenten zu erstellen und Workflows mit Echtzeitdaten zu automatisieren.

**Official Response from Jess Darnell:**

> Wir freuen uns sehr zu hören, dass Sie Lakebase einfach zu bedienen finden und dass es mit Funktionen für die Entwicklung von Datenpipelines und KI ausgestattet ist. Es ist großartig zu wissen, dass es bei der Implementierung von GenAI und der Integration mit verschiedenen Quellen über LakeFlow hilfreich war.

  ### 36. Von 1 Stunde auf 10 Minuten: Wie Databricks unseren Workflow modernisierte

**Rating:** 4.5/5.0 stars

**Reviewed by:** Mukundan R. | Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 30, 2026

**Was gefällt Ihnen an Databricks am besten?**

Früher haben wir ADF verwendet, um Daten von SQL Server zu holen und dann in Databricks daran zu arbeiten, bevor wir sie in Salesforce einfügten. Der gesamte Prozess dauerte mehr als eine Stunde, weil ADF zusätzliche Arbeit verursachte. 
Jetzt passiert alles in Databricks. Wir transformieren die Rohdaten in Databricks und fügen sie in Salesforce ein, alles an einem Ort. Das hat den gesamten Prozess viel schneller gemacht, es dauert jetzt 10 Minuten. Das ist eine Verbesserung gegenüber dem, was wir mit ADF hatten.
Delta Lake war auch wirklich nützlich. Es hilft uns, Änderungen nachzuverfolgen und zurückzugehen, wenn etwas schiefgeht. Wir können sehen, was vorher passiert ist und Fehler leicht beheben.
Delta Lake stellt auch sicher, dass die Daten gut sind, bevor sie in die Pipeline gelangen. Es verhindert, dass Daten hineingelangen und später in Salesforce Probleme verursachen. Das macht den gesamten Prozess zuverlässiger und einfacher zu handhaben.

**Was gefällt Ihnen an Databricks nicht?**

Databricks ist wirklich gut in dem, was es tut. Manchmal dauert es eine Weile, bis der Cluster hochgefahren und betriebsbereit ist. Die Benutzeroberfläche ist manchmal langsam. Das kann ärgerlich sein, wenn wir es eilig haben, Dinge für Salesforce zu erledigen. Die Salesforce-Connectoren in Databricks können etwas knifflig sein. Sie müssen oft richtig eingerichtet werden und funktionieren nicht immer wie erwartet. Das bedeutet, dass wir Arbeit investieren müssen, wenn wir versuchen, Probleme zu lösen oder die Pipelines in Databricks für Salesforce im Auge zu behalten.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Es löst unsere Leistungs- und Zuverlässigkeitsprobleme, indem es uns ermöglicht, die Daten an einem Ort ohne ADF zu extrahieren, zu transformieren und in Salesforce zu laden. Dieser einheitliche Workflow hat unsere Laufzeit von 1 Stunde auf 10 Minuten reduziert, was uns schnellere Auftragsabschlüsse und pünktliche Salesforce-Datenaktualisierungen ermöglicht. Mit Delta-Lake-Funktionen wie ACID-Transaktionen und Zeitreisen sind unsere Daten genauer und leichter wiederherzustellen, wenn etwas schiefgeht.

**Official Response from Janelle Glover:**

> Wir freuen uns zu hören, dass Databricks Ihren Arbeitsablauf erheblich verbessern konnte, indem es die Laufzeit verkürzt hat. Es ist großartig zu wissen, dass Delta Lake nützlich war, um die Datenintegrität zu wahren und einfachere Wiederherstellungsoptionen zu bieten. Wir verstehen Ihre Bedenken bezüglich der Cluster-Einrichtungszeit und der Geschwindigkeit der Benutzeroberfläche sowie die Herausforderungen mit den Salesforce-Konnektoren. Wir schätzen Ihr Feedback und werden es mit unserem Team für weitere Verbesserungen teilen.

  ### 37. Databricks: Funktionsreich, benutzerfreundlich und alles auf einer Plattform vereint

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sivabalan A. | Technical Lead - Data Engineering, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 27, 2026

**Was gefällt Ihnen an Databricks am besten?**

Unter den verschiedenen Plattformen, mit denen ich gearbeitet habe, sticht Databricks als eine wirklich kohärente Umgebung hervor. Es fühlt sich weniger wie ein Bündel von getrennten Funktionen an und mehr wie ein einheitlicher Arbeitsbereich – einer, der sich mit den Teams, die ihn nutzen, weiterentwickeln kann. Die Benutzeroberfläche ist intuitiv genug, um die Einstiegshürde zu senken, während sie dennoch die Tiefe und Leistung bietet, die für anspruchsvolle Ingenieurarbeiten erforderlich sind.

Eine seiner größten Stärken ist, wie es den Datenlebenszyklus konsolidiert. Indem es Ingenieurwesen, Datenwissenschaft und SQL-Analytik unter einem Dach vereint, hilft es, die Silos aufzulösen, die oft zu „Datenabweichungen“ und Missverständnissen zwischen Abteilungen führen. In der Praxis vereinfacht es auch die zugrunde liegende Infrastruktur, indem es ein Dutzend spezialisierter (und manchmal widersprüchlicher) Werkzeuge durch eine einzige, klarere Quelle der Wahrheit ersetzt.

Über das bloße „Sauberhalten“ hinaus glänzt die Plattform auch in Bezug auf kollaborative Transparenz. Mit in Echtzeit geteilten Notebooks und Experimenten kann die Lücke zwischen einer anfänglichen Datenidee und einem produktionsreifen Modell erheblich verkürzt werden. Darüber hinaus bedeutet das Engagement für offene Standards wie Delta Lake, dass man nicht in eine proprietäre Blackbox eingesperrt ist – man baut auf einem Fundament, das mit der Richtung der breiteren Daten-Community übereinstimmt. Insgesamt findet es eine seltene Balance: eine polierte, benutzerfreundliche Hülle um einige der leistungsstärksten verteilten Rechenmaschinen, die heute verfügbar sind.

**Was gefällt Ihnen an Databricks nicht?**

Die „Große Aufgabe“ Aufschlüsselung

Wenn Genie ein großes Datenvolumen verarbeitet, sendet es oft eine riesige Menge an JSON zurück an den Browser, damit dieser die Tabellen und Visualisierungen darstellen kann.

Speicherüberlastung: Browser (und insbesondere Chrome) können echte Speicherfresser sein. Wenn eine Genie-Antwort eine sehr große Ergebnismenge oder einen massiven Ausführungsplan enthält, kann die RAM-Nutzung schnell ansteigen, was zu dem bekannten „Keine Rückmeldung“-Hänger führen kann.

Das „DOM“-Verzögerung: Jede Zeile in einer Tabelle und jede Codezeile wird zu einem Element, das der Browser im Auge behalten muss. Während Sie scrollen oder tippen, muss der Browser Tausende dieser Elemente neu zeichnen. Wenn die Aufgabe zu groß ist, kann der Hauptthread des Browsers beim Rendern blockiert werden, und Ihr Tippen fühlt sich an, als würde es um ein paar Sekunden hinterherhinken.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Sie haben den Hauptgrund erkannt, warum Databricks so viele Datenteams für sich gewinnt: Sie reduzieren die "Integrationskosten". In den meisten Unternehmen kann man leicht etwa 30 % seiner Zeit damit verlieren, Daten zwischen dem "Speicher"-Tool, dem "Verarbeitungs"-Tool und dem "BI"-Tool zu verschieben.

Das AI/BI-Dashboard ist ein großartiges Beispiel für diesen umfassenderen Wandel – von einer "Sammlung von Tools" zu einer einheitlicheren Plattform.

Was als einfache Visualisierungsschicht begann, hat sich zu einem "Compound AI"-System entwickelt. So ist es so nützlich geworden:

Die "Ask Genie"-Integration: Sie sind nicht mehr darauf beschränkt, auf ein statisches Diagramm zu starren. Ab 2026 enthält jedes veröffentlichte Dashboard standardmäßig einen "Ask Genie"-Button. Wenn ein Stakeholder einen Anstieg in einem Liniendiagramm bemerkt, muss er Sie nicht anrufen; er kann mit der rechten Maustaste auf das Diagramm klicken und fragen: "Genie, warum ist das am Dienstag gesunken?" und es wird den Treiber im Agentenmodus aufspüren.

Direkt-zum-Warehouse-Geschwindigkeit: Da es innerhalb von Databricks lebt, gibt es keine Notwendigkeit, Daten auf einen separaten BI-Server zu "extrahieren". Es fragt die Daten dort ab, wo sie bereits leben (Unity Catalog), was bedeutet, dass das Dashboard so aktuell bleibt wie Ihr letzter ETL-Lauf.

KI-unterstützte Erstellung: Sie können ganze Widgets erstellen, indem Sie einfach beschreiben, was Sie möchten. Anstatt Felder herumzuziehen, können Sie eingeben: "Zeigen Sie mir ein Trichterdiagramm unserer Verkaufsumwandlung nach Region", und es generiert das SQL und die Visualisierung für Sie.

Tiefgehende Governance: Da es integriert ist, folgen Ihre Sicherheitsrichtlinien (zeilenbasierte Sicherheit, Tags) den Daten automatisch. Sie müssen keine Berechtigungen in einem separaten Tool wie Tableau oder Power BI neu erstellen.

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie die Vorteile von Databricks bei der Reduzierung der "Integrationskosten" und der Optimierung der Datenbewegung zwischen Speicher, Verarbeitung und BI-Tools hervorgehoben haben. Wir freuen uns zu hören, wie das AI/BI-Dashboard und Genie wertvoll waren, um direkte Geschwindigkeit zum Warehouse und KI-unterstütztes Erstellen zu bieten.

  ### 38. Databricks Genie Code - Agentische angewandte KI für den gesamten SDL-Lebenszyklus

**Rating:** 4.5/5.0 stars

**Reviewed by:** Senthil K. | Senior Cloud Solution Architect - Accenture Data &amp; AI (Applied Intelligence), Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** October 03, 2023

**Was gefällt Ihnen an Databricks am besten?**

Genie Code

1) Genie Code automatisierte unsere ETL-Prozesse, reduzierte den manuellen Aufwand und steigerte die Effizienz. Mit Agentics SDL implementierten wir CI/CD-Pipelines für schnellere, nahtlose Updates und Bereitstellungen.

2) Genie Code vereinfachte komplexe STTM-Zuordnungen, verbesserte die Genauigkeit und Geschwindigkeit. Agentics Echtzeit-Updates stellten sicher, dass Zuordnungsanpassungen dynamisch vorgenommen wurden, um sich an die sich ändernden Transaktionsdaten anzupassen.

3) Wir definierten automatisierte Unit-Tests mit SKILL.md, um sicherzustellen, dass Datenumwandlungen vor der Bereitstellung validiert werden. Dies reduzierte Fehler und gewährleistete die Datenqualität, was das Vertrauen in unsere Analysen stärkte.

4) Mit Skills.md fügten wir Genie Code benutzerdefinierte Erweiterungen hinzu, wie die Integration von Drittanbieterdaten für angereicherte Berichte. Diese Agilität ermöglichte es uns, schnell auf Geschäftsanforderungen zu reagieren und neue Fähigkeiten bereitzustellen.

5) Agentics SDL ermöglichte die Echtzeit-Datenverarbeitung und lieferte sofortige Analysen für die Entscheidungsfindung. Unsere Marketing- und Vertriebsteams können nun sofort auf frische Daten reagieren, was die Reaktionszeiten und die Gesamteffizienz verbessert.

**Was gefällt Ihnen an Databricks nicht?**

Hoffentlich kann es im nächsten Update verbessert werden -

Das Debuggen von Problemen in komplexen Workflows kann zeitaufwändig sein, da die Sichtbarkeit in Zwischen-Datenumwandlungen begrenzt ist.

Genie Code fehlt es an fortschrittlichen Fehlerbehebungsmechanismen, was es schwierig macht, Ausfälle in groß angelegten Datenpipelines zu verwalten.

Mit zunehmendem Datenvolumen kann die Leistung von Genie Code nachlassen, was erhebliche manuelle Anpassungen erfordert, um einen reibungslosen Betrieb im großen Maßstab sicherzustellen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

1) Skalierbare Verarbeitung - Auf der Spark-basierten Architektur von Databricks aufgebaut, verarbeitet Genie Code effizient und skaliert die Verarbeitung für riesige Datensätze, um die Leistung auch bei zunehmenden Datenmengen sicherzustellen.

2) Genie Code automatisiert End-to-End-ETL-Workflows, von der Datenextraktion bis zur Transformation und zum Laden, rationalisiert Datenoperationen und eliminiert manuelle Aufgaben.

3) Echtzeit-Zusammenarbeit - Genie Code ermöglicht Echtzeit-Zusammenarbeit über Teams hinweg durch die Nutzung gemeinsamer Notebooks, was es Datenprofis erleichtert, Workflows gemeinsam zu erstellen und zu verfeinern.

**Official Response from Aunalisa Arellano:**

> Es ist großartig zu hören, dass die Databricks Data Intelligence Platform Ihnen mit einer einheitlichen Lakehouse-Plattform, Workflow-Orchestrierung, Integrationen und Datenaustausch hilft. Wir sind bestrebt, Lösungen bereitzustellen, die Ihren geschäftlichen Anforderungen entsprechen.

  ### 39. Databricks' Einheitliche Plattform: Schnelles SQL, Optimierte Pipelines und Kontextbewusste KI

**Rating:** 5.0/5.0 stars

**Reviewed by:** Deeraj R. | Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 27, 2026

**Was gefällt Ihnen an Databricks am besten?**

Die einheitliche Plattform-Erfahrung ist das, was mich bei Databricks hält. Notebooks, Pipelines, SQL-Warehouses, ML und Governance an einem Ort unter dem Unity Catalog zu haben, bedeutet, dass ich nicht ständig fünf verschiedene Tools zusammenfügen muss, nur um meine Arbeit zu erledigen.

Lakeflow Pipelines (ehemals DLT) machen es einfach, Medaillon-Architektur-Pipelines zu erstellen, und die Photon-Engine liefert echte Leistungssteigerungen bei SQL-Workloads, ohne dass Codeänderungen erforderlich sind. Neuere Ergänzungen wie Genie Code und Hintergrundagenten zeigen auch, dass sie es mit agentischer KI ernst meinen – es fühlt sich nicht wie ein angehängter Copilot an, weil es tatsächlich Ihren Datenkontext durch den Unity Catalog verstehen kann. Serverless-Computing war ebenfalls eine große Verbesserung der Lebensqualität, da ich nicht mehr auf das Hochfahren von Clustern warten muss, wenn ich nur schnelle, ad-hoc-Abfragen ausführen möchte.

**Was gefällt Ihnen an Databricks nicht?**

Kostenmanagement kann knifflig sein – DBUs summieren sich schnell, wenn man bei der Clustergröße und der automatischen Skalierung des Warehouses nicht vorsichtig ist. Das Preismodell ist auch nicht immer transparent, besonders wenn man serverlose und klassische Berechnungen mischt.

Unity Catalog ist mächtig, aber die anfängliche Einrichtung und die Migration von einem alten HMS kann schmerzhaft sein, insbesondere für große Organisationen mit jahrelangen bestehenden Hive-Metastore-Objekten. Die Dokumentation ist im Allgemeinen gut, hinkt jedoch manchmal hinter neuen Feature-Releases hinterher. Darüber hinaus kann die Benutzeroberfläche des Arbeitsbereichs manchmal träge wirken, besonders wenn man mit einer großen Anzahl von Assets arbeitet.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Vor Databricks war unser Daten-Stack fragmentiert – separate Tools für ETL, Analytik, ML und Governance. Das bedeutete ständiges Kontextwechseln, duplizierte Daten und Governance-Lücken. Databricks konsolidiert all das in einer Lakehouse-Plattform. Delta Lake bietet uns zuverlässige ACID-Transaktionen auf dem Data Lake, Unity Catalog verwaltet die Datenherkunft und den Zugriffskontrolle umfassend, und SQL-Warehouses ermöglichen es unseren Analysten, sich selbst zu bedienen, ohne ein separates Data-Warehouse-Produkt zu benötigen. Es hat unsere Pipeline-Entwicklungszeit erheblich verkürzt und die Daten-Governance zu etwas gemacht, das wir tatsächlich konsequent durchsetzen können, anstatt nur auf das Beste zu hoffen.

**Official Response from Janelle Glover:**

> Wir freuen uns zu hören, dass Sie die einheitliche Plattform-Erfahrung genießen und den Wert in Lakeflow Pipelines, Photon Engine und Genie Code finden. Wir verstehen Ihre Bedenken bezüglich Kostenmanagement und Preistransparenz sowie die Herausforderungen bei der anfänglichen Einrichtung und der Benutzeroberfläche des Arbeitsbereichs. Ihr Feedback ist wertvoll und wird mit unserem Team für weitere Verbesserungen geteilt.

  ### 40. All-in-One Databricks-Plattform mit starker Governance, schneller Spark-Leistung und Genie

**Rating:** 5.0/5.0 stars

**Reviewed by:** Sabareeswara S. | Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 27, 2026

**Was gefällt Ihnen an Databricks am besten?**

Die All-in-One-Plattform beseitigt das Tool-Wirrwarr. Unity Catalog bietet Governance, Herkunft und Auffindbarkeit, ohne dass ein separater Katalog hinzugefügt werden muss. Die Notebook-Benutzeroberfläche ist übersichtlich und ermöglicht schnelles Iterieren mit PySpark. Genie ist das herausragende KI-Feature, das kuratierte Tabellen in natürliche Sprachschnittstellen für Geschäftsanwender verwandelt, und das SDK ermöglicht es, es programmatisch zu konfigurieren, sodass es wartbar bleibt. DLT übernimmt die Orchestrierung von Pipelines gut. Die Leistung bei Spark-Workloads ist solide, insbesondere mit Photon. Die Integrationen mit Airflow, S3 und dem breiteren Ökosystem sind unkompliziert. In Bezug auf den ROI zahlt sich die Konsolidierung, die früher mehrere Tools erforderte, in eine Plattform durch die reduzierte Komplexität aus.

**Was gefällt Ihnen an Databricks nicht?**

Die Preisgestaltung kann schwer vorherzusagen sein. Berechnungskosten steigen schnell, wenn Sie nicht vorsichtig mit der Clustergröße und der Auswahl der SKUs sind, und es ist nicht immer offensichtlich, welche Arbeitslaststufe Sie tatsächlich benötigen, bis Sie die Rechnung sehen. Die Notebook-IDE, obwohl funktional, hinkt immer noch hinter einem echten Editor für Refactoring, Navigation über mehrere Dateien und Code-Review-Workflows hinterher.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Die Konsolidierung von Werkzeugen ist die größte Herausforderung. Früher benötigte man separate Systeme für Ingestion, Transformation, Speicherung, Governance und Bereitstellung, jedes mit seiner eigenen Lernkurve, Wartungsaufwand und Integrationsproblemen. Databricks vereint all das in einer einzigen Plattform. Unity Catalog löst das Problem der Daten-Governance, indem es Ihnen Abstammung, Zugriffskontrolle und Auffindbarkeit an einem Ort bietet, anstatt Berechtigungen über getrennte Systeme hinweg zu verwalten.

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie Ihre positive Erfahrung mit Databricks geteilt haben! Wir freuen uns zu hören, dass Sie Delta Live Tables, Unity Catalog und Genie als vorteilhaft empfinden. Wir schätzen auch Ihr Feedback zur Preisgestaltung und werden Ihre Kommentare mit unserem Team teilen.

  ### 41. Databricks beseitigt weiterhin Reibungen mit starker Governance und intuitiven KI-Tools.

**Rating:** 4.5/5.0 stars

**Reviewed by:** Praveenkumar S. | Solutions Architect, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 27, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir an Databricks am meisten gefällt, ist, wie seine Funktionen konsequent den sich entwickelnden Bedürfnissen von Engineering-Teams gerecht werden. Im Laufe der Jahre habe ich gesehen, wie es sich von einer soliden Datenplattform zu einem Arbeitsbereich entwickelt hat, der wirklich vereinfacht, wie wir Daten- und KI-Lösungen entwickeln und verwalten. Der Unity Catalog war eine der größten Verbesserungen für uns, da ein einziger Ort zur Verwaltung von Berechtigungen und Abstammung viele manuelle Schritte entfernt hat, die wir früher separat über Systeme hinweg gehandhabt haben. Genie AI und BI sind ebenfalls Teil meines regelmäßigen Workflows geworden; die Möglichkeit, SQL zu generieren oder Datensätze durch natürliche Gespräche zu erkunden, hilft Teams, schneller zu Antworten zu kommen, insbesondere wenn wir unter Zeitdruck stehen. Die Apps-Funktion hat unerwarteten Wert hinzugefügt, indem sie uns ermöglicht, vereinfachte interne Tools direkt innerhalb der Plattform zu erstellen und zu teilen, wodurch die Notwendigkeit entfällt, zusätzliche Infrastruktur bereitzustellen. Und mit Lakebase konnten wir mehr transaktionsartige Anwendungsfälle unterstützen, ohne die Flexibilität eines Sees zu verlieren, was bestimmte Pipelines viel einfacher zu warten gemacht hat. Insgesamt haben diese Verbesserungen viel Reibung aus der täglichen Arbeit entfernt und die Plattform zu etwas gemacht, das ich wirklich gerne nutze, während sie sich weiterentwickelt.

**Was gefällt Ihnen an Databricks nicht?**

Was ich an Databricks nicht mag, ist, dass einige der neueren KI-Erfahrungen, insbesondere Genie für die Code-Generierung, manchmal instabil wirken können und während längerer Entwicklungssitzungen den Kontext verlieren können. Es stört meinen Arbeitsablauf, wenn der Assistent die frühere Logik nicht beibehalten oder die Kontinuität über mehrere Iterationen hinweg aufrechterhalten kann.

Ich habe auch eine Lücke bei den nativen Konnektoren für bestimmte Unternehmenssysteme wie DFS, SMB-Shares oder Windows-basierte Quellsysteme sowie Plattformen wie DB2 auf AS/400 bemerkt, auf die viele Kunden immer noch angewiesen sind. Obwohl Databricks sein Ökosystem weiter ausbaut, bedeutet der Mangel an direkter Konnektivität in diesen Bereichen oft, dass wir zusätzliche Middleware oder benutzerdefinierte Pipelines benötigen, um die Lücke zu schließen.

Keines davon ist ein K.-o.-Kriterium, aber es sind Bereiche, in denen die ansonsten reibungslose Erfahrung der Plattform noch etwas unvollständig wirken kann.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks hat uns geholfen, mehrere langjährige Herausforderungen in der Verwaltung und Bereitstellung von Daten und KI zu bewältigen. Bevor wir die neueren Funktionen übernommen haben, hatten wir mit fragmentierter Governance, doppelten Datensätzen und viel manueller Arbeit zu kämpfen, um Berechtigungen und Abstammung in verschiedenen Systemen konsistent zu halten. Unity Catalog verbesserte dies, indem es uns einen einzigen Ort zur Verwaltung von Sicherheit und Eigentum bot, was die Verwirrung in den Teams verringerte und die Nacharbeit bei Audits spürbar reduzierte.

Wir verbrachten auch viel Zeit damit, Teams bei der Datenexploration oder der Erstellung von Abfragen zu unterstützen. Mit Genie AI und BI können sie jetzt SQL, Zusammenfassungen und visuelle Einblicke unabhängiger generieren. Dadurch hat sich die Zeit von einer Frage bis zu einer brauchbaren Antwort verkürzt, insbesondere wenn wir unter engen Lieferzyklen arbeiten.

Ein weiterer Schmerzpunkt war der Aufbau kleiner interner Tools rund um unsere Daten. Das Einrichten separater Infrastrukturen oder Hosting-Umgebungen verursachte unnötigen Aufwand. Mit Databricks Apps können wir diese Tools jetzt innerhalb der Plattform selbst erstellen und teilen, was die Einrichtungszeit spart und den laufenden Wartungsaufwand reduziert.

Schließlich hatten wir Schwierigkeiten, Workloads zu unterstützen, die sowohl die Flexibilität eines Sees als auch die Zuverlässigkeit einer Datenbank benötigten. Lakebase half, diese Lücke zu schließen, indem es transaktionsähnliche Operationen direkt auf unseren Seedaten ermöglichte, was mehrere Pipelines vereinfachte und die Anzahl der zu wartenden Systeme reduzierte.

Insgesamt hat Databricks uns von der Jonglage mit mehreren getrennten Tools zu einer einheitlicheren und vorhersehbareren Umgebung geführt. Dieser Wandel hat die Lieferung beschleunigt, den betrieblichen Aufwand gesenkt und die Klarheit unserer Arbeitsabläufe verbessert.

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie Ihre positive Erfahrung mit Databricks geteilt haben! Wir freuen uns zu hören, dass unsere Plattform in der Lage ist, die sich entwickelnden Bedürfnisse Ihrer Engineering-Teams konsequent zu erfüllen und Ihre Daten- und KI-Lösungen zu optimieren. Wir schätzen Ihr Feedback zu Unity Catalog, Genie und Lakebase und sind bestrebt, unsere Plattform kontinuierlich zu verbessern und weiterzuentwickeln, um ein reibungsloses und angenehmes Benutzererlebnis zu bieten.

  ### 42. Schnelle, gesteuerte Self-Service-Datenexploration mit Databricks Genie

**Rating:** 3.5/5.0 stars

**Reviewed by:** Yuvashree M. | Senior Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 27, 2026

**Was gefällt Ihnen an Databricks am besten?**

Als Dateningenieur nutze ich Databricks Genie, um in natürlicher Sprache mit Daten zu interagieren, während ich weiterhin auf die gleichen verwalteten Tabellen, Metriken und semantischen Modelle zurückgreife, die mein Team erstellt hat. Anstatt für jede explorative Anfrage direkt in SQL-Notebooks zu springen, können ich oder Geschäftsanwender Fragen in einfacher Sprache formulieren und Genie sie in strukturierte, katalogbewusste Abfragen übersetzen lassen. Dies hält den Self-Service schnell, aber auch sicher und geregelt.

**Was gefällt Ihnen an Databricks nicht?**

Laptop-Stabilität beim Multitasking
Mein Laptop kann hängen oder merklich langsamer werden, wenn ich mit mehreren Genie-Tabs und Dashboards gleichzeitig arbeite, besonders bei schwereren Abfragen oder anspruchsvolleren Visualisierungen. Dies beeinträchtigt das gesamte Benutzererlebnis und kann die iterative Entwicklung und Analyse verlangsamen.

Latenz bei komplexen Datenmodellen
Bei sehr breiten Schemata oder komplexeren semantischen Modellen wählt Genie manchmal suboptimale Joins oder ein zu breites/enges Granularitätsniveau. Daher muss ich die generierte SQL immer noch überprüfen und selbst optimieren. In diesem Sinne bleibt es ein hilfreicher Assistent, anstatt eine vollständig autonome Abfrage-Engine zu sein.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

In einem kürzlich durchgeführten Projekt wollte das Unternehmen einen Rückgang des Customer-Lifetime-Value (CLV) in einer bestimmten Region verstehen. Ein Produktmanager nutzte Genie, um CLV-Trends nach Region und Kohorte zu untersuchen, wobei Rückerstattungen direkt von einem AI/BI-Dashboard ausgeschlossen wurden. Aus diesem Gespräch habe ich die Kernlogik erfasst, sie in eine Delta Live Table-Pipeline eingebunden und als wiederkehrenden Job geplant. Dies reduzierte Ad-hoc-Anfragen um etwa 30–40 % und ermöglichte einen fortlaufenden Self-Service-Zugang zu CLV-Einblicken, während ich mich auf die Optimierung der Leistung und der Datenqualitätsregeln konzentrierte.

Insgesamt hilft mir Genie, mit meinen Daten in natürlicher Sprache zu kommunizieren, verbessert, wie schnell wir Erkenntnisse gewinnen, und unterstützt bessere Datenqualitätspraktiken – obwohl die Arbeit über viele Genie-gestützte Tabs die lokale Hardware belasten und manchmal den Arbeitsablauf verlangsamen kann.

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie Ihre positive Erfahrung mit der Nutzung von Genie für die selbstständige Datenexploration geteilt haben. Wir entschuldigen uns für die Probleme, die Sie in Bezug auf Stabilität und Latenz bemerkt haben. Unser Team arbeitet aktiv daran, diese Bedenken zu beheben und das Benutzererlebnis zu verbessern.

  ### 43. Databricks Genie meistert Unity-Katalog-Migrationen mit kontextbezogener Anleitung

**Rating:** 4.0/5.0 stars

**Reviewed by:** Nandhini E. | Senior Data Architect, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** March 27, 2026

**Was gefällt Ihnen an Databricks am besten?**

Databricks Genies kontextuelles Verständnis des Unity Catalog ist wirklich beeindruckend. Während der Arbeit an einer komplexen UC-Migration, bei der dreistufige Namensräume, Volumenpfade, Sicherheitsmodi und widgetgesteuerte SQL-Ausführung navigiert werden mussten, hat Genie die spezifischen Details durchdacht, anstatt auf generische Antworten zurückzugreifen. Es spricht wirklich die Sprache der UC-Migration, was viel Hin und Her reduziert und das Troubleshooting direkter erscheinen lässt. Insgesamt ist die Plattform leistungsstark für das Management von groß angelegten Datenengineering-Arbeiten über Python, Scala und notebookbasierte Pipelines, alles an einem Ort.

**Was gefällt Ihnen an Databricks nicht?**

Mein größter Frust mit Genie ist der Mangel an persistentem Sitzungs-Speicher. Bei einem lang andauernden Migrationsprojekt mit über 60 Testfällen und mehreren miteinander verbundenen Komponenten entsteht durch das ständige Wiederherstellen des Kontexts in jeder Sitzung ein echter Mehraufwand. Genie hat auch Schwierigkeiten mit der übergreifenden Komponenten-Logik: Es verarbeitet einzelne Notebooks gut, aber das Nachverfolgen von Problemen über mehrere Schichten eines Frameworks hinweg ist immer noch weitgehend manuelle Arbeit. Gelegentlich wirken die Antworten übervorsichtig, wenn eigentlich eine direktere, selbstbewusstere Antwort benötigt wird.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Wir verwenden Databricks, um eine vollständige Unity Catalog-Migration für ein großes, automatisiertes Ingestions-Framework durchzuführen, wobei wir vom alten Hive Metastore weggehen und gleichzeitig die Laufzeitumgebung aktualisieren. Databricks bietet eine einheitliche Plattform, auf der die Migrationsarbeit, das Testen und die Validierung an einem Ort stattfinden können. Während der Tests half insbesondere Genie, die Ursachenanalyse zu beschleunigen. Zum Beispiel zeigte es auf, warum ein Datenextraktions-Notebook die UC-verwalteten Tabellenreferenzen nicht auflösen konnte, und identifizierte, dass das Hinzufügen einer USE CATALOG-Anweisung die Lösung war. Diese Art von gezielter, kontextbewusster Unterstützung reduziert direkt die Untersuchungszeit bei komplexen Migrationen.

**Official Response from Janelle Glover:**

> Es ist fantastisch zu hören, dass Databricks Ihnen dabei hilft, Ihre Unity-Katalog-Migration und Testprozesse zu optimieren. Wir schätzen Ihr konkretes Beispiel dafür, wie Genies kontextbewusste Unterstützung die Untersuchungszeit bei komplexen Migrationen direkt reduziert hat. Wir schätzen auch Ihr Feedback zur Effizienz und werden Ihre Kommentare für zukünftige Verbesserungen berücksichtigen.

  ### 44. Förderung von KI- und Dateninnovation mit einer einheitlichen Databricks-Plattform

**Rating:** 4.5/5.0 stars

**Reviewed by:** Ajay Kumar P. | Associate Consultant-Data Engineer, Kleinunternehmen (50 oder weniger Mitarbeiter)

**Reviewed Date:** August 09, 2023

**Was gefällt Ihnen an Databricks am besten?**

Ich benutze Databricks für ETL, Reporting und KI und schätze, dass es als eine einheitliche Lösung für alle Daten- und KI-Bedürfnisse funktioniert. Es erleichtert das Nachverfolgen von Daten und das Erstellen von Erkenntnissen, was uns hilft, mit Datensilos umzugehen. Ich mag den Unity Catalog, da er uns hilft, Daten an einem Ort zu verwalten und zu steuern. Ich benutze auch gerne AgentBricks als ein Multi-Agenten-System, um KI-Anwendungen aus PDFs und anderen Dokumenten zu erstellen. Ich finde Genie wertvoll, da es Geschäftsanwendern ermöglicht, Fragen in natürlicher Sprache zu stellen und genaue Antworten zu erhalten. Die anfängliche Einrichtung von Databricks war sehr einfach, was den Übergang reibungslos machte.

**Was gefällt Ihnen an Databricks nicht?**

Ich denke, der Arbeitsablauf könnte verbessert werden, indem mehrere Trigger zu derselben Pipeline hinzugefügt werden. Denn derzeit müssen wir, wenn wir dieselbe Pipeline mehrmals am Tag planen wollen, sie für jede Zeit klonen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Ich nutze Databricks, um Datensilos zu beseitigen und die Verfolgung von Daten sowie die Erstellung von Einblicken zu erleichtern. Unity Catalog verwaltet die Datenverwaltung, AgentBricks entwickelt KI-Anwendungen, und Genie liefert Antworten in natürlicher Sprache auf strukturierte Daten.

**Official Response from Aunalisa Arellano:**

> Wir freuen uns zu hören, dass die Databricks Intelligence Platform einen Mehrwert bietet, indem sie Probleme der Datenverwaltung angeht und das Datenmanagement optimiert. Ihr Feedback zum Bedarf an robusteren Workflows wurde zur Kenntnis genommen, und wir sind bestrebt, unsere Plattform kontinuierlich zu verbessern, um den Bedürfnissen von Data Engineers, ML Engineers und Analysten besser gerecht zu werden.

  ### 45. Der Genie-Code-Agentenmodus hat unsere Migration zu Databricks schnell und genau gemacht.

**Rating:** 4.0/5.0 stars

**Reviewed by:** Dharun T. | Senior Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 26, 2026

**Was gefällt Ihnen an Databricks am besten?**

Genie Code (Databricks Assistant Agent) — Ich arbeite derzeit an der Migration bestehender Workloads von ADF und SQLMI zu Databricks. Im Rahmen dessen muss ich gespeicherte Prozeduren und ADF-Datenflüsse in Databricks-Notebooks umwandeln. Zunächst haben wir den gesamten Code manuell umstrukturiert, aber als der Agent-Modus in der Vorschau verfügbar war, haben wir versucht, ihn zu verwenden, um die gespeicherten Prozeduren und Datenflüsse in Databricks PySpark-Code zu konvertieren. Ich war beeindruckt von der Genauigkeit: Er hat etwa 90 % der Code-Konvertierung fehlerfrei durchgeführt, abgesehen von einigen Anpassungen bei der Groß- und Kleinschreibung und ähnlichen Anpassungen.

Auch Lakeflow Connect hat mir geholfen, SharePoint- und SFTP-Daten einfacher mit Databricks zu verbinden.

**Was gefällt Ihnen an Databricks nicht?**

Es ist kein großes Problem, aber in meinem Projekt hat der Kunde uns gebeten, Tabellen- und Spaltenbeschreibungen mithilfe von KI im Unity-Katalog zu erstellen. Für jede Umgebung variieren diese Beschreibungen, und ich habe allein in der Bronze-Zone etwa 300 Tabellen. In jede Tabelle klicken zu müssen, um KI-Beschreibungen einzeln zu generieren, ist sehr zeitaufwändig, und die Ergebnisse sind nicht konsistent über die Umgebungen hinweg.

Es wäre viel effizienter, wenn wir die Möglichkeit hätten, Beschreibungen auf Schemaebene zu generieren, und wenn es ein Informationsschema oder Systemtabellen gäbe, die Tabellen- und Spaltenbeschreibungen als Metadaten speichern. Auf diese Weise könnten wir sie leicht über Umgebungen hinweg replizieren. In einigen Fällen haben Kunden auch Dokumentationen des Quellsystems, die wir nutzen könnten, um genauere Tabellen- und Spaltenbeschreibungen zu erstellen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Eines meiner Hauptszenarien war die Migration aller vorhandenen gespeicherten Prozeduren und ADF-Datenflüsse in Databricks-Notebooks. Dies manuell zu tun, dauerte mehr als 6 Stunden, um sowohl die Entwicklung als auch die Validierung abzuschließen. Später nutzten wir den Agent Mode Preview und konvertierten über 80+ mittel/komplexe gespeicherte Prozeduren und 20+ ADF-Datenflüsse in Databricks-Notebooks. Dies sparte mehr als 100+ Stunden und generierte auch Validierungsskripte für jede Tabelle, um die Komponententests abzuschließen.

Abgesehen vom Agent Assistant nutzten wir auch externes Volumen. Zuvor verließen wir uns auf die Azure-Bibliothek für die Dateiverarbeitung im ADLS-Speicher, stießen jedoch auf Ratenbegrenzungsprobleme, konnten nicht parallel verarbeiten und manchmal brach der Job ab. Nachdem wir ein externes Volumen erstellt hatten, das auf den erforderlichen ADLS-Container zeigte, erreichten wir parallele Verarbeitung und schnellere Lese- und Schreibvorgänge, anstatt benutzerdefinierten Python-Code zu verwenden.

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie Ihre positive Erfahrung mit Genie und Lakeflow Connect in Databricks geteilt haben! Wir freuen uns zu hören, dass es Ihren Migrationsprozess schnell und genau gemacht hat.

  ### 46. Databricks: Eine wirklich einheitliche Analyse- und KI-Plattform, die Geschwindigkeit und Zuverlässigkeit steigert

**Rating:** 5.0/5.0 stars

**Reviewed by:** Amit D. | Data Architect, Unternehmen (> 1000 Mitarbeiter)

**Reviewed Date:** March 26, 2026

**Was gefällt Ihnen an Databricks am besten?**

Was mir an Databricks am besten gefällt, ist, dass es endlich das geliefert hat, was sich jeder Dateningenieur/Datenprofi gewünscht hat — eine echte einheitliche Analyse- und KI-Plattform.
Ich erinnere mich, dass ich mit fünf verschiedenen Tools arbeiten musste, nur um eine einzige Pipeline von der Erfassung bis zur Berichterstellung zu erstellen. Databricks hat all das in einer Umgebung zusammengefasst, und das hat für mich alles verändert.
Delta Lake war der erste Durchbruch. Als es um 2020 herum erschien, beseitigten ACID-Transaktionen und Zeitreisen sofort die betrieblichen Schmerzen, die wir früher als „normal“ betrachteten. Wenn ein Job eine Tabelle beschädigte, konnte ich in Sekundenschnelle auf eine frühere Version zurücksetzen, anstatt Stunden mit der Wiederherstellung von Backups zu verbringen. Diese Zuverlässigkeit allein verhinderte mehrere nachgelagerte Ausfälle.
Bevor Delta existierte, waren unsere Pipelines stark auf Überschreibmuster angewiesen, da es keine zuverlässige Möglichkeit gab, Updates anzuwenden oder spät eintreffende Daten sicher zu handhaben. Überschreibungen waren langsam, teuer und riskant — insbesondere bei großen Tabellen. Ein einziger Fehler während der Überschreibung konnte die Tabelle in einem halb geschriebenen, inkonsistenten Zustand hinterlassen. Die Verarbeitung dauerte länger, die Rechenkosten stiegen in die Höhe, und die Wiederherstellung bedeutete oft, Partitionen manuell von Grund auf neu zu erstellen.
Der ROI wurde offensichtlich, sobald wir Databricks von Anfang bis Ende nutzten. Da eine Plattform die Erfassung → Transformation → ML → BI → Governance abwickelt, haben wir ganze Kategorien von Altsystemen abgeschafft und den betrieblichen Aufwand drastisch reduziert.
Dann kam Genie — und es hat meine tägliche Arbeit wirklich verändert.
Ich brauchte einmal ein PySpark-Modul für Datenqualitätsprüfungen. Genie generierte die gesamte Logik — Nullprüfungen, Schema-Validierung, Aggregationen — in Sekunden. Anstatt 30 Minuten mit dem Schreiben von Boilerplate zu verbringen, verbrachte ich 3 Minuten damit, die Logik zu verfeinern. Es verlagerte meinen Fokus von der Syntax auf Entscheidungen.
Integrationen sind eine weitere Stärke. Die Verbindung von Databricks mit S3, SQL Server und insbesondere Power BI war nahtlos. Das direkte Veröffentlichen von Delta-Tabellen in BI-Modelle machte brüchige Extrakte überflüssig und beschleunigte Aktualisierungen. Unity Catalog machte alles noch sauberer mit konsistenten Berechtigungen und Abstammung.
Die Leistung ist konstant stark, wenn es darauf ankommt — schwere Joins, Fensterfunktionen, mehrstufige Pipelines oder Streaming-Workloads. Serverlose Rechenleistung startet sofort, und Workloads skalieren vorhersehbar, selbst unter Druck.
Schließlich hat mich das Onboarding überrascht. Funktionen wie serverlose Rechenleistung, Abfragen in natürlicher Sprache, KI-generierte Codevorschläge und automatische Kommentare machen Databricks auch für Ingenieure, die neu in Spark sind, intuitiv. Es fühlt sich an, als würde die Plattform aktiv beim Lernen helfen.
Kurz gesagt: Databricks lässt mich schneller arbeiten, sofort wiederherstellen, nahtlos integrieren und selbstbewusst skalieren — alles an einem Ort. Es ist die seltene Plattform, die sowohl Geschwindigkeit als auch Zuverlässigkeit gleichzeitig verbessert.

**Was gefällt Ihnen an Databricks nicht?**

Was ich an Databricks am meisten missbillige, ist die Kostenübersicht und Vorhersehbarkeit. Selbst als erfahrener Ingenieur kann es schwierig sein, einen klaren, Echtzeit-Einblick in die Kosten eines Workflows zu bekommen, bevor man ihn ausführt. Photon vs. Standard-Runtime, Autoskalierungsverhalten, shuffle-intensive Operationen, DBUs – diese können sich schnell summieren, und Kostenüberraschungen passieren, es sei denn, man überwacht und optimiert alles aktiv. Eine einfache Fehlkonfiguration der Pipeline kann leise Ihre Ausgaben verdoppeln.

Eine weitere Herausforderung ist das schnelle Tempo neuer Funktionen und Änderungen. Databricks innoviert unglaublich schnell, was großartig ist, aber es bedeutet auch, dass Funktionen möglicherweise eingeführt werden, bevor Dokumentation, Best Practices oder Governance-Muster vollständig ausgereift sind. Manchmal verhält sich die Funktionalität unterschiedlich je nach Runtime oder Cloud-Anbieter, und auf dem Laufenden zu bleiben erfordert kontinuierliches Lernen und Refactoring. Dies kann zu Teamkonflikten und technischem Schulden führen.

Kurz gesagt: Databricks ist außergewöhnlich, aber das Kostenmodell ist nicht immer transparent, und die schnelle Einführung neuer Funktionen kann operative Komplexität einführen, die Teams aktiv managen müssen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Business: Bevor wir Databricks einführten, litt unsere Luft- und Raumfahrt-Analyseumgebung – insbesondere im Bereich der Überwachung der Gesundheit von Kundenmotoren – unter denselben Herausforderungen, denen viele traditionelle Ingenieurorganisationen gegenüberstehen. Wir hatten mehrere getrennte Systeme, die Telemetrieaufnahme, Fehlercodeverarbeitung, Flottenanalysen und Wartungsvorhersagen behandelten. Daten von Motorsensoren (FADEC, Vibration, Thermik, Ölsysteme) kamen in unterschiedlichen Formaten an und erforderten viel manuelle Arbeit, um sie zu normalisieren. Die Pipelines basierten auf vollständigen Überschreibungen, da unser Altsystem keine Aktualisierungen oder spät eintreffende Daten unterstützte, was die Verarbeitung langsam und teuer machte. Wir hatten Schwierigkeiten mit langsamer Aufnahme von Motorentelemetrie, inkonsistenten Datensätzen über Ingenieurteams hinweg und langen Durchlaufzeiten für Anomalieerkennungsmodelle.

Architekturherausforderung: Bevor wir Databricks nutzten, operierten wir in einer fragmentierten Datenlandschaft. Wir hatten mehrere Systeme, getrennte Speicherebenen und eine starke Abhängigkeit von überschreibungsbasierten ETL-Jobs, da unsere alte Datenplattform keine Aktualisierungen, spät eintreffende Daten oder ACID-Garantien unterstützte. Das bedeutete, dass die Pipelines langsam, fehleranfällig und teuer waren. Das Zurücksetzen von fehlerhaften Daten konnte Stunden dauern, und Dateninkonsistenzen zwischen den Teams waren häufig. Wir hatten Schwierigkeiten mit isolierten Systemen, langsamen Pipelines, unzuverlässigen Daten und hohen Betriebskosten.

Wir hatten Schwierigkeiten mit manuellen Überschreibungen und inkonsistenten Daten – aber jetzt können wir Delta Lake mit ACID und Zeitreisen nutzen, was zu Folgendem geführt hat:

- Sofortiges Zurücksetzen bei Datenkorruptionsszenarien
- Zuverlässige inkrementelle Verarbeitung anstelle von vollständigen Überschreibungen
- Konsistente Daten, die von Ingenieur-, BI- und ML-Teams konsumiert werden

Dies hat unser Telemetrie-Pipeline-Verarbeitungsfenster von Stunden auf unter 30 Minuten für eine flottenweite tägliche Charge reduziert.

Wir hatten Schwierigkeiten mit mehreren Tools und duplizierten Architekturen – aber jetzt haben wir ein einheitliches Lakehouse, was zu Folgendem geführt hat:

- Eine einzige Plattform für Aufnahme → Transformation → ML → BI → Governance
- Entfernung von 3–5 Altsystemen (ETL-Planer, BI-Extrakte, alte ML-Infrastruktur)
- Geringerer Wartungs- und Lizenzierungsaufwand

Wir hatten Schwierigkeiten mit langsamen Entwicklungszyklen – aber jetzt können wir Genie für KI-unterstütztes Engineering nutzen, was zu Folgendem geführt hat:

- 70–80% schnellere Erstellung von PySpark-Modulen
- Automatische Generierung von Schemaüberprüfungen, Nullprüfungen und DQ-Logik
- Mehr Zeit für Entscheidungen, weniger für Boilerplate-Code

Zum Beispiel dauert ein Datenqualitätsmodul, das früher 30 Minuten dauerte, jetzt 2–3 Minuten zum Gerüstbau.

Wir hatten Schwierigkeiten mit inkonsistenter Governance – aber jetzt gibt uns der Unity Catalog vollständige Sichtbarkeit, was zu Folgendem geführt hat:

- Schnellere Einarbeitung (von Tagen auf Minuten reduziert)
- Zentralisierte Berechtigungen, Abstammung und Prüfpfade
- Stärkere Compliance-Ausrichtung

Wir hatten Schwierigkeiten, Pipelines und ML-Workloads zu skalieren – aber jetzt nutzen wir verteiltes Rechnen + Photon, was zu Folgendem geführt hat:

- Große Joins und Fensteroperationen, die bis zu 10× schneller ausgeführt werden
- Stabile Handhabung von Terabyte-großen Datensätzen
- Vorhersehbare Leistung auch bei hoher Arbeitslast

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie Ihre positive Erfahrung mit Databricks geteilt haben! Wir freuen uns zu hören, wie unsere Plattform Ihren Arbeitsablauf verbessert und Zuverlässigkeit und Geschwindigkeit geboten hat. Wir schätzen Ihr Feedback und sind bestrebt, unsere Plattform kontinuierlich zu verbessern, um Ihren Bedürfnissen noch besser gerecht zu werden.

  ### 47. Für uns: Von ML-Proof of Concept zu sicheren Produktionsanwendungen—schnell, serverlos und gut verwaltet

**Rating:** 4.0/5.0 stars

**Reviewed by:** Luis V. | Partner, Informationsdienste, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** May 24, 2026

**Was gefällt Ihnen an Databricks am besten?**

Ich persönlich nutze diese App gerne, weil sie die Möglichkeit bietet, ein Proof of Concept für maschinelles Lernen oder retrieval-augmented generation schnell in eine sichere, produktionsreife Anwendung zu überführen, indem vertraute Python-Frameworks wie Streamlit, Gradio oder Dash verwendet werden. Der Betrieb auf serverloser Rechenleistung bedeutet, dass unser Team den Kunden schnell einen Mehrwert demonstrieren kann, ohne auf die Bereitstellung separater Infrastruktur warten zu müssen.

Wir mögen auch den Unity-Katalog, der eine einheitliche Governance über strukturierte und unstrukturierte Daten, ML-Modelle und Geschäftsmetriken bietet. Funktionen wie die automatisierte Abstammung vereinfachen die Einhaltung von Kundenprüfungen.

**Was gefällt Ihnen an Databricks nicht?**

Ja, es gibt etwas zu verbessern. Bei strukturiertem Streaming und Auto-Loader führt eine Schemaänderung während der Ausführung dazu, dass die Abfrage fehlschlägt und ein manueller Neustart erforderlich ist. Für Produktionsumgebungen von Kunden mit strengen SLAs können diese Unterbrechungen den Wartungsaufwand erhöhen.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Für Kunden, die sofortige Analysen ohne eine kostspielige mehrmonatige Migration suchen, setzen wir Lakehouse-Föderation ein. Diese Funktion hilft unserem Team, Daten direkt von der Databricks-Oberfläche aus in verschiedenen Systemen abzufragen und zu verwalten, wodurch die Bereitstellung strategischer Erkenntnisse beschleunigt wird.

Wir nutzen auch integrierte Tools wie die Mosaic AI-Vektorsuche, um RAG-Anwendungen zu erstellen, und verwenden Databricks-Apps, um interaktive prädiktive Analyse-Frontends für Kunden bereitzustellen. Insgesamt ist dies, wie wir diese Software nutzen.

**Official Response from Jess Darnell:**

> Wir freuen uns zu hören, dass die App eine entscheidende Rolle dabei gespielt hat, den Kunden schnell Wert zu demonstrieren und eine einheitliche Governance über strukturierte und unstrukturierte Daten, ML-Modelle und Geschäftsmetriken bereitzustellen. Wir verstehen die Herausforderungen bei Schemaänderungen während der Ausführung und werden daran arbeiten, diesen Aspekt für ein reibungsloseres Erlebnis zu verbessern. Es ist großartig zu hören, dass Databricks Ihrem Team hilft, die Lakehouse-Föderation einzusetzen und integrierte Tools wie die Mosaic AI-Vektorsuche zu nutzen. Vielen Dank für Ihr detailliertes Feedback zu Ihrer Erfahrung und danke, dass Sie sich für Databricks entschieden haben!

  ### 48. Eine einheitliche Plattform für skalierbare Daten- und KI-Workloads

**Rating:** 4.5/5.0 stars

**Reviewed by:** Janani D. | Senior Data Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 27, 2026

**Was gefällt Ihnen an Databricks am besten?**

Databricks ist großartig, weil es alles, was Sie für Daten und KI benötigen, an einem Ort vereint. Anstatt zwischen verschiedenen Tools für Datenengineering, Datenbereinigung, Analytik und maschinelles Lernen zu wechseln, können Sie alles in einer einzigen Umgebung erledigen. Das macht das Leben viel einfacher.

**Was gefällt Ihnen an Databricks nicht?**

Databricks ist nicht anfängerfreundlich. Man benötigt oft solide Dateningenieurkenntnisse, um es effektiv zu nutzen. Bewertungen weisen darauf hin, dass Databricks zwar äußerst leistungsfähig ist, aber eine „High-End-Werkstatt“ darstellt, die Fachwissen erfordert und für weniger technische Teams nicht einfach ist. Databricks verwendet Kosteneinheiten (DBUs), die viele Menschen als schwer einschätzbar und verwaltbar empfinden. Selbst Expertenbewertungen heben hervor, dass die Preisgestaltung berüchtigt kompliziert ist und unerwartete Kosten verbergen kann.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Databricks verwendet die Lakehouse-Architektur, um die Stärken von Data Lakes und Data Warehouses in einer einheitlichen Plattform zu vereinen. Das bedeutet, dass strukturierte und unstrukturierte Daten zusammenleben und für Analysen oder maschinelles Lernen bereit sind.

**Official Response from Janelle Glover:**

> Vielen Dank, dass Sie uns mitgeteilt haben, wie die Architektur von Databricks Ihnen zugutekommt. Wir haben unsere Plattform entwickelt, um die Herausforderungen bei der Verwaltung von strukturierten und unstrukturierten Daten zu bewältigen, und es ist großartig zu hören, dass sie sich positiv auf Ihre Analyse- und Machine-Learning-Workflows auswirkt.

  ### 49. Databricks-Notebooks machen die Zusammenarbeit nahtlos über Python, SQL und Scala hinweg.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Joseph F. | Cloud Engineer, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** March 25, 2026

**Was gefällt Ihnen an Databricks am besten?**

Databricks-Kollaborationsnotebooks sind wirklich nützlich und ermöglichen es mir, in jeder Sprache zu arbeiten, die ich benötige, um meine Anforderungen effektiv zu erfüllen. Die Fähigkeit, Python, SQL und sogar Scala innerhalb eines Dashboards zu mischen, macht die Zusammenarbeit und Teamarbeit viel reibungsloser. Ich schätze auch, wie einfach es sich in andere Tools und Cloud-Plattformen integriert, sodass es sich ohne großen Aufwand in meine bestehenden Arbeitsabläufe einfügt.

**Was gefällt Ihnen an Databricks nicht?**

Ich mag ihren Kundensupport und die häufigen Updates sind ein großer Grund, warum dies zu meinem Favoriten für Datenmanagement geworden ist. Ich schätze auch, wie gut es sich mit externen Tools wie Power BI für Berichterstattung integriert, es ist wirklich gut.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Es vereinfacht die Zusammenarbeit zwischen Teams und hilft uns, mit großen Datensätzen zu arbeiten, ohne sich zu sehr um Infrastruktur oder Analyseaufwand kümmern zu müssen. Berechnungen und Berichterstattung sind schnell, was unsere Entwicklungszyklen verbessert und den Austausch zwischen den Ingenieur- und Analyseteams reduziert hat.

**Official Response from Janelle Glover:**

> Es ist großartig zu hören, dass Databricks die Zusammenarbeit zwischen Teams vereinfacht und die Entwicklungszyklen für Sie verbessert. Wir bemühen uns, eine Plattform bereitzustellen, die den Infrastruktur- und Analyseaufwand reduziert, sodass sich Teams auf ihre Kernziele konzentrieren können.

  ### 50. Trotz der Lernkurve großartig zum Skalieren von ML-Modellen.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Lokesh S. | Senior Data Scientist, Unternehmen mittlerer Größe (51-1000 Mitarbeiter)

**Reviewed Date:** May 28, 2026

**Was gefällt Ihnen an Databricks am besten?**

Wir sind ein mittelgroßes Technologieunternehmen, in dem ich als Senior Data Scientist arbeite, und wir nutzen Databricks als unsere Hauptplattform für die Datenaufnahme sowie für das Training und die Bereitstellung von Machine-Learning-Modellen. Vorher arbeiteten unsere Data Scientists und Ingenieure in getrennten Welten und tauschten ständig Skripte hin und her, was einen enormen Engpass verursachte. Jetzt bereinigen wir unsere riesigen Datenaufbereitungs-Datensätze, führen fortgeschrittene PySpark-Pipelines aus und zeichnen jedes Modellexperiment auf einer einzigen cloudbasierten Plattform auf. Was mir an Databricks am meisten gefällt, ist, dass es alle Datenteams in einem einzigen Arbeitsbereich vereint. Es ist eine großartige Funktion von kollaborativen Notebooks, die von mehreren Teammitgliedern gleichzeitig genutzt werden können, die in Python, SQL oder sogar R gleichzeitig Code schreiben können, wodurch Peer-Reviews und Debugging viel schneller werden. Die integrierte Unterstützung für MLflow ist ebenfalls ein großer Vorteil für meine Arbeit. Alle meine Experimentparameter und Modellmetriken werden automatisch überwacht und ich muss nicht raten, um herauszufinden, welche Version eines Modells beim Training am besten funktioniert hat. Außerdem kann ich, wenn ich ein großes Rechencluster einrichten muss, dies mit ein paar Klicks tun und mich auf die Modellierung meiner Daten konzentrieren, anstatt mich um DevOps-Aufgaben, Infrastruktur-Setup und dergleichen kümmern zu müssen.

**Was gefällt Ihnen an Databricks nicht?**

Aber die Website ist nicht ohne ihre Nachteile. Die steile Lernkurve, insbesondere beim Onboarding neuer Mitarbeiter aus einer gut definierten Panda-/lokalen Python-Umgebung, ist der herausforderndste Teil. Das Erlernen des Spark-Ökosystems und des verteilten Rechnens erfordert viel Zeit und Mühe. Manchmal ist es schwierig, die Kosten der Preisstruktur zu verstehen, und man kann am Ende zu viel ausgeben, wenn man nicht achtsam ist. Da die Berechnung auf Basis der Nutzung berechnet wird, könnte man in sein monatliches Budget eingreifen, wenn man versehentlich einen großen Cluster eingeschaltet lässt, und es ist sicherlich kein einfaches Dashboard. Zu guter Letzt kann die Benutzeroberfläche etwas überladen und langsam werden, wenn man ein großes Notebook mit Dutzenden oder sogar Hunderten von Ausgaben in visuellen Zellen hat, die alle gleichzeitig angezeigt werden.

**Welche Probleme löst Databricks für Sie, und wie profitieren Sie davon?**

Bei der Lösung von Problemen in der realen Welt hat Databricks gerade unsere Modellbereitstellungspipeline gelöst! Früher dauerte es Wochen, den Code mit dem Engineering-Team umzuschreiben, um ein prädiktives Kundenabwanderungsmodell von meinem lokalen Rechner in ein Produktionssystem zu überführen. Ich bin auch kürzlich an der Entwicklung und Bereitstellung einer Echtzeit-Empfehlungsmaschine beteiligt, die ich in wenigen Tagen trainieren, überwachen und als vollwertigen Endpunkt an die Ingenieure übergeben konnte. Es hat im Grunde die "Es funktioniert auf meinem Rechner"-Probleme beseitigt. Wir haben die Markteinführungszeit für neue Datenprodukte erheblich verkürzt und konnten Terabytes an Kundendaten ohne Überlastung und ohne Zusammenbruch unserer Infrastruktur verwalten.

**Official Response from Jess Darnell:**

> Thank you for sharing your experience with Databricks! We're glad to hear that it has transformed your data teams and provided a common platform for collaboration. We appreciate your feedback on the user-friendliness and cost control, and we are continuously working to improve in these areas. It's great to hear that Databricks has helped standardize runtime environments and removed silos among departments, leading to more efficient cross-functional teamwork.


## Databricks Discussions
  - [Was ist Lakehouse in Databricks?](https://www.g2.com/de/discussions/what-is-lakehouse-in-databricks) - 4 comments, 2 upvotes
  - [Was sind die Merkmale von Databricks?](https://www.g2.com/de/discussions/what-are-the-features-of-databricks) - 4 comments, 2 upvotes
  - [What does Databricks software do?](https://www.g2.com/de/discussions/what-does-databricks-software-do) - 3 comments
  - [Was ist die einheitliche Analyseplattform von Databricks?](https://www.g2.com/de/discussions/what-is-databricks-unified-analytics-platform) - 3 comments

- [View Databricks pricing details and edition comparison](https://www.g2.com/de/products/databricks/reviews?section=pricing&secure%5Bexpires_at%5D=2026-06-01+16%3A29%3A11+-0500&secure%5Bsession_id%5D=46c26091-e4ac-48c0-ad2b-99ee0bdaa11c&secure%5Btoken%5D=6bd90192a3f9d8061e6900f76a4979994910b43c752e7a8c55847364d089da08&format=llm_user)
## Databricks Integrations
  - [Agentforce 360 Platform (formerly Salesforce Platform)](https://www.g2.com/de/products/agentforce-360-platform-formerly-salesforce-platform/reviews)
  - [Agentforce Sales (formerly Salesforce Sales Cloud)](https://www.g2.com/de/products/agentforce-sales-formerly-salesforce-sales-cloud/reviews)
  - [Alation](https://www.g2.com/de/products/alation/reviews)
  - [Amazon EC2](https://www.g2.com/de/products/amazon-ec2/reviews)
  - [Amazon Redshift](https://www.g2.com/de/products/amazon-redshift/reviews)
  - [Amazon Relational Database Service (RDS)](https://www.g2.com/de/products/amazon-relational-database-service-rds/reviews)
  - [Anaplan](https://www.g2.com/de/products/anaplan/reviews)
  - [Anomalo](https://www.g2.com/de/products/anomalo/reviews)
  - [Apache Airflow](https://www.g2.com/de/products/apache-airflow/reviews)
  - [Apache Kafka](https://www.g2.com/de/products/apache-kafka/reviews)
  - [Apache NiFi](https://www.g2.com/de/products/apache-nifi/reviews)
  - [Atlan](https://www.g2.com/de/products/atlan/reviews)
  - [AWS Glue](https://www.g2.com/de/products/aws-glue/reviews)
  - [AWS Lambda](https://www.g2.com/de/products/aws-lambda/reviews)
  - [Azure Blob Storage](https://www.g2.com/de/products/azure-blob-storage/reviews)
  - [Azure Databricks](https://www.g2.com/de/products/azure-databricks/reviews)
  - [Azure Data Factory](https://www.g2.com/de/products/azure-data-factory/reviews)
  - [Azure Data Lake Store](https://www.g2.com/de/products/azure-data-lake-store/reviews)
  - [Azure Functions](https://www.g2.com/de/products/azure-functions/reviews)
  - [Azure Logic Apps](https://www.g2.com/de/products/azure-logic-apps/reviews)
  - [Azure OpenAI Service](https://www.g2.com/de/products/azure-openai-service/reviews)
  - [Azure Pipelines](https://www.g2.com/de/products/azure-pipelines/reviews)
  - [Azure Portal](https://www.g2.com/de/products/azure-portal/reviews)
  - [Azure SQL Database](https://www.g2.com/de/products/azure-sql-database/reviews)
  - [Claude Code](https://www.g2.com/de/products/anthropic-claude-code/reviews)
  - [Confluent](https://www.g2.com/de/products/confluent/reviews)
  - [Crunchbase](https://www.g2.com/de/products/crunchbase/reviews)
  - [Customer.io](https://www.g2.com/de/products/customer-io/reviews)
  - [Dash](https://www.g2.com/de/products/dash-for-brands-ltd-dash/reviews)
  - [data.world](https://www.g2.com/de/products/data-world/reviews)
  - [DAT iQ](https://www.g2.com/de/products/dat-iq/reviews)
  - [dbt](https://www.g2.com/de/products/dbt/reviews)
  - [DigitalOcean](https://www.g2.com/de/products/digitalocean/reviews)
  - [Fivetran](https://www.g2.com/de/products/fivetran/reviews)
  - [GEN TDS](https://www.g2.com/de/products/gen-tds/reviews)
  - [Git](https://www.g2.com/de/products/git/reviews)
  - [GitHub](https://www.g2.com/de/products/github/reviews)
  - [GitLab](https://www.g2.com/de/products/gitlab/reviews)
  - [Google Analytics](https://www.g2.com/de/products/google-analytics/reviews)
  - [Google Cloud Run](https://www.g2.com/de/products/google-cloud-run/reviews)
  - [HubSpot Marketing Hub](https://www.g2.com/de/products/hubspot-marketing-hub/reviews)
  - [Immuta](https://www.g2.com/de/products/immuta/reviews)
  - [JD Edwards World](https://www.g2.com/de/products/jd-edwards-world/reviews)
  - [Microsoft Copilot Studio](https://www.g2.com/de/products/microsoft-microsoft-copilot-studio/reviews)
  - [Microsoft Fabric](https://www.g2.com/de/products/microsoft-fabric/reviews)
  - [Microsoft Power Apps](https://www.g2.com/de/products/microsoft-power-apps/reviews)
  - [Microsoft Power Automate](https://www.g2.com/de/products/microsoft-power-automate/reviews)
  - [Microsoft Power BI](https://www.g2.com/de/products/microsoft-microsoft-power-bi/reviews)
  - [Microsoft SharePoint](https://www.g2.com/de/products/microsoft-sharepoint/reviews)
  - [Microsoft SQL Server](https://www.g2.com/de/products/microsoft-sql-server/reviews)
  - [Microsoft Teams](https://www.g2.com/de/products/microsoft-teams/reviews)
  - [Monte Carlo](https://www.g2.com/de/products/monte-carlo/reviews)
  - [MySQL](https://www.g2.com/de/products/mysql/reviews)
  - [ObjectWay SpA](https://www.g2.com/de/products/objectway-spa/reviews)
  - [Oracle Database](https://www.g2.com/de/products/oracle-database/reviews)
  - [Pega Platform](https://www.g2.com/de/products/pega-platform/reviews)
  - [PostgreSQL](https://www.g2.com/de/products/postgresql/reviews)
  - [PowerBI Portal](https://www.g2.com/de/products/powerbi-portal/reviews)
  - [Prophecy](https://www.g2.com/de/products/prophecy-prophecy/reviews)
  - [Qualtrics Customer Experience](https://www.g2.com/de/products/qualtrics-customer-experience/reviews)
  - [React Native](https://www.g2.com/de/products/react-native/reviews)
  - [Salesforce Agentforce](https://www.g2.com/de/products/salesforce-agentforce/reviews)
  - [SAP Ariba](https://www.g2.com/de/products/sap-ariba/reviews)
  - [SAP ECC](https://www.g2.com/de/products/sap-ecc/reviews)
  - [SAS Viya](https://www.g2.com/de/products/sas-sas-viya/reviews)
  - [Seamless (formally Seamless.AI)](https://www.g2.com/de/products/seamless-formally-seamless-ai/reviews)
  - [ServiceNow IT Service Management](https://www.g2.com/de/products/servicenow-it-service-management/reviews)
  - [Sigma](https://www.g2.com/de/products/sigma-computing-sigma/reviews)
  - [Sisense](https://www.g2.com/de/products/sisense/reviews)
  - [SnapLogic Intelligent Integration Platform (IIP)](https://www.g2.com/de/products/snaplogic-intelligent-integration-platform-iip/reviews)
  - [Snowflake](https://www.g2.com/de/products/snowflake/reviews)
  - [Spark](https://www.g2.com/de/products/apache-spark/reviews)
  - [Spark SQL](https://www.g2.com/de/products/spark-sql/reviews)
  - [SplashBI](https://www.g2.com/de/products/splashbi/reviews)
  - [Spotfire Analytics](https://www.g2.com/de/products/spotfire-analytics/reviews)
  - [Tableau](https://www.g2.com/de/products/tableau/reviews)
  - [ThoughtSpot](https://www.g2.com/de/products/thoughtspot/reviews)
  - [Visual Studio Code](https://www.g2.com/de/products/visual-studio-code/reviews)
  - [Workday HCM](https://www.g2.com/de/products/workday-hcm/reviews)

## Databricks Features
**Berichte**
- Benutzeroberfläche "Berichte"
- Schritte zur Beantwortung
- Grafiken und Diagramme
- Score-Karten
- Armaturenbretter

**Verwaltung**
- Datenmodellierung
- Empfehlungen
- Workflow-Verwaltung
- Dashboards und Visualisierungen

**Management**
- Reporting
- Rechnungsprüfung

**Einsatz**
- Sprachliche Flexibilität
- Flexibilität des Rahmens
- Versionsverwaltung
- Einfache Bereitstellung
- Skalierbarkeit

**system**
- Datenerfassung und -aufbereitung

**Datenaufbereitung**
- Verbinder
- Daten-Governance

**Datenmanagement**
- Datenintegration
- Datenkompression
- Datenqualität
- Integrierte Datenanalyse
- Maschinelles Lernen in der Datenbank
- Data Lake Analytics

**Management**
- Datenbeschreibungsverzeichnis
- Daten-Replikation
- Abfragesprache
- Datenmodellierung
- Performance-Analyse

**Management**
- Business-Glossar
- Datenermittlung
- Daten-Profilierung
- Reporting und Visualisierung
- Datenherkunft

**Einsatz**
- Sprachliche Flexibilität
- Flexibilität des Rahmens
- Versionsverwaltung
- Einfache Bereitstellung
- Skalierbarkeit

**Datenmanagement**
- Datenintegration
- Metadaten
- Selbstbedienung
- Automatisierte Workflows

**Skalierbarkeit und Leistung - Generative KI-Infrastruktur**
- Hohe Verfügbarkeit
- Skalierbarkeit des Modelltrainings
- Inferenz-Geschwindigkeit

**Anpassung - KI-Agenten-Ersteller**
- Natürliche Sprachkonfiguration
- Tonanpassung
- Sicherheitsleitplanken

**Agentische KI - DataOps-Plattformen**
- Autonome Aufgabenausführung
- Mehrstufige Planung
- Systemübergreifende Integration
- Adaptives Lernen
- Entscheidungsfindung

**Verkehrsmanagement & Leistung - KI-Gateways**
- Token-bewusste Ratenbegrenzung
- Semantisches Caching
- Multi-Modell-Routing & Fallbacks

**Modellentwicklung**
- Unterstützte Sprachen
- Drag-and-Drop
- Vorgefertigte Algorithmen
- Modell-Training

**Datenbank**
- Datenerfassung in Echtzeit
- Datenverteilung
- Data Lake

**Datentransformation**
- Echtzeit-Analysen
- Datenabfrage

**Beachtung**
- Einhaltung sensibler Daten
- Schulungen und Richtlinien
- Durchsetzung von Richtlinien
- Überwachung der Einhaltung der Vorschriften

**Funktionalität**
- Extraktion
- Transformation
- Laden
- Automatisierung
- Skalierbarkeit

**Management**
- Katalogisierung
- Überwachung
- Regierend
- Modell-Registry

**Modellentwicklung**
- Feature-Entwicklung

**Datenmodellierung und -zusammenführung**
- Datenabfrage
- Filterung von Daten
- Daten-Blending

**Integration**
- KI/ML-Integration
- Integration von BI-Tools
- Data-Lake-Integration

**Instandhaltung**
- Daten Migration
- Backup und Wiederherstellung
- Multi-User-Umgebung

**Sicherheit**
- Zugriffskontrolle
- Rollen-Management
- Compliance-Management

**Transaktionen**
- Metriken
- Infrastruktur-Management
- Zusammenarbeit

**Analytics**
- Analyse-Funktionen
- Dasboard-Visualisierungen

**Kosten und Effizienz - Generative KI-Infrastruktur**
- Kosten pro API-Aufruf
- Flexibilität bei der Ressourcenzuweisung
- Energieeffizienz

**Funktionalität - KI-Agenten-Ersteller**
- Omni-Kanal-Support
- Agentenmarke
- Proaktive Reaktionsfähigkeiten
- Nahtlose menschliche Eskalation

**Governance & Beobachtbarkeit - KI-Gateways**
- Datenschutz
- Kostenverfolgung
- Zentralisierte API-Schlüsselsicherheit

**Machine-/Deep-Learning-Dienste**
- Maschinelles Sehen
- Verarbeitung natürlicher Sprache
- Generierung natürlicher Sprache
- Künstliche neuronale Netze

**Integrationen**
- Hadoop-Integration
- Spark-Integration

**Datenqualität**
- Datenaufbereitung
- Datenverteilung
- Datenvereinheitlichung

**Machine-/Deep-Learning-Dienste**
- Verstehen natürlicher Sprache
- Deep Learning

**Einsatz**
- On-Premise
- Cloud

**Sicherheit**
- Datenverschlüsselung
- Steuerung des Benutzerzugriffs

**Wartung**
- Daten-Qualitätsmanagement
- Verwaltung von Richtlinien

**Management**
- Katalogisierung
- Überwachung
- Regierend

**Überwachung und Verwaltung**
- Beobachtbarkeit von Daten
- Testmöglichkeiten

**Generative KI**
- Textgenerierung
- Textzusammenfassung

**Integration und Erweiterbarkeit - Generative KI-Infrastruktur**
- Multi-Cloud-Unterstützung
- Integration von Datenpipelines
- API-Unterstützung und Flexibilität

**Daten und Analytik - KI-Agentenentwickler**
- Analytik & Berichterstattung
- Kontextbewusstsein
- Datenschutzkonformität

**Einsatz**
- Managed Service
- Anwendung
- Skalierbarkeit

**Plattform**
- Maschinelle Skalierung
- Datenaufbereitung
- Spark-Integration

**Verbindung**
- Hadoop-Integration
- Spark-Integration
- Multi-Source-Analyse
- Data Lake

**Leistung**
- Skalierbarkeit

**Cloud-Bereitstellung**
- Hybrid-Cloud-Unterstützung
- Funktionen für die Cloud-Migration

**Generative KI**
- Textgenerierung
- Textzusammenfassung

**Generative KI**
- Textgenerierung
- Textzusammenfassung

**Sicherheit und Compliance - Generative KI-Infrastruktur**
- DSGVO und Einhaltung gesetzlicher Vorschriften
- Rollenbasierte Zugriffskontrolle
- Datenverschlüsselung

**Integration - KI-Agentenbauer**
- Arbeitsablaufautomatisierung
- API-Nutzung
- Plattform-Interoperabilität
- CRM-Datenintegration

**Agentische KI - Analyseplattformen**
- Autonome Aufgabenausführung
- Mehrstufige Planung
- Systemübergreifende Integration
- Adaptives Lernen
- Natürliche Sprachinteraktion
- Proaktive Unterstützung
- Entscheidungsfindung

**Selbstbedienung**
- Berechnete Felder
- Filtern von Datenspalten
- Datenermittlung
- Suchen
- Kollaboration / Workflow
- Automatische Modellierung

**Verarbeitung**
- Cloud-Verarbeitung
- Workload-Verarbeitung

**Transaktionen**
- Datenvisualisierung
- Daten-Workflow
- Geregelte Ermittlung
- Eingebettete Analytik
- Notizbücher

**Sicherheit**
- Daten-Governance
- Datensicherheit

**Generative KI**
- KI-Textgenerierung
- Textzusammenfassung
- Text-zu-Bild

**Generative KI**
- Textgenerierung
- Textzusammenfassung

**Benutzerfreundlichkeit und Unterstützung - Generative KI-Infrastruktur**
- Qualität der Dokumentation
- Community-Aktivitäten

**Agentische KI - Datenverwaltung**
- Autonome Aufgabenausführung
- Mehrstufige Planung
- Systemübergreifende Integration
- Adaptives Lernen
- Natürliche Sprachinteraktion
- Entscheidungsfindung

**Bereitstellung & Integration - Analyseplattformen**
- No-Code-Dashboard-Builder
- Berichtplanung und Automatisierung
- Eingebettete Analysen und White-Labeling
- Datenquellenkonnektivität

**Erweiterte Analytik**
- Prädiktive Analytik
- Datenvisualisierung
- Big-Data-Dienste

**Generative KI**
- Textgenerierung
- Textzusammenfassung

**Agentic AI - Datenwissenschafts- und maschinelles Lernplattformen**
- Autonome Aufgabenausführung
- Mehrstufige Planung
- Systemübergreifende Integration
- Adaptives Lernen
- Natürliche Sprachinteraktion
- Proaktive Unterstützung
- Entscheidungsfindung

**Leistung & Skalierbarkeit - Analyseplattformen**
- Große Datenverarbeitung und Abfragegeschwindigkeit
- Gleichzeitige Benutzerunterstützung

**Erweiterte Analysen & Modellierung - Analyseplattformen**
- Datenmodellierung und Governance
- Notebook- und Skriptintegration
- Eingebaute prädiktive und statistische Modelle

**Agentische KI-Fähigkeiten - Analyseplattformen**
- Automatisch generierte Einblicke und Erzählungen
- Natürliche Sprachabfragen
- Proaktive KPI-Überwachung und Warnungen
- KI-Agenten für analytische Nachverfolgungen

**Personalisierte Intelligenz - Analyseplattformen**
- Verhaltenslernen zur kontextuellen Abfrageverfeinerung
- Rollenbasierte Einblick-Personalisierung
- Konversations- und Prompt-basierte Analysen

**Gebäude-Berichte**
- Datentransformation
- Datenmodellierung
- Entwurf von WYSIWYG-Berichten
- Integrations-APIs

**Plattform**
- Support für mobile Benutzer
- Anpassung
- Benutzer-, Rollen- und Zugriffsverwaltung
- Internationalisierung
- Sandbox / Testumgebungen
- Leistung und Zuverlässigkeit
- Breite der Partneranwendungen

## Top Databricks Alternatives
  - [Cloudera Data Platform](https://www.g2.com/de/products/cloudera-cloudera-data-platform/reviews) - 4.1/5.0 (131 reviews)
  - [Snowflake](https://www.g2.com/de/products/snowflake/reviews) - 4.6/5.0 (705 reviews)
  - [Teradata Vantage](https://www.g2.com/de/products/teradata-teradata-vantage/reviews) - 4.3/5.0 (355 reviews)

