# Beste Maschinelles Lernen Datenkatalog Software - Seite 3

  *By [Shalaka Joshi](https://research.g2.com/insights/author/shalaka-joshi)*

   Maschinelles Lernen Datenkataloge ermöglichen es Unternehmen, Unternehmensdaten aus mehreren Datenquellen zu kategorisieren, darauf zuzugreifen, sie zu interpretieren und zusammenzuarbeiten, während ein hohes Maß an Governance und Zugriffsmanagement aufrechterhalten wird. Künstliche Intelligenz ist der Schlüssel zu vielen Funktionen von maschinellen Lernendatenkatalogen und ermöglicht Funktionen wie maschinelle Lernempfehlungen, Abfragen in natürlicher Sprache und dynamische Datenmaskierung für verbesserte Sicherheitszwecke.

Unternehmen können maschinelle Lernendatenkataloge nutzen, um Datensätze an einem einzigen Ort zu pflegen, sodass die Suche und Entdeckung von Daten für alltägliche Geschäftsanwender und Analysten gleichermaßen einfach ist. Benutzer haben die Möglichkeit, Datensätze zu kommentieren, zu teilen und zu empfehlen, damit Kollegen sofort verstehen, was sie abfragen. Darüber hinaus können IT-Administratoren die Benutzerbereitstellung einrichten, um sicherzustellen, dass unbefugte Mitarbeiter keinen Zugriff auf sensible Daten haben.

Maschinelle Lernendatenkataloge werden am häufigsten von Unternehmen implementiert, die über mehrere Datenquellen verfügen, nach einer einzigen Quelle der Wahrheit suchen und versuchen, die Datennutzung unternehmensweit zu skalieren. Diese Produkte werden in der Regel von IT-Abteilungen verwaltet, die Organisation und Sicherheit aufrechterhalten können, aber Daten können von Datenwissenschaftlern oder Analysten und dem durchschnittlichen Geschäftsanwender abgerufen werden. Die Daten können dann entweder direkt im maschinellen Lernendatenkatalog oder durch eine Integration mit [Business-Intelligence-Software](https://www.g2.com/categories/business-intelligence) transformiert, modelliert und visualisiert werden.

Es sollte beachtet werden, dass nicht alle maschinellen Lernendatenkataloge Datenvorbereitungsfunktionen bieten und möglicherweise eine Integration mit einer [Business-Intelligence-Plattform](https://www.g2.com/categories/business-intelligence-platforms) erfordern. Darüber hinaus unterscheiden sich diese Tools von [Master-Datenmanagement-Software](https://www.g2.com/categories/master-data-management-mdm) aufgrund ihrer erweiterten Governance, Zusammenarbeit und maschinellen Lernfunktionalität.

Um sich für die Aufnahme in die Kategorie Maschinelles Lernen Datenkatalog zu qualifizieren, muss ein Produkt:

- Daten aus allen Unternehmensquellen in einem einzigen Repository organisieren und konsolidieren
- Benutzerzugriffsmanagement für Sicherheits- und Daten-Governance-Zwecke bereitstellen
- Geschäftsanwendern ermöglichen, innerhalb des Katalogs nach Daten zu suchen und darauf zuzugreifen
- Zusammenarbeitsfunktionen rund um Datensätze bieten, einschließlich Kategorisierung, Kommentierung und Teilen
- Intelligente Empfehlungen basierend auf maschinellem Lernen für einen schnelleren Zugriff auf relevante Daten geben


## Category Overview

**Total Products under this Category:** 89


## Trust & Credibility Stats

**Warum Sie den Software-Rankings von G2 vertrauen können:**

- 30 Analysten und Datenexperten
- 1,700+ Authentische Bewertungen
- 89+ Produkte
- Unvoreingenommene Rankings

Die Software-Rankings von G2 basieren auf verifizierten Benutzerbewertungen, strenger Moderation und einer konsistenten Forschungsmethodik, die von einem Team von Analysten und Datenexperten gepflegt wird. Jedes Produkt wird nach denselben transparenten Kriterien gemessen, ohne bezahlte Platzierung oder Einflussnahme durch Anbieter. Während Bewertungen reale Benutzererfahrungen widerspiegeln, die subjektiv sein können, bieten sie wertvolle Einblicke, wie Software in den Händen von Fachleuten funktioniert. Zusammen bilden diese Eingaben den G2 Score, eine standardisierte Methode, um Tools innerhalb jeder Kategorie zu vergleichen.


## Best Maschinelles Lernen Datenkatalog Software At A Glance

- **Führer:** [Alation](https://www.g2.com/de/products/alation/reviews)
- **Höchste Leistung:** [Collibra](https://www.g2.com/de/products/collibra/reviews)
- **Am einfachsten zu bedienen:** [AWS Glue](https://www.g2.com/de/products/aws-glue/reviews)
- **Top-Trending:** [Atlan](https://www.g2.com/de/products/atlan/reviews)
- **Beste kostenlose Software:** [Alation](https://www.g2.com/de/products/alation/reviews)


## Top-Rated Products (Ranked by G2 Score)
### 1. [Informatica Cloud Data Governance and Catalog](https://www.g2.com/de/products/informatica-cloud-data-governance-and-catalog/reviews)
  Informatica Cloud Data Governance and Catalog ist eine umfassende, cloud-native Lösung, die Organisationen mit prädiktiver Datenintelligenz ausstattet. Durch die Integration von Datenerkennung, Katalogisierung, Governance und Abstammungsfunktionen ermöglicht sie es Unternehmen, ihre Datenressourcen effizient zu finden, zu verstehen, zu vertrauen und darauf zuzugreifen. Dieser einheitliche Ansatz vereinfacht die Zusammenarbeit zwischen technischen und geschäftlichen Teams und stellt sicher, dass datengetriebene Entscheidungen auf genauen und vertrauenswürdigen Informationen basieren. Mit KI-gestützter Automatisierung verbessert die Plattform die Datenklassifizierung, -kuratierung und Qualitätsmanagement und erleichtert schnellere und zuverlässigere analytische Einblicke. Durch die Bereitstellung eines ganzheitlichen Überblicks über Datenbeziehungen und -abstammung hilft Informatica Cloud Data Governance and Catalog Organisationen, ihre Daten in einen Wettbewerbsvorteil zu verwandeln. Hauptmerkmale und Funktionalität: - Automatisierte Datenerkennung und -klassifizierung: Nutzt KI, um kritische Daten in Cloud- und On-Premises-Umgebungen automatisch zu finden, zu klassifizieren und zu inventarisieren. - Umfassende Datenkatalogisierung: Erstellt ein zentrales Repository von Datenressourcen, das technische Metadaten mit Geschäftskontext für ein verbessertes Verständnis verknüpft. - End-to-End-Datenabstammung: Bietet visuelle Darstellungen des Datenflusses und der Transformationen, sodass Benutzer die Datenherkunft nachverfolgen und Auswirkungen bewerten können. - Integriertes Datenqualitätsmanagement: Überwacht und gewährleistet die Datenqualität durch Profiling, Validierung und Bereinigungsprozesse. - Zusammenarbeit und soziale Kuratierung: Erleichtert die Teamarbeit, indem Benutzer Einblicke teilen, Datenressourcen zertifizieren und sich durch Kommentare und Bewertungen an Diskussionen beteiligen können. - KI-Modell-Governance: Verwalten und steuern von KI-Modellen neben Daten, um Compliance und Vertrauen in KI-gesteuerte Entscheidungen sicherzustellen. Primärer Wert und gelöstes Problem: Informatica Cloud Data Governance and Catalog adressiert das kritische Bedürfnis von Organisationen, ihre Datenressourcen in einer zunehmend komplexen Datenlandschaft effektiv zu verwalten und zu steuern. Durch die Bereitstellung einer einheitlichen Plattform, die die Datenerkennung, -klassifizierung und das Qualitätsmanagement automatisiert, stellt sie sicher, dass Unternehmen ihren Daten für Entscheidungsfindungen vertrauen können. Die Lösung verbessert die Zusammenarbeit zwischen technischen und geschäftlichen Benutzern, indem sie technische Metadaten mit Geschäftskontext verknüpft, um einen ganzheitlichen Überblick über Datenressourcen zu bieten. Dieser umfassende Ansatz beschleunigt nicht nur die Bereitstellung zuverlässiger analytischer Einblicke, sondern stellt auch die Einhaltung von Daten-Governance-Richtlinien sicher und verwandelt Daten letztendlich in einen strategischen Vermögenswert, der Innovation und Wettbewerbsvorteile vorantreibt.


  **Average Rating:** 4.3/5.0
  **Total Reviews:** 14

**User Satisfaction Scores:**

- **Einfache Bedienung:** 8.5/10 (Category avg: 8.6/10)
- **Business- und Daten-Glossar:** 10.0/10 (Category avg: 8.5/10)
- **Metadaten-Management:** 10.0/10 (Category avg: 8.4/10)
- **Datenherkunft:** 8.3/10 (Category avg: 8.6/10)


**Seller Details:**

- **Verkäufer:** [Informatica](https://www.g2.com/de/sellers/informatica)
- **Gründungsjahr:** 1993
- **Hauptsitz:** Redwood City, CA
- **Twitter:** @Informatica (99,880 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/3858/ (5,337 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** NYSE: INFA

**Reviewer Demographics:**
  - **Company Size:** 50% Unternehmen, 43% Kleinunternehmen


### 2. [Informatica Enterprise Data Preparation](https://www.g2.com/de/products/informatica-enterprise-data-preparation/reviews)
  Informatica Enterprise Data Preparation befähigt Datenwissenschaftler und Datenanalysten, Datenpipelines schnell zu entdecken, anzureichern, zu bereinigen und zu verwalten, um schnellere Einblicke zu gewinnen.


  **Average Rating:** 4.3/5.0
  **Total Reviews:** 9

**User Satisfaction Scores:**

- **Einfache Bedienung:** 7.2/10 (Category avg: 8.6/10)
- **Business- und Daten-Glossar:** 8.3/10 (Category avg: 8.5/10)
- **Metadaten-Management:** 8.3/10 (Category avg: 8.4/10)
- **Datenherkunft:** 8.3/10 (Category avg: 8.6/10)


**Seller Details:**

- **Verkäufer:** [Informatica](https://www.g2.com/de/sellers/informatica)
- **Gründungsjahr:** 1993
- **Hauptsitz:** Redwood City, CA
- **Twitter:** @Informatica (99,880 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/3858/ (5,337 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** NYSE: INFA

**Reviewer Demographics:**
  - **Company Size:** 50% Unternehmen mittlerer Größe, 30% Kleinunternehmen


### 3. [LayerNext](https://www.g2.com/de/products/layernext/reviews)
  LayerNext ist eine KI-CFO-Plattform, die Ihre Finanzen genau, aktuell und bereit für Entscheidungen in Echtzeit hält. Wir kategorisieren Transaktionen automatisch, stimmen Konten ab und führen saubere Bücher, indem wir direkt mit QuickBooks integrieren. Neben genauen Finanzdaten liefert LayerNext CFO-Einblicke, einschließlich Burn-Rate, Runway, Cashflow-Trends, Margenanalyse und zukunftsgerichteten Finanzsignalen. Keine Tabellenkalkulationen. Keine manuelle Arbeit. Keine Verzögerungen. Unsere Plattform kombiniert fortschrittliche KI mit Präzision auf menschlichem Niveau und bietet Gründern und kleinen Unternehmen eine zuverlässige Möglichkeit, ihre finanzielle Gesundheit zu verstehen, ohne Buchhaltungspersonal einstellen oder verwalten zu müssen. Was LayerNext macht: - Automatisierte Buchhaltung - Echtzeit-Abstimmung - Cashflow- und Runway-Einblicke - Burn- und Ausgabenanalyse - Sofortige Finanzberichte LayerNext gibt Geschäftsinhabern Klarheit, Kontrolle und Vertrauen, damit sie sich auf das Führen des Unternehmens konzentrieren können, anstatt die Bücher zu führen.


  **Average Rating:** 5.0/5.0
  **Total Reviews:** 1

**User Satisfaction Scores:**

- **Einfache Bedienung:** 10.0/10 (Category avg: 8.6/10)
- **Datenherkunft:** 8.3/10 (Category avg: 8.6/10)


**Seller Details:**

- **Verkäufer:** [LayerNext AI](https://www.g2.com/de/sellers/layernext-ai)
- **Gründungsjahr:** 2022
- **Hauptsitz:** San Francisco, US
- **LinkedIn®-Seite:** https://www.linkedin.com/company/layernext/ (7 Mitarbeiter*innen auf LinkedIn®)

**Reviewer Demographics:**
  - **Company Size:** 100% Unternehmen


### 4. [PHEMI Health DataLab](https://www.g2.com/de/products/phemi-health-datalab/reviews)
  Das PHEMI Trustworthy Health DataLab ist ein einzigartiges, cloudbasiertes, integriertes Big-Data-Managementsystem, das es Gesundheitsorganisationen ermöglicht, Innovationen zu fördern und Wert aus Gesundheitsdaten zu schöpfen, indem es die Aufnahme und De-Identifizierung von Daten mit eingebauter NSA-/militärischer Governance, Datenschutz und Sicherheit vereinfacht. Konventionelle Produkte sperren Daten einfach ein, PHEMI geht weiter, löst Datenschutz- und Sicherheitsherausforderungen und adressiert das dringende Bedürfnis, den Zugang zu datenschutzsensiblen persönlichen Gesundheitsinformationen (PHI) zu sichern, zu verwalten, zu kuratieren und zu kontrollieren. Dies verbessert den Datenaustausch und die Zusammenarbeit innerhalb und außerhalb eines Unternehmens, ohne die Privatsphäre sensibler Informationen zu gefährden oder die administrative Belastung zu erhöhen. Auf Prinzipien des Datenschutzes durch Design aufgebaut, bietet die Software Forschern, Wissenschaftlern und Klinikern schnelleren Zugang zu mehr Informationen, während sichergestellt wird, dass sie Daten nur auf einer Need-to-know-Basis sehen. Verantwortungsbewusster Datenaustausch und ein Governance-Rahmen erleichtern die Einhaltung von Datenschutzbestimmungen. PHEMI Trustworthy Health DataLab kann auf jede Organisationsgröße skaliert werden, ist einfach zu implementieren und zu verwalten, verbindet sich mit Hunderten von Datenquellen und integriert sich mit beliebten Datenwissenschafts- und Geschäftsanalysetools.


  **Average Rating:** 3.9/5.0
  **Total Reviews:** 6

**User Satisfaction Scores:**

- **Einfache Bedienung:** 9.6/10 (Category avg: 8.6/10)


**Seller Details:**

- **Verkäufer:** [PHEMI Systems](https://www.g2.com/de/sellers/phemi-systems)
- **Gründungsjahr:** 2013
- **Hauptsitz:** Vancouver, CA
- **Twitter:** @PHEMIsystems (749 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/3561810 (6 Mitarbeiter*innen auf LinkedIn®)

**Reviewer Demographics:**
  - **Company Size:** 67% Kleinunternehmen, 33% Unternehmen


### 5. [Precisely Data 360 Govern](https://www.g2.com/de/products/precisely-data-360-govern/reviews)
  Jetzt Teil der Data Integrity Suite von Precisely, ist Data360 Govern eine Unternehmenslösung für Daten-Governance, Katalogisierung und Metadaten-Management, die Ihnen Vertrauen in die Qualität, den Wert und die Vertrauenswürdigkeit Ihrer Daten gibt. Sie automatisiert Governance- und Verwaltungsaufgaben, um Ihnen zu helfen, wesentliche Fragen über die Quelle, Nutzung, Bedeutung, Eigentümerschaft und Qualität Ihrer Daten zu beantworten. Mit Data360 Govern können Sie schnellere Entscheidungen über die Datennutzung und -verwaltung treffen, die Zusammenarbeit in Ihrer gesamten Organisation fördern und es den Benutzern ermöglichen, die Antworten zu erhalten, die sie benötigen – wann sie sie benötigen.


  **Average Rating:** 3.3/5.0
  **Total Reviews:** 2

**User Satisfaction Scores:**

- **Einfache Bedienung:** 8.3/10 (Category avg: 8.6/10)


**Seller Details:**

- **Verkäufer:** [Precisely](https://www.g2.com/de/sellers/precisely-0b25c016-ffa5-4f51-9d9e-fcbc9f54cc55)
- **Hauptsitz:** Burlington, Massachusetts
- **Twitter:** @PreciselyData (3,970 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/64863146/ (2,962 Mitarbeiter*innen auf LinkedIn®)

**Reviewer Demographics:**
  - **Company Size:** 50% Unternehmen mittlerer Größe


### 6. [Rudol](https://www.g2.com/de/products/rudol-rudol/reviews)
  Entfesseln Sie die wahre Kraft Ihrer Daten In der heutigen datengetriebenen Landschaft ist die Qualität Ihrer Daten von größter Bedeutung. Schlechte Datenqualität kann zu falschen Geschäftsentscheidungen, schlechter Softwarequalität oder voreingenommenen KI-Trainings führen, aufgrund ungenauer, unvollständiger oder unzuverlässiger Informationen. Hier kommt Rudol ins Spiel, Ihr Partner für Datenqualität, der entwickelt wurde, um Ihr Datenqualitätsniveau auf neue Höhen zu heben. Rudol ist eine umfassende Datenqualitätsplattform, die Organisationen befähigt, den Wert ihrer Daten zu maximieren. Sie ist maßgeschneidert für Unternehmen, die die Bedeutung von Datenqualität erkennen, sei es zur Verbesserung der Entscheidungsfindung, zur Einhaltung von Vorschriften, für das maschinelle Lernen oder einfach zur Reduzierung von Problemen in veröffentlichter Software. Und das für Ihre gesamte Organisation, da es keinerlei technische Vorkenntnisse oder Programmierkenntnisse erfordert, es ist komplett im Selbstbedienungsmodus mit 24/7-Support, und alle Benutzerkonten sind kostenlos, da die Abonnementkosten durch das Volumen Ihrer Daten bestimmt werden, was es Ihrer gesamten Struktur ermöglicht, Teil des Prozesses zu sein. Die Grundlage der Datenqualität ist das Verständnis der Landschaft Ihrer Assets. Rudols Datenkatalog ermöglicht es Organisationen, Ordnung in ihren Stack zu bringen, indem sie Datenquellen aus den beliebtesten Technologien hinzufügen, sei es strukturierte SQL-Datenbanken, Tabellenkalkulationen, Dashboards oder sogar Streaming-Quellen. Dann können Teams Governance-Prozesse durchführen und Eigentümer definieren, unter Domänen oder Tags klassifizieren, sensible Labels anbringen und Teams helfen, unbekannte Quellen für ihre Projekte zu entdecken. Für diejenigen, die keinen weiteren Browser-Tab geöffnet haben möchten, bietet Rudol Plugins für Slack, Microsoft Teams und Google Chrome mit umfangreichen Funktionen, sodass Sie Ressourcen finden und teilen können, während Sie mit einem anderen Teammitglied chatten oder in Ihrem Browser als Seitenleiste verwenden, während Sie Ihre bevorzugte Analyseplattform nutzen. Die Ermöglichung von Datenqualität ist ein mühsamer Prozess, Geschäftsinteressenten müssen versuchen, ihre Vision in technische Anforderungen zu übersetzen, und Software-Ingenieure müssen diese Anforderungen interpretieren, um langweilige, sich wiederholende und zeitaufwändige Skripte zu codieren. Dieser Prozess erfolgt mit Reibung und ist sehr schwer über die Zeit zu pflegen, daher umgeht Rudol diesen Prozess, indem es Geschäftsinteressenten einfach zu erstellende Validierungen bietet, die keine Programmierkenntnisse erfordern und extrem einfach zu konfigurieren sind. Wählen Sie aus mehr als 15 Geschäftsregel-Validierungen oder lassen Sie Rudol Ihre Daten analysieren, um einige davon vorzukonfigurieren, der Prozess dauert weniger als 3 Minuten und Sie können Validierungen für alle Ihre Assets in einem Augenblick massiv konfigurieren. Die Befreiung Ihres Datenteams von diesen sich wiederholenden Aufgaben ist entscheidend für die Optimierung ihrer Arbeit und das Erzielen eines höheren Werts aus der Praxis, deshalb bietet Rudol auch KI-Validierungen an, um Anomalien zu erkennen, wo keine Geschäftsregeln definiert sind. Verwenden Sie eines unserer 3 Modelle, um Inkonsistenzen zu erkennen, die nicht einmal Geschäftsinteressenten bemerken können, und benachrichtigen Sie proaktiv Ihre interessierten Rollen, um versteckte Probleme oder Fehlalarme zu identifizieren, da die Modelle mit Ihrem Feedback lernen und sich verbessern. Rudol bietet auch Rückverfolgbarkeit auf Linienebene für Ursachen- und Auswirkungsanalysen, sodass Sie Daten von der Quelle bis zum Ziel über Datenpipelines hinweg verfolgen können. Verstehen Sie die Auswirkungen von Datenproblemen stromaufwärts und stromabwärts, fördern Sie Verantwortlichkeit und Transparenz oder kopieren Sie Validierungen über Ihren Pipeline-Fluss für eine höhere Qualitätsabdeckung. Mit Rudol wird Datenqualität zugänglich und einfach durchzuführen. Es ist für alle technischen Erfahrungsstufen konzipiert und ermöglicht es jedem in Ihrer Organisation, an der Aufrechterhaltung der Datenqualität teilzunehmen. Rudol verbessert die Entscheidungsfindung, reduziert Infrastrukturkosten und befähigt Organisationen, das Beste aus ihren Daten herauszuholen.


  **Average Rating:** 5.0/5.0
  **Total Reviews:** 1


**Seller Details:**

- **Verkäufer:** [Rudol](https://www.g2.com/de/sellers/rudol)
- **Gründungsjahr:** 2022
- **Hauptsitz:** N/A
- **LinkedIn®-Seite:** https://www.linkedin.com/company/rudol (7 Mitarbeiter*innen auf LinkedIn®)

**Reviewer Demographics:**
  - **Company Size:** 100% Kleinunternehmen


### 7. [Waterline Data Catalog](https://www.g2.com/de/products/waterline-data-catalog/reviews)
  Waterline Data Fingerprinting funktioniert, indem es die Datenwerte in jedem Datensatz analysiert und die Daten profiliert. Waterline Data verwendet dann diese Informationen, um einen Fingerabdruck für jede Datenkolonne zu erstellen – unter Verwendung von maschinellem Lernen, um Datenfingerabdrücke intelligent und automatisch mit Glossarbegriffen zu kennzeichnen und abzugleichen und den Datenkatalog zu füllen. Benutzer können dann abgeglichene Begriffe und verbleibende nicht abgeglichene Begriffe durch Crowdsourcing verfeinern.


  **Average Rating:** 5.0/5.0
  **Total Reviews:** 1

**User Satisfaction Scores:**

- **Einfache Bedienung:** 10.0/10 (Category avg: 8.6/10)


**Seller Details:**

- **Verkäufer:** [Waterline Data](https://www.g2.com/de/sellers/waterline-data)
- **Gründungsjahr:** 2013
- **Hauptsitz:** Mountain View, US
- **Twitter:** @waterlinedata (1,702 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/3752606 (5 Mitarbeiter*innen auf LinkedIn®)

**Reviewer Demographics:**
  - **Company Size:** 100% Unternehmen


### 8. [Zaloni Data Governance](https://www.g2.com/de/products/zaloni-data-governance/reviews)
  Bei Zaloni glauben wir an die ungenutzte Kraft von Daten. Unsere Datenmanagement-Software, Arena, bietet einen erweiterten Katalog, der die Selbstbedienung bei der Datenanreicherung und -nutzung ermöglicht. Wir arbeiten mit den weltweit führenden Unternehmen zusammen und liefern außergewöhnliche Datenverwaltung, die auf einer erweiterbaren, maschinellen Lernplattform basiert, die sowohl die Datenbestände von Unternehmen verbessert als auch schützt.


  **Average Rating:** 4.0/5.0
  **Total Reviews:** 1


**Seller Details:**

- **Verkäufer:** [Zaloni](https://www.g2.com/de/sellers/zaloni)
- **Gründungsjahr:** 2007
- **Hauptsitz:** Research Triangle Park, US
- **Twitter:** @zaloni (1,292 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/859448 (62 Mitarbeiter*innen auf LinkedIn®)

**Reviewer Demographics:**
  - **Company Size:** 100% Kleinunternehmen


### 9. [Accurity Software Suite](https://www.g2.com/de/products/accurity-software-suite/reviews)
  Mit Accurity, der All-in-One-Datenintelligenzplattform, erhalten Sie ein unternehmensweites Verständnis und vollständiges Vertrauen in Ihre Daten - beschleunigen Sie geschäftskritische Entscheidungsfindungen, steigern Sie Ihren Umsatz, senken Sie Ihre Kosten und gewährleisten Sie die Datenkonformität Ihres Unternehmens. Accurity unterstützt mehrere Lösungen über den gesamten Projektlebenszyklus hinweg, von der Definition der Datenanforderungen bis zu Datenqualitätsprüfungen durch Datenverwalter. Accurity bietet umfassende Lösungen, die Datenharmonisierung, Qualität und Herkunft abdecken, einschließlich Geschäftsglossar, Datenkatalog und Referenzdatenmanagement. Sie können eine unternehmensweite und unternehmensspezifische gemeinsame Sprache von Geschäftstermini beschreiben und bereitstellen und erhalten einen vollständigen Überblick über alle technischen Metadaten, die sich auf Ihre Geschäftsprojekte beziehen und alle Ebenen Ihrer Datenarchitektur abdecken. Und brechen Sie Ihre Geschäftstermini in ein strukturiertes, konsistentes und detaillierteres Modell herunter, das es Ihnen ermöglicht, Datenherkunft zu erreichen. Die Accurity-Plattform ist vor Ort oder als SaaS verfügbar. Sie ist so aufgebaut, dass Anfängern der Einstieg in die Datenverwaltung leicht fällt, mit der Möglichkeit, das Dienstleistungsspektrum entsprechend Ihren Bedürfnissen zu erweitern, bis hin zu groß angelegten Unternehmensumgebungen mit speziellen Anforderungen. Jeder kann jetzt mit dem Data Catalog und Business Glossary SaaS völlig kostenlos starten.


  **Average Rating:** 5.0/5.0
  **Total Reviews:** 1

**User Satisfaction Scores:**

- **Einfache Bedienung:** 10.0/10 (Category avg: 8.6/10)


**Seller Details:**

- **Verkäufer:** [Simplity](https://www.g2.com/de/sellers/simplity)
- **Gründungsjahr:** 2010
- **Hauptsitz:** Prague, CZ
- **LinkedIn®-Seite:** https://www.linkedin.com/company/simplity/ (25 Mitarbeiter*innen auf LinkedIn®)

**Reviewer Demographics:**
  - **Company Size:** 100% Unternehmen mittlerer Größe


#### Pros & Cons

**Pros:**

- Barrierefreiheit (1 reviews)
- Automatisierung (1 reviews)
- Zusammenarbeit (1 reviews)
- Compliance-Management (1 reviews)
- Datengenauigkeit (1 reviews)

**Cons:**

- Schwierige Einrichtung (1 reviews)
- Benutzerakzeptanzschwierigkeiten (1 reviews)

### 10. [Ataccama One](https://www.g2.com/de/products/ataccama-one/reviews)
  Ataccama ermöglicht es Organisationen, das transformative Potenzial von Daten und KI mit Ataccama ONE zu maximieren, einer einheitlichen, KI-gestützten Datenmanagementplattform für automatisierte Datenqualität, Daten-Governance und Stammdatenmanagement in Cloud- und Hybridumgebungen. Mit mehr als 450 Kunden weltweit ermöglichen wir es Geschäfts- und Datenteams, bei der Erstellung hochwertiger, wiederverwendbarer Datenprodukte zusammenzuarbeiten und datengetriebene Innovationen massiv zu skalieren, während die Datengenauigkeit, Kontrolle und Governance aufrechterhalten werden.


  **Average Rating:** 4.2/5.0
  **Total Reviews:** 10

**User Satisfaction Scores:**

- **Einfache Bedienung:** 8.5/10 (Category avg: 8.6/10)


**Seller Details:**

- **Verkäufer:** [Ataccama](https://www.g2.com/de/sellers/ataccama)
- **Unternehmenswebsite:** https://www.ataccama.com
- **Gründungsjahr:** 2007
- **Hauptsitz:** Toronto, Canada
- **Twitter:** @ataccama (3,089 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/ataccama (497 Mitarbeiter*innen auf LinkedIn®)

**Reviewer Demographics:**
  - **Company Size:** 45% Kleinunternehmen, 36% Unternehmen


#### Pros & Cons

**Pros:**

- Kundendienst (1 reviews)
- Anpassung (1 reviews)
- Anpassungsoptionen (1 reviews)
- Benutzerfreundlichkeit (1 reviews)
- Benutzeroberfläche (1 reviews)

**Cons:**

- Komplexität (1 reviews)
- Schwieriges Lernen (1 reviews)
- Schwierigkeiten beim Lernen (1 reviews)
- Lernkurve (1 reviews)
- Lernschwierigkeit (1 reviews)

### 11. [Binary Demand](https://www.g2.com/de/products/binary-demand/reviews)
  Binary Demand bietet maßgeschneiderte Lösungen, um die Verschwendung Ihrer Daten zu verhindern, indem es deren natürlichen Abbau ausgleicht. Seine maßgeschneiderten Datenlösungen umfassen Standardisierung, Dublettenbereinigung, Bereinigung, Verifizierung usw. Dies hilft bei der Erstellung einer Liste potenzieller Kunden basierend auf Kriterien wie Geografie, Unternehmensgröße, Berufsbezeichnungen, Branche usw.


**Seller Details:**

- **Verkäufer:** [Binary Demand](https://www.g2.com/de/sellers/binary-demand)
- **Hauptsitz:** Dubai, AE
- **Twitter:** @BinaryDemand (41 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/binary-demand/ (57 Mitarbeiter*innen auf LinkedIn®)


### 12. [circlewise](https://www.g2.com/de/products/datazone-circlewise/reviews)
  Chatten Sie mit Ihrem Unternehmenswissen/Datenbanken/Dokumenten Von HR-Richtlinien bis hin zu Verkaufsdaten, geben Sie Ihrem Team Zugriff auf konsistente Unternehmensinformationen. Fragen Sie einfach, unsere KI findet, was Sie brauchen, erklärt es klar und hilft jedem, auf dem gleichen Stand zu bleiben.


**Seller Details:**

- **Verkäufer:** [Datazone](https://www.g2.com/de/sellers/datazone)
- **Gründungsjahr:** 2021
- **Hauptsitz:** London, GB
- **LinkedIn®-Seite:** https://www.linkedin.com/company/datazoneco (10 Mitarbeiter*innen auf LinkedIn®)


### 13. [Data Collection](https://www.g2.com/de/products/sapien-data-collection/reviews)
  Sapien&#39;s Datensammlungsdienste bieten hochwertige, strukturierte Datensätze, die speziell darauf zugeschnitten sind, KI- und maschinelle Lernprojekte zu unterstützen. Um die Herausforderungen bei der Beschaffung und Vorbereitung von Daten für das KI-Training zu bewältigen, nutzt Sapien Echtzeit-Datensammlungssoftware und automatisierte Techniken, um relevante Daten für sowohl überwachte als auch unüberwachte Trainingsmodelle zu sammeln.


**Seller Details:**

- **Verkäufer:** [Sapien](https://www.g2.com/de/sellers/sapien)
- **Hauptsitz:** New York City, US
- **LinkedIn®-Seite:** https://www.linkedin.com/company/getsapien (8 Mitarbeiter*innen auf LinkedIn®)


### 14. [Dataland](https://www.g2.com/de/products/dataland/reviews)
  Dataland ist ein einheitlicher Datenarbeitsbereich, der speziell für Frontline- und operative Benutzer wie Lieferketten, Logistik, Betrieb und Kundensupport entwickelt wurde. Dataland zentralisiert alle Daten an einem Ort, sodass Geschäftsanwender KI fragen, suchen, analysieren und Maßnahmen gegen Daten an einem Ort ergreifen können. Geschäftsteams nutzen Dataland, um einen 360-Grad-Blick auf alle Daten zu erhalten, die sie für ihre täglichen Arbeitsabläufe benötigen. So funktioniert Dataland: Echtzeit-Datensynchronisierung: Dataland verfügt über integrierte Konnektoren zu Datenbanken, Data Warehouses, SaaS-APIs und benutzerdefinierten Quellen. Im Gegensatz zu herkömmlichen Datenintegrationstools aktualisiert Dataland in Echtzeit von seinen Quellsystemen, was für operative Anwendungsfälle notwendig ist. Universelle Suche: Dataland indexiert die Daten in Echtzeit und ermöglicht es operativen Benutzern, schnell nach aktuellen Informationen über alle Attribute in allen Datenquellen zu suchen. Dies ermöglicht es den Benutzern, schnell den vollständigen Kontext zu erhalten, den sie benötigen, ohne wissen zu müssen, wo sie suchen sollen oder unflexible Tools zu verwenden, die Informationen nur auf spezifische vordefinierte Weise abrufen können. 360-Grad-Ansichten: Dataland kombiniert Informationen aus fragmentierten Datenquellen in einheitliche Ansichten, die das vollständige 360-Grad-Bild jeder Geschäftseinheit bieten. Dies eliminiert die Notwendigkeit für Benutzer, zwischen mehreren Tools zu wechseln. AI-Datenassistent: Benutzer können die KI bitten, Daten für sie zu analysieren, ohne SQL zu kennen. Automatisierungen und Benachrichtigungen: Benutzerdefinierte Geschäftsaktionen können operativen Benutzern zur Verfügung gestellt werden (z. B. Auslösen einer Zapier-Automatisierung, Aufrufen einer internen API, Ausführen von SQL-Updates usw.), sodass sie End-to-End-Workflows in Dataland abschließen können, ohne die Plattform jemals verlassen zu müssen. Benutzer können auch Benachrichtigungen über eine einfache Schnittstelle definieren, ohne Code zu kennen.


**Seller Details:**

- **Verkäufer:** [Dataland](https://www.g2.com/de/sellers/dataland)
- **Gründungsjahr:** 2021
- **Hauptsitz:** N/A
- **LinkedIn®-Seite:** https://www.linkedin.com/company/datalandio (8 Mitarbeiter*innen auf LinkedIn®)


### 15. [DataMarket](https://www.g2.com/de/products/datamarket/reviews)
  DataMarket is a data marketplace and data discovery solution within the RightData platform. It provides a centralized place where datasets and data products are organized, documented, and made available for use across teams, with defined access controls. Users can search and browse available data, view metadata, and understand what the data represents before requesting access. This helps them assess whether a dataset is relevant for their use case without relying on back-and-forth with data teams. Access requests follow approval workflows based on organizational policies, and records are maintained for audit and tracking purposes. DataMarket brings together data cataloging, data discovery, and access management in a single interface. Datasets are structured and categorized so they can be located and understood more easily. By standardizing how data is published and accessed, it reduces inconsistencies in how different teams interact with data. The platform supports data democratization by allowing more users across the organization to find and use data independently, while still operating within governance and security boundaries. This reduces dependency on data engineers for routine access and helps teams move faster on reporting and analysis tasks. DataMarket is used by business users, analysts, and data scientists who need access to data for reporting, analysis, and decision-making. It is also used by data engineers and data owners to publish, organize, and manage datasets so they can be accessed by others in a controlled manner.


**Seller Details:**

- **Verkäufer:** [RightData](https://www.g2.com/de/sellers/rightdata)
- **Gründungsjahr:** 2016
- **Hauptsitz:** Atlanta, US
- **Twitter:** @GetRightData (119 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/getrightdata (82 Mitarbeiter*innen auf LinkedIn®)


### 16. [Data World](https://www.g2.com/de/products/data-world-data-world/reviews)
  data.world ist der am häufigsten angenommene Datenkatalog und Governance-Plattform auf dem Markt. Auf einer einzigartigen Wissensgraph-Basis aufgebaut, integriert sich data.world nahtlos in Ihre bestehenden Systeme. Wir setzen den Standard für schnelle, menschenzentrierte Governance. Wir verwalten nicht nur Daten; wir erschließen ihr Potenzial und ebnen den Weg für verantwortungsvolle KI-Einführung und datengetriebene Entscheidungsfindung im großen Maßstab. data.world ist eine zertifizierte B Corporation und eine gemeinnützige Gesellschaft und Heimat der weltweit größten kollaborativen Open-Data-Community mit mehr als zwei Millionen Mitgliedern, darunter neunzig Prozent der Fortune 500.


**Seller Details:**

- **Verkäufer:** [data.world](https://www.g2.com/de/sellers/data-world)
- **Gründungsjahr:** 2016
- **Hauptsitz:** Austin, Texas
- **Twitter:** @datadotworld (5,515 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/data.world/ (107 Mitarbeiter*innen auf LinkedIn®)


### 17. [Deasie](https://www.g2.com/de/products/deasie/reviews)
  Deasie bietet einen automatisierten Kennzeichnungs-Workflow, um unstrukturierte Daten schneller zu kennzeichnen, zu katalogisieren und zu filtern als jeder Mensch.


**Seller Details:**

- **Verkäufer:** [Deasie](https://www.g2.com/de/sellers/deasie)
- **Hauptsitz:** N/A
- **LinkedIn®-Seite:** https://www.linkedin.com/company/No-Linkedin-Presence-Added-Intentionally-By-DataOps (1 Mitarbeiter*innen auf LinkedIn®)


### 18. [Dsense](https://www.g2.com/de/products/dsense/reviews)
  Ermöglicht es Nicht-Technikern, mit Daten unter Verwendung beliebiger LLMs zu kommunizieren, sei es in einer VPC bereitgestellt oder über externe APIs, und gewährleistet dabei eine schnelle Abfrage mit außergewöhnlicher Geschwindigkeit, Genauigkeit und Präzision. Vollständig verwaltet und mit robusten Sicherheitsleitplanken ausgestattet, um Daten auf einer „Need-to-know“-Basis offenzulegen und so die Informationssicherheitsprotokolle einzuhalten. Es ermöglicht Organisationen, Analysen zu beschleunigen und KI-Anwendungen sicher mit ihren Unternehmensdaten zu erstellen, während sie ihre wertvollen Vermögenswerte schützen.


**Seller Details:**

- **Verkäufer:** [Dview](https://www.g2.com/de/sellers/dview)
- **Gründungsjahr:** 2021
- **Hauptsitz:** Bengaluru East, IN
- **Twitter:** @DviewTech (18 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/dview-io/ (16 Mitarbeiter*innen auf LinkedIn®)


### 19. [Enterprise Data Catalog Advanced Scanners](https://www.g2.com/de/products/enterprise-data-catalog-advanced-scanners/reviews)
  Mit Enterprise Data Catalog Advanced Scanners können Sie automatisch die detailliertesten Metadaten extrahieren und Datenabhängigkeiten über Datenquellen hinweg verfolgen.


**Seller Details:**

- **Verkäufer:** [Informatica](https://www.g2.com/de/sellers/informatica)
- **Gründungsjahr:** 1993
- **Hauptsitz:** Redwood City, CA
- **Twitter:** @Informatica (99,880 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/3858/ (5,337 Mitarbeiter*innen auf LinkedIn®)
- **Eigentum:** NYSE: INFA


### 20. [Entity Catalog](https://www.g2.com/de/products/entity-catalog/reviews)
  Der Entity Catalog ist eine umfassende Datenbank, die von Qloo entwickelt wurde und über 575 Millionen Entitäten in verschiedenen Bereichen wie Unterhaltung, Gastronomie, Reisen und Konsumgüter umfasst. Dieses umfangreiche Verzeichnis enthält detaillierte Informationen über Filme, Musik, Bücher, Restaurants, Hotels und mehr, wodurch Unternehmen tiefgehende Einblicke in Verbraucherpräferenzen und -trends gewinnen können.


**Seller Details:**

- **Verkäufer:** [Qloo](https://www.g2.com/de/sellers/qloo)
- **Gründungsjahr:** 2012
- **Hauptsitz:** New York, US
- **LinkedIn®-Seite:** https://www.linkedin.com/company/qloo/ (56 Mitarbeiter*innen auf LinkedIn®)


### 21. [Erisna](https://www.g2.com/de/products/erisna/reviews)
  Erisna ist eine Unternehmensdatenkatalog- und Entdeckungsplattform, die es Datenanalysten, Dateningenieuren, Datenwissenschaftlern und Datenmanagern ermöglicht, das Beste aus ihren Daten herauszuholen. Verbinden Sie Erisna mit verschiedenen Datenquellen wie Amazon Redshift, Google BigQuery, Microsoft Azure Synapse, Snowflake, PostgreSQL und SQL Server, um Ihr Datenwörterbuch zu erstellen, sensible Daten automatisch zu erkennen, die Datenerkennung zu automatisieren, Anforderungen an die Datenpipeline zu sammeln und die Datenverwaltung zu verbessern, alles an einem Ort. Unsere Plattform hilft Organisationen, die Produktivität zu steigern, regulatorische Risiken zu reduzieren, bessere Entscheidungen zu treffen und die Kosten erheblich zu senken.


**Seller Details:**

- **Verkäufer:** [Erisna](https://www.g2.com/de/sellers/erisna)
- **Gründungsjahr:** 2021
- **Hauptsitz:** London, GB
- **LinkedIn®-Seite:** https://www.linkedin.com/company/erisna (5 Mitarbeiter*innen auf LinkedIn®)


### 22. [Forcepoint Data Classification](https://www.g2.com/de/products/forcepoint-data-classification/reviews)
  Forcepoint Data Classification definiert die Datenklassifizierung mit KI-gesteuerter Präzision und Automatisierung neu, beseitigt manuelle Fehler und verbessert die Wirksamkeit von DLP. Wir verwenden ein fortschrittliches AI Mesh, um eine hochpräzise Datenklassifizierung zu liefern. Seine vernetzte KI-Architektur nutzt ein Small Language Model und fortschrittliche KI-Komponenten, um die Effizienz zu verbessern und Fehlalarme zu reduzieren. Durch kontinuierliches Lernen und Verbesserung liefert es sichere Empfehlungen, die die Durchsetzung von Richtlinien und die Einhaltung von Vorschriften für Organisationen verbessern.


**Seller Details:**

- **Verkäufer:** [Forcepoint](https://www.g2.com/de/sellers/forcepoint)
- **Gründungsjahr:** 1994
- **Hauptsitz:** Austin, TX
- **Twitter:** @Forcepointsec (65,480 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/forcepoint/ (1,658 Mitarbeiter*innen auf LinkedIn®)


### 23. [Foursquare Spatial H3 Hub](https://www.g2.com/de/products/foursquare-spatial-h3-hub/reviews)
  FSQ Spatial H3 Hub beseitigt traditionelle Barrieren für die Übernahme von Geodaten in traditionellen ML-Modellen, indem es Datenwissenschaftlern analysenbereite Datensätze bereitstellt, die keine spezialisierten Geotools oder Fachkenntnisse erfordern. Datensätze, die Informationen in Raster- und Vektorformaten enthalten, werden in tabellarische Form umgewandelt und in H3-Zellen indexiert. Dies ermöglicht es Datenwissenschaftlern, ihre eigenen Datensätze, die Attribute wie Lat/Lon-Koordinaten, Städtenamen oder Postleitzahlen enthalten, einfach durch das Verbinden mit einem gemeinsamen H3-Index zu bereichern. Aufgebaut auf dem Enterprise-Metadaten-Managementsystem von DataHub, stellt die Plattform sicher, dass die Nachverfolgung der Datenherkunft, Versionierung und Governance-Fähigkeiten gewährleistet sind, die Unternehmensdaten-Teams benötigen. Diese Grundlage ermöglicht das erste Angebot im FSQ Spatial H3 Hub: einen Iceberg-Katalog, der über 20 offene Datensätze bietet, die auf H3-Zellen bei Auflösung 8 vorindexiert sind und in einer kostenlosen Vorschau verfügbar gemacht werden. Datenwissenschaftler können auf diesen Katalog aus ihrem bevorzugten Framework (Spark, Python, DuckDB) zugreifen und ihre ML-Modelle mit einer Vielzahl von räumlichen Merkmalen anreichern.


**Seller Details:**

- **Verkäufer:** [Foursquare](https://www.g2.com/de/sellers/foursquare)
- **Gründungsjahr:** 2009
- **Hauptsitz:** New York, NY
- **Twitter:** @foursquare (22,968 Twitter-Follower)
- **LinkedIn®-Seite:** https://www.linkedin.com/company/foursquare (517 Mitarbeiter*innen auf LinkedIn®)


### 24. [IQ Metadata Manager](https://www.g2.com/de/products/iq-metadata-manager/reviews)
  IQ Metadata Manager hilft Unternehmen, ihre Daten freizuschalten, indem es Metadaten-Domänenkategorien an einem Ort vereint, um eine Echtzeitansicht aller Informationen zu erstellen. Erstellen Sie ein standardisiertes Glossar und einen Datenkatalog. Verbessern Sie die Datensichtbarkeit für die Datenvorbereitung und -analyse.


**Seller Details:**

- **Verkäufer:** [InQuisient](https://www.g2.com/de/sellers/inquisient)
- **Gründungsjahr:** 2004
- **Hauptsitz:** Reston, US
- **LinkedIn®-Seite:** https://www.linkedin.com/company/inquisient (8 Mitarbeiter*innen auf LinkedIn®)


### 25. [Key Ward](https://www.g2.com/de/products/key-ward/reviews)
  Key Ward ist ein Deep-Tech-Unternehmen, das sich auf das Management von Ingenieurdaten und die Einführung von KI spezialisiert hat, insbesondere in der Automobil- und Luftfahrtindustrie. Ihre Flaggschiffprodukte, Key Ward HUB und Key Ward FLOW, nutzen künstliche Intelligenz, um Konstruktionsprozesse zu optimieren und zu verbessern. Key Ward HUB automatisiert die Extraktion und Umwandlung von Daten aus verschiedenen CAE/CAD-Dateiformaten in KI-bereite Datensätze und eliminiert so die Notwendigkeit manueller Datenvorbereitung. Key Ward FLOW verwendet vortrainierte KI-Modelle, um Bewertungen von Konstruktionsentwürfen vorherzusagen, wie z.B. Bewertungen der numerischen Strömungsmechanik (CFD), was es Ingenieuren ermöglicht, mehr Designvarianten in kürzerer Zeit zu erkunden. Dieser Ansatz beschleunigt nicht nur den Bewertungszyklus von Entwürfen, sondern liefert auch genauere Ergebnisse im Vergleich zu herkömmlichen Simulationsmethoden. Durch die Integration dieser Werkzeuge befähigt Key Ward Ingenieurteams, Designs effizient zu optimieren, das Risiko von Fehlern in späten Entwicklungsstadien zu reduzieren und die Gesamtleistung des Produkts zu verbessern, ohne dass vorherige Kenntnisse in Datenwissenschaft erforderlich sind.


**Seller Details:**

- **Verkäufer:** [Key Ward](https://www.g2.com/de/sellers/key-ward)
- **Gründungsjahr:** 2021
- **Hauptsitz:** Berlin, DE
- **LinkedIn®-Seite:** https://www.linkedin.com/company/keyward (13 Mitarbeiter*innen auf LinkedIn®)


## Parent Category

[IT-Infrastruktur-Software](https://www.g2.com/de/categories/it-infrastructure)


## Related Categories

- [Datenverwaltungstools](https://www.g2.com/de/categories/data-governance-tools)
- [DataOps-Plattformen](https://www.g2.com/de/categories/dataops-platforms)
- [Aktive Metadatenverwaltungssoftware](https://www.g2.com/de/categories/active-metadata-management)


---

## Buyer Guide

### Was Sie über Software zur Verwaltung von Gesundheitsansprüchen wissen sollten

### Was ist ein Machine Learning Data Catalog?

Ein Machine Learning Data Catalog (MLDC) ist ein automatisierter Datenkatalog, der Aufgaben wie das Crawlen von Metadaten, das Katalogisieren und Klassifizieren von personenbezogenen Daten (PII) durchführt. Machine Learning Data Catalogs organisieren das Datenbestandsverzeichnis mithilfe von Metadaten.

Datenkataloge helfen Unternehmen zu wissen, wo die Daten gespeichert sind, wodurch die Zeit zur Identifizierung von Daten reduziert wird und sie leicht für Analysen zugänglich gemacht werden. Sie sind Bestandsverzeichnisse von Assets wie Tabellen, Schemata, Dateien und Diagrammen in Organisationen und helfen, die Herausforderungen der Datenentdeckung, -qualität und -verwaltung eines Unternehmens zu lösen.

### Wofür steht MLDC?

MLDC ist ein Akronym für Machine Learning Data Catalog.&amp;nbsp;

### Was sind die häufigsten Merkmale von Machine Learning Data Catalogs?

Machine Learning Data Catalogs vereinfachen die manuellen Funktionen eines Datenkatalogs. Ein Datenkatalog ist ein wesentlicher Bestandteil der Datenmanagementstrategie jeder Organisation. Einige der Merkmale von Machine Learning Data Catalogs sind:

**Datenaufnahme und -entdeckung:** Machine Learning Data Catalogs müssen vorgefertigte Adapter haben, um sich mit verschiedenen Unternehmenssystemen wie Anwendungen, Datenbanken, Dateien und externen APIs zu verbinden. Diese Adapter helfen bei der Entdeckung von Metadaten aus Systemen. Metadaten können Tabellennamen, Attributnamen und Einschränkungen sein. Das Merkmal hilft beim Aufbau nativer Konnektivität wie Integrationen für Datenquellen, Business-Intelligence-Lösungen (BI) und Data-Science-Tools.

**Geschäftsglossar:** Obwohl eine große Menge an Daten im Repository gespeichert ist, ist es auch wichtig, dass die Benutzer verstehen, was die gespeicherten Daten bedeuten. Das Glossar-Merkmal verknüpft diese Daten mit Geschäftstermini und verleiht ihnen mehr Bedeutung.&amp;nbsp;

**Automatisierte Datenkennzeichnung:** Datenkennzeichnung ist eine Voraussetzung für maschinelle Lernalgorithmen. Automatisierte Datenkennzeichnung ist genauer als manuelle, da sie menschliche Fehler eliminiert. Datenkennzeichnung beinhaltet normalerweise, dass Annotatoren Objekte in Bildern identifizieren, um qualitativ hochwertige Trainingsdaten für künstliche Intelligenz (KI) zu erstellen. Automatisierte Kennzeichnung beseitigt die Herausforderungen, die durch die mühsamen Annotationszyklen entstehen.

**Datenherkunft:** Datenherkunft ist der Prozess, der den Benutzern hilft zu wissen, wer, warum, wann und wo Änderungen an den Daten vorgenommen werden. Es ist ein Teil des Metadatenmanagements. MLDCs automatisieren den Datenherkunftsprozess. Datenherkunft hilft zu bestimmen, wann neue oder geänderte Daten ein erneutes Training von maschinellen Lernmodellen erfordern. MLDCs durchforsten normalerweise automatisch Abfragelogs in Data Lakes und anderen Datenquellen, um eine Datenherkunftskarte zu erstellen.

**Datenqualitätsüberwachung und Anomalieerkennung:** Die Datenqualitätsüberwachung hilft Benutzern zu verstehen, ob die Daten aus einer vertrauenswürdigen Quelle stammen. Der Machine Learning Data Catalog hat auch ein Merkmal, um plötzliche Änderungen in den Daten mithilfe von maschinellen Lernalgorithmen zu identifizieren. Die Benutzer werden sofort über alle erkannten Änderungen oder Anomalien informiert.&amp;nbsp;

**Semantische Suche nach Datensätzen:** Machine Learning Data Catalogs bieten Benutzern visuelle und intuitive Suchmöglichkeiten wie Suchmaschinen. Fast jeder Benutzer in einer Organisation ist ein Datenbenutzer, aber nicht jeder kann SQL-Abfragen verwenden, um Daten zu nutzen. Das semantische Suchmerkmal erleichtert es allen Benutzern, Datensätze zu entdecken.

**Compliance-Fähigkeiten:** Dieses Merkmal stellt sicher, dass sensible Daten nicht offengelegt werden und dass der Benutzer den Daten vertrauen kann. Es hilft weiter, Datenverwaltungspolitiken aufrechtzuerhalten und das Datenmanagement in der Organisation zu stärken. Datenverwalter können minderwertige Daten identifizieren und den Zugriff auf sensible Daten einschränken, wodurch die Einhaltung von Vorschriften wie der Datenschutz-Grundverordnung (DSGVO) unterstützt wird.

**Datenprofilierung:** Die Datenprofilierung hilft, die Daten aus der Datenquelle zu überprüfen und Informationen darüber zu sammeln. Dieser Prozess hilft, Datenqualitätsprobleme viel besser zu erkennen, wodurch der Datenmanagementprozess effizienter wird.

### Was sind die Vorteile von Machine Learning Data Catalogs?

Ein Machine Learning Data Catalog bietet verschiedene Vorteile für unterschiedliche Benutzertypen in der Organisation. Dazu gehören:

**Erleichterung bei der Datenkuratierung:** Datenkuratierung ist ein Prozess des Sammelns, Organisierens, Kennzeichnens und Bereinigens von Daten. Machine Learning Data Catalogs validieren Metadaten und organisieren Erkenntnisse mithilfe von maschinellen Lernalgorithmen in die richtigen Repositories.

**Erleichterung der Suche:** Dank der semantischen Suche wird es für nicht-technische Benutzer einfacher, Daten zu suchen und zu entdecken, da sie nicht jedes Mal SQL-Abfragen verwenden müssen, um auf Daten zuzugreifen.

**Erleichterung der Datenzusammenarbeit:** Machine Learning Data Catalogs helfen den Benutzern, zusammenzuarbeiten, Datensätze zu nutzen und zu teilen, da Machine Learning Data Catalogs das Auffinden und Speichern von isolierten Daten erleichtern.

### Wer nutzt Machine Learning Data Catalogs?

Machine Learning Data Catalogs zentralisieren Metadaten für verschiedene Datenassets. Durch die Organisation der Metadaten helfen MLDCs Organisationen, den Datenzugriff zu verwalten.

**Datenanalysten:** Datenanalysten nutzen MLDC, um Daten für ihre Analyseprozesse zu entdecken, zu klassifizieren und zu manipulieren. Sie können auch KI- oder maschinelle Lernmodelle entdecken, verstehen, wie sie funktionieren, und sie in ihre BI-Tools importieren. Datenkataloge helfen Datenanalysten, Unternehmen in Self-Service-Organisationen zu verwandeln. Self-Service-Analysen sind wichtig für jede Organisation, die von Erkenntnissen getrieben werden möchte. Machine Learning Data Catalogs helfen den Benutzern, die Mittel zu finden, zu verstehen und den Daten zu vertrauen.

**Vermarkter:** Marketingteams nutzen den Machine Learning Data Catalog kommerzieller. Sie erhalten Erkenntnisse, um bessere Entscheidungen zu treffen, indem sie Datenkataloge verwenden.

**Datenwissenschaftler:** Datenwissenschaftler veröffentlichen normalerweise ihre Modelle zur Wiederverwendung. Datenwissenschaftler suchen immer nach einer Plattform, die Daten für verschiedene Projekte zentralisiert.&amp;nbsp;

### Herausforderungen mit Machine Learning Data Catalogs

Obwohl Machine Learning Data Catalogs helfen, große Herausforderungen in traditionellen Datenkatalogen wie Datenentdeckung und Datenherkunft zu lösen, bringen MLDCs auch Herausforderungen mit sich.&amp;nbsp;&amp;nbsp;

**Skalierbarkeit:** Es ist schwierig für alle MLDCs, ein großes Metadatenvolumen zu unterstützen. Manchmal brechen die Datenkataloge aufgrund von Leistungsproblemen zusammen, wenn sie mit enormen Mengen an Metadaten überlastet sind. Ursprünglich wurden Daten im Mainframe-Rechenzentrum des Unternehmens gespeichert. Aufgrund der heutigen Big Data müssen Machine Learning Data Catalogs jedoch Daten sowohl in der Cloud als auch in Data Lakes verfolgen.

**Fragmentierung bei der Bewertung eines Produkts:** Wenn ein Datenkatalog zu umfangreich ist, verursacht er eine Fragmentierung im Benutzererlebnis bei der Bewertung eines Produkts. Zu viele Daten führen dazu, dass Benutzer zu viele Tools verwenden, wodurch ein nahtloses Erlebnis in Fragmente zerbricht.

### Wie kauft man Machine Learning Data Catalogs

#### Anforderungserhebung (RFI/RFP) für Machine Learning Data Catalogs

Der Machine Learning Data Catalog bietet viele Funktionen, um Benutzern zu helfen, nutzbare Daten zu identifizieren. Ein Käufer kann die richtige MLDC-Software je nach den Bedürfnissen der Organisation auswählen. RFP/RFIs helfen der Organisation, nach Preisen, Produktmerkmalen und Richtlinien zu suchen.

#### Vergleich von Machine Learning Data Catalog-Produkten

**Erstellen Sie eine Longlist**

Der erste Schritt besteht darin, nach allen möglichen Anbietern in diesem Bereich zu suchen. Dies gibt den Vorteil, die Anbieter hinsichtlich Preis, Produktmerkmalen und Kundenservice zu bewerten.&amp;nbsp;

**Erstellen Sie eine Shortlist**

Nach der Bewertung der potenziellen Anbieter kann das Unternehmen die Liste auf diejenigen eingrenzen, die alle ihre Anforderungen erfüllen.

**Führen Sie Demos durch**

Demos helfen, das Produkt als Ganzes zu verstehen. Ein Team von IT-Profis und Datenwissenschaftlern sollte an diesen Demos teilnehmen, um die Funktionalität des Produkts zu verstehen, während das Marketingteam teilnehmen kann, um den geschäftlichen Nutzen der Software in den Projekten zu analysieren.

#### Auswahl von Machine Learning Data Catalogs

**Wählen Sie ein Auswahlteam**

Ein Team von Marketingfachleuten mit Datenwissenschaftlern und IT-Profis kann alle Fragen zum MLDC-Produkt mit den Anbietern klären. Ein Datenwissenschaftler wäre mehr daran interessiert, die technischen Merkmale der Software zu kennen. Ein Marketingmanager wäre neugierig zu wissen, wie das Marketingteam MLDC für ein Projekt nutzen könnte. Ein IT-Profi möchte das Installationsverfahren der Software verstehen.

**Verhandlung**

Sobald der Anbieter den Preis nennt, beginnen die Verhandlungen. Der Preis wird basierend auf den Kosten anderer ähnlicher Produkte auf dem Markt und dem Ausmaß, in dem das Produkt die Herausforderungen lösen kann, festgelegt.

**Endgültige Entscheidung**

Die endgültige Entscheidung basiert auf Vereinbarungen zwischen dem Anbieter und dem Käufer.