Les catalogues de données d'apprentissage automatique permettent aux entreprises de catégoriser, accéder, interpréter et collaborer autour des données de l'entreprise à partir de multiples sources de données, tout en maintenant un haut niveau de gouvernance et de gestion des accès. L'intelligence artificielle est essentielle à de nombreuses fonctionnalités des catalogues de données d'apprentissage automatique, permettant des fonctionnalités telles que les recommandations d'apprentissage automatique, les requêtes en langage naturel et le masquage dynamique des données à des fins de sécurité renforcée.
Les entreprises peuvent utiliser les catalogues de données d'apprentissage automatique pour maintenir des ensembles de données en un seul endroit afin que la recherche et la découverte de données soient simples pour les utilisateurs professionnels quotidiens et les analystes. Les utilisateurs ont la possibilité de commenter, partager et recommander des ensembles de données afin que les collègues puissent avoir une compréhension immédiate de ce qu'ils interrogent. De plus, les administrateurs informatiques peuvent mettre en place une gestion des utilisateurs pour s'assurer que les employés non autorisés n'accèdent pas aux données sensibles.
Les catalogues de données d'apprentissage automatique sont le plus souvent mis en œuvre par des entreprises qui ont plusieurs sources de données, recherchent une source unique de vérité et tentent de généraliser l'utilisation des données à l'échelle de l'entreprise. Ces produits sont généralement administrés par les départements informatiques, qui peuvent maintenir l'organisation et la sécurité, mais les données peuvent être accessibles par les data scientists ou les analystes et l'utilisateur professionnel moyen. Les données peuvent ensuite être transformées, modélisées et visualisées soit directement dans le catalogue de données d'apprentissage automatique, soit par une intégration avec un logiciel de business intelligence.
Il convient de noter que tous les catalogues de données d'apprentissage automatique ne fournissent pas de capacités de préparation des données et peuvent nécessiter une intégration avec une plateforme de business intelligence. De plus, ces outils diffèrent des logiciels de gestion des données de référence en raison de leur gouvernance améliorée, de leur collaboration et de leur fonctionnalité d'apprentissage automatique.
Pour être inclus dans la catégorie des catalogues de données d'apprentissage automatique, un produit doit :
Organiser et consolider les données de toutes les sources de l'entreprise dans un seul référentiel
Fournir une gestion des accès utilisateurs à des fins de sécurité et de gouvernance des données
Permettre aux utilisateurs professionnels de rechercher et d'accéder aux données depuis le catalogue
Offrir des fonctionnalités de collaboration autour des ensembles de données, y compris la catégorisation, le commentaire et le partage
Donner des recommandations intelligentes basées sur l'apprentissage automatique pour un accès plus rapide aux données pertinentes