Los catálogos de datos de aprendizaje automático permiten a las empresas categorizar, acceder, interpretar y colaborar en torno a los datos de la empresa a través de múltiples fuentes de datos, mientras mantienen un alto nivel de gobernanza y gestión de acceso. La inteligencia artificial es clave para muchas características de los catálogos de datos de aprendizaje automático, habilitando funcionalidades como recomendaciones de aprendizaje automático, consultas en lenguaje natural y enmascaramiento dinámico de datos para mejorar la seguridad.
Las empresas pueden utilizar catálogos de datos de aprendizaje automático para mantener conjuntos de datos en una única ubicación, de modo que la búsqueda y el descubrimiento de datos sea sencillo tanto para los usuarios empresariales cotidianos como para los analistas. Los usuarios tienen la capacidad de comentar, compartir y recomendar conjuntos de datos para que los colegas puedan tener una comprensión inmediata de lo que están consultando. Además, los administradores de TI pueden implementar la provisión de usuarios para garantizar que los empleados no autorizados no accedan a datos sensibles.
Los catálogos de datos de aprendizaje automático son implementados con mayor frecuencia por empresas que tienen múltiples fuentes de datos, están buscando una única fuente de verdad y están intentando escalar el uso de datos en toda la empresa. Estos productos son generalmente administrados por departamentos de TI, que pueden mantener la organización y la seguridad, pero los datos pueden ser accedidos por científicos de datos o analistas y el usuario empresarial promedio. Los datos pueden luego ser transformados, modelados y visualizados ya sea directamente en el catálogo de datos de aprendizaje automático o a través de una integración con software de inteligencia empresarial.
Debe tenerse en cuenta que no todos los catálogos de datos de aprendizaje automático proporcionan capacidades de preparación de datos y pueden requerir una integración con una plataforma de inteligencia empresarial. Además, estas herramientas difieren del software de gestión de datos maestros debido a su mejorada gobernanza, colaboración y funcionalidad de aprendizaje automático.
Para calificar para la inclusión en la categoría de Catálogo de Datos de Aprendizaje Automático, un producto debe:
Organizar y consolidar datos de todas las fuentes de la empresa en un único repositorio
Proporcionar gestión de acceso de usuarios para propósitos de seguridad y gobernanza de datos
Permitir a los usuarios empresariales buscar y acceder a los datos desde dentro del catálogo
Ofrecer características de colaboración en torno a conjuntos de datos, incluyendo categorización, comentarios y compartición
Dar recomendaciones inteligentes basadas en aprendizaje automático para un acceso más rápido a datos relevantes