Os catálogos de dados de aprendizado de máquina permitem que as empresas categorizem, acessem, interpretem e colaborem em torno dos dados da empresa a partir de várias fontes de dados, mantendo um alto nível de governança e gerenciamento de acesso. A inteligência artificial é fundamental para muitos recursos dos catálogos de dados de aprendizado de máquina, possibilitando funcionalidades como recomendações de aprendizado de máquina, consultas em linguagem natural e mascaramento dinâmico de dados para fins de segurança aprimorada.
As empresas podem utilizar catálogos de dados de aprendizado de máquina para manter conjuntos de dados em um único local, de modo que a busca e descoberta de dados seja simples tanto para usuários de negócios do dia a dia quanto para analistas. Os usuários têm a capacidade de comentar, compartilhar e recomendar conjuntos de dados para que os colegas possam ter uma compreensão imediata do que estão consultando. Além disso, os administradores de TI podem implementar o provisionamento de usuários para garantir que funcionários não autorizados não acessem dados sensíveis.
Os catálogos de dados de aprendizado de máquina são mais frequentemente implementados por empresas que possuem múltiplas fontes de dados, estão em busca de uma única fonte de verdade e estão tentando escalar o uso de dados em toda a empresa. Esses produtos são geralmente administrados por departamentos de TI, que podem manter a organização e a segurança, mas os dados podem ser acessados por cientistas de dados ou analistas e pelo usuário médio de negócios. Os dados podem então ser transformados, modelados e visualizados diretamente no catálogo de dados de aprendizado de máquina ou por meio de uma integração com software de inteligência de negócios.
Deve-se notar que nem todos os catálogos de dados de aprendizado de máquina fornecem capacidades de preparação de dados e podem exigir uma integração com uma plataforma de inteligência de negócios. Além disso, essas ferramentas diferem do software de gerenciamento de dados mestres devido à sua governança aprimorada, colaboração e funcionalidade de aprendizado de máquina.
Para se qualificar para inclusão na categoria de Catálogo de Dados de Aprendizado de Máquina, um produto deve:
Organizar e consolidar dados de todas as fontes da empresa em um único repositório
Fornecer gerenciamento de acesso de usuários para fins de segurança e governança de dados
Permitir que usuários de negócios busquem e acessem os dados de dentro do catálogo
Oferecer recursos de colaboração em torno de conjuntos de dados, incluindo categorização, comentários e compartilhamento
Dar recomendações inteligentes baseadas em aprendizado de máquina para acesso mais rápido a dados relevantes