O software de reconhecimento de imagem, ou visão computacional, permite que aplicativos compreendam imagens ou vídeos. Este software recebe imagens como entrada, e um algoritmo de visão computacional fornece uma saída, como um rótulo ou caixa delimitadora.
Alguns outros aspectos do reconhecimento de imagem incluem restauração de imagem, reconhecimento de objetos e reconstrução de cena. Essas capacidades são tipicamente incorporadas em aplicativos inteligentes.
O software de reconhecimento de imagem pode ser usado por cientistas de dados para treinar modelos de reconhecimento de imagem, bem como por desenvolvedores que desejam adicionar recursos de reconhecimento de imagem a outros softwares. O tipo de usuário determinaria o formato em que este software é acessado, seja por meio de uma biblioteca ou framework de aprendizado de máquina, uma API ou SDK, ou uma plataforma de ponta a ponta.
Este tipo de software deve ser distinguido de formas relacionadas de software. Por exemplo, embora plataformas de ciência de dados e aprendizado de máquina frequentemente forneçam ferramentas para treinar modelos de visão computacional, elas são amplamente focadas e não voltadas exclusivamente para reconhecimento de imagem.
Além disso, enquanto o reconhecimento de imagem é tecnicamente uma forma de aprendizado de máquina (ML), a categoria de aprendizado de máquina é focada em ferramentas, como software, APIs, SDKs e frameworks, que fornecem outras capacidades de ML, como motores de recomendação e reconhecimento de padrões. Além disso, software que é especificamente projetado para o reconhecimento de texto pode ser encontrado na categoria de reconhecimento óptico de caracteres (OCR).
Embora muitas soluções de reconhecimento de imagem sejam multifuncionais e permitam o reconhecimento de vários tipos de imagens e objetos, algumas têm focos particulares.
Esses focos incluem detecção de logotipo, reconhecimento facial, detecção de objetos e detecção de conteúdo explícito. Além disso, alguns desses produtos podem lidar apenas com arquivos de imagem, enquanto outros podem lidar com vídeos também.
Finalmente, enquanto a maioria dessas ferramentas funciona na nuvem (ou seja, é necessário enviar a imagem para a nuvem para ser processada), algumas fornecem a capacidade de processamento de imagem na borda ou no dispositivo.
Para se qualificar para inclusão na categoria de Reconhecimento de Imagem, um produto deve:
Fornecer um algoritmo de aprendizado profundo especificamente para reconhecimento de imagem
Conectar-se a pools de dados de imagem para aprender uma solução ou função específica
Consumir os dados de imagem como entrada e fornecer uma saída
Fornecer capacidades de reconhecimento de imagem para outros aplicativos, processos ou serviços