El software de reconocimiento de imágenes, o visión por computadora, permite a las aplicaciones entender imágenes o videos. Este software toma imágenes como entrada, y un algoritmo de visión por computadora proporciona una salida, como una etiqueta o un cuadro delimitador.
Algunos otros aspectos del reconocimiento de imágenes incluyen la restauración de imágenes, el reconocimiento de objetos y la reconstrucción de escenas. Estas capacidades suelen estar integradas dentro de aplicaciones inteligentes.
El software de reconocimiento de imágenes puede ser utilizado por científicos de datos para entrenar modelos de reconocimiento de imágenes, así como por desarrolladores que buscan añadir características de reconocimiento de imágenes a otro software. El tipo de usuario determinaría el formato en el que se accede a este software, ya sea a través de una biblioteca o marco de aprendizaje automático, una API o SDK, o una plataforma de extremo a extremo.
Este tipo de software debe distinguirse de formas relacionadas de software. Por ejemplo, aunque las plataformas de ciencia de datos y aprendizaje automático frecuentemente proporcionan herramientas para entrenar modelos de visión por computadora, están enfocadas de manera amplia y no están orientadas exclusivamente al reconocimiento de imágenes.
Además, aunque el reconocimiento de imágenes es técnicamente una forma de aprendizaje automático (ML), la categoría de aprendizaje automático se centra en herramientas, como software, APIs, SDKs y marcos, que proporcionan otras capacidades de ML como motores de recomendación y reconocimiento de patrones. Además, el software que está diseñado específicamente para el reconocimiento de texto se puede encontrar en la categoría de reconocimiento óptico de caracteres (OCR).
Aunque muchas soluciones de reconocimiento de imágenes son multipropósito y permiten el reconocimiento de varios tipos de imágenes y objetos, algunas tienen enfoques particulares.
Estos enfoques incluyen la detección de logotipos, el reconocimiento facial, la detección de objetos y la detección de contenido explícito. Además, algunos de estos productos solo pueden manejar archivos de imagen, mientras que otros pueden manejar videos también.
Finalmente, aunque la mayoría de estas herramientas funcionan en la nube (es decir, se debe enviar la imagen a la nube para ser procesada), algunas proporcionan la capacidad de procesamiento de imágenes en el borde o en el dispositivo.
Para calificar para la inclusión en la categoría de Reconocimiento de Imágenes, un producto debe:
Proporcionar un algoritmo de aprendizaje profundo específicamente para el reconocimiento de imágenes
Conectarse con grupos de datos de imágenes para aprender una solución o función específica
Consumir los datos de imagen como entrada y proporcionar una salida
Proporcionar capacidades de reconocimiento de imágenes a otras aplicaciones, procesos o servicios