Il software di riconoscimento delle immagini, o visione artificiale, consente alle applicazioni di comprendere immagini o video. Questo software prende le immagini come input e un algoritmo di visione artificiale fornisce un output, come un'etichetta o un riquadro di delimitazione.
Altri aspetti del riconoscimento delle immagini includono il ripristino delle immagini, il riconoscimento degli oggetti e la ricostruzione delle scene. Queste capacità sono tipicamente integrate all'interno di applicazioni intelligenti.
Il software di riconoscimento delle immagini può essere utilizzato dai data scientist per addestrare modelli di riconoscimento delle immagini, così come dagli sviluppatori che desiderano aggiungere funzionalità di riconoscimento delle immagini ad altri software. Il tipo di utente determinerebbe il formato in cui questo software viene accesso, che sia tramite una libreria o un framework di apprendimento automatico, un'API o un SDK, o una piattaforma end-to-end.
Questo tipo di software dovrebbe essere distinto da forme di software correlate. Ad esempio, sebbene le piattaforme di data science e machine learning forniscano frequentemente strumenti per l'addestramento di modelli di visione artificiale, sono ampiamente focalizzate e non esclusivamente orientate al riconoscimento delle immagini.
Inoltre, mentre il riconoscimento delle immagini è tecnicamente una forma di apprendimento automatico (ML), la categoria dell'apprendimento automatico è focalizzata su strumenti, come software, API, SDK e framework, che forniscono altre capacità di ML come motori di raccomandazione e riconoscimento di pattern. Inoltre, il software specificamente progettato per il riconoscimento del testo può essere trovato nella categoria del riconoscimento ottico dei caratteri (OCR).
Sebbene molte soluzioni di riconoscimento delle immagini siano multifunzionali e consentano il riconoscimento di vari tipi di immagini e oggetti, alcune hanno particolari focalizzazioni.
Queste focalizzazioni includono il rilevamento di loghi, il riconoscimento facciale, il rilevamento di oggetti e il rilevamento di contenuti espliciti. Inoltre, alcuni di questi prodotti possono gestire solo file di immagini, mentre altri possono gestire anche video.
Infine, mentre la maggior parte di questi strumenti funziona nel cloud (cioè, si deve inviare l'immagine al cloud per essere elaborata), alcuni forniscono la possibilità di elaborare le immagini al margine o sul dispositivo.
Per qualificarsi per l'inclusione nella categoria del Riconoscimento delle Immagini, un prodotto deve:
Fornire un algoritmo di deep learning specificamente per il riconoscimento delle immagini
Connettersi con pool di dati di immagini per apprendere una soluzione o funzione specifica
Consumare i dati delle immagini come input e fornire un output
Fornire capacità di riconoscimento delle immagini ad altre applicazioni, processi o servizi