Il software di riconoscimento ottico dei caratteri (OCR), chiamato anche acquisizione di documenti, è la tecnologia utilizzata per convertire la maggior parte dei tipi di immagini contenenti testo scritto in dati di testo leggibili dalla macchina. Una volta che i documenti scansionati subiscono l'elaborazione OCR, il testo può essere modificato utilizzando elaboratori di testi. Il software OCR ha una vasta gamma di casi d'uso grazie alla sua funzionalità di base. Questi strumenti possono essere utilizzati praticamente da qualsiasi team all'interno di un'organizzazione, in particolare dai team di contabilità, risorse umane e inserimento dati per ottenere informazioni importanti da grandi quantità di file sia cartacei che digitali. Il miglior software OCR può ridurre notevolmente il tempo dedicato all'inserimento manuale, minimizzare errori critici e migliorare gli sforzi di rilevamento delle frodi. Alcuni strumenti in questa categoria possono anche rendere i documenti ricercabili e ordinati in modo ordinato per un accesso successivo da parte delle persone necessarie all'interno dell'organizzazione.
Il software OCR tradizionale ha una funzionalità limitata ma fondamentalmente potente. Recentemente, una versione avanzata della tecnologia OCR, chiamata software di elaborazione intelligente dei documenti (IDP), si è evoluta dalle limitazioni dell'OCR. La categoria OCR di G2 contiene entrambi i tipi di prodotti: software OCR puro e software IDP. Il software OCR puro ha tutte le funzionalità e i casi d'uso elencati sopra. Il software IDP ha anche tutte le funzionalità del software OCR, tuttavia, utilizza anche tecnologie avanzate come il software di apprendimento automatico, il software di elaborazione del linguaggio naturale (NLP) e il software di riconoscimento delle immagini per scansionare documenti in modo intelligente e migliorare continuamente in base ai modelli e al comportamento degli utenti. Questi prodotti si differenziano anche dal software OCR puro poiché si occupano solo della semplice scansione di un documento, non dell'analisi delle informazioni da esso. Poiché il testo estratto utilizzando questa tecnologia ha un significato, questi dati possono essere utilizzati per processi a valle. Pertanto, il software IDP può essere integrato con varie applicazioni, sistemi e altre piattaforme di automazione.
Il software OCR è spesso considerato una tecnologia nascosta perché viene utilizzato in molti altri prodotti software il cui scopo principale è diverso dall'elaborazione dei documenti. Molte opzioni software, come il software CRM, i sistemi ERP, il software di contabilità e il software di gestione dei contenuti aziendali (ECM) utilizzano tutti la tecnologia OCR per aumentare l'efficienza.
Per qualificarsi per l'inclusione nella categoria del Riconoscimento Ottico dei Caratteri (OCR), un prodotto deve:
Elaborare immagini digitali e/o scansioni di vari tipi di documenti
Identificare ed estrarre dati rilevanti all'interno dei documenti scansionati e convertirli in testo leggibile dalla macchina che può essere cercato e modificato
Assistere nella classificazione e nell'ordinamento dei file di documenti acquisiti