I documenti scansionati possono avere pagine con allineamento errato, basso contrasto, bassa luminosità e ruotate sottosopra. Questo può creare sfide durante l'elaborazione dei documenti utilizzando OCR, ICR, estrazione di testo, modellazione ML/AI basata su immagini, ecc. Questa soluzione incorpora modelli statistici che identificano l'angolo di inclinazione basato sull'orientamento del testo e sulla posizione del testo rispetto ai confini della pagina e corregge l'allineamento/l'inclinazione delle pagine. Identifica il contrasto tra lo sfondo e il testo nelle pagine del documento scansionato e regola il contrasto delle pagine a basso contrasto. Include anche modelli di deep learning che identificano se una pagina è sottosopra. I modelli sono addestrati su un ampio dataset di migliaia di pagine. Questo consente ai motori OCR/ICR di raggiungere una maggiore precisione e migliora le pipeline di estrazione del testo successive.