L’OCR incorporato
L’OCR è la procedura di estrazione del testo da un’immagine. L’immagine può essere ottenuta mediante digitalizzazione di un documento cartaceo oppure aprendo un file d’immagine elettronico o un file PDF. Le immagini non contengono caratteri di testo modificabili: sono formate da molti piccoli punti (pixel) che compongono le forme dei caratteri, che rappresentano il testo di una pagina.
Dall’immagine del carattere… |
al testo modificabile |
|
|