El programa incorporado de OCR
El OCR es el proceso que consiste en extraer texto a partir de una imagen. Esta imagen puede originarse a partir de la digitalización de un documento impreso, de la apertura de un archivo electrónico de imagen o de un archivo PDF. Las imágenes no incluyen caracteres de texto modificables, sino que están compuestas por muchos puntos minúsculos (píxeles) que forman los caracteres. Dichos puntos presentan un dibujo del texto en una página.
A partir de una imagen del carácter… |
se genera texto modificable |
|
|