Niet-standaard codering

Bij de meeste bronbestanden is sprake van standaard tekencodering, maar sommige bestanden gebruiken een interne bestandsspecifieke oplossing. Voor de conversie van dergelijke bestanden gebruikt PDF Professional optische tekenherkenning (OCR, Optical Character Recognition).

 

Als u tekst wilt extraheren via de ingebouwde OCR-module, selecteert u onder Verwerkingsopties de optie Pagina’s met niet-standaard codering herkennen. Deze optie vindt u in de vier verwerkingsvensters (Standaarddocument, Juridisch, Spreadsheet en Formulier). Standaard is deze optie geselecteerd. Zie Standaarddocument voor meer informatie.

 

 

Niet-standaard codering