Когда использовать программу OmniPage
В программе PDF Professional реализована эффективная встроенная функция оптического распознавания текста, аналогичная распознаванию текста в программе OmniPage 17.
Вместе с тем у программы оптического распознавания текста (OCR) Nuance® OmniPage® есть определенные преимущества, поскольку она обеспечивает дополнительные возможности управления распознаванием текста.
-
Преобразование выбранных областей страницы.
-
Выбор из четырех уровней форматирования вместо двух (см. ниже).
-
Полный контроль над процессом оптического распознавания текста, включая:
-
-
возможность выделения областей на странице вручную;
-
доступ к многоязычным средствам проверки орфографии и редактирования;
-
вывод изображения с динамической проверкой для ускорения редактирования;
-
возможность воспроизведения записанного голоса;
-
и многое другое.
-
-
Сканирование новых страниц в преобразованный документ.
-
Добавление новых страниц из факсимильных файлов или файлов изображений.
-
Сохранение файлов в других форматах, включая внутренний формат OmniPage для обмена документами с другими пользователями OmniPage.
Для сохранения в OmniPage предлагаются четыре уровня форматирования.
1. Cтраница с поточным текстом
На страницах сохраняется макет исходных документов. Графические элементы и элементы в рамках размещаются в текстовых блоках. По возможности остальной текст переносится без использования текстовых блоков. В программе PDF Professional такой вариант называется «Колонка с поточным текстом». См. раздел Стандартный документ.
2. True Page
На страницах сохраняется макет исходных документов, но все элементы размещаются в текстовых блоках, включая текст в колонках. Программа PDF Professional предоставляет возможность такого форматирования. См. раздел Стандартный документ.
3. Форматированный текст
Колонки из текста убираются, но атрибуты текста, графические изображения и таблицы сохраняются.
4. Простой текст
Колонки из текста убираются, а документ преобразуется в простой текст. Графические изображения и таблицы сохраняются, но не на своих исходных местах. Этот вариант удобен для пользователей, которым нужно переформатировать содержимое документа.