Как сохранить документ в формате tiff многостраничный finereader
Для удобства сканирования большого количества страниц в программе ABBYY FineReader предусмотрен специальный режим сканирования: Сканировать несколько страниц. Он позволяет отсканировать несколько страниц подряд. Для того чтобы включить этот режим, отметьте опцию Сканировать несколько страниц на закладке Сканировать/Открыть диалога Опции (меню Сервис > Опции). При этом:
- при сканировании через TWAIN с использованием интерфейса ABBYY FineReader по окончании сканирования страницы сканер автоматически начинает сканирование следующей;
- при сканировании через TWAIN с использованием интерфейса TWAIN-драйвера сканера Twain-диалог сканера не закрывается после окончания сканирования первой страницы. Вы можете положить следующую страницу в сканер и отсканировать ее и т.д.
Вы можете отсканировать большое количество страниц двумя путями: с использованием автоподатчика (ADF) и без него.
При использовании автоподатчика (ADF)
Интерфейс ABBYY FineReader. В диалоге Настройки сканера отметьте опцию Загружать страницы из автоподатчика бумаги и запустите сканирование, нажав кнопку 1-Сканировать.
Интерфейс TWAIN-драйвера сканера. В TWAIN-диалоге сканера отметьте опцию использования автоподатчика (эта опция может называться по-разному в зависимости от модели сканера; см. документацию, поставляемую со сканером) и запустите сканирование, нажав кнопку 1-Сканировать.
Замечание. Для того чтобы открыть диалог Настройки сканера, щелкните по кнопке Настройки сканера на закладке Сканировать / Открыть диалога Опции (меню Сервис / Опции).
Без использования автоподатчика (ADF)
Интерфейс ABBYY FineReader
Для удобства сканирования нескольких страниц подряд на планшетном сканере без автоподатчика:
-
Установите величину паузы (время от окончания сканирования одной страницы до начала сканирования следующей). Для этого в диалоге Настройки сканера отметьте опцию Пауза между страницами и установите величину паузы в секундах.
В этом случае после сканирования первой страницы сканер делает указанную паузу, во время которой вы вставляете в сканер следующую страницу. Затем сканирование автоматически продолжается.
Замечание. Для того чтобы открыть диалог Настройки сканера, щелкните по кнопке Настройки сканера на закладке Сканировать / Открыть диалога Опции (меню Сервис / Опции).
Интерфейс TWAIN-драйвера сканера
Убедитесь в том, что на закладке Сканировать/Открыть диалога Опции (меню Сервис > Опции) отмечен пункт Сканировать несколько страниц. Для начала сканирования в открывшемся TWAIN-диалоге сканера нажмите кнопку Scan (Final и т.д., название кнопки зависит от конкретной реализации TWAIN-драйвера сканера).
Для продолжения сканирования нажмите на кнопку Scan в Twain-диалоге сканера.
Для завершения сканирования в Twain-диалоге сканера нажмите на кнопку Close (или аналогичную ей по смыслу).
Совет: Чтобы вы могли контролировать результаты сканирования, в группе Вид диалога Дополнительные опции отметьте опцию Открывать изображения по мере сканирования. (Для того чтобы открыть диалог Дополнительные опции, щелкните по кнопке Дополнительные опции на закладке Общие диалога Опции). В этом случае по окончании сканирования страницы отсканированное изображение появится в окне Изображение. Если изображение отсканировано неверно, остановите сканирование (в меню Файл выберите пункт Остановить сканирование) и отсканируйте изображение заново.
Как отсканировать документ в многостраничный файл tiff?
Если программное обеспечение сканера не позволяет сохранять в формате tiff, то можно поступить так:
сначала отсканировать страницы документа в другом графическом формате (например, jpg), сохранять при этом стоит всё в одну папку.
затем из полученных изображений создать файл в формате tiff.
Файл tiff можно создать как в специализированных программах по работе с данным форматом, так и в более-менее продвинутых графических редакторах.
Рассмотрим, например, бесплатную программу IrfanView.
Порядок действий будет таким:
1) В главном меню нужно выбрать "Options" -> "Multipage images" -> "Create Multipage Tiff".
В русифицированной версии - "Сервис" -> "Многостраничные файлы" -> "Создать многостраничный TIFF".
2) Появится такое окно:
Для того, чтобы добавить сканы, нужно нажать на "Add images".
Чтобы расположить их в нужной последовательности используйте кнопки "Move files up" ("Выше") и "Move files down" ("Ниже").
Можно задать опции файла - для этого нажмите на "Options".
В поле "Save directory" ("Папка для сохранения файла") указывается место, куда нужно сохранить ваш tiff.
В поле "Result filename" ("Имя результирующего файла") нужно написать имя файла.
3) Для создания файла tiff нажмите на кнопку "Create TIF image" ("Создать файл TIF").
Данный формат Tiff сейчас весьма популярен. Если необходимо сканировать в этом формате, сначала смотрим в настройках сканера, можно ли сразу сохранить сканкопию в нужном формате. Если такой возможности нет, проще всего воспользоваться конвертером документов. Первым делом сканируем нужный документ в том формате, который есть у сканера. В основном это jpg. Вы можете скачать программу преобразования файлов или преобразовать файл онлайн.
Затем выбираем «Параметры» — «Многостраничные изображения» — «Создать многостраничный Tiff» в главном меню. Потом, если программа на русском языке, то следует выбрать: Сервис - Многостраничные файлы, а затем - Создать многостраничный тифф. Таким образом, окна становятся видимыми, и чтобы расположить их по порядку, используйте Верхнее или Нижнее. Потом, в папке для сохранения файла указываем место сохранения. В поле получившегося файла укажите имя. Затем нажмите, чтобы создать - Создать файл TIF.
Кроме обычных форматов графических файлов (с расширением jpg, png, bmp и т.д.), которые обычно содержат в себе одну страницу графического файла, существуют также форматы графических файлов, которые поддерживают многостраничные изображения. Одним из них является формат с расширением tiff (Tagged Image File Format). Существует как трёхбуквенное расширение данного формата файла tif, так и четырёхбуквенное tiff. На самом деле это один и тот же формат файла, который, будучи в оригинале четырёхбуквенным, стал трёхбуквенным потому, что у ранних версий Windows было обязательное требование, чтобы все расширение файлов этой операционной системы были трёхзначными.
Также иногда необходимо отсканировать несколько страниц какой-либо книги, или небольшую брошюру, и затем свести все эти отдельные файлы страниц в один файл на компьютере. Для решения таких задач я обычно использую маленькую, но очень мощную и удобную программу IrfanView. Я уже описывал кратко её возможности в статье «Полезные программы для компьютера»
Скачивание и установка IrfanView
Программа IrfanView является бесплатной графической программой, небольшой по размеру, но имеющей очень мощный функционал. Учитывая, что при этом она также поддерживает русский язык, она стала для меня одной из самых необходимых на компьютере для просмотра и редактирования фотографий. По сути, в симбиозе со встроенным в Windows Paint’ом, это маленький аналог Фотошопа.
Если вы выбрали первый способ, то на официальном сайте нажимаем на ссылку, указанную на скриншоте ниже (сайт англоязычный, поэтому я показал ниже, как скачать самую свежую версию программы):
После скачивания устанавливаем программу (просто нажимаем «Далее», или «Next» на предложения установки программы). Значок программы напоминает красную распластавшуюся кошку:
Русификация программы IrfanView
Русский язык для интерфейса программы можно скачать с того же сайта, в левом меню «IrfanView languages»
Затем находим в списке русский язык и скачиваем Installer:
Затем устанавливаем скачанный файл, и IrfanView становится программой на русском языке, как показано ниже.
Если по какой-то причине программа не перешла на русский язык автоматически, то зайдите в меню «Options», далее «Change language», и затем выберите русский язык, и нажмите «ОК»:
Создание многостраничного tif файла
Итак, программа установлена, русифицирована, и теперь можно перейти непосредственного к созданию многостраничного tif файла, состоящего из нескольких последовательных изображений.
У меня есть семь страниц только что отсканированной брошюры, которые мне необходимо свести в один графический файл tif. Пока что они все находятся по отдельности и выглядят так:
Открываем IrfanView, заходим в пункт меню «Сервис», далее «Многостраничные изображения», затем «Создать многостраничный файл TIFF»:
Открывается новое окно, в котором мы будем создавать наш многостраничный tiff из наших отдельных файлов.
Нажимаем справа самую верхнюю кнопку «Добавить изображения», находим и выделяем мышкой все файлы, которые нам необходимо объединить (в нашем примере это 7 файлов), при этом желательно предварительно эти файлы пронумеровать в правильной последовательности, чтобы в созданном многостраничном файле они шли в правильном порядке. У меня после добавления эти файлы выглядят вот так:
Также я рекомендую войти в пункт меню справа «Параметры сохранения» и выбрать сжатие файлов TIFF при сохранении JPEG или ZIP, чтобы в итоге файл получился не очень большой по размеру:
Далее через кнопку «Обзор» указываем папку для сохранения создаваемого файла, и ниже можем сразу задать имя получаемого файла (только не меняйте расширение tif). Также можно воспользоваться возможностью сортировки исходных файлов, но если вы их изначально правильно пронумеровали, то в этом нет необходимости.
После всех приготовлений нажимаем снизу слева кнопку «Создать файл TIF»:
В итоге у вас создаётся многостраничный файл tif (в нашем примере создался семистраничный файл «Брошюра.tif»).
Открываем полученный файл «Брошюра.tif», и видим, что в нём ровно 7 страниц. Перелистывать страницы многостраничного файла можно либо указанными на скриншоте ниже кнопками, либо комбинациями клавиш «Ctrl» + «Page Down» (следующая страница), либо «Ctrl» + «Page Up» (предыдущая страница).
Итак, сегодня мы скачали и установили замечательную программу IrfanView, русифицировали её, а также научились создавать многостраничные файлы tiff. Если у вас появятся дополнительные вопросы, прошу задавать их в комментариях.
Пользовательские сценарии предоставляют большее разнообразие шагов по сравнению со встроенными сценариями. Последовательность шагов сценария должна соответствовать этапам обработки документа в программе ABBYY FineReader. При этом шаги получение изображения, распознавание и сохранение являются обязательными, а шаги проверка результатов и анализ страницы — необязательные.
При создании пользовательского сценария на каждом шаге выберите одно из предложенных действий:
-
Получение изображения
Данный шаг всегда первый в сценарии, его цель — получение изображения для дальнейшей обработки.
Выберите один из предложенных способов получения изображения:
- Сканировать изображения
Сканирование выполняется с текущими настройками программы. - Открыть изображения
Укажите папку, из которой в программу будут добавляться изображения при запуске сценария. - Открыть документ FineReader
Укажите документ ABBYY FineReader, из которого будут обрабатываться изображения при запуске сценария.
- Если при выполнении сценария изображения добавляются в документ, уже содержащий изображения, то будет выполнена обработка только добавленных изображений. Если же в ходе выполнения сценария должен быть обработан новый документ, то будут обработаны все изображения из этого документа.
- Если при выполнении сценария должен быть обработан документ ABBYY FineReader, в котором есть распознанные страницы, и страницы, на которых уже была выполнена разметка областей, то распознанные страницы повторно обрабатываться не будут, страницы с размеченными областями будут распознаны.
Данный шаг является необязательным. Позволяет настроить использование шаблонов областей.
- Загрузить шаблон областей
Укажите путь к файлу шаблона областей. - Анализ макета страницы
После получения изображения программа ABBYY FineReader выполнит анализ изображений и разметит на них области. Если вы хотите нарисовать области вручную, включите опцию Выделять области вручную.
Данный шаг позволяет распознать изображения.
- Распознать документ FineReader
Распознавание выполняется с текущими настройками ABBYY FineReader 10
Данный шаг является необязательным. Позволяет настроить проверку результатов распознавания.
- Проверка
Выберите способ проверки распознанного текста.
Данный шаг позволяет сохранить распознанный текст в файлы различных форматов или передать его в выбранное приложение. Пользовательский сценарий может содержать несколько шагов сохранения.
Сохранить документ
Вы можете указать имя файла, формат, папку, в которую будет помещен файл с распознанным текстом, а также опции файла.
Замечание. Для того чтобы при каждом выполнении вам не приходилось задавать новую папку (т.е. перенастраивать сценарий), отметьте опцию При каждом запуске сценария сохранять файлы в новую папку, к имени которой добавлять время и дату.
- Передать документ в…
Выберите нужное приложение из выпадающего списка.
При выполнении сценария распознанный текст будет помещен в новый файл, открытый в выбранном приложении.
Внимание! В данном случае распознанный текст не сохраняется на диск.
Замечание. Для того чтобы сохранить все изображения в один файл, отметьте опцию Сохранить в один многостраничный файл (только для форматов TIFF и PDF).
Как сохранить текст в формат PDF:
- На главной панели инструментов в выпадающем списке выберите режим сохранения оформления документа.
- Воспользуйтесь пунктом меню Файл>Сохранить документ как>Документ PDF или кнопкой сохранения результатов на главной панели инструментов. Нажмите на стрелку возле кнопки сохранения результатов и выберите из списка формат сохранения. Если нужного формата в списке нет, выберите пункт Сохранить в другом формате…, и в открывшемся диалоге сохранения выберите требуемый формат.
Совет. В случае необходимости вы можете настроить дополнительные опции сохранения на закладке Сохранить > PDF диалога Опции (меню Сервис>Опции… ).
Данная закладка содержит следующие группы настроек:
Вы можете указать размер бумаги, который будет использован при сохранении результатов распознавания в формат PDF. Размер бумаги задается в выпадающем списке Размер бумаги по умолчанию .
Выбор режима сохранения зависит от того, как вы будете использовать созданный документ в дальнейшем:
- Только текст и картинки
В данном режиме сохраняются распознанный текст и иллюстрации. PDF-файл такого типа имеет относительно небольшой размер, и в нем возможен полнотекстовый поиск. Внешний вид документа может незначительно отличаться от оригинала. - Текст поверх изображения страницы
В данном режиме сохраняются фон и иллюстрации исходного документа, на них накладывается распознанный текст. Обычно размер такого PDF-файла больше, чем файла, получаемого при сохранении в режиме Только текст и картинки . В PDF-документе этого типа есть возможность полнотекстового поиска, однако внешний вид документа может незначительно отличаться от оригинала. - Текст под изображением страницы
В данном режиме сохраняется изображение страницы, распознанный текст помещается на невидимый слой под изображением. Таким образом, получается документ с возможностью поиска по тексту, при этом внешний вид PDF-документа практически неотличим от оригинала. - Только изображение
В данном режиме сохраняется изображение страницы. Внешний вид полученного PDF-документа будет не отличим от оригинала, однако в таком документе невозможен поиск по тексту.
В зависимости от выбранного режима сохранения могут быть доступны следующие опции:
- Сохранять цвет фона и букв
Указывает, что при сохранении текста в формат PDF будет сохранен цвет букв и фона. - Сохранять колонтитулы
Отметьте эту опцию, если вы хотите, чтобы текст колонтитулов был сохранен. Если данная опция отключена, текст колонтитулов сохраняться не будет. - Разрешить теги PDF (для Acrobat 5.0 или более поздней версии)
Указывает, что при сохранении распознанного текста в формате PDF будут автоматически сохранены теги PDF.
Помимо текста и иллюстраций PDF-файлы могут содержать информацию о структуре документа: логических частях, иллюстрациях и таблицах. Эта информация хранится в виде тегов PDF. Теги PDF обеспечивают удобство просмотра документа на экранах различного размера, например, на экранах карманных компьютеров.
Внимание! Если распознанный текст содержит иврит или идиш, создание PDF-документа с тегами невозможно. Данная функциональность не поддерживается.
Если распознанный текст содержит большое количество иллюстраций, то размер конечного файла может быть очень большим. Качество картинок и размер полученного файла зависят от выбранного значения в выпадающем списке группы Качество картинок .
- Для того чтобы задать параметры сохранения картинок, выберите пункт Пользовательское . В открывшемся диалоговом окне Параметры сохранения картинок выберите необходимые значения и нажмите кнопку ОК.
- Если вы не хотите сохранять иллюстрации в распознанном тексте, убедитесь, что опция Сохранять картинки не отмечена.
При сохранении распознанного текста в формат PDF можно использовать стандартные шрифты Acrobat или системные шрифты, установленные на компьютере пользователя. Для того чтобы указать, какой набор шрифтов должен быть использован, в выпадающем списке Шрифт выберите:
- Использовать стандартные шрифты
При выборе данной опции PDF-файл содержит ссылку на стандартные шрифты Acrobat: TimesNewRoman, Arial, CourierNew. - Использовать системные шрифты
При выборе данной опции PDF-файл содержит ссылку на системные шрифты, установленные на компьютере пользователя.
Если вы не хотите встраивать какие-либо привязки к шрифтам в создаваемый PDF-документ, убедитесь, что опция Встраивать шрифты не отмечена.
Вы можете задать пароли, защищающие ваш PDF-документ от несанкционированного открытия, печати и редактирования:
Читайте также: