Abbyy hot folder что это
С выпуском обновлённой версии FineReader компания ABBYY кардинально изменила концепцию своего флагманского продукта и превратила его в универсальное программное решение, включающее не только средства оптического распознавания текста, но и внушительный набор инструментов для работы с бумажными и PDF-документами
Новый FineReader 14 можно сравнить со швейцарским ножом — теперь под его личиной кроются сразу четыре продукта именитого разработчика, объединённых в одну программу с единым рабочим окружением. Помимо успевшей зарекомендовать себя с наилучшей стороны системы оптического распознавания текста Optical Character Recognition (OCR), которая обеспечивает конвертирование отсканированных изображений, фотографий, документов или PDF-файлов в редактируемые электронные форматы, в составе программы представлены редактор PDF, инструмент «Сравнение документов» для сравнения документов различных форматов, включая бумажные и электронные, а также средства автоматизации задач по конвертации документов Hot Folder. Вряд ли кто-то мог предполагать, что в почти четвертьвековой истории развития FineReader (первая версия продукта увидела свет в 1993 году) случится такой крутой поворот, однако в ABBYY убеждены в правильности выбранного курса и уверены, что подобного рода перемены сделают программу ещё более востребованной в пользовательской среде.
Новая концепция FineReader 14
Своё стремление уйти от устоявшихся традиций в компании объясняют современными тенденциями развития рынка электронного документооборота. Согласно проведённым ABBYY исследованиям, сотрудники различных организаций регулярно сталкиваются со следующими сценариями работы с документами: преобразование изображений и PDF-файлов в редактируемые форматы и внесение в них правок; сравнение документов разных форматов; создание, просмотр и редактирование PDF-файлов, а также извлечение из них данных. При этом типичный пользователь имеет дело с четырьмя и более сценариями и для решения каждой задачи использует разные программные продукты. В результате получается так, что вместо того, чтобы выполнять свою задачу, сотрудник компании занимается тем, что изучает эти инструменты и переключается между ними в процессе работы. Это очень неудобно и, по сути, является бесполезной тратой ресурсов, правильно распорядиться которыми должен новый FineReader 14.
ABBYY FineReader 14 предоставляет широкий спектр возможностей в одной программе
Не остались без изменений в обновлённом FineReader и фирменные технологии оптического распознавания текста ABBYY OCR и обработки структуры документа Adaptive Document Recognition Technology. Приложение определяет расположение текста, тип и размер шрифта, начертание и другие особенности форматирования, а также воссоздаёт структурные элементы — таблицы и диаграммы, колонки, заголовки, сноски, колонтитулы, номера страниц. В результате пользователь получает электронную копию документа, идентичную оригиналу. Распознанный текст можно сохранить как текстовый документ (DOCX, ODT, RTF), электронную таблицу (XLSX), презентацию (PPTX), файл HTML, электронную книгу (ePub и FB2), а также в форматах PDF и PDF/A.
Профессиональные инструменты для распознавания текста
С помощью встроенного в программу редактора пользователь может сравнить в одном окне оригинальный документ и распознанную копию. Расширенные функции по редактированию позволяют корректировать форматирование документа, вносить правки в текст, редактировать изображения, искать информацию, управлять страницами документа. Кроме того, имеется возможность вручную задавать области для распознавания и даже научить программу распознаванию специфических шрифтов.
В четырнадцатую версию FineReader были добавлены новые языки распознавания: математические символы (для распознавания однострочных математических формул) и английская транскрипция. Таким образом, теперь программа умеет оперировать документами на 192 мировых языках и любых их комбинациях.
Также при подготовке FineReader 14 к выпуску специалисты ABBYY увеличили скорость обработки и точность распознавания документов, доработали средства конвертирования PDF-файлов с текстовым слоем, улучшили работу с таблицами, графиками, диаграммами и документами на арабском языке. Множеству доработок подверглись другие компоненты программного комплекса. В частности, теперь FineReader позволяет создавать PDF-документы из файлов различных редактируемых форматов (DOCX, XLSX, RTF и др.) и объединять их в один PDF-документ.
Самый важный компонент нового FineReader – PDF-редактор, построенный на базе программы ABBYY PDF Transformer+. Приложение позволяет выполнять рецензирование и согласование PDF-документов, а также предлагает полный набор функций для их защиты от несанкционированного доступа и изменений. Кроме того, приложение интегрировано с Adobe PDF Library , что обеспечивает гарантированное открытие любых PDF -файлов и возможность внесения в них изменений без преобразования в редактируемый формат. С прицелом на корпоративный сегмент рынка в программе предусмотрены инструменты удаления конфиденциальной информации, добавления цифровой подписи и разграничения прав на печать и редактирование документов.
Внесение изменений в текст PDF-документов
FineReader 14 позволяет преобразовывать PDF в популярные форматы Microsoft Word, Excel, PowerPoint, HTML, OpenOffice (ODT) и другие. При этом исходная структура и форматирование документа сохраняются. Благодаря упомянутой выше поддержке ePub и FB2, пользователи могут создавать из PDF-документов любительские электронные книги для чтения на планшетах и других портативных устройствах. Отдельно стоит отметить возможность создания PDF из файлов изображений (JPEG, JPEG2000, JBIG2, PNG, BMP, GIF, TIFF) и поддержку потокового конвертирования документов.
Пригодится новый FineReader и тем, кто по долгу службы часто сталкивается с процессом согласования договоров или работает с документами, для которых характерна версионность. Возможности инструмента «Сравнение документов» позволяют сверять документы в различных форматах, быстро находить даже самые мелкие несоответствия в тексте и предотвращать тем самым подписание или публикацию некорректной версии документа. Автоматическое сравнение документов поможет существенно сэкономить время юристам, менеджерам по продажам, финансистам, логистам, а также всем офисным сотрудникам, которые сталкиваются со сравнением документов — договоров, актов, прайс-листов или других материалов.
Параллельный просмотр различий
Проводить сравнение документов можно как в текстовых, так и в графических (отсканированные документы или их фотографии, PDF без текстового слоя и т. п.) форматах. Для удобства работы с полученными результатами все обнаруженные несоответствия отображаются на отдельной панели, а также подсвечиваются по тексту в обоих документах. Предусмотрена возможность создания подробного отчёта о различиях и последующего его сохранения в виде таблицы в формате Word или PDF-документа с комментариями в местах изменений. Полученную таблицу можно использовать для вставки в отчёт о согласовании документов или для ведения переговоров с контрагентом. Несущественные различия перед формированием отчёта можно удалить.
Сохранение результатов сравнения
Для предприятий среднего и крупного бизнеса в составе FineReader 14 представлено приложение-планировщик ABBYY Hot Folder, с помощью которого можно автоматизировать однотипные или повторяющиеся задачи по обработке документов в сети организации. Возможности программы позволяют выполнять пакетное конвертирование файлов, преобразование документов по расписанию и обработку почтовых вложений. Для начала работы необходимо выбрать компьютер, который будет заниматься выполнением перечисленных операций, указать рабочую директорию на файловом сервере и настроить список задач.
Обработка документов по расписанию
Таковы основные отличительные особенности нового поколения FineReader, определённо заслуживающего внимания тех, кто часто занимается оцифровкой бумажных документов. Программа предназначена для запуска в среде Windows, совместима со всеми популярными моделями сканеров и многофункциональных устройств (МФУ) и поставляется разработчиком в трёх редакциях — Standard, Business и Enterprise. Они различаются набором включённых инструментов, формами поставки и условиями лицензирования.
Редакции и формы поставки ABBYY FineReader 14
И последний штрих. Как и в случае с предыдущими версиями FineReader, условия лицензионного договора допускают установку продукта на один стационарный и один мобильный компьютер при соблюдении двух требований: оба устройства должны принадлежать человеку, который приобрёл продукт, и одновременно может быть запущена только одна копия программы. Таким образом, приложение можно установить и на рабочий ноутбук, и на домашний ПК, не нарушая тем самым условий лицензионного соглашения с компанией ABBYY.
Возможно, окончательная победа цифровых технологий уже не за горами, но сегодня мы все еще находимся в переходном периоде и вынуждены приводить разнородные потоки и источники информации к «общему знаменателю». Оцифровка печатных материалов (OCR, Optical Character Recognition), одна из наиболее типичных задач, хорошо знакома отечественным пользователям и на просторах СНГ однозначно ассоциируется с ABBYY FineReader. Популярность этого продукта вполне заслуженна, а компания-разработчик не почивает на лаврах и неутомимо отслеживает современные тенденции и развивает свое детище. Так, в девятой версии FineReader стал работать не с отдельными блоками или даже страницами, а с целыми документами (ADRT, Adaptive Document Recognition Technology), что позволило ему гораздо правильнее воссоздавать их структуру, включая такие элементы как таблицы, колонтитулы и пр. В десятой приоритет сместился в сторону качественной обработки изображений, полученных не со сканеров, а с цифровых фотокамер. Популярность последних продолжает расти, так, согласно информации ABBYY, фотокамеры для оцифровки печатной продукции (учебников и научной литературы, юридических и деловых документов, газет и журналов, анкет и пр.) применяют более 30% пользователей. Представленный в конце августа FineReader 11 также имеет немало полезных нововведений, хотя выделить главное направление довольно сложно. Скорее, в нынешней версии разработчики сосредоточились на совершенствовании накопленных технологий и, конечно, на повышении удобства работы.
Общая информация
На текущий момент доступны две редакции FineReader 11 — Professional и Corporate. Home пока осталась в 10-й версии. На сайте ABBYY есть довольно объемная таблица с описанием возможностей всех трех редакций, хотя проводить такое сравнение не совсем корректно — наверняка со временем появится и FineReader 11 Home Edition, который сократит отставание от старших собратьев. Однако принципиально картину это не изменит — функциональность редакции Home сильно урезана. Так, отсутствуют возможности обработки документов PDF, DjVu, XPS; распознавание штрихкодов; встроенный редактор; вывод во многие форматы; поддержка многоядерных процессоров и пр. Конечно, кому-то базовой функциональности будет достаточно, особенно для эпизодического применения, но в общем случае сниженная стоимость не компенсирует потери.
К примеру, последние версии FineReader характеризуются отличной, практически линейной масштабируемостью, т. е. на двух вычислительных ядрах программа будет работать почти вдвое быстрее чем на одном, на трех — втрое, на четырех — вчетверо и т. д. Заглянув в Task Manager после запуска редакции Professional или Corporate, вы увидите несколько процессов FineExec, ответственных за обработку изображений, — их будет два для двухъядерного процессора или на единицу меньше числа ядер, если последних больше двух (одно резервируется для интерфейса программы и других системных задач). А при обработке многостраничного документа будет отлично заметно, как одновременно распознаются несколько страниц. В общем, это весомый плюс, особенно при большой нагрузке.
Рис. 1. Каждому вычислительному ядру — свой рабочий процесс. За счет этого обеспечивается отличная масштабируемость и максимальная утилизация ресурсов.
Однако между ними также имеется существенная разница. Прежде всего, редакция Corporate предназначена для использования в организациях и, соответственно, обеспечивает гибкое управление лицензиями. Последние бывают двух основных типов: per-seat, закрепляемая за конкретным компьютером (т. е. по сути аналогичная персональной лицензии), и concurrent (распределенная), которую допускается использовать на любом компьютере. Распределенные лицензии позволяют установить FineReader Corporate на произвольном числе рабочих мест, при этом сервер лицензий будет автоматически выдавать имеющиеся лицензии при запуске клиентской программы и вновь забирать при завершении. Если корректно оценить потребность сотрудников в OCR (а большинство наверняка будет использовать FineReader лишь от случая к случаю), то комбинацией per-seat и concurrent лицензий можно добиться существенной экономии по сравнению с приобретением для всех персональных продуктов — даже при том, что корпоративные лицензии дороже: 4180-3200 р. за per-seat и 6260-5330 р. за concurrent (в зависимости от пакета лицензий) против 3590 р. за электронную поставку FineReader 11 Professional.
- возможность создавать пользовательские сценарии, аналогичные встроенным типовым задачам;
- режим совместной работы с одним документом, когда несколько пользователей могут параллельно выполнять различные действия;
- передачу документов на серверы SharePoint;
- режим Цензура, позволяющий в буквальном смысле вымарать лишнюю информацию, причем, в документах, которые поддерживают графический и текстовый слои, она будет удалена из обоих;
- программу ABBYY Hot Folder, обеспечивающую автоматическую обработку документов, поступающих в папку, почтовый ящик или на FTP-сервер;
- программу ABBYY Business Card Reader для преобразования визиток в электронные контакты.
Рис. 2. Редакция Corporate предлагает не только специфическое лицензирование, но и ряд дополнительных функций. К примеру только в ней можно создавать дополнительные сценарии работы (Мои задачи)
Системные требования и установка
- операционная система Windows XP, Windows Server 2003 или более новая;
- процессор с частотой от 1 ГГц;
- объем оперативной памяти не менее 1 ГБ плюс по 512 МБ на каждое вычислительное ядро;
- 700 МБ дискового пространства непосредственно для установки и столько же для рабочих файлов.
Программа более чувствительна к производительности процессора, ресурсы которого обычно задействуются на все 100%, чем к объему оперативной памяти.
FineReader умеет напрямую работать со сканерами и МФУ, поддерживающими интерфейсы TWAIN или WIA. Изображения оригиналов можно также получать с помощью цифровых фотокамер, минимальным требованием является 2 Мп на лист формата A4, рекомендуется 5 Мп. Однако на деле более важно наличие автоматической или ручной фокусировки, никакие мегапиксели не помогут встроенным в телефон камерам с фиксированным фокусом. Естественно, съемку крайне желательно вести при хорошем освещении, с помощью штатива, отрегулировав баланс белого и т. д. Хотя встроенные в FineReader 11 инструменты способны скорректировать некоторые недочеты цифровых снимков, сильно рассчитывать на них не стоит.
Установка FineReader 11 довольно проста — настолько, что даже не описана в руководстве пользователя. Инсталляционная процедура запустится на языке, указанном в системных настройках, но на первом же экране можно выбрать нужную локализацию. Выборочная установка позволит отказаться от некоторых инструментов и функций, вроде ABBYY Screenshot Reader (для распознавания снимков экрана) и интеграции в сторонние приложения. Но все это относится к клиентской части, в основном, к редакции Professional. FineReader 11 Corporate в общем случае предполагает сетевое развертывание, описание которого приведено в руководстве администратора. С дистрибутивного диска вначале нужно установить сервер и менеджер лицензий. Последний представляет собой управляющую утилиту и также может размещаться на любой рабочей станции. Сервер лицензий на самом деле не требует серверной ОС, а учитывая минимальную вычислительную нагрузку, его вполне разумно установить в виртуальной машине. Принципиально только соединение с Интернетом, так как с помощью менеджера лицензий необходимо регистрировать и активировать имеющиеся лицензии.
Для установки FineReader 11 Corporate на рабочие станции есть несколько способов, самый простой (но не всегда самый эффективный) — формирование административного дистрибутива в папке общего доступа и запуск инсталляции на каждом рабочим месте. При этом все параметры сервера лицензий будут прописаны автоматически, так что никаких дополнительных действий не понадобится. При использовании per-seat лицензий FineReader 11 Corporate можно устанавливать и локально.
В дальнейшем менеджер лицензий позволяет объединять лицензии в пулы, закреплять за группами пользователей, принудительно назначать и забирать их и т. д. Но в простых вариантах (к примеру, только concurrent лицензии и одинаковые потребности у всех пользователей) в этом даже нет необходимости, все будет происходить автоматически.
Рис. 4. Менеджер лицензий позволяет контролировать использование лицензий и, при необходимости, управлять их распределением
Работа с FineReader 11
Несмотря на то, что за ABBYY FineReader стоит целая отрасль искусственного интеллекта и весьма изощренные алгоритмы, сама по себе программа достаточно проста и интуитивна. По сути она решает одну единственную задачу — распознавание текста, соответственно, в ней нет изобилия инструментов и сложных меню, хотя все необходимые опции и средства появляются при работе с конкретными объектами, будь то изображение, выделенный блок или распознанный текст. За последнее время интерфейс программы практически не менялся (никаких «лент») и это хорошо, так как пользователи предыдущих версий найдут привычные инструменты на своих местах. Работать с FineReader можно двумя основными способами: либо воспользоваться одним из типовых сценариев, к примеру, со сканера сразу в EPUB, либо проделать основные операции вручную. В любом случае обработка документов состоит из четырех основных этапов: получение изображения, его распознавание, проверка, сохранение результата, — и на каждом доступно некоторое количество опций и дополнительных возможностей, способных существенно повлиять на качество результата. С опытом каждый пользователь отработает собственный стиль взаимодействия с FineReader, но для начала вполне разумно полагаться на автоматические настройки, тем более, что программа оповестит о всех проблемах, скажем, о необходимости отсканировать с большим разрешением оригиналы, на которых имеется мелкий шрифт. Кроме того, в рабочем документе отмечаются все неуверенно распознанные символы, так что их можно будет быстро проверить, в том числе, в специальном окне с укрупненным фрагментом оригинала. В большинстве случаев FineReader и сам примет правильные решения, особенно если сомнения возникают в известных словах, в противном случае имеет смысл добавить слово в словарь и повторить распознавание. При возникновении большого количества ошибок следует обратить внимание на качество оригинала и его изображения — это самый важный фактор, нивелировать который в дальнейшем практически невозможно.
Рис. 5. Выбранный режим может сильно повлиять на результат, причем программа не восстанавливает стандартные настройки — перед сменой задания необходимо это делать самостоятельно
Для сравнения доступных режимов обработки был проведен небольшой тест. В качестве оригинала был взят 10-страничный, отпечатанный на цветном принтере материал со сравнительно сложной версткой, но почти без иллюстраций. Такое задание можно считать достаточно типичным, так как главной задачей программ распознавания является именно извлечение текста. Затем в опциях FineReader 11 была отключена автоматическая обработка и сформированы три документа: один в черно-белом режиме и два в цветном, отсканированные в цвете и в оттенках серого. Сканирование выполнялось на МФУ с разрешением 300 dpi, что также является типичной ситуацией. Все прочие настройки FineReader 11 не менялись, в частности, использовался тщательный режим собственно распознавания. Серии операций по распознаванию проводились на компьютере с двухъядерным процессором, усредненные результаты можно видеть в следующей таблице:
Очевидно, ускорение обработки в черно-белом режиме зависит от характера исходного документа и качества отпечатков. На самом деле экономия времени начнется еще на этапе сканирования, которое в цвете осуществляется намного дольше. Очень большая разница также наблюдается на первом «холодном» прогоне, что, вероятно, связано с размерами изображений. При повторных обработках скорости выравниваются, хотя разница все же присутствует, пусть и не такая большая, как обещано разработчиками. Естественно, в цветном режиме ABBYY FineReader требуется больше оперативной памяти, а вот процессор во всех случаях задействовался фактически одинаково — на 100% в процессе обработки, и несколько ниже при дополнительных операциях (сохранении и т. д.).
Рис. 7. Специальный режим проверки позволяет оперативно просмотреть все неуверенно распознанные символы и при необходимости внести коррективы или занести в словарь новые слова
Несмотря на достаточно высокое качество оригинала, в черно-белом режиме значительно большее число символов было распознано неуверенно. Однако, львиная доля их приходилась на фрагменты с изображениями. При этом на одной чисто текстовой странице лучшее качество распознавания оказалось именно в черно-белом режиме. Сканирование в оттенках серого считается ABBYY FineReader 11 оптимальным для OCR, с чем, пожалуй, можно согласиться, глядя на результаты теста. По физическим характеристикам, в том числе скорости, серый режим близок к черно-белому, а по качеству распознавания — к цветному. Справедливости ради, отметим, что результаты в черно-белом режиме было несложно значительно улучшить, предварительно разметив иллюстрации или добавив в словарь несколько часто встречающихся в документе аббревиатур (в них программа ошибалась наиболее часто). Тем не менее, цветной режим со сканированием в оттенках серого действительно выглядит не компромиссом, а оптимальным выбором.
Дополнительные возможности
Несмотря на прозрачность работы и наличие типовых сценариев, ABBYY FineReader 11 имеет в своем арсенале и достаточно тонкие инструменты, которые при умелом использовании существенно могут облегчить жизнь пользователям. К примеру, программу можно обучить для работы с декоративными шрифтами или специальными символами (вначале, конечно, следует убедиться, что она с ними не справляется). Хотя это довольно трудоемкий процесс, и применять его целесообразно только в исключительных случаях. Другим примером могут служить шаблоны областей для обработки однотипных документов. Достаточно проанализировать один образец, скорректировать его разметку, выделить нужные блоки и сохранить шаблон. В дальнейшем его можно будет применять к аналогичным документам, не повторяя рутинную работу. В полной мере возможности этой функции раскрываются при использовании вместе с Hot Folder для автоматической обработки документов.
Рис. 8. ABBYY Hot Folder позволяет настроить все параметры задания, чтобы в дальнейшем распознавание проходило в полностью автоматическом режиме
ABBYY Hot Folder, в свою очередь, является одним из дополнительных компонентов FineReader 11 (только редакции Corporate). Это специализированный планировщик, управляющий заданиями для автоматической обработки документов. По указанному расписанию он может проверять один из типов источников (папки, ftp-серверы, почтовые ящики, документы ABBYY FineReader, которые сами по себе также являются папками) и инициировать их обработку с предварительно настроенными параметрами. Типичное применение Hot Folder — централизованное распознавание документов, которые вводятся сотрудниками через сетевые МФУ. Как правило такие устройства умеют сохранять отсканированные изображения в папках общего доступа, за которыми как раз и будет следить Hot Folder.
Рис. 9. ABBYY Business Card Reader достаточно уверенно справляется с визитками, несмотря на разницу в их оформлении
Еще одним полезным дополнением FineReader 11 Corporate является ABBYY Business Card Reader — программа для распознавания визитных карточек. В ней все настройки и OCR-алгоритмы адаптированы для решения исключительно своей узкой задачи, пользователь может лишь скорректировать используемые языки. Разом можно сканировать несколько визиток, главное — одинаково их позиционировать в сканере. Для отличных результатов достаточно разрешения в 600 dpi, при этом не только корректно распознаются мелкие шрифты, но и достаточно уверенно идентифицируются различные поля: имя, фамилия, должность, телефоны, адреса и т. д. Ошибки случаются, в основном, в не совсем стандартных ситуациях, когда, к примеру, длинное название должности занимает сразу две строки. Экспортировать данные можно в файлы vCard или непосредственно в контакты Microsoft Outlook.
Рис. 10. ABBYY Screenshot Reader захватывает указанную часть экрана и распознает в ней текстовую информацию
Наконец, еще одно дополнение — ABBYY Screenshot Reader — присутствует в редакциях и Corporate, и Professional. Как и следует из названия, данная программа распознает информацию на экране компьютера (можно выделять окно или прямоугольную область). Таким образом, к примеру, можно быстро извлечь информацию о программной ошибке для поиска в базе знаний. Результат можно сохранять в файлах распространенных форматов или копировать в буфер обмена.
Резюме
ABBYY FineReader 11 сделал еще несколько шагов к тому, чтобы освободить пользователей от рутины и приблизить нашу жизнь к цифровому будущему. В программе внешняя простота сочетается с мощными алгоритмами, что позволяет даже неподготовленным пользователям добиваться хороших результатов. Все нововведения нынешней версии наверняка будут оценены по достоинству, начиная с повышенной производительности и заканчивая поддержкой популярных форматов электронных книг. Преимущества редакции Corporate также очевидны, хотя, с учетом более высокой стоимости лицензии, ее внедрение требует предварительной оценки реальной потребностей в OCR всех сотрудников.
С выпуском обновлённой версии FineReader компания ABBYY кардинально изменила концепцию своего флагманского продукта и превратила его в универсальное программное решение, включающее не только средства оптического распознавания текста, но и внушительный набор инструментов для работы с бумажными и PDF-документами
Новый FineReader 14 можно сравнить со швейцарским ножом — теперь под его личиной кроются сразу четыре продукта именитого разработчика, объединённых в одну программу с единым рабочим окружением. Помимо успевшей зарекомендовать себя с наилучшей стороны системы оптического распознавания текста Optical Character Recognition (OCR), которая обеспечивает конвертирование отсканированных изображений, фотографий, документов или PDF-файлов в редактируемые электронные форматы, в составе программы представлены редактор PDF, инструмент «Сравнение документов» для сравнения документов различных форматов, включая бумажные и электронные, а также средства автоматизации задач по конвертации документов Hot Folder. Вряд ли кто-то мог предполагать, что в почти четвертьвековой истории развития FineReader (первая версия продукта увидела свет в 1993 году) случится такой крутой поворот, однако в ABBYY убеждены в правильности выбранного курса и уверены, что подобного рода перемены сделают программу ещё более востребованной в пользовательской среде.
Новая концепция FineReader 14
Своё стремление уйти от устоявшихся традиций в компании объясняют современными тенденциями развития рынка электронного документооборота. Согласно проведённым ABBYY исследованиям, сотрудники различных организаций регулярно сталкиваются со следующими сценариями работы с документами: преобразование изображений и PDF-файлов в редактируемые форматы и внесение в них правок; сравнение документов разных форматов; создание, просмотр и редактирование PDF-файлов, а также извлечение из них данных. При этом типичный пользователь имеет дело с четырьмя и более сценариями и для решения каждой задачи использует разные программные продукты. В результате получается так, что вместо того, чтобы выполнять свою задачу, сотрудник компании занимается тем, что изучает эти инструменты и переключается между ними в процессе работы. Это очень неудобно и, по сути, является бесполезной тратой ресурсов, правильно распорядиться которыми должен новый FineReader 14.
ABBYY FineReader 14 предоставляет широкий спектр возможностей в одной программе
Не остались без изменений в обновлённом FineReader и фирменные технологии оптического распознавания текста ABBYY OCR и обработки структуры документа Adaptive Document Recognition Technology. Приложение определяет расположение текста, тип и размер шрифта, начертание и другие особенности форматирования, а также воссоздаёт структурные элементы — таблицы и диаграммы, колонки, заголовки, сноски, колонтитулы, номера страниц. В результате пользователь получает электронную копию документа, идентичную оригиналу. Распознанный текст можно сохранить как текстовый документ (DOCX, ODT, RTF), электронную таблицу (XLSX), презентацию (PPTX), файл HTML, электронную книгу (ePub и FB2), а также в форматах PDF и PDF/A.
Профессиональные инструменты для распознавания текста
С помощью встроенного в программу редактора пользователь может сравнить в одном окне оригинальный документ и распознанную копию. Расширенные функции по редактированию позволяют корректировать форматирование документа, вносить правки в текст, редактировать изображения, искать информацию, управлять страницами документа. Кроме того, имеется возможность вручную задавать области для распознавания и даже научить программу распознаванию специфических шрифтов.
В четырнадцатую версию FineReader были добавлены новые языки распознавания: математические символы (для распознавания однострочных математических формул) и английская транскрипция. Таким образом, теперь программа умеет оперировать документами на 192 мировых языках и любых их комбинациях.
Также при подготовке FineReader 14 к выпуску специалисты ABBYY увеличили скорость обработки и точность распознавания документов, доработали средства конвертирования PDF-файлов с текстовым слоем, улучшили работу с таблицами, графиками, диаграммами и документами на арабском языке. Множеству доработок подверглись другие компоненты программного комплекса. В частности, теперь FineReader позволяет создавать PDF-документы из файлов различных редактируемых форматов (DOCX, XLSX, RTF и др.) и объединять их в один PDF-документ.
Самый важный компонент нового FineReader – PDF-редактор, построенный на базе программы ABBYY PDF Transformer+. Приложение позволяет выполнять рецензирование и согласование PDF-документов, а также предлагает полный набор функций для их защиты от несанкционированного доступа и изменений. Кроме того, приложение интегрировано с Adobe PDF Library , что обеспечивает гарантированное открытие любых PDF -файлов и возможность внесения в них изменений без преобразования в редактируемый формат. С прицелом на корпоративный сегмент рынка в программе предусмотрены инструменты удаления конфиденциальной информации, добавления цифровой подписи и разграничения прав на печать и редактирование документов.
Внесение изменений в текст PDF-документов
FineReader 14 позволяет преобразовывать PDF в популярные форматы Microsoft Word, Excel, PowerPoint, HTML, OpenOffice (ODT) и другие. При этом исходная структура и форматирование документа сохраняются. Благодаря упомянутой выше поддержке ePub и FB2, пользователи могут создавать из PDF-документов любительские электронные книги для чтения на планшетах и других портативных устройствах. Отдельно стоит отметить возможность создания PDF из файлов изображений (JPEG, JPEG2000, JBIG2, PNG, BMP, GIF, TIFF) и поддержку потокового конвертирования документов.
Пригодится новый FineReader и тем, кто по долгу службы часто сталкивается с процессом согласования договоров или работает с документами, для которых характерна версионность. Возможности инструмента «Сравнение документов» позволяют сверять документы в различных форматах, быстро находить даже самые мелкие несоответствия в тексте и предотвращать тем самым подписание или публикацию некорректной версии документа. Автоматическое сравнение документов поможет существенно сэкономить время юристам, менеджерам по продажам, финансистам, логистам, а также всем офисным сотрудникам, которые сталкиваются со сравнением документов — договоров, актов, прайс-листов или других материалов.
Параллельный просмотр различий
Проводить сравнение документов можно как в текстовых, так и в графических (отсканированные документы или их фотографии, PDF без текстового слоя и т. п.) форматах. Для удобства работы с полученными результатами все обнаруженные несоответствия отображаются на отдельной панели, а также подсвечиваются по тексту в обоих документах. Предусмотрена возможность создания подробного отчёта о различиях и последующего его сохранения в виде таблицы в формате Word или PDF-документа с комментариями в местах изменений. Полученную таблицу можно использовать для вставки в отчёт о согласовании документов или для ведения переговоров с контрагентом. Несущественные различия перед формированием отчёта можно удалить.
Сохранение результатов сравнения
Для предприятий среднего и крупного бизнеса в составе FineReader 14 представлено приложение-планировщик ABBYY Hot Folder, с помощью которого можно автоматизировать однотипные или повторяющиеся задачи по обработке документов в сети организации. Возможности программы позволяют выполнять пакетное конвертирование файлов, преобразование документов по расписанию и обработку почтовых вложений. Для начала работы необходимо выбрать компьютер, который будет заниматься выполнением перечисленных операций, указать рабочую директорию на файловом сервере и настроить список задач.
Обработка документов по расписанию
Таковы основные отличительные особенности нового поколения FineReader, определённо заслуживающего внимания тех, кто часто занимается оцифровкой бумажных документов. Программа предназначена для запуска в среде Windows, совместима со всеми популярными моделями сканеров и многофункциональных устройств (МФУ) и поставляется разработчиком в трёх редакциях — Standard, Business и Enterprise. Они различаются набором включённых инструментов, формами поставки и условиями лицензирования.
Редакции и формы поставки ABBYY FineReader 14
И последний штрих. Как и в случае с предыдущими версиями FineReader, условия лицензионного договора допускают установку продукта на один стационарный и один мобильный компьютер при соблюдении двух требований: оба устройства должны принадлежать человеку, который приобрёл продукт, и одновременно может быть запущена только одна копия программы. Таким образом, приложение можно установить и на рабочий ноутбук, и на домашний ПК, не нарушая тем самым условий лицензионного соглашения с компанией ABBYY.
Нововведений в недавно увидевшей свет одиннадцатой версии флагманского продукта российской компании ABBYY — вагон и маленькая тележка. Мы постарались акцентировать внимание на наиболее значимых изменениях популярной во всем мире системы оптического распознавания текстов (OCR — Optical Character Recognition)
Пожалуй, трудно в IT-сфере найти человека, ничего не слышавшего о программных решениях отечественной компании ABBYY, входящей в ТОП-100 самых упоминаемых брендов Рунета и являющейся законодателем мод в области распознавания документов и лингвистики. Более чем двадцатилетний опыт насыщенной и продуктивной работы определил успех российского разработчика во всем мире, о чем свидетельствует не только 30-миллионная аудитория пользователей более чем в 130 странах, но и признание со стороны бизнес-сообщества, обрабатывающего с помощью технологий и инструментов компании свыше 1,6 млрд страниц документов и форм ежегодно. Цифры впечатляющие, однако в ABBYY не почивают на лаврах и продолжают неустанно из года в год совершенствовать и расширять линейку своей продукции, не так давно пополнившуюся новой, одиннадцатой по счету версией OCR-пакета FineReader, представленного в редакциях Professional Edition и Corporate Edition и предназначенного для конвертирования отсканированных документов, изображений, фотографий и PDF-файлов в редактируемые форматы.
Говоря о нововведениях в систему оптического распознавания текстов, прежде всего следует отметить увеличенную скорость обработки документов. По результатам проведенных ABBYY тестов, FineReader 11 демонстрирует возросшую на 20% производительность по сравнению с предыдущей версией продукта. Особый акцент разработчики делают на оптимизации различных режимов работы приложения, позволяющих добиваться существенной экономии времени при обработке больших объемов информации. Так, практическое использование нового черно-белого режима ускоряет конвертирование данных до 30%, а активация режима быстрого распознавания, предназначенного для документов с простым оформлением и хорошим качеством печати, форсирует упомянутый процесс аж до 70%. Немалую роль в достижении программой столь значимых результатов играет эффективное использование вычислительных возможностей многоядерных процессоров.
Вторая ключевая особенность FineReader 11 — улучшенное качество распознавания и сохранения структуры многостраничных документов. Благодаря совершенствованию технологии адаптивного распознавания документов (ADRT — Adaptive Document Recognition Technology), специалистам ABBYY удалось на 40% повысить точность определения заголовков и колонтитулов, на 70% — текста на полях, на 25% улучшить распознавание таблиц и на 15% — определение картинок и диаграмм. Также добавлена поддержка вертикальных колонтитулов, улучшено на 20% качество "понимания" текстов для группы языков CJK (китайский, японский, корейский) и в состав программы включен инструментарий для создания в PDF-документе оглавления в виде закладок. Использование последней опции восстанавливает структуру оглавления документа с возможностью перехода по ссылкам, что существенно упрощает навигацию и работу с многостраничными материалами.
Важный аспект — поддержка языков, также не оставшаяся без внимания программистов, инженеров и лингвистов ABBYY. Разработчики добавили в одиннадцатую сборку продукта арабский, вьетнамский, туркменский (латиница) языки и реализовали словарную поддержку для арабского, вьетнамского, латинского, японского, корейского языков. Таким образом, отныне в активе OCR-решения значится 189 языков распознавания, для 45 из которых предусмотрена проверка орфографии. Такой багаж знаний делает FineReader самой многоязычной системой распознавания в мире.
Вполне возможно, что рядовым пользователям FineReader, чья работа с приложением ограничивается конвертированием документов на двух-трех европейских языках, включение поддержки перечисленных в предыдущем абзаце языков покажется малозначительным, однако на деле умение программы понимать особенности той же арабской системы письма свидетельствует о том, что технологии оптического распознавания ABBYY развиваются, а значит, становятся еще совершеннее. Важно осознавать, что за реализацией поддержки любого дополнительного языка кроется кропотливый труд большого числа специалистов и экспертов компании.
Отдельное внимание при разработке программы было уделено переводу бумажных книг в цифровой вид. Электронные книги давно уже превратились из экзотики в обыденность, поэтому включение в состав FineReader 11 поддержки форматов FictionBook 2.0 (FB2), Electronic Publication (ePub) и возможности отправлять файлы непосредственно из окна приложения в учетную запись Amazon Kindle является оправданным шагом. В настройках модуля, отвечающего за формирование eBook-изданий, можно управлять функцией сохранения изображений и их качеством, выбирать оформление книги с использованием простого или форматированного текста, включать встраивание шрифтов и манипулировать прочими свойствами документа. Кроме того, программа умеет автоматически сохранять главы книги в отдельные HTML-файлы и восстанавливать ссылки в содержании на соответствующие главы книги. Данная возможность FineReader также может быть востребована владельцами eBook-ридеров и прочих портативных устройств.
Серьезно изменились средства обработки фотографий, пополнившиеся новыми инструментами для редактирования изображений, включая настройку яркости, контрастности и уровней интенсивности света и тени, которая позволяет значительно улучшить исходные снимки и получить более точные результаты распознавания. Подобного рода корректировки можно произвести в любом имеющемся под рукой графическом редакторе, однако одно дело — возиться со сторонним приложением и затем переносить файлы в FineReader, и совсем другое — вносить необходимые правки непосредственно в окне OCR-пакета.
Упомянуть следует и появившийся в 10-й версии программы и улучшенный в 11-й инструментарий для исправления трапециевидных искажений, часто возникающих при съемке документов цифровой камерой. Выбрав в редакторе изображений соответствующий пункт, пользователь может, перетаскивая мышью углы рамки и совмещая их с углами картинки, устранить искажение перспективы и в два счета привести снимок к «плоскому» виду. Подобный функционал может быть полезен как для улучшения читабельности сфотографированных документов, так и для приведения разнородных снимков к общему знаменателю.
. и после коррекции трапеции средствами FineReader 11
ABBYY FineReader предоставляет широкий спектр возможностей для работы с форматом PDF — принятым во всем мире стандартом обмена электронными документами и деловой переписки. В обновленной редакции продукта улучшена технология MRC-сжатия (Mixed Raster Content), благодаря чему можно уменьшить размеры PDF-файлов в пять раз, по сравнению с 10-й версией программы, без видимых изменений качества изображения — это позволяет экономить пространство на диске компьютера и пересылать объемные документы по электронной почте. Три новых режима сохранения PDF — «Высокое качество», «Небольшой размер», «Сбалансированный режим» — позволяют пользователю получать оптимальные результаты для разного типа задач.
Претерпели изменения в FineReader 11 также средства редактирования и проверки документов. Из наиболее значимых новшеств можно отметить механизм разделения пакета страниц на несколько документов. Данная функция может быть полезна при сканировании в едином потоке разнородных материалов (газетные вырезки, журнальные статьи, сканы книжных страниц и так далее), для каждого из которых необходимо использовать различные настройки OCR-движка. Сортировка осуществляется простым перетягиванием мышью миниатюр страниц в окне «Разделить документ на несколько» и последующим нажатием клавиши «Создать» (см. скриншот). В результате для каждого набора страниц запустятся отдельные копии FineReader с независимыми друг от друга параметрами распознавания текстов.
Брызги нововведений затронули также инструментарий для проверки неуверенно распознанных и отсутствующих в словарной базе слов, редактор стилей с функцией объединения стилей со схожими атрибутами и диалоговое окно «Задачи», обеспечивающее мгновенный доступ ко всем базовым и пользовательским сценариям работы. Кроме того, в FineReader 11 появилась возможность изменять нумерацию страниц в книгах с обратной нумерацией и восстанавливать оную при двустороннем сканировании документов.
Таковы основные изменения одиннадцатой линейки FineReader, обзор которой был бы неполным без упоминания особенностей корпоративной сборки продукта, включающей все возможности Professional-редакции и имеющей ряд дополнительных инструментов для удобства совместной работы в сети (например на одном компьютере можно сканировать документы, на другом — распознавать, а на третьем — проверять результаты). Кроме того, версия Corporate Edition предусматривает возможность автоматизированной установки программы на вычислительные машины в локальной сети и централизованное управление лицензиями.
Акцентируя внимание на новшествах FineReader 11 Corporate Edition, прежде всего следует отметить расширенное стартовое окно «Задачи» и возможность создания пользователем собственных сценариев работы программы. Если в профессиональной редакции OCR-пакета список «однокликовых» операций строго регламентирован, то в корпоративной версии его можно всячески варьировать, гибко настраивая и автоматизируя работу FineReader. Важной особенностью приложения является возможность использования сценариев, созданных другими пользователями, и наличие в составе продукта планировщика Hot Folder, также подвергшегося дальнейшим улучшениям и доработкам.
Настраиваемые сценарии FineReader 11 Corporate Edition
Менеджер задач с функциями экспорта/импорта сценариев
Следуя новым техническим и организационным веяниям в области информационной безопасности, разработчики ABBYY оснастили текстовый редактор программы средствами цензурирования документов. Основная функция новинки заключается в защите конфиденциальных данных от посторонних глаз: с помощью специального маркер, пользователь может замазать черными полосами секретный текст и сделать его недоступным для просмотра и копирования. Функция поддерживается при сохранении документа в PDF-файл, а также в других форматах.
Что касается предъявляемых одиннадцатой версией FineReader системных требований, то они практически не изменились. Для корректной работы пакета необходим функционирующий под управлением Windows компьютер с тактовой частотой процессора 1 ГГц или выше и объемом оперативной памяти не менее одного гигабайта. Программа работает со всеми популярными моделями сканеров и многофункциональных устройств (МФУ), в том числе с цифровыми фотокамерами и камерами мобильных телефонов с разрешением свыше двух мегапикселей и функцией автофокуса.
Первая версия программы FineReader увидела свет в далеком 1993 году, и умела она только распознавать и сохранять в редактируемых форматах сканированные тексты на русском и еще нескольких языках. А пятнадцатая версия, которая вышла на рынок в конце августа нынешнего года, позиционируется уже как универсальный инструмент для работы с бумажными и PDF-документами на цифровом рабочем месте, использующий технологии оптического распознавания символов и конвертации документов, основанные на возможностях искусственного интеллекта, и позволяет распознавать тексты на 192 языках.
ABBYY предлагает три варианта программы: Standard, Business и Corporate. Первый предназначается для домашних пользователей, второй – для небольших и средних компаний, а третий, включающий полный набор функций, – для крупных и средних компаний. В состав Corporate включена программа, которая по расписанию производит автоматическое распознавание документов, помещаемых в «горячую папку» – ABBYY Hot Folder. В этой версии есть также инструмент для сравнения документов, представленных в разных форматах, с формированием перечня выявленных различий и возможностью сохранения результатов сравнения в формате Word, где все изменения уже подсвечиваются в режиме Track Changes, в PDF с комментариями в местах изменений или в виде таблицы с перечнем правок в Word. Для каждой версии можно купить либо бессрочную, либо годовую лицензию.
Исходная страница книги в формате PDF
ABBYY FineReader 15 позволяет открывать, просматривать и редактировать PDF-документы, добавлять к ним комментарии, графические пометки и закладки, работать с вложенными файлами, осуществлять поиск по тексту. Если исходный PDF-документ не содержит текстового слоя, программа производит фоновое распознавание текста и таким образом обеспечивает возможность поиска по ключевым словам. Отсканированный документ с помощью OCR-редактора можно проанализировать, выделить блоки изображений и текстовые блоки и сохранить в формате PDF, который с помощью имеющегося набора инструментов превращается фактически в редактируемый: можно исправлять опечатки, добавлять и удалять тексты, перемещать и переформатировать текстовые блоки, редактировать таблицы, добавлять и удалять страницы, заполнять формы, совместно работать с документами, подписывать их электронной подписью и защищать с помощью пароля, а также объединять несколько документов в один PDF-файл, преобразовывать в другие редактируемые форматы и т. д. (Полный перечень возможностей программы и подробное «Руководство пользователя» представлены на сайте производителя.)
Она же после автоматического преобразования в формат Word
При тестировании программы она легко справилась с такими задачами, как сканирование и распознавание бумажных документов, создание и редактирование PDF-документов и преобразование их в документы Word. Например, преобразование книги формата А5 на 488 страницах из PDF в Word заняло около пяти минут, при этом в тексте объемом без малого 890 000 знаков программа сделала всего 16 мелких ошибок (лишние пробелы, длинное тире вместо короткого, неверно распознанные буквы) – это ничтожно мало. В исходном PDF-файле не было текстового слоя, но FineReader примерно за 45-50 секунд просматривал 488 книжных страниц и находил заданные слова и словосочетания. После сохранения книги в PDF с текстовым слоем поиск занимал около 30 секунд.
Автоматически «исправленное» при преобразовании изображение страницы
С преобразованием страниц с иллюстрациями дело обстояло похуже: в автоматическом режиме с настройками по умолчанию искусственный интеллект допускал ошибки. При преобразовании брошюры из PDF в Word программа 10 из 14 фотографий альбомного формата (в брошюре они располагались с поворотом на 90º) разрубила пополам, поместив каждую половинку на отдельную страницу (интересно, что неразделенными остались фотографии, подписи под которыми были длинными – это подсказка разработчикам). Еще одну картинку искусственный интеллект повернул примерно на 30º вместе с подписью.
Инструментарий «Редактора изображений»
Окно настроек приложения ABBYY Screenshot Reader
Часть картинок для этой статьи была сделана с помощью этого удобного инструмента. Распознавание текста в выделенной области экрана оказалось очень удобным, в частности, для копирования текстов из презентаций, в том числе и на иностранных языках. Если это приходится делать часто, значок ABBYY Screenshot Reader можно закрепить на панели задач Windows.
Достоинства:
Высокое качество распознавания текстов
Широкий набор инструментов для работы с PDF
Недостатки:
Высокая цена
Ориентировочная цена: 8690 (бессрочная Standard)
(только для версии ABBYY FineReader Corporate)
ABBYY FineReader включает в себя приложение ABBYY Hot Folder. Это приложение-планировщик, с помощью которого можно назначить время обработки документов из выбранной папки. Открытие файлов и распознавание изображений может быть выполнено в то время, когда компьютер наименее загружен, например, ночью.
Для автоматической обработки изображений необходимо настроить задачу для выбранной папки. Настройки задачи включают в себя все необходимые параметры открытия изображений, распознавания и сохранения распознанного текста, режим проверки папки (однократно или постоянно), время начала обработки папки.
Внимание! Для того чтобы обработка папки началась в заданное время, на компьютере должен быть выполнен вход в систему.
Установка и запуск приложения ABBYY Hot Folder
Приложение ABBYY Hot Folder устанавливается вместе с программой ABBYY FineReader 12. Если приложение ABBYY Hot Folder отсутствует на вашем компьютере, это значит, что при выборочной установке ABBYY FineReader 12 компонент ABBYY Hot Folder был отключен.
Как установить ABBYY Hot Folder позднее:
Замечание. В операционной системе Windows XP данная команда называется Установка и удаление программ.
- Из списка установленных программ выберите программу ABBYY FineReader 12 и нажмите кнопку Изменить.
- В диалоге Выборочная установка выберите компонент ABBYY Hot Folder.
- Далее следуйте инструкциям программы установки.
Запуск приложения ABBYY Hot Folder
Запустить приложение ABBYY Hot Folder можно одним из следующих способов:
- В меню Старт>Программы>ABBYY FineReader 12 выберите пункт ABBYY Hot Folder, или
- В меню Сервис программы ABBYY FineReader 12 выберите команду Hot Folder…, или
- Щелкните по значку приложения, расположенному на панели задач Windows (данный значок появляется после того, как на компьютере была настроена хотя бы одна задача).
При запуске приложения ABBYY Hot Folder открывается главное окно.
На панели инструментов приложения расположены кнопки, позволяющие настраивать, копировать, удалять задачи для папок, а также запускать обработку папок и просматривать отчет об обработке папки.
В окне ABBYY Hot Folder располагается список настроенных задач. Для каждой задачи указывается полный путь к обрабатываемой папке, статус задачи и время следующего сеанса обработки папки.
В процессе выполнения задача может иметь следующие статусы:
Статус | Описание | |
Обрабатывается… | Выполняется обработка изображений, находящихся в папке. | |
Однократная обработка | Для данной папки выбран режим разовой обработки, момент начала обработки указан в столбце Время следующего запуска. | |
Остановлена | Обработка папки приостановлена. | |
Обработана | Обработка папки завершена. | |
Ошибка (см. отчет) | В процессе обработки папки произошла ошибка, и обработка изображений не была завершена. Описание ошибок приводится в отчете об обработке папки. Для того чтобы установить причину ошибки, выберите папку и нажмите кнопку Просмотр отчета, расположенную на панели инструментов. |
Вы можете сохранить любую задачу для последующего использования.
Чтобы загрузить ранее сохраненную задачу:
- На панели инструментов нажмите кнопку и выберите пункт Импортировать…
- В открывшемся диалоге выберите нужную задачу и нажмите кнопку Открыть.
Как создать новую задачу для папки
Если для получения доступа к FTP папке необходимо указать имя пользователя и пароль, введите их в поля Имя пользователя и Пароль. Если же для доступа к FTP папке не требуются имя пользователя и пароль, отметьте опцию Анонимное подключение.
- Файл из папки Outlook — позволяет обрабатывать изображения из папок, расположенных в почтовом ящике.
- Документ FineReader — позволяет обрабатывать изображения из документа FineReader.
Подробнее о цветовом оформлении документа см. «Как учесть характеристики исходного документа».
В группе Исходные файлы укажите сохранять, удалять или переносить исходные файлы в указанную папку.
- На шаге Анализ и распознавание выберите настройки анализа и распознавания документа.
- В выпадающем списке Язык документа выберите язык, соответствующий тексту на изображениях, которые вы собираетесь распознать.
Замечание. Возможен выбор нескольких языков распознавания.
- В группе Параметры обработки документа укажите, следует распознавать документ, анализировать или выполнять только предобработку изображений. При необходимости задайте дополнительные параметры распознавания и предобработки изображений, нажав кнопку Настройки распознавания… или Настройки предобработки… соответственно.
- Если при распознавании нет необходимости сохранять цвета изображений, вы можете обрабатывать документы в черно-белом режиме. Для этого в группе Цветовой режим отметьте опцию Конвертировать изображения в черно-белые.
- Выберите, следует анализировать расположение областей автоматически или использовать шаблон областей.
- Из выпадающего списка Сохранить и поделиться выберите, в каком виде вы хотите сохранять документы.
- Из выпадающего списка Сохранить как выберите формат файла.
Совет. Чтобы настроить дополнительные параметры сохранения, нажмите кнопку Опции….
- В поле Папка укажите папку, в которую нужно сохранить обработанные документы.
- Из выпадающего списка Результат выберите способ сохранения:
- Создать отдельный документ для каждого файла (сохраняя иерархию папок) — позволяет сохранить каждый файл в отдельный документ;
- Создать отдельный документ для каждой папки (сохраняя иерархию папок) — позволяет сохранить все файлы из одной папки в один документ;
- Создать один документ для всех файлов — позволяет сохранить все файлы в один документ.
Совет. Вы можете включить в процесс обработки папки несколько шагов сохранения и создать копии документов в различных форматах.
Настроенная задача будет отображена в окне ABBYY Hot Folder.
Замечание. Файлы задач сохраняются в папку %Userprofile%AppDataLocalABBYYHotFolder12.00. (В операционной системе Microsoft Windows XP — в папку %Userprofile%Local SettingsApplication DataABBYYHotFolder12.00).
Внимание! Для того чтобы обработка папки началась в заданное время, на компьютере должен быть выполнен вход в систему.
Как изменить параметры задачи
Вы можете изменить параметры уже существующей задачи.
Отчет об обработке папки
Обработка изображений из папки, для которой была настроена задача, выполняется автоматически. В ходе обработки приложение ABBYY Hot Folder фиксирует все события процесса и регистрирует их в отчете.
- Название и перечень настроек задачи
- Список ошибок и предупреждений
- Статистику выполнения задачи (количество обработанных страниц, количество ошибок и предупреждений, выявленных в ходе обработки, количество неуверенно распознанных символов)
Как включить сохранение отчета:
Отчет об обработке папки будет сохранен в файл формата TXT в той же папке, что и файлы с распознанным текстом.
Как открыть файл отчета:
- В списке задач главного окна ABBYY Hot Folder выберите задачу.
- На панели инструментов нажмите кнопку Отчет.
Замечание. Для того чтобы получить информацию о ходе выполнения задачи, наведите курсор мыши на ее статус.
ABBYY FineReader включает в себя приложение ABBYY Hot Folder. Это приложение-планировщик, с помощью которого можно назначить время обработки документов из выбранной папки. Открытие файлов и распознавание изображений может быть выполнено в то время, когда компьютер наименее загружен, например, ночью.
Для автоматической обработки изображений необходимо настроить задачу для выбранной папки. Настройки задачи включают в себя все необходимые параметры открытия изображений, распознавания и сохранения распознанного текста, режим проверки папки (однократно или постоянно), время начала обработки папки.
Для того чтобы обработка папки началась в заданное время, на компьютере должен быть выполнен вход в систему.
Установка ABBYY Hot Folder
Приложение ABBYY Hot Folder устанавливается вместе с программой ABBYY FineReader 14. Если приложение ABBYY Hot Folder отсутствует на вашем компьютере, это значит, что при выборочной установке ABBYY FineReader 14 компонент ABBYY Hot Folder был отключен.
Как установить ABBYY Hot Folder позднее:
При запуске приложения ABBYY Hot Folder открывается главное окно.
На панели инструментов приложения расположены кнопки, позволяющие настраивать, копировать, удалять задачи для папок, а также запускать обработку папок и просматривать отчет об обработке папки.
В окне ABBYY Hot Folder располагается список настроенных задач. Для каждой задачи указывается полный путь к обрабатываемой папке, статус задачи и время следующего сеанса обработки папки.
В процессе выполнения задача может иметь следующие статусы:
Статус | Описание |
Обрабатывается. | Выполняется обработка изображений, находящихся в папке. |
Однократная обработка | Для данной папки выбран режим разовой обработки, момент начала обработки указан в столбце Время следующего запуска. |
Проверяемая. | Для данной папки выбран режим повторного запуска, момент начала повторной обработки указан в столбце Время следующего запуска. |
Остановлена | Обработка папки приостановлена. |
Обработана | Обработка папки завершена. |
Ошибка (см. отчет) | В процессе обработки папки произошла ошибка, и обработка изображений не была завершена. Описание ошибок приводится в отчете об обработке папки. Для того чтобы установить причину ошибки, выберите папку и нажмите кнопку Просмотр отчета, расположенную на панели инструментов. |
Вы можете сохранить любую задачу для последующего использования.
Чтобы загрузить ранее сохраненную задачу:
- На панели инструментов нажмите кнопку и выберите пункт Импортировать.
- В открывшемся диалоге выберите нужную задачу и нажмите кнопку Открыть.
Как создать новую задачу для папки
Настроенная задача будет отображена в окне ABBYY Hot Folder.
Файлы задач сохраняются в папку %Userprofile%AppDataLocalABBYYFineReader14.00HotFolder.
Для того чтобы обработка папки началась в заданное время, на компьютере должен быть выполнен вход в систему.
Как изменить параметры задачи
Вы можете изменить параметры уже существующей задачи.
Отчет об обработке папки
Обработка изображений из папки, для которой была настроена задача, выполняется автоматически. В ходе обработки приложение ABBYY Hot Folder фиксирует все события процесса и регистрирует их в отчете.
- Название и перечень настроек задачи
- Список ошибок и предупреждений
- Статистику выполнения задачи (количество обработанных страниц, количество ошибок и предупреждений, выявленных в ходе обработки, количество неуверенно распознанных символов)
Как включить сохранение отчета:
Отчет об обработке папки будет сохранен в файл формата TXT в той же папке, что и файлы с распознанным текстом.
Читайте также: