Как пользоваться эбби файн ридер. FineReader сканирование

Здравствуйте. Сегодня я расскажу о том, как с помощью программы Abbyy FineReader распознать текст c изображения, которое вы могли получить в результате сканирования. Ваш сканированный текст будет полностью в документе Microsoft Word и этот распознанный текст можно будет редактировать! Распознать текст при помощи Abbyy Finereader может пригодиться тем, кто учится, работает с текстами и переводами. Программа, к сожалению, является платной. Как-то доводилось попробовать одну из бесплатных вариантов аналогичных программ, но весьма хорошо отсканированный текст распознается просто ужасно... А распознать текст в Abbyy FineReader получается весьма качественно! Сейчас я покажу как пользоваться программой Abbyy FineReader для быстрого распознавания текста с изображения.

ABBYY FineReader имеет пробную версию на 30 дней с возможностью распознавания до 100 страниц и сохранением не более 3-х страниц из документа. Т.е. в течение этого времени вы можете увидеть возможности программы и принять взвешенное решение — нужна ли она вам, стоит ли её покупать или нет.

Как установить Abbyy FineReader!

Перед тем как пользоваться Abbyy Finereader её необходимо установить. Рассмотрим процесс установки этой программы...

Для начала выбираем язык программы. Нажимаем «ОК».

Принимаем условия лицензионного соглашения (при желании можно прочесть лицензионный договор, если вам интересно о чём там речь). Нажимаем «Далее».

Далее вы должны выбрать режим установки. При обычном режиме программа не спросит вас и установит то, что в программе задано по умолчанию, а именно — все компоненты: саму программу Abbyy Finereader для распознавания текста, компонент для программ Microsoft Office и компонент для проводника Windows (позволяющий быстро распознавать изображения, не открывая отдельно программу). Советую отметить выборочную установку чтобы настроить так, как вам нужно. Тем более это не займет и 15 минут:) Внизу указана папка куда установится программа. Желательно оставить выбор по умолчанию, чтобы потом не было никаких проблем при использовании программы. Нажимаем «Далее».

Компоненты программы. Это окно как раз появится в случае, если вы выберите тип установки «Выборочная». Компоненты — это что-то вроде вспомогательных приложений к программе. Первый компонент «Интеграция с программами Microsoft Office и Проводником Windows». Этот компонент будет отображен в меню Microsoft Office и если вы щелкните по изображению у себя на компьютере правой кнопкой мыши, то там будет пункт с этой программой. Вот так будет выглядеть ваше меню в Microsoft Office после добавления этого компонента.

А вот что будет если вы щелкните правой кнопкой мыши по изображению:

Т.е. появится меню, в котором вы можете сделать быстрое распознавание текста с отправкой результатов в Word, Excel или PDF.

Второй компонент позволит вам распознать текст с экрана компьютера. Это значит, что вы сможете сделать скриншот и также распознать текст. Если вы не хотите устанавливать один из этих компонентов, или вовсе не хотите устанавливать оба, то нужно нажать на стрелочку вниз и выбрать «Данный компонент будет недоступен». Тогда компонент установлен не будет. Я оставила оба.

Далее 4 пункта. 1-ый означает то, что сведения о том, как вы пользуетесь программой Abbyy Finereader будут переданы разработчику. Данный пункт советую не отмечать, чтобы программа лишний раз не выходила в интернет ради отправки сведений о работе с ней. Тем более, мало ли какие ещё сведения будут отправляться:) 2-ой пункт создает ярлык программы на рабочем столе. 3-ий означает, что программа будет запускаться при включении компьютера, а 4-ый будет проверять обновления программы. Я оставляю только второй и напротив него оставляю галочку. Закрываем все приложения Microsoft Office, потому что так требует установщик и нажимаем «Установить».

Нужно подождать пару минут чтобы программа загрузилась и нажать «Далее».

Все, установка завершена! Нажимаем «Готово».

Как при помощи Abbyy Finereader распознать текст c отсканированного или любого другого изображения?

Рассмотрим, как пользоваться программой. К примеру, у вас есть отсканированный текст. Теперь, чтобы распознать текст в Abbyy FineReader, открываем программу. Нажимаем «Открыть».

Выбираем нужное нам изображение и нажимаем открыть.

Когда вы откроете нужный документ, Abbyy Finereader начнёт распознавать текст. Чем больше документ, тем дольше будет длиться распознавание. Распознавание одной страницы может занять несколько секунд.

После того как текст распознается вам останется только сохранить результат в документ Microsoft Word, чтобы затем вы могли отредактировать в нём что угодно. Для этого нажмите кнопку «Сохранить» на верхней панели инструментов, после чего выберите в какую папку будет сохранён документ Word и под каким названием.

Если у вас подключён к компьютеру сканер, то вы можете запустить сканирование прямо из программы, и после чего отсканированный документ сразу будет распознаваться. Для этого на верхней панели инструментов нажмите кнопку «Сканировать». Далее действия будут зависеть от программы-драйвера для вашего принтера. Вам нужно только следовать указаниям мастера сканирования.

Как видите, все очень просто и быстро. Теперь вы знаете, как пользоваться Abbyy FineReader для распознавания текста с изображений! Надеюсь, что эта информация очень поможет многим:) Удачи!

Один из популярнейших функционалов по работе со сканированием и обработкой файлов различного типа - Файн Ридер. Функционал программного продукта был разработан российской компанией ABBYY, он позволяет не только распознавать, но и обрабатывать документы (переводить, менять форматы и другое). Многие пользователи могут только установить, а как пользоваться ABBYY FineReader, сразу разобраться не могут. На многие вопросы вы сможете найти ответы в этой статье.

Программа позволяет сканировать и распознавать текст — и не только

Чтобы подробно разобраться, что это за программа ABBYY FineReader 12, необходимо подробно рассмотреть все её возможности. Первой и самой простой функцией является сканирование документа. Существует два варианта сканирования: с распознаванием и без него. В случае обычного сканирования печатного листа вы получите изображение, которое сканировали в указанной папке на вашем компьютерном устройстве.

ВНИМАНИЕ. Лист нужно класть на сканирующую часть принтера ровно, по указанным на принтере контурам. Не допускайте заламывания исходника, это может привести к плохому качеству итогового скана.

Вы должны самостоятельно решить, для чего нужен FineReader именно вам, так как утилита имеет значительный функционал, например, вы можете самостоятельно выбрать в каком цвете хотите получить изображение, есть возможность перевести все фото в чёрно-белый . В чёрно-белом цвете распознавание происходит быстрее, качество обработки возрастает.

Если же вас интересует функция распознавания текста ABBYY FineReader, перед сканированием вам нужно нажать специальную кнопку. В этом случае есть несколько вариантов получения информации. Стандартно на ваш экран выведется распознанный кусок листа, который вы сможете скопировать или отредактировать вручную.

Если вы выберите другие функции, то сможете сразу получить файл Word-документом или Excel-таблицей . Выбирать функции очень просто, меню интуитивно понятно, легко настраивается благодаря тому, что все нужные вам кнопки перед глазами.

ВАЖНО. Перед тем как распознать текст ABBYY FineReader, вам необходимо точно подобрать язык обработки. Несмотря на то, что утилита работает полностью автоматически, бывает, что низкое качество исходника не позволяет понять, что за язык был в исходнике. Это сильно снижает качество итоговых результатов работы приложения.

Несколько режимов работы

Чтобы полностью разобраться, как пользоваться ABBYY FineReader 12, необходимо попробовать два режима работы «Тщательный» и «Быстрое распознавание». Второй режим подходит для высококачественных изображений , а первый - для низкокачественных файлов. Режим «Тщательный» в 3–5 раз дольше обрабатывает файлы.

На иллюстрации показан результат работы программы — распознавание текста с изображения

Какие ещё есть функции?

Распознавание текста в программе ABBYY FineReader не единственная полезная функция. Для большего удобства пользователей имеется

«ABBYY® FineReader 12 Краткое руководство пользователя Данный документ содержит основные сведения по работе ABBYY FineReader. Полное...»

ABBYY® FineReader 12

Краткое руководство пользователя

Данный документ содержит основные сведения по работе ABBYY FineReader. Полное руководство по

работе с приложениями ABBYY FineReader, Screenshot Reader и Hot Folder доступно на сайте компании

ABBYY. Если у вас нет постоянного соединения с интернетом, вы можете скачать руководство

пользователя в формате PDF.

Что такое ABBYY FineReader

Установка и запуск ABBYY FineReader

Системные требования

Установка программы

Запуск ABBYY FineReader

Работа с ABBYY FineReader

Встроенные задачи

Поэтапное конвертирование документа

Анализ структуры документа и редактирование областей

Активация и регистрация программы

Активация ABBYY FineReader

Регистрация ABBYY FineReader

Безопасность данных

Что такое ABBYY FineReader ABBYY FineReader - это система оптического распознавания текстов (OCR - Optical Character Recognition). Она предназначена для конвертирования в редактируемые форматы отсканированных документов, PDF–документов и файлов изображений, включая цифровые фотографии.

Преимущества программы ABBYY FineReader 12 Скорость и высокая точность распознавания Поддержка большинства мировых языков Проверка результатов распознавания Простой и понятный интерфейс Распознавание сфотографированных документов Сохранение документов в различных форматах, а также отправка в интернет-хранилища Бесплатная техническая поддержка для зарегистрированных пользователей Установка и запуск ABBYY FineReader Системные требования 1. 32-разрядный (x86) или 64-разрядный (x64) процессор с тактовой частотой 1 гигагерц (ГГц) или выше.



2. Операционная система Microsoft® Windows® 8, Microsoft® Windows® 7, Microsoft Windows Vista, Microsoft Windows XP, Microsoft Windows Server 2012/2012 R2, Microsoft Windows Server 2008/2008 R2, Microsoft Windows Server 2003.

Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.

3. Оперативная память - 1024 Мб.

При работе в многоядерных системах требуется дополнительно 512 Мб оперативной памяти для каждого дополнительного ядра.

4. Свободное место на диске: 850 Мб для установки всех компонентов программы, 700 Мб для работы программы.

5. Видеоплата и монитор с разрешением не менее 1024768 точек.

6. Клавиатура, мышь или другое указательное устройство.

Установка программы

Чтобы установить ABBYY FineReader 12:

1. Запустите файл Setup.exe с установочного компакт-диска или из папки дистрибутива программы.

Вы можете установить ABBYY FineReader 12 Corporate в локальной сети. Руководство для системного администратора в формате PDF можете скачать с сайта компании ABBYY.

Запуск ABBYY FineReader

Для того чтобы запустить программу ABBYY FineReader 12:

Краткое руководство пользователя ABBYY FineReader 12 Выберите пункт ABBYY FineReader 12 (ABBYY FineReader 12 Corporate) в меню ПускПрограммы, или В приложениях Microsoft Office нажмите кнопку запуска ABBYY FineReader, расположенную на панели FineReader 12, или В Windows Explorer выделите файл с изображением и в его контекстном меню выберите Открыть с помощью ABBYY FineReader или пункт конвертирования в нужный формат.

Работа с ABBYY FineReader

Процесс обработки документов с помощью программы ABBYY FineReader состоит из четырех этапов:

Получение изображения;

Распознавание документа;

Проверка и редактирование полученного текста;

Сохранение результатов распознавания.

Зачастую этот процесс состоит из одной и той же последовательности действий, например, сканирование, распознавание и сохранение распознанного текста в определенном формате. Для выполнения наиболее распространенных задач в программе предусмотрены встроенные задачи, позволяющие получить распознанный текст одним нажатием кнопки. Для распознавания документов, имеющих сложную структуру, вы можете настраивать и запускать каждый этап обработки самостоятельно.

Встроенные задачи Запуск встроенных задач осуществляется из окна Задачи, которое по умолчанию открывается при старте приложения. Если окно закрыто, нажмите на главной панели инструментов программы кнопку Задача.

Краткое руководство пользователя ABBYY FineReader 12

Чтобы конвертировать документ, используя встроенные задачи:

1. В окне Задача выберите необходимую закладку с задачами:

Основные - содержит наиболее часто используемые встроенные задачи программы ABBYY FineReader;

Microsoft Word - задачи конвертирования в документ Microsoft Word;

Microsoft Excel - задачи создания электронных таблиц Microsoft Excel;

–  –  –

Мои задачи - вы можете создать свои, пользовательские задачи, состоящие из шагов, необходимых именно для вас (только для версии ABBYY FineReader Corporate).

2. В списке Язык документа укажите языки распознавания.

3. В списке Цветовой режим выберите цветовой режим:

Цветной - цветовое оформление документа не изменится;

Черно-белый - страницы документа будут черно-белыми, что позволит уменьшить размер документа FineReader. По сравнению с Цветным режимом, в этом режиме требуется меньше времени на обработку документа.

Краткое руководство пользователя ABBYY FineReader 12 Внимание! После выбора черно-белого режима восстановить цветовое оформление документа не удастся. Чтобы получить цветной документ, откройте файл, содержащий цветные изображения страниц, или отсканируйте бумажный документ в цветном режиме.

4. При необходимости задайте дополнительные параметры для задач конвертирования в документ Microsoft Word, в документ Microsoft Excel и документ Adobe PDF в правой части окна.

5. Нажмите кнопку нужной вам задачи.

Задачи ABBYY FineReader выполняются с учетом настроек, заданных в диалоге Настройки (меню СервисНастройки…).

После запуска на экране появляется панель выполнения задачи, содержащая индикатор выполнения задачи, список шагов, а также подсказки и предупреждения.

В результате выполнения задачи будет создан документ нужного формата, а изображения будут добавлены в документ FineReader. При необходимости вы можете отредактировать выделенные на изображениях области, проверить распознанный текст и сохранить результаты распознавания в другом формате.

Поэтапное конвертирование документа Для самостоятельной настройки и запуска каждого этапа обработки документов используйте главное окно программы ABBYY FineReader.

Краткое руководство пользователя ABBYY FineReader 12

1. На главной панели инструментов в выпадающем списке Язык документа укажите языки распознавания.

2. Отсканируйте или откройте изображения.

По умолчанию анализ и распознавание документа запустятся автоматически. Вы можете изменить эти настройки на закладке Сканировать/Открыть диалога Настройки (меню СервисНастройки…).

3. В окне Изображение проверьте выделенные области и при необходимости отредактируйте их.

4. Если вы изменили области, на главной панели инструментов нажмите кнопку Распознать.

5. В окне Текст проверьте и при необходимости отредактируйте результаты распознавания.

Анализ структуры документа и редактирование областей Качество, полученного в результате конвертирования документа, зависит от многих факторов: от исходного изображения, настроек распознавания, параметров сохранения. Одним из важнейших шагов является анализ логической структуры документа, т.е. выделение областей с текстом, картинками, таблицами и штрих-кодами. Области выделяются для того, чтобы указать системе, каким образом следует распознавать те или иные части изображения и в каком порядке. Так воспроизводится исходное оформление документа.

Краткое руководство пользователя ABBYY FineReader 12 По умолчанию анализ документа в ABBYY FineReader выполняется автоматически.

Однако в сложных документах некоторые области могут быть выделены неправильно. Часто оказывается удобнее исправить только их, а не выделять все области заново Инструменты для ручной разметки и редактирования областей расположены на панели окна Изображение, а также на всплывающих панелях инструментов для областей Текст, Картинка, Фоновая картинка и Таблица. Ввсплывающая панель инструментов появляется у активной области. Чтобы выделить область щелкните по ней левой кнопкой мыши.

С помощью инструментов для ручной разметки вы можете:

Добавить или удалить область

–  –  –

Передвинуть границы области или саму область Добавить/удалить прямоугольную часть области Перенумеровать области После того, как все операции по редактированию областей будут завершены, запустите распознавание еще раз.

Подробнее о том, как работать с инструментами для ручной разметки, а так же о нестандартных ситуациях, решение которых может потребовать дополнительных настроек, вы можете прочитать в полной справке на сайте компании ABBYY.

Активация и регистрация программы Активация ABBYY FineReader Для использования ABBYY FineReader 12 в полнофункциональном режиме может потребоваться активация продукта. Активация полностью безопасна и анонимна.

Самый простой и быстрый способ - активировать программу через интернет. Вы также можете активировать программу по электронной почте или телефону/факсу. Подробную информацию об активации вы найдете на сайте компании ABBYY.

Регистрация ABBYY FineReader Компания ABBYY предлагает вам стать зарегистрированным пользователем программы ABBYY

FineReader 12. Регистрируясь, вы получаете ряд преимуществ:

Бесплатная техническая поддержка;

Возможность использовать приложение ABBYY Screenshot Reader, предназначенное для распознавания текста со снимков областей экрана (скриншотов);

Восстановление серийного номера в случае его утери;

Автоматическое обновление продукта;

Возможность получать информацию о специальных предложениях на продукты компании ABBYY.

Зарегистрировать вашу копию программы вы можете одним из следующих способов:

Заполните регистрационную карточку в процессе активации программы. Если вы не зарегистрировали программу в процессе активации, вы можете сделать это позднее, в любое удобное для вас время.

Краткое руководство пользователя ABBYY FineReader 12 В меню Справка выберите пункт Зарегистрироваться... и заполните регистрационную карточку.

Зарегистрируйтесь на сайте компании ABBYY.

Безопасность данных В процессе регистрации программы вы соглашаетесь на добровольную передачу компании ABBYY своих персональных данных. Также вы выражаете свое согласие на сбор, обработку и использование своих персональных данных компанией ABBYY на условиях обеспечения конфиденциальности и в соответствии с применимым правом согласно Лицензионному договору. Предоставленные Вами персональные данные будут использованы только в рамках группы компаний ABBYY и не будут предоставлены третьим лицам, за исключением случаев, предусмотренных применимым правом согласно Лицензионному договору или самим Лицензионным договором.

Компания ABBYY имеет право присылать вам по электронной почте письма, содержащие новости о продуктах, ценовых изменениях, специальных предложениях, а также сообщать другую информацию о продуктах или компании только в том случае, если вы подтвердили свое согласие на получение информации от ABBYY, отметив соответствующую опцию во время регистрации. Вы можете удалить свой адрес из списка подписчиков в любое время, обратившись в компанию ABBYY.

Краткое руководство пользователя ABBYY FineReader 12

Информация, содержащаяся в этом документе, может быть изменена без предварительного уведомления, и компания ABBYY не берет на себя на этот счет никаких обязательств.

Программное обеспечение, описываемое в этом документе, поставляется в соответствии с Лицензионным договором. Это программное обеспечение может быть использовано или скопировано лишь в строгом соответствии с условиями этого договора. Копирование этого программного обеспечения на какой-либо носитель информации, если на это нет специального разрешения в Лицензионном договоре или в соглашении о нераспространении, является нарушением Закона Российской Федерации "О правовой охране программ для ЭВМ и баз данных" и норм международного права.

Никакая часть настоящего Руководства ни в каких целях не может быть воспроизведена или передана в какой бы то ни было форме и какими бы, то ни было средствами, будь то электронные или механические, включая фотокопирование и запись на магнитные носители, если на то нет письменного разрешения компании ABBYY.

© ООО “Аби Продакшн”, 2013. Все права защищены.

ABBYY, ABBYY FineReader, ADRT являются зарегистрированными товарными знаками или товарными знаками компании ABBYY Software Ltd.

© 1984-2008 Adobe Systems Incorporated и их лицензиары. Все права защищены.

Охраняется патентами США: 5,929,866; 5,943,063; 6,289,364; 6,563,502; 6,185,684; 6,205,549; 6,639,593;

7,213,269; 7,246,748; 7,272,628; 7,278,168; 7,343,551; 7,395,503; 7,389,200; 7,406,599; 6,754,382; Заявки на патенты рассматриваются.

Право на использование Adobe® PDF Library предоставлено компанией Adobe Systems Incorporated.

Adobe, Acrobat®, логотип Adobe, логотип Acrobat, логотип Adobe PDF и Adobe PDF Library являются зарегистрированными товарными знаками или товарными знаками компании Adobe Systems Incorporated в Соединенных Штатах Америки и/или других странах.

Данная программа содержит компоненты, принадлежащие © 2008 Celartem, Inc. Все права защищены.

Данная программа содержит компоненты, принадлежащие © 2011 Caminova, Inc. Все права защищены.

На основе AT&T Labs Technology.

DjVu® охраняется патентами США No. 6.058.214. Заявки на патенты в других странах рассматриваются.

Данная программа содержит компоненты, принадлежащие © 2013 University of New South Wales. Все права защищены.

© 2002-2008 Intel Corporation.

© 2010 Microsoft Corporation. Все права защищены.

Microsoft, Outlook, Excel, PowerPoint, Windows Vista, Windows являются зарегистрированными товарными знаками или товарными знаками компании Microsoft Corporation в Соединенных Штатах Америки и/или других странах.

© 1991-2013 Unicode, Inc. Все права защищены.

© 2010, Oracle и/или аффилированные ему лица. Все права защищены.

OpenOffice.org, логотип OpenOffice.org являются товарными знаками, или зарегистрированными товарными знаками Oracle и/или аффилированных ему лиц.

JasPer License Версия 2.0:

© 2001-2006 Michael David Adams © 1999-2000 Image Power, Inc.

© 1999-2000 The University of British Columbia EPUB® является зарегистрированным товарным знаком IDPF (International Digital Publishing Forum Данная программа содержит компоненты, принадлежащие © 2009 The FreeType Project (www.freetype.org). Все права защищены.

Продукт включает программное обеспечение, разработанное в рамках проекта OpenSSL для использования в OpenSSL Toolkit. (http://www.openssl.org/). Продукт содержит криптографическое программное обеспечение, написанное Эриком Янгом ([email protected]).

© 1998-2011 The OpenSSL Project. Все права защищены.

© 1995-1998 Эрик Янг ([email protected]) Все права защищены.

Этот продукт включает программное обеспечение разработанное Тимом Хадсоном ([email protected]).

Остальные товарные знаки являются товарными знаками или зарегистрированными товарными

Похожие работы:

«01.02.2016 ШЕМОТ ИМЕНА Исход 1:1–6:1/Исайя 27:6-28:13; 29:22,23/Марка 1,2 Исход 1:1 Вот (ныне) имена сынов Израилевых, которые вошли в Египет, вошли каждый с домом своим с Иаковом. Исход 1:1 И вот имена сынов Израилевых, которые вошли в Египет с Иаковом, вошли каждый с домом своим. Здесь прямая...»

История Abbyy FineReader насчитывает уже более 20 лет. Юбилейный 2013 г. компания отметила выпуском полновесного (по сравнению с Express Edition от 2009 г.) Abbyy FineReader Pro для Mac, а через пару месяцев, в феврале 2014 г., свой «подарок» получили и пользователи Windows - Abbyy FineReader 12 Professional и Corporate. Напомню, что предыдущая версия появилась еще в 2011 г. , а два с половиной года срок немалый - давайте разбираться, насколько существенны изменения.

Общая информация

Системные требования для новой версии совершенно не изменились. Платформой может служить Windows или Windows Server начиная от XP и 2003 соответственно. Аппаратные запросы по нынешним временам и подавно скромны: процессор любой разрядности с частотой от 1 ГГц, оперативной памяти не менее 1 ГБ плюс по 512 МБ на каждое вычислительное ядро и т. п. Несколько увеличилась только потребность в дисковом пространстве - теперь для установки требуется не 700, а 850 МБ (плюс, по-прежнему, еще 700 МБ для рабочих файлов).

Естественно, речь идет о минимальных требованиях; полностью возможности Abbyy FineReader 12 Professional раскроются только на сравнительно современных системах. В частности, напомню, что программа умеет эффективно распараллеливать обработку отдельных страниц, задействует при этом все процессорные ядра и загружает любой процессор почти на 100%. А вот к оперативной памяти она действительно не жадная, и даже остается 32-разрядной.

Не претерпела изменений и процедура установки: минимум вопросов и опций. В комплекте с Abbyy FineReader 12 Professional по-прежнему идет Abbyy Screenshot Reader, который становится работоспособным только после регистрации пользователя.

После этого также откроется доступ к техподдержке.

Даже на основе этой скромной информации можно предположить, что перед нами результат эволюции. Соответственно, в дальнейшем я сосредоточусь на описании изменений по сравнению с предыдущей версией, которые условно можно разделить на две основные группы: работа с программой (интерфейс, вспомогательные инструменты, удобство использования) и OCR (качество и производительность собственно распознавания).

Работа с программой

Abbyy FineReader 12 Professional демонстрирует некоторые доработки в части пользовательского интерфейса. Это сразу же заметно на окне Задачи, которое по умолчанию открывается при запуске программы. Оно, очевидно, имитирует концепцию плиток Windows 8.x и адаптировано для управления пальцами, тем более, что в программе также поддерживаются и основные жесты вроде прокрутки и масштабирования. На деле же, изменения коснулись только «фасада», да и то отчасти - рядом с плитками соседствуют обычные элементы управления и в процессе настройки любого сценария придется иметь дело со стандартными диалоговыми окнами. Работать с ними пальцами довольно проблематично, особенно на экранах 8-10″, которые становятся популярными у Windows-планшетов.

Представить же, что пользователь такого планшета, оснащенного камерой, может захотеть быстро «на ходу» ввести какой-то печатный документ, действительно несложно. Между тем вся история Windows, начиная с первой редакции Tablet PC, подтверждает бессмысленность адаптации к сенсорному управлению стандартного настольного интерфейса. По-видимому, для этих целей гораздо правильнее создавать специальную оболочку, соответствующую всем канонам Metro, но использующую тот же «движок». Примером подобного решения служит Internet Explorer из Windows 8.x. К тому же, у Abbyy даже имеется некий задел в виде Abbyy FineReader Touch для Windows 8, который использует облачный сервис компании.

Если же отвлечься от сенсорного ввода, то найдутся еще изменения данного класса - от вполне ожидаемого обновления окон открытия/сохранения документов, которые, среди прочего, обеспечивают простой доступ к облачным хранилищам (при наличии в системе соответствующего агента и его папки), до нескольких более важных и полезных.

Обработка страниц в Abbyy FineReader 12 Professional теперь выполняется в фоновом режиме. Это подразумевает отсутствие прежнего модального окна со статусом операций (теперь данную роль играет строка статуса внизу экрана) и, соответственно, наличие доступа к интерфейсу. Таким образом пользователь имеет возможность работать с программой параллельно процессу распознавания (если он, конечно достаточно длительный), к примеру, копировать фрагменты полученного текста или даже корректировать разметку страниц - последние при этом будут поставлены в очередь и обработаны заново.

В отличие от прежней версии, также не происходит перелистывания страниц по мере распознавания или при начальной загрузке документа, если автоматическое распознавание отключено. В Abbyy FineReader 12 Professional документ загружается и разбивается на страницы практически мгновенно, а их эскизы строятся только по мере ручного пролистывания в левой панели. Кроме всего прочего, тем самым экономятся вычислительные ресурсы, причем, довольно ощутимо на больших многостраничных документах.

Остальные изменения данного класса не столь интересны, хотя и могут пригодиться в каких-то сценариях, поэтому о них кратко.

Если нужно не обработать документ целиком, а лишь процитировать отдельные места, то можно отключить все автоматические операции и выбирать необходимые фрагменты любых типов, сразу же копируя их в буфер обмена - при этом анализ и распознавание будут выполняться на лету.

Для получения результата с более простой структурой, чем у оригинала, можно отключать воссоздание колонтитулов, сносок и других элементов макета. Это может пригодиться, к примеру, при подготовке электронных книг.

Продолжая об электронных книгах - в Abbyy FineReader 12 Professional поддерживаются форматы EPUB 2.0.1 и 3.0.

Расширены параметры преобразования в XLSX, к примеру, появилась возможность очищать форматирование или сохранять картинки.

При сохранении результирующих документов в PDF с текстовым слоем теперь можно воспользоваться новой технологией Abbyy Precise Scan, которая заключается в сглаживании символов на оригинальных изображениях страниц. Доступна она, кстати, только в цветном режиме.

Эффект от ее работы достаточно заметен, хотя и не всегда, скажем так, «академичен». Впрочем, читабельность сглаженных символов в любом случае должна быть выше, а в данном примере оригинал действительно очень низкого качества.


OCR

Теперь давайте разберемся, какие улучшения произошли в механизмах собственно распознавания.

Разработчики сообщают об очередном этапе совершенствования технологии ADRT, которая, напомню , анализирует и воссоздает логическую структуру документа. Декларируется, что она стала работать гораздо точнее, особенно с таблицами, списками, диаграммами. Продемонстрировать это адекватными примерами не так просто, но не невозможно. Вот, к примеру, результаты распознавания (с настройками по умолчанию) одной и той же страницы в Abbyy FineReader 11 Professional (вверху) и Abbyy FineReader 12 Professional (внизу).


Старая версия выделила и обработала только основной текстовый блок, возможно, из-за низкого качества оригинала сочтя остальные элементы «мусором». Новая, напротив, корректно опознала список и попыталась его воссоздать. Результат, правда, не идеален: то что распознаны не все маркеры можно, опять же, отнести на качество изображения, но программа, по-видимому, все же не поняла, что перед ней содержание, иначе не интерпретировала бы цифры как буквы. Тем не менее, прогресс налицо и на более качественных оригиналах подобных претензий, возможно, не было бы.

А вот как обрабатывается «неявная» таблица без разделительных линий - Abbyy FineReader 11 Professional (вверху) и Abbyy FineReader 12 Professional (внизу).


Хорошо видно, что старая версия, в отличие от новой, вообще не увидела здесь табличной структуры и ограничилась набором несвязанных между собой текстовых блоков. Не поленитесь щелкнуть на изображениях и сравнить результаты распознавания - у Abbyy FineReader 12 Professional он близок к идеалу.

К сожалению, так происходит не всегда и уже на соседних страницах Abbyy FineReader 12 Professional показал результаты, аналогичные Abbyy FineReader 11 Professional. Хотя именно ADRT должна была бы отследить одинаковые «шапки» и понять, что перед ней своеобразная перетекающая таблица.

Но все равно хорошо заметно, что обновленные алгоритмы обращают внимание на большее количество деталей чем ранее. В процессе тестирования Abbyy FineReader 12 Professional наблюдалась, к примеру, даже попытка интерпретировать как таблицу картинку с упорядоченным размещением на нем текстовой информации. Гораздо чаще также новая версия пытается воссоздавать различные диаграммы и схемы на основе фонового рисунка, а не из отдельных графических и текстовых блоков.

Есть еще несколько новинок, призванных повысить в Abbyy FineReader 12 Professional качество распознавания. Как известно, одной из предпосылок для этого является качество оригинала, особенно если он получен с помощью не сканера, а фотокамеры. Именно поэтому в свое время в FineReader появились средства предварительной обработки оригиналов. В новой версии их список расширен, добавились обрезка по краям страниц, осветление и выравнивание яркости фона, удаление цветных элементов. Последнее может пригодиться, к примеру, для обработки документов с печатями и штампами. Кроме того, теперь пользователь может подключать различные методы индивидуально.

Улучшена также языковая поддержка. Во-первых, появился русский алфавит с ударениями, во-вторых, декларируется повышение качества распознавания китайского, японского и корейского (до 20%), арабского (до 60%), иврита (до 10%) - достигнуто это, по-видимому, за счет совершенствования и дополнительной тренировки классификаторов .

Ну и наконец, один из наиболее животрепещущих вопросов для многих читателей: выросла ли скорость работы программы? Аргументированно ответить на этот вопрос, тем более с цифрами, не так-то просто - слишком много языков, каждый из которых имеет свои нюансы; слишком велико разнообразие оригиналов; слишком много неизвестных нам факторов влияния на работу алгоритмов. Поэтому даже сами разработчики достаточно сдержанно говорят о росте производительности Abbyy FineReader 12 Professional на 10-15%.

Подобные цифры обычно получаются по результатам обработки достаточно больших массивов документов и, соответственно, представляют собой нечто вроде «средней температуры по больнице». Поэтому полезно подробнее изучить какие-нибудь показательные частные случаи, к примеру, подобные двум следующим:

  • отсканированные в цвете с разрешением 300 dpi 10 страниц полноцветного буклета формата A4. Качество хорошее, языки русский и английский, макет сложный;
  • PDF с графическими изображениями 138 страниц книги, содержащей небольшое количество цветных и черно-белых иллюстраций, несколько таблиц. Качество низкое (начиная, по-видимому, со «слепой» печати в бумажной книге), языки украинский и русский, макет простой.

Оба документа распознавались в цветном режиме, а второй также и в черно-белом, что имело целью имитировать процесс подготовки электронной книги. Все настройки по умолчанию оставлялись без изменений, за исключением набора языков и, соответственно, режимов работы. В качестве тестового полигона использовался ПК с процессором i5-3450 и 8 ГБ памяти. Результаты представлены в следующей таблице:

Как видно, для PDF ускорение даже превышает обещанные 15% - возможно, это как раз один из особых случаев, хорошо подходящих для последних оптимизаций в алгоритмах распознавания. При этом надо иметь в виду, что программы, вообще говоря, проделали разный объем работы. Взгляните хотя бы на иллюстрации выше к обработке таблиц - трудно сказать, какой из версий пришлось сложнее.

Что касается количества ошибок, то оно у обеих версий практически совпадало, хотя было заметно, что иногда сомнения вызывают разные фрагменты и символы - это, по-видимому, является свидетельством тренировки алгоритмов. В любом случае, большинство неуверенно распознанных символов абсолютно корректно идентифицировалось с помощью словарей, а «грубые» ошибки (некорректная интерпретация специальных и декоративных символов, текста на графике и пр.) совпадали. Так что разницу и вовсе можно считать исчезающей.

Другой вопрос, насколько подобное повышение производительности вообще имеет значение? По-видимому, выигрыш в полминуты на 138 страницах, которые все равно нужно проверять и, возможно, корректировать, немногого стоит. Если работы, подобные тестовым заданиям, предполагается выполнять от случая к случаю, то о производительности можно точно не переживать. Другое дело, если речь идет об автономной обработке больших объемов документов, которая доступна в Abbyy FineReader 12 Corporate. В таком случае экономия 15% времени уже вполне ощутима.

Резюме

Несмотря на то, что новый Abbyy FineReader 12 Professional не обещал ничего революционного, по крайней мере несколько изменений в нем заслуживают всяческой похвалы. Прежде всего, это усовершенствования технологии ADRT в части распознавания таблиц, диаграмм и вообще логической структуры страниц, что в некоторых случаях позволяет получать кардинально лучшие результаты, а также фоновый режим обработки, который открывает новые возможности для интерактивной работы с большими документами.

Других изменений также немало, хотя они и менее значимы. Движение в сторону поддержки сенсорного управления сегодня безусловно оправдано, однако путь выбран порочный - обеспечить в одном интерфейсе одинаково удобную работу мышью и пальцами вряд ли возможно. Впрочем, пока Windows-планшеты только пытаются пробиться на рынок, и у разработчиков из Abbyy еще есть время.

Цены на Abbyy FineReader 12 Professional:

  • коробочная версия: 4990 руб.;
  • версия для скачивания: 4490 руб.;
  • обновление: 2690 руб.

Как обычно, ответ на вопрос «стоит ли менять старую версию на новую?» зависит от ситуации. В любом случае стоит учитывать, что жизненный цикл у FineReader достаточно продолжительный, и если какое-то из описанных улучшений играет для вас сколько-нибудь существенную роль, то за 2-3 года затраты на обновление наверняка окупятся - если не материально, то морально. Решить же для себя этот вопрос окончательно поможет .

В этот раз расскажу как превращать бумажные документы в электронный вид формата PDF, а также, как бумажный документ перекинуть в компьютер с целью изменить текст. Итак начнем.
У меня на руках бумажный документ.

СКАНИРОВАНИЕ в PDF

Задача: перекинуть в компьютер (перевести в электронный вид) этот документ. Притом нужно сделать именно в таком виде чтобы нельзя было его в будущем изменить (грубо говоря надо сделать фото документа). Потом этот электронный документ нужно переслать по почте на электронный адрес. Притом клиент просит именно в формате pdf.

По этапам:
1) пропускаю документ через сканер
2) сохраняю полученный отпечаток в формате pdf на свой компьютер
3) пересылаю полученный файл по почте
В своей работе я использую для решения такой задачи 2 программы:
Foxit Phantom или ABBYY FineReader. Для понятности прикладываю скриншоты:
В Foxit Phantom при включенном сканере необходимо в главном меню выбрать ФАЙЛ-СОЗДАТЬ PDF-СО СКАНЕРА…
Произойдет сканирование и появится предложение сохранить файл. Выбираем место, пишем название файла и сохраняем.

В ABBYY FineReader в панели инструментов есть огромные кнопки. Одна из них называется СКАНИРОВАТЬ в PDF. Её и используем.

Если же надо отсканировать многостраничный документ то, по этапам:
1) Нажимаем кнопку под номером 1 СКАНИРОВАНИЕ

Получаем отсканированный документ

Также сканируем ещё одну страницу (нажимаем ещё раз кнопку под номером 1 СКАНИРОВАНИЕ).
2) Сохраняем в PDF



В итоге получаем готовый многостраничный документ в виде файла в формате PDF.

Теперь данный файл можно отправлять по электронной почте.

РАСПОЗНАВАНИЕ ТЕКСТА

Задача: перевести бумажный документ в электронный вид (в компьютер)

По этапам:
1) Сканирование (кнопка 1 СКАНИРОВАНИЕ)

2) Распознавание (кнопка 2 РАСПОЗНАТЬ ВСЕ)

Распознавание нужно понимать как процесс перевода фотографии (картинки) в текст (буквы, цифры, знаки). Если Вы сфотографировали текстовую страницу, то после распознавания 99% текста с бумаги превратиться в текст электронный. Электронный текст уже можно на компьютере менять (редактировать) так, как Вам захочется.

3) Сохранение в текстовый редактор (кнопка 4 Сохранить)
Советую выбирать ПЕРЕДАТЬ ВСЕ СТРАНИЦЫ В-MICROSOFT WORD

Получаем

Хотелось бы указать на важные моменты при процедуре РАСПОЗНАВАНИЯ. Есть нюансы при работе.
Сразу после распознавания советую поглядеть на результат. Особенно на блоки, которые создает программа FineReader.

Это области выделенные в прямоугольные рамки. Рамки эти разного цвета. Если красного цвета-то этот блок распознался как КАРТИНКА. Если черного цвета - то ТЕКСТ. Блоки бывают разного типа. Тип блока можно узнать щелкнув на блоке ПРАВОЙ клавишей мыши и выбрав ИЗМЕНИТЬ ТИП БЛОКА.

Маленькая хитрость: можно выделить произвольную область и пометить любым типом блок. Например выделим ту часть текста, которая плохо распознается, при помощи левой клавиши мыши (нажимает, удерживаем и тянем, рамка меняет размер).

В итоге документ в Word-е будет иметь блок текста и блок картинка. Блок картинка будет иметь абсолютно неизменный вид. Данный способ я использую при сохранении печатей, нестандартных шрифтов, картинок, фотографий.

ЗЫ: Знания и умения работать с PDF, сканировать и распознавать документы очень часто выручают в офисной работе. Знание - экономит Ваше время!