Опция «Поточное сканирование» компании «Электронные Офисные Системы» помогает легко и быстро перевести в электронный вид большой объем бумажных документов. Эффективная организация поточного сканирования позволяет значительно сократить время массового перевода документов в электронный вид. Высокая скорость достигается благодаря автоматизации процесса сканирования и применению технологии параллельных вычислений при распознавании текста. Опция «Поточное сканирование» - это коробочное решение. Продукт можно использовать совместно с любой системой электронного документооборота.

Документы загружаются в сканер одной пачкой. В процессе сканирования каждый документ из нее автоматически идентифицируется по штрих-коду. Таким образом, все операции, начиная с загрузки документов в сканер, выполняются автоматически, без участия оператора. Штрих-код для документа может быть сгенерирован системой и распечатан на документе или на отдельном листе бумаги. Если на страницы документов уже нанесены штрих-коды стандартного формата, то они также могут быть использованы для идентификации.

 

Распознавание текста(OCR)

Распознавание отсканированного документа и его сохранение в текстовом виде существенно расширяет возможности по его дальнейшее обработке. К примеру, становится доступным быстрый поиск по содержанию документов. Механизм распознавания текста в опции «Поточное сканирование» базируется на возможностях продукта ABBYY FineReader Engine, по праву считающегося лучшим решением для распознавания.

 

Сканирование одной кнопкой

Система поддерживает работу с сетевым сканером - достаточно загрузить в него документы и нажать кнопку сканирования на самом устройстве. Полученные результаты будут автоматически сохраняться и отправляться на дальнейшую обработку. Таким образом, управление сканированием сводиться к нажатию одной кнопки. А значит, не требуется ни специальных программ для управления сканером, ни отдельного рабочего места для управления сканированием, благодаря чему достигается существенная экономия времени.

 

Высокая скорость

При традиционном подходе обработка текста при распознавании может занимать достаточно много времени. В опции «Поточное сканирование» предусмотрена возможность параллельной обработки текста на нескольких серверах одновременно, что позволяет получить необходимую скорость обработки.

 

Интеграция с любыми системами

Процедура регистрации сканируемых документов практически не отличается от стандартной. Опция «Поточное сканирование» запускается непосредственно из используемой системы документооборота.

 

Простая система лицензирования

При покупке системы лицензируется только параметр «количество обрабатываемых страниц в месяц». А дополнительно, для выполнения задач OCR-распознавания текста, в комплект могут быть включены лицензии на использование одного или нескольких экземпляров продукта ABBYY FineReader Engine.

 

Возможность ручного контроля

На этапе запуска системы в эксплуатацию предусмотрена возможность вручную управлять работой системы. Это позволяет установить наиболее подходящие параметры настроек и подобрать оптимальное качество сканируемых документов.

 

Технические требования и загрузка дистрибутива

Для работы опции «Поточное сканирование» рекомендуется использовать ОС Windows Server 2003 или Windows Server 2008.

Требования к поточным сканерам:

  • Обязательно – поддержка TWAIN-интерфейса;
  • Рекомендуется – отсутствие предзахвата второй страницы.

Меню настроек опции «Поточное сканирование» . Предусмотрено создание нескольких профилей для различных размеров и расположения штрих-кода на документе. Сохранение отсканированного образа возможно в любом из распространенных текстовых или графических форматов.

Меню настроек опции «Поточное сканирование» . Предусмотрено создание нескольких профилей для различных размеров и расположения штрих-кода на документе. Сохранение отсканированного образа возможно в любом из распространенных текстовых или графических форматов.

 

Описание технологического процесса обработки документов

Принцип поточного сканирования основан на том, что на документ при регистрации наносится штрих-код. Потом помеченные штрих-кодом документы сканируются и автоматически (по штрих-коду) связываются с регистрационной карточкой соответствующего документа. Если на сканируемые документы уже нанесен штрих-код стандартного формата, то он также может быть использован для идентификации. Структурная схема работы системы представлена на рисунке.

Структурная схема работы опции

Структурная схема работы опции

В процессе сканирования предусмотрены как опция сохранения непосредственно графического образа документа, так и возможность последующего распознавания и сохранения в текстовом формате. Это существенно облегчает дальнейшую работу с документом и расширяет возможности использования поиска. Распознавание и перевод в текстовый формат реализуются с помощью ABBYY FineReader Engine.

Многоязычные документы

Опция «Поточное сканирование» позволяет обрабатывать документы на всех поддерживаемых ABBYY FineReader языках, включая русский, английский, немецкий, французский, испанский, итальянский, шведский, финский, болгарский, венгерский, словацкий, чешский, башкирский, белорусский, казахский, украинский.

 

Интеграция произвольной СЭД с опцией

Интеграция с опцией «Поточное сканирование» предполагает реализацию со стороны произвольной СЭД только двух функций:

  • Формирование и отправка в опцию «Поточное сканирование» заявки на сканирование - cо стороны СЭД передается запрос, содержащий требования на обработку документа. Опция регистрирует заявку и возвращает в СЭД ее уникальный идентификатор. На данном этапе осуществляется связка уникального идентификатора заявки на сканирование с штрих-кодом, уже существующем на документе, либо вновь сгенерированным.
  • Выполнение приема и сохранение итоговых результатов, сформированных опцией «Поточное сканирование» - при этом сопоставляются результатов выполнения сканирования с объектами СЭД. Причем данное действие, осуществляющееся на основе уникального идентификатора заявки на сканирование и может быть расширено любой бизнес - логикой СЭД.

 

Регистрация и сканирование документов

Регистрация документа, т.е. создание регистрационной карточки, выполняется по обычным правилам используемой системы электронного документооборота. Далее, при обращении к опции «Поточное сканирование», происходят регистрация заявки на сканирование, а также генерация штрих-кода и указание параметров заявки (расположение штрих-кода, требуемые форматы, необходимость распознавания). После того как регистрационная карточка документа будет записана в базу данных, на его первую страницу или на отдельный лист бумаги с помощью принтера наносится штрих-код. Он содержит уникальный идентификационный номер документа и устанавливает правила его обработки. Печать полученного изображения штрих-кода осуществляется средствами системы документооборота. Затем пакет зарегистрированных документов помещается в устройство подачи бумаги сканера, после чего их обработка производится автоматически.

Регистрация  документов

Применение штрих-кода

В процессе сканирования, нанесенный штрих-код используется как признак окончания текущего документа и начала следующего, а содержащаяся в штрих-коде дополнительная информация применяется для дальнейшей идентификации обрабатываемого документа.

 

Результаты сканирования

Графические документы

При сохранении графического образа документов система обеспечивает возможность конвертации изображений сканируемых документов в следующие форматы:

  • BMP (Windows or OS/2 bitmap);
  • PNG (Portable Network Graphics);
  • TIFF (Tagged Image Format);
  • JPEG (Joint Photographic Experts Group);
  • PDF (Portable Document Format).

Для каждого из них предусмотрена возможность указывать размеры изображения и дополнительные атрибуты (глубина цвета, тип сжатия и т.п.). Если размер требуемого формата отличается от текущего графического представления, то конвертация может быть выполнена с использованием заданных параметров.

Графические документы

Текстовые документы

В случае применения технологии распознавания текста, предусмотрена возможность сохранения в большинстве наиболее распространенных форматах файлов*:

  • Текстовый файл (.txt);
  • Rich Text Format (.rtf);
  • Microsoft Excel, Microsoft Excel 2007 (.xls, .xlsx);
  • Microsoft Word 2007 (.docx);
  • HTML (.html);
  • XML (.xml);
  • PDF (Portable Document Format).

Для каждого из них предусмотрена возможность указывать дополнительные атрибуты (размер страницы, кодировка и т.п.). В режиме сохранения в виде PDF-файла возможна как запись в виде изображения, так и в виде распознанного текста.

Таким образом, опция «Поточное сканирование» реализует эффективную технологию преобразования бумажных документов в электронный вид и позволяет в сжатые сроки осуществить переход к работе с их электронными образами. Продуманные настройки, гибкие механизмы управления и подробная документация для разработчиков делают работу с системой удобной и результативной.

*Список поддерживаемых текстовых форматов зависит от возможностей используемой системы распознавания и может изменяться.