Андреев Владимир, Digital Design

Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

В последнее время тема автоматизации документооборота стала одной из самых популярных в компьютерной прессе. Однако, как количество публикаций о программном продукте не всегда являются прямым отражением количества установленных копий, так и интерес к проблеме выказываемый прессой показывает скорее остроту проблемы, а не степень ее разрешения.

Поводом для написания данной статьи послужили наши многочисленные контакты с менеджерами информационных систем организаций различного размера, имевшие предметом вопросы автоматизации документооборота. Вывод, который мы сделали из этих контактов - проблема автоматизации документооборота волнует практически все организации, но в тоже время технические специалисты, как правило, не могут вразумительно сформулировать потребностей в данной области.

Данная публикация собственно и призвана ответить на то, что может ожидать потребитель от внедрения системы автоматизации документооборота. Для этого нам понадобится разобраться в том, что собственно является объектом автоматизации при внедрении системы документооборота, какие задачи необходимо решать и какое программное обеспечение может обеспечить решение данных задач.

Сразу нужно отметить, что главная задача, которую мы ставили перед собой в данной статье - формализация некоторой методологической базы для того, чтобы в дальнейшем рассматривать те или иные конкретные системы. Соответственно мы попробуем не столько описывать функции конкретных систем, сколько будем рассматривать саму задачу автоматизации документооборота, определим ее составляющие, и соответствующие им подсистемы.

Сложность подобной формализации вытекает из специфики предметной области документооборота.

Вообще говоря, если рассматривать деятельность любой организации под определенным углом зрения, ее можно описать как последовательность порождения, восприятия, модификации и сохранения определенного набора документов. При таком подходе автоматизация документооборота фактически выступает синонимом автоматизации предприятия в целом. Естественно нам придется искать более частное понимание данного вопроса.

Немного о терминах, или что такое “документооборот”

С одной стороны можно трактовать термин “документооборот” как отражение термина “делопроизводство”, достаточно хорошо формализованного в традиционном управлении (имеются даже соответствующие стандарты, зафиксированные в ГОСТ), при использовании его в компьютерной индустрии. В этом случае средства автоматизации документооборота сводились бы к компьютеризации традиционных задач делопроизводства – формированию дел и учету содержащихся в них документов, контролю исполнению и формированию соответствующей отчетности.

Другим способом трактовать термин “документооборот” было бы найти его аналоги в западной компьютерной индустрии. К сожалению подобного термина, однозначно соответствующего отечественному “документообороту” в западном компьютерном словаре не имеется. В зависимости от пристрастий и специфики описываемого программного продукта в прессе можно встретить следующие соответствия между термином “документооборот” и западными терминами:

  • DMS (Document Management Systems) – в русскоязычной литературе для данного термина имеется более точный перевод - Архивы документов;
  • DocFlow системы или системы маршрутизации документов;
  • И, наконец, довольно часто в качестве систем документооборота предстают WorkFlow системы. Более точно данный термин переводится как “Системы автоматизации бизнес-процессов”, имеется и другой перевод данного термина – “Системы поддержки управления”.

У специалистов в области автоматизации бухгалтерского учета, финансовой и складской деятельности также сложилась традиция использовать термин “документооборот” еще в одном аспекте. Здесь под документооборотом понимается подсистема программы, обеспечивающая генерацию “бумажной” отчетности (сводных ведомостей, накладных, справок и пр.) на основе данных, порождаемых в системе.

При рассмотрении вопросов связанных с автоматизацией документооборота обычно возникают смежные темы, такие как автоматизация перевода документов из бумажного вида в электронный, и связанная с ней задача распознавания текста и содержимого печатных форм, а также задача оптимизации стоимости хранения больших объемов данных.

В последнее время в прессе появились новые термины, близкие теме автоматизации документооборота - Document Warehousing (хранилища документов) и Knowledge Management (управление знаниями). Проблемы, стоящие за этими терминами, находятся в том же отношении к задачам автоматизации документооборота, в каком задачи организации хранилищ данных (Data Warehousing) и оперативного анализа данных (OLAP) относятся к системам оперативной обработки транзакций (OLTP). То есть системы данного класса являются дальнейшим развитием систем документооборота, и необходимы для структуризации и долгосрочного хранения больших массивов, накопленных в организации документов, а также оптимального поиска необходимой информации на массиве разнородных накопленных документов.

Прежде чем перейти к собственно структуризации задач и подсистем автоматизации документооборота необходимо отметить некоторые специфические особенности данной отрасли автоматизации предприятия.

Задача автоматизации документооборота лежит на стыке традиционных "бумажных" технологий работы с документами и новых компьютерных технологий. Дополнительные сложности вызывает то, что до сих пор четко законодательно не закреплен статус электронного документа. Существуют определенные сложности с сертификацией систем электронной подписи, и систем обеспечения секретности доступа к документам.

К тому же, задача документооборота не является изолированной технологической цепочкой в бизнес-процессе организации, документодвижение тесно интегрировано с другими подзадачами, решаемыми информационной системой организации. Таким образом, система автоматизации документооборота должна обеспечивать прикладные интерфейсы, позволяющие встраивать функции передачи и сохранения документов в прикладные системы, функционирующие в организациях, в которых она внедряется.

Все перечисленное позволяет сделать вывод - система автоматизации документооборота достаточно сложный механизм. Очевидно, не имеет смысла говорить об отдельном программном продукте, как о системе автоматизации документооборота организации. Система документооборота предприятия включает в себя множество подсистем, построенных с помощью программных продуктов, как правило, созданных различными производителями. Система автоматизации документооборота может по-разному интерпретироваться в зависимости от размера организации и специфики ее деятельности. Например, системы автоматизации документооборота небольшой торговой организации, законодательного собрания и проектной организации будут выполнять различные функции, строится на различных программных продуктах и вообще иметь мало общего.

На дискуссии, состоявшейся на прошлогоднем “Фестивале Microsoft”, в которой участвовали представители отечественных фирм, производителей программного обеспечения в области документооборота, было выработано солидарное мнение признать термин “документооборот”, плохо приспособленным для использования в компьютерной индустрии. Необходимо использовать термины, отражающие более частные задачи, входящие в комплекс задач обозначаемых термином “автоматизация документооборота”. Важным аспектом использования отдельных компонент информационной системы, выполняющим функции работы с документами является степень их интеграции между собой и возможности их встраивания сложившуюся инфраструктуру информационной системы.

В данной статье мы будем рассматривать некоторую идеальную систему автоматизации документооборота, включающую в себя максимальное количество функций. Естественно любая реальная система будет включать в себя лишь подмножество функций необходимых для конкретной организации.

Собственно уточнению этих более частных определений и будет посвящена оставшаяся часть нашего повествования.

Многоликий документ

Прежде чем детально обсуждать функции и реализацию отдельных компонентов системы автоматизации документооборота необходимо кратко остановиться формализации термина “документ” по отношению к рассматриваемым приложениям. Можно выделить несколько аспектов использования термина документ:

  • Бумажный” документ, представляет собой объект непосредственно не погруженный в информационную систему, но о котором в информационной системе имеется та или иная информация. Разновидностью данного типа документа может быть фотографическая копия документа, микрофиш, изображение, видеозапись, и пр.
  • Электронный образ документа – копия документа (результат сканирования), хранящаяся в информационной системе. Образ документа, помимо собственно изображения документа, представляющего собой файл в том или ином формате, может содержать некоторый набор свойств его идентифицирующих (название, категорию, дату создания, и пр.) При этом данная информация храниться не непосредственно в файле образа документа, а в некоторой внешней по отношению к нему базе данных.
  • Электронный документ – в отличие от образа документа, электронный документ, также представляющий собой файл, внутри себя содержит содержательную информацию, которая может быть использована, например, для поиска документа или отнесения его к той или иной группе. Например, это может быть текст или электронная форма Microsoft Word, таблица Excel, сообщение в формате электронной почты Internet. Файлы документов могут быть “сырыми”, то есть не содержащими внутри себя структурных элементов (обычные текстовые документы) или структурированными. Последние внутри себя содержат элементы структуры, позволяющие внешним приложениям получать информацию об отдельных элементах информации (формы Word, электронные таблицы, документы в формате XML). Еще одной разновидностью данной группы документов являются файлы составных документов, например файлы Binder Microsoft Office.
  • Особый тип документов составляют записи баз данных специализированных систем автоматизации групповой работы, таких как документы Lotus Notes или электронные формы Microsoft Exchange. В отличие от обычного электронного документа, данный документ не представлен в виде отдельного файла, но представляет собой некоторую целостную единицу информации, имеющую уникальный идентификатор, средство отображения и модификации. Данный тип документов может быть извлечен из системы и передан, например, посредством электронной почты, в другое подразделение и снова погружен в систему. В силу природы приложений документы данного типа изначально содержат внутреннюю структуру и могут содержать внутри себя другие файлы документов или ссылки на них.
  • К последней группе документов относятся отчеты порождаемые в результате работы прикладных АРМ’ов. Это особый тип документов динамически формируемых из различных записей различных баз данных. После просмотра или вывода на печать данный документ перестает существовать как целостный объект в информационной системе. Данный документ “живет” только в пространстве конкретного приложения и не может отчуждаться от него. Например, для передачи в другое подразделение он должен быть преобразован в документ одного из вышеперечисленных типов.

Нужно отметить, что хотя интеграция прикладных АРМ’ов в работу комплексной системы автоматизации документооборота является отдельной задачей, документы последней группы, как правило, оказываются за рамками системы автоматизации документооборота.

Идеальная система автоматизации документооборота должна предлагать механизмы для автоматизации работы с документами всех перечисленных типов, за исключением последнего. При этом механизмы эти должны соответствовать информационным возможностям соответствующих типов документов. Например, если документ содержит внутри себя помеченное поле, то система должна позволять поиск непосредственно по данному полю, если же документ не содержит структуры, то поиск должен быть осуществлен просто по наличию слова в документе. Если документ не содержит внутри себя информации, которая “понятна” компьютеру (образ документов) система должна обеспечить поиск по различным атрибутам данного файла документа, хранящимся в информационной системе.

Теперь давайте выделим характерные подзадачи нашей идеальной системы автоматизации документооборота и формализуем их функции, учитывая при этом различные типы документов, с которыми приходится работать пользователям системы.

Подсистемы и их функции

В данной публикации мы сможем лишь коротко остановиться на функциях подсистем, решающих отдельные задачи автоматизации документооборота. Более детальному обсуждению каждой из задач и особенностей программного обеспечения для их реализации будут посвящены дальнейшие публикации данной рубрики.

Как мы уже убедились, система автоматизации документооборота складывается из нескольких подсистем. Каждая подсистема обладает набором специфических для нее функций. При этом отдельные подсистемы тесно взаимодействуют между собой. Разделение системы документооборота на подсистемы, предпринимаемое нами носит несколько “академический” характер. В реальной практике программные продукты достаточно условно можно отнести к той или иной группе в нашей классификации. Как правило, системы реализуют лишь часть функций, описанных ниже, при этом продукт одного класса может включать в себя часть функций систем другого класса. По этому построение систем автоматизации документооборота из существующих на рынке продуктов требует не только хорошего понимания конечной задачи, но и отличного знания рынка программного обеспечения.

Можно выделить следующие подсистемы автоматизации документооборота:

  • Системы автоматизации делопроизводства;
  • Архивы документов;
  • Системы ввода документов и системы обработки образов документов;
  • Системы управления стоимостью хранения документов;
  • Системы маршрутизации документов;
  • Системы комплексной автоматизации бизнес-процессов.

Давайте кратко остановимся на функциях каждой из них.

Системы автоматизации делопроизводства

Функции автоматизации делопроизводства в том или ином виде представлены в любой системе автоматизации документооборота. В функции систем автоматизации делопроизводства не входит хранение и перемещение документов в организации. В их функции входит фиксация документов в специальной базе данных, выражающаяся в заполнении специальной карточки документа. Содержимое карточки документа может варьироваться в зависимости от сложившейся в организации ситуации. Структура документов, зафиксированных в базе данных, опирается на так называемую номенклатуру дел, имеющуюся, как правило, в каждой организации, а технология учета и обработки документов опирается на сформулированное в данной организации “Положение о делопроизводстве”. Как мы уже отметили, документы хранятся в бумажном виде, в специальном архиве, но в базе данных отображается их текущее местоположение и статус, включая атрибуты контроля исполнения. Обычно в системах делопроизводстве различают входящие и исходящие документы, нормативно-распорядительные документы, документы коллегиальных органов управления, справочные документы и пр. Документы, находящиеся на контроле исполнения, подразделяются по исполнителям, статусу исполнения, срокам исполнения и прочее. Каждый документ в системе представляет собой запись в базе данных, характеризующуюся набором значений атрибутов карточки. Помимо учета и поиска документов в базе данных, система должна обеспечивать генерацию отчетов, позволяющих получить ведомости исполнения документов и прочую сводную информацию.

Для разработки приложений, выполняющих функции автоматизации делопроизводства больше всего подходят стандартные инструменты, используемые для разработки автоматизированных рабочих мест, от настольных баз данных до систем на базе различных SQL серверов.

Однако в том случае, если автоматизация документооборота не закончиться данным шагом, то можно подумать и о других инструментах, обеспечивающих более последовательное развитие системы. Так например, при переходе к электронному хранилищу документов база данных системы делопроизводство должна содержать ссылки на соответствующие объекты электронного архива, при использовании электронных средств маршрутизации документов система должна обеспечивать возможность рассылки документов на рабочие места пользователей, определения текущего местоположения документа и так далее. О конкретных решениях и программных продуктах для реализации данных функций мы поговорим в наших последующих публикациях.

Архивы документов

Архив документов это то, что собственно хранит электронный документ. При этом может храниться либо образ документа, либо его содержание, либо и то и другое. Помимо собственно хранения документов, архив должен обеспечивать навигацию по иерархии документов и их поиск.

В отличие от поиска по атрибутам документов, который имелся и в системах предыдущего класса, архивы документы должны обеспечивать полнотекстовый поиск по содержимому текстовых фрагментов в документе. В предельном случае поисковый механизм должен обладать некоторым интеллектом, то есть обеспечивать поиск близких грамматических конструкций, а также поиск близких по смыслу слов.

В отличие от систем предыдущего класса, в архивах хранятся сами документы, и по этому система должна обеспечивать разграничение прав доступа к документам. Пользователь может идентифицироваться либо посредством сетевого имени, либо с помощью специального имени и пароля определенного в системе управления архивом. Помимо разделения прав доступа на уровне пользователей система должна обеспечивать выделение групп пользователей или ролей.

Следующей функцией архива документов является обеспечение возможности групповой работы с документами, находящимися в стадии создания - это функция блокировок документов или Check-In/Check-Out контроль. Если один из пользователей системы начинает редактировать документ, он блокируется для доступа других пользователей до тех пор, пока с ним не закончится работа.

Еще одной функцией архива является поддержка контроля версий. Версии документов могут фиксироваться либо автоматически, либо по инициативе пользователя. В случае необходимости пользователь может вернуться к одной из предыдущих версий документа.

К сервисным функциям архива документов относятся возможность создания резервных копий документов без прекращения работы системы, интеграция с системами обеспечения оптимальной стоимости хранения данных и прочее.

Системы ввода документов и системы обработки образов документов

Одной из самостоятельных функций систем документооборота является ввод документов в архив. Под этим понимается перевод документов из бумажного вида в электронный. В простейшем случае эта процедура сводиться к простому сканированию. Однако, как правило, простого сохранения образа документа оказывается недостаточно.

Образ документа может потребовать так называемого аннотирования, наложения на образ документа различных дополнительных образов, выделений, текстовых пометок и прочее. Помимо этого, образ документа должен быть снабжен набором атрибутов, который позволит его идентифицировать в системе делопроизводства и в архиве документов. Эти операции производятся вручную.

Более сложной функцией является автоматическое распознавание содержимого образа документа и формирование документа, содержащего его текст. Для этого предназначены программы, относящиеся к классу ПО распознавания текста. Еще более сложной функцией является распознавание содержимого форм. При этом программа определяет наличие записей, в том числе и рукописных в определенных полях бланка документа, распознает его содержимое и автоматически заполняет значения атрибутов данного документа в системе. При необходимости значения определенных полей бланка может выбираться из определенного в системе справочника.

Системы управления стоимостью хранения документов

Совершенно очевидно, что при сохранении в архиве образов документов объемы хранения могут быстро расти и достигать значительных объемов. При этом интенсивность обращения к документам, находящимся в архиве далеко не равномерна. Документы, находящиеся в работе, очевидно, затребуются достаточно часто, в то время как доступ к документам, работа с которыми уже завершена, осуществляется очень редко. Соответственно, система может обеспечивать различную оперативность доступа к различным документам. Так как стоимость хранения документов в архиве, как правило, обратно пропорциональна скорости доступа, то можно воспользоваться отмеченной закономерностью для оптимизации стоимости содержания архива.

Системы управления стоимостью хранения как раз и решают данную задачу. Обеспечивая возможность работы с периферийными различными устройствами – накопителями на жестких магнитных дисках, On-Line оптическими стойками, накопителями на магнитной ленте и CD-ROM устройствами. Система обеспечивает автоматический перенос данных на более “дешевые” устройства в случае, если доступ к ним осуществляется недостаточно часто.

Системы маршрутизации документов

Системы маршрутизации документов занимаются непосредственно пересылкой документов на рабочие места исполнителей, сбор информации о текущем статусе документов, осуществляют консолидацию документов по завершению работы с ними на отдельных этапах, а также обеспечивают средства доступа к информации о текущем состоянии работ с документами.

Системы маршрутизации, как правило, содержат средства описания типовых маршрутов прохождения документов в организации. На основании разработанных маршрутных схем могут порождаться экземпляры бизнес-процессов работы с документами. В данном случае можно говорить о жесткой маршрутизации.

Альтернативой является так называемая свободная маршрутизация, при которой маршрут формируется “стихийно”. Каждый пользователь системы, обладающий соответствующими правами, может определить следующего или следующих исполнителей документа.

Администратор системы и менеджер, курирующий конкретный бизнес-процесс, может контролировать текущее состояние маршрута и вносить различные корректирующие воздействия в случае необходимости.

При маршрутизации документов возможны две схемы, назовем их Off-Line и On-Line. В первом случае при пересылке документа на рабочее место пользователя происходит его физическое извлечение из архива документов и доставка (например, с помощью электронной почты) на рабочее место клиента. По завершению работы документ обратно погружается в архив.

В этом случае система маршрутизации сама является клиентом архива документов и вносит соответствующую информацию в учетную базу данных.

Вторая схема не подразумевает физического перемещение документа. Система маршрутизации документов обеспечивает клиенту интерфейс для доступа к заданиям на обработку документов.

Обе схемы маршрутизации имеют свои достоинства и недостатки. К сожалению, в связи с ограниченностью пространства, обсуждения нюансов использования систем маршрутизации мы вынесем в отдельные публикации.

Системы комплексной автоматизации бизнес-процессов

Развитием систем маршрутизации документов являются WorkFlow системы, или системы комплексной автоматизации бизнес-процессов. В отличие от систем маршрутизации документов, объектом маршрутизации в них является совокупность данных используемых в некотором бизнес-процессе. Пользователь получает на рабочее место информацию о том, что он должен сделать и все необходимые для этого данные. WorkFlow приложение определяет, какое приложение должно быть запущено для реализации функций на данном рабочем месте, и загружает в него необходимые данные. Парадигма WorkFlow системы предполагает, что пользователь должен выполнять только необходимые функции, всю рутинную работу – определение последовательности действий, доставку необходимой информации, контроль своевременности исполнения работы и прочее выполняет система WorkFlow.

Функции WorkFlow приложений выходит за рамки функций систем документооборота, однако, технологии, используемые в данных приложениях очень близки технологиям, используемым в системах маршрутизации документов, к тому же маршрутизация документов может рассматриваться как частный случай задачи построения WorkFlow систем, поэтому мы уделили им некоторое внимание.

В основе системы документооборота лежит подсистема хранения. В простейшем случае это может быть база данных учета документов в системах автоматизации делопроизводства. Клиентское рабочее место осуществляет возможность занесения информации о документах в систему, поиск документов по их атрибутам, модификацию информации (текущее местоположение, статус исполнения и прочее) и управление данными.

В том случае, если система документооборота хранит документы или их образы необходима специальная среда их хранения. В простейшем случае для этого может использоваться файловая система. В более сложном случае это может быть специализированная система построения архива документов. База данных должна содержать информацию о правах доступа к документам, блокировках и пр. В этом случае возможно присутствие систем оптимизации стоимости хранения документов и системы поддержки полнотекстового индексирования.

Клиентские приложения, соответственно, должны включать такие дополнительные функции, как доступ к документам в архиве, поддержка блокировки и изменения атрибутов документов, а также возможность полнотекстового поиска.

Для ввода документов в систему может использоваться система распознавания текстов и печатных форм.

В случае наличия в системе средств маршрутизации база данных хранит дополнительную информацию о маршрутах движения документов, текущем состоянии маршрутов и пр. Модуль маршрутизации осуществляет непосредственную доставку документов на рабочие места пользователей и внесение информации об изменении статуса документов в базу данных. Клиентское рабочее место системы маршрутизации может непосредственно не взаимодействовать с базой данных и архивом документов, а получать доступ к документам посредством среды маршрутизации, в качестве которой может использоваться электронная почта.

Что дальше

Естественно в рамках одной публикации не представляется возможным осветить все вопросы, связанные с созданием систем документооборота. Мы не коснулись таких вопросов, как организация распределенных систем, их масштабируемости, вопросов взаимодействия систем различных производителей и многого другого.

В данной статье мы хотели лишь выработать некоторый взгляд, который позволит в дальнейших публикациях использовать некоторые термины и рассматривать различные продукты и технологии под общим углом зрения.

В дальнейшем мы планируем рассмотреть конкретные системы и технологии, предоставить слово отечественным производителям систем документооборота, более детально рассмотреть вопросы стандартов, существующих в данной отрасли, и многое другое.