Технологии электронного документооборота

В основе электронного документооборота лежат технологии управления потоками информации (документов) docflow и технология потоков управления работами workflow. Технология docflow обеспечивает движение документа по маршруту, определяет условия и возможности его перемещения.

Технология workflow обеспечивает порядок работ по обработке документа. Она управляет заданиями по обработке документа и ролевой моделью управления правами доступа к документу. Кроме вышеперечисленных, в СЭД применяются различные технологии, связанные с необходимостью обработки и преобразования документов.

Технологии хранения электронных документов. Электронный документ в СЭД состоит из набора атрибутов, определяющих его свойства и использующихся для различных автоматизированных задач, таких, как поиск, классификация, построение отчетов, групповая обработка, и т. д., и непосредственно файла документа. В некоторых случаях файл документа может создаваться «на лету», автоматически по заданному шаблону, в котором переменные заменяются значениями из атрибутов документа и из базы данных.

Атрибуты электронного документа, как правило, хранятся в таблицах базы данных. Если файл документа может быть проиндексирован, то его текст помещается в специальный индексный каталог системы управления базами данных (СУБД) для индексации, что позволяет выполнять полнотекстовый поиск.

Сам файл документа записывается в папку информационного хранилища системы документооборота. Как правило, доступ к такому файлу предоставляется пользователям через систему управления правами доступа СЭД. Прочий доступ к файлу закрывается.

Технология поточного сканирования. Поточное сканирование — это массовое сканирование документов с последующим помещением отсканированных образов в базу данных системы учета (архивного хранения, документооборота). Для обеспечения данной технологии нужно специальное оборудование — поточные сканеры.

При поточном сканировании возможно (в зависимости от используемого оборудования) автоматическое нанесение штрих-кода на сканируемый документ, а также создание регистрационных карточек. Если карточки создаются в системе документооборота, то возможна их автоматическая регистрация (присвоение номера и записи даты регистрации) с последующим направлением карточки по заданному маршруту.

Оптическое распознавание документа — это процесс преобразования электронного образа документа в текстовый формат. Электронный образ документа получается при сканировании или фотографировании документа, а также в случае специального преобразования текстового документа в графический формат, например, jpeg. Процедура преобразует графический образ документа в редактируемый текст.

Для оптического распознавания используются специальные программные средства. Они могут быть самостоятельными приложениями или интегрированными в систему документооборота. Самостоятельные приложения для оптического распознавания имеют более мощные возможности и позволяют распознавать даже рукописный текст.

Штрихкодирование документов — это комплекс процедур по формированию и нанесению на документ графического изображения уникального штрихкода. При формировании штрихкода необходимо, чтобы созданный штрихкод был абсолютно уникальным. Для этого необходимо использовать идентификаторы (GUID).

Штрихкодирование обеспечивает однозначную идентификацию документа и применяется:

  1. При регистрации входящих документов. Для документа создается электронная регистрационная карточка. На бумажный документ наносится штрихкод, соответствующий идентификатору, указанному в регистрационной карточке. Для нанесения штрихкода используются самоклеящиеся этикетки, на которых печатается штрихкод. Этикетки могут быть подготовлены заранее (при большом количестве регистрируемых документов) или печатаются в момент регистрации.
  2. Для поиска электронного документа в базе данных. Использование поиска по штрихкоду позволяет быстро найти в базе документооборота карточку документа. Поиск происходит автоматически после считывания с документа штрихкода.
  3. Для учета мест хранения оригиналов документов. При считывании штрихкода происходит автоматическое занесение в раздел «Места хранения» карточки документа информации о текущем времени и пользователе, выполнившем сканирование. Данная операция может использоваться при большом объеме документопотоков для регистрации поступивших в подразделение документов; в архиве для регистрации поступивших или выдаваемых документов.

Подписание электронной подписью документа позволяет удостовериться в неизменности электронного документа с момента его подписания, а также удостовериться в корректности подписи. Подписание происходит в системе документооборота или другой программе с использованием специального программного обеспечения, называемого криптопровайдером электронной подписи, — программного ключа (сертификата).

Сертификат электронной подписи — это файл в специальном формате. Сертификат создается одним из удостоверяющих центров — организаций, имеющих соответствующие лицензии.

Для выполнения процедуры подписания необходимо наличие на компьютере сертификата электронной подписи и программного обеспечения криптопровайдера. Для обеспечения сохранности сертификата электронной подписи от его хищения злоумышленниками необходимо использовать специальные аппаратно-программные комплексы, такие, как смарт-карты или ключи типа RuToken. Они имеют специальное защищенное хранилище и позволяют использовать ПИН-коды при обращении к сертификату. В случае если ПИН- код будет несколько раз введен неправильно, сертификат будет заблокирован, использовать его будет невозможно.

Технология полнотекстового и атрибутного поиска. Атрибутный поиск — это поиск по одному или нескольким значениям в полях карточек документов. Для выполнения атрибутного поиска используют специальные формы, содержащие поля для ввода критериев поиска.

Каждое поле критерия относится к конкретному полю карточки документа. Например, критерий поиска по регистрационному номеру обеспечивает поиск в поле «Регистрационный номер», а критерий «Контрагент», обеспечивает поиск в поле «Отправитель» или «Получатель» и т. д. При выполнении поиска система сравнивает значения критериев со значениями в карточках и заносит в результаты отбора те карточки, у которых значения совпали. При атрибутном поиске возможно задание условий «И ИЛИ НЕ». Возможен также поиск с учетом либо точного совпадения значений, либо частичного совпадения.

Интересно
Полнотекстовый поиск — это поиск по одному или нескольким критериям в тексте электронных документов. При полнотекстовом поиске возможен поиск по словоформам, если поисковая система это поддерживает. В большинстве СЭД полнотекстовый поиск выполняется средствами, предоставляемыми СУБД, которые используют СЭД для хранения документов.

Мощные средства полнотекстового поиска есть в СУБД MS SQL SERVER и в ORACLE. Некоторые СЭД используют собственные форматы баз данных и собственные технологии поиска. Для того чтобы полнотекстовый поиск был возможен, необходимо, чтобы документ был представлен в одном из форматов, для которых имеется возможность полнотекстового поиска.

В первую очередь, это текстовые форматы, форматы документов (doc, docx и др.), таблиц (xls и др.), презентаций, почтовых сообщений. Документ в таком формате помещается в специальный индекс СУБД. Если же документ представлен в графическом формате (Tif, jpeg и т. п.), то для того, чтобы он мог участвовать в полнотекстовом поиске, необходимо выполнить процедуру его оптического распознавания. В результате будет создан файл, содержащий текст документа. Этот файл будет прикреплен к карточке, и по нему станет возможно выполнение поиска.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)