Научная статья на тему 'Модель интеллектуальной электронной системы документооборота для обеспечения эффективной работы персонала организаций'

Модель интеллектуальной электронной системы документооборота для обеспечения эффективной работы персонала организаций Текст научной статьи по специальности «Политологические науки»

CC BY
2
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Альманах «Крым»
ВАК
Ключевые слова
персонал организаций / система электронного документооборота / машинное обучение / мультиагентные технологии / тематическое моделирование / organizational personnel / electronic document management system / machine learning / multi-agent technologies / topic modeling

Аннотация научной статьи по политологическим наукам, автор научной работы — Моргунов А. В.

В статье поставлен и решен ряд задач по оптимизации на каждом этапе документооборота с использованием подсистем. Рассмотрены особенности развития модели интеллектуальной системы управления документами, которая может быть задействована на предприятиях. Доказано, что осуществимость и эффективность предлагаемой модели интеллектуального документооборота на основе машинного обучения и мультиагентного моделирования процессов поиска информации обеспечивает максимальную надежность и сокращение времени работы с документами. Также анализируется процесс применения тематического моделирования, методы и алгоритмы анализа текста на основе на мультиагентного подхода, который можно использовать построив систему интеллектуального документооборота.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Model of an intelligent electronic document management system to ensure efficient work of organizational personnel

The article poses and solves a number of optimization problems at each stage of document flow using subsystems. The features of the development of a model of an intelligent document management system that can be used in enterprises are considered. It has been proven that the feasibility and effectiveness of the proposed model of intelligent document management based on machine learning and multi-agent modeling of information retrieval processes ensures maximum reliability and reduction of time for working with documents. The process of applying topic modeling, methods and algorithms for text analysis based on a multi-agent approach, which can be used to build an intelligent document management system, are also analyzed.

Текст научной работы на тему «Модель интеллектуальной электронной системы документооборота для обеспечения эффективной работы персонала организаций»

Моргунов А.В.

Магистрант, Московский автомобильно-дорожный государственный технических университет (МАДИ).

Модель интеллектуальной электронной системы документооборота для обеспечения эффективной работы персонала организаций

В наши дни системы электронного документооборота используются в различных областях. Они играют ключевую роль в структурировании процессов оформления документов в компаниях, приведении их в единый порядок, оптимизации работы сотрудников за счет обеспечения эффективного и бесшовного доступа к документам с функцией автоматизации рутинных операций по отслеживанию и поиску необходимой информации и формированию отчетов о документообороте. Качество и эффективность обработки документов во многом определяют выручку компании. по мере развития предоставления электронных услуг, которые осуществляют компании, число обработанных запросов может достигать нескольких тысяч в сутки. поскольку процессы особенно в крупных предприятиях типизируются, как и документы, применение интеллектуальных алгоритмов будет эффективнее, чем в структуре со сложной и уникальной организационной структурой.

История документооборота уходит корнями в конец XIX в., начинаясь с изобретения картотеки. В 1898 г. Эдвин Гранвилл Сейбельс разработал вертикальную систему подачи, в которой бумажные документы были организованы в ящики, помещенные в сложенные шкафы. Эти шкафы останутся основным методом хранения документов в деловом мире на протяжении большей части ХХ в. [1]. В 1980-е гг. с ростом доступности компьютерных технологий разработка серверов позволила организациям хранить документы в электронном виде в централизованных мейнфреймах. Это послужило рождению систем электронного документооборота. Изобретение сканеров позволило конвертировать бумажные документы в цифровые. Рост числа компьютеров дал возможность предприятиям создавать и хранить документы на компьютерах в офисе [2].

Современные системы электронного документооборота централизованно хранят большие объемы цифровых документов. Для обеспечения корректной классификации электронных документов

многие системы электронного управления документами опираются на подробный процесс хранения документов, включая определенные элементы, называемые метаданными. Современные корпорации используют оригинальные протоколы хранения в своих системах электронного документооборота для повышения информационной безопасности, что делает систему электронного документооборота особо ценной для бизнеса или безопасности организации. Массовое увеличение объема электронного документооборота из-за пандемии COVID-19 привело к увеличению механической однотипной работы сотрудников, руководителей и сотрудников служб документооборота организаций, которые регистрируют и обрабатывают тысячу и более документов в день. Увеличились трудозатраты и временные затраты.

Усовершенствовать традиционные системы электронного документооборота можно путем применения анализа данных и машинного обучения, оптимизации работы сотрудников организации и качественного прохождения всего жизненного цикла электронного документа при минимальном вмешательстве человека в процесс [4]. Новые системы документооборота могут понимать предыдущие запросы пользователя, обнаруживать связанные данные и структурировать вычисления, необходимые для получения нужных результатов. Опора на концепцию подсистемы поддержки для принятия решений на основе применения взаимодействий типа «пользователь — Системы электронного документооборота (СЭД) — Документ» позволяет сформировать такие технологии машинного обучения, которые будут использоваться для автоматизации процесса обработки документов на примере конструкторской документации СЭД, создания формализованных критериев, алгоритма проектирования и адаптации СЭД, использования автоматизированного ввода данных из отсканированных копий документов контрактного отдела [5; 6].

СЭД предназначены для повышения эффективности и прозрачности процессов документооборота и выполнения следующих основных функций:

• получение, обработка, регистрация и хранение - входящей и исходящей корреспонденции, в том числе внутренней;

• получение, обработка, регистрация, хранение и повторная передача ссылок физических и юридических лиц;

• получение, обработка, регистрация и хранение организационно-распорядительных документов;

• осуществление контроля за оформлением документов;

• процесс чтения, создания, утверждения, подписания,

• оформление, оформление, закрытие и хранение документов;

• процесс электронного обмена документами;

• процесс формирования и хранения отчетов.

Машинное обучение — область, целью которой является модернизация компьютерных программ при помощи обучения и действиям без явного программирования, подход к анализу данных, включающий построение и адаптацию моделей, позволяющих программам «учиться» на предыдущем опыте. Машинное обучение предполагает построение алгоритмов, адаптирующих модели для улучшения их способности формировать прогнозы или дальнейшие действия на аналогичных процедурах, заложенных в модель [10]. Такое обучение дает возможность классифицировать данные для анализируемых документов, что обеспечивает выбор правильного шаблона при формировании электронного документа [7].

Для создания и оценки моделей машинного обучения с множественной классификацией текста, включая подходы к глубокому обучению, используется оптическое распознавание символов (OCR). проприетарный подход (англ. proprietary software; от proprietary — частное, патентованное, в составе собственности + software — программное обеспечение) основан на применении семантической карты в качестве инструмента сокращения признаков для классификации документов [8]. Имеется ряд трудностей, связанных предоставлением агенту технологий для документов. Однако этот недостаток компенсируется разработкой новой концепции классификации знаний, интегрированной в архитектуру когнитивного агента, позволяющей ускорить процесс ее вывода [9]. Агент может выбрать только класс правил, допускающий действие, вместо того, чтобы пытаться исчерпывающе вывести всю его базу правил.

Для разработки модели, методов и эффективных алгоритмов, обеспечивающих извлечение информации из документов, составления интеллектуального текстового анализа и оптимизации всего бизнес-процесса документооборота необходимо: во-первых, провести сравнительный анализ существующих систем электронного документооборота на рынке информационных систем; оптимизировать каждую из подсистем системы электронного документооборота; построить модель интеллектуальной системы документооборота для обеспечения эффективной работы персонала организаций.

Существующие СЭД представляют собой автоматизированные информационно-справочные системы, предназначенные для автоматизации следующих технологических процессов: обработка электронных документов (ЭД); обеспечение механизмов управления выполнением ЭД; разрешение доступа к ЭД; обеспечение доступа к

опубликованным документам. Для обеспечения этих целей СЭД использует следующие функции: подготовку, регистрацию, хранение, архивирование и обеспечение транспортной среды для обмена документами между организациями. СЭД состоит из ряда подсистем: обработки внутренней и внешней корреспонденции; подготовки и утверждения проектов документов; поддержки нормативных и справочных документов; информации (NRIS); подготовки отчетной информации; взаимодействия с временной архивной базой; системного администрирования; обеспечивающей взаимодействие с СЭД.

Эта функциональная структура подходит для традиционных систем электронного документооборота, но требует модификации и оптимизации для построения новой модели интеллектуальной системы документооборота. На рынке информационных систем представлен ряд систем электронного документооборота: Indocs, Directum, Softline, — которые могут обеспечить только типовую автоматизацию документооборота. Эти системы создают полную автоматизацию оформления документов, но при ежедневном увеличении объема документов с регламентированным временем их обработки качество и эффективность взаимодействия документов во многом зависят от оперативности и оперативности организаций. применение интеллектуальных алгоритмов будет эффективнее в повышении производительности работы сотрудника и организации в целом.

Для реализации интеллектуального рабочего процесса необходимо усовершенствовать вышеупомянутые подсистемы с использованием машинного обучения. подсистема обработки внутренней и внешней корреспонденции выполняет следующие основные операции:

1. Регистрация документов: в этой операции определяются первичные детали документа и последующий ход его обработки.

2. Определение решений для документа: в ходе операции документ определяется в соответствии с иерархической структурой организации — документ переходит от руководителя к окончательному исполнителю.

3. постановка документа на контроль: операция может быть выполнена после регистрации документа в СЭД или в любой момент обработки документа.

4. Выполнение инструкций по данному документу.

5. Вывод из-под контроля.

В данной подсистеме предполагается выполнение таких задач, как кластерный анализ данных и прогнозирование атрибутов документа. процесс обработки документов полностью зависит от набора атрибутов. Так, документы от конкретного адресата и по конкретной теме

должны обрабатываться конкретным блоком и по вполне определенным правилам. В настоящее время обработка каждого документа осуществляется на 100% вручную. Учитывая структурированный характер такой информации, этим же правилам можно легко научить алгоритм машинного обучения. при использовании базы данных, в которой документы структурированы по правилам организации, алгоритмы машинного обучения будут готовы самостоятельно прогнозировать новые атрибуты и маршруты обработки новых документов, а также прогнозировать количество дней, необходимое для выполнения задания и идентификации исполнителя. Для того чтобы алгоритмы научились делать это с высокой точностью, необходима база структурированных данных огромных объемов:

• автозаполнение при регистрации. Исходя из содержания текста, система должна автоматически заполнять необходимые данные в карточке документа, определять связь с другими аналогичными документами или перепиской и предлагать адресату самого сообщения, исходя из данных о выполнении аналогичных дел. И по тому же принципу определяются сроки обработки документов;

• автоматическое абстрагирование. Ручное абстрагирование (создание краткого, содержательного «отрывка» из полного документа) — сложная, трудоемкая работа, поэтому также целесообразно использовать средства автоматической генерации.

В подсистеме подготовки и утверждения проектов документов для автоматизации процессов подготовки и согласования документов вводится условный вид документа — «проектный документ», характеризующийся собственной карточкой и имеющий свой уникальный регистрационный номер. подсистема в свою очередь обеспечивает связь с такими подсистемами, подсистема обработки внутренней и внешней корреспонденции и подсистема работы с NSI, для запроса элементов каталогов, которые используются для заполнения реквизитов документов.

Справочники используются для определения значений реквизитов проектов документов, поэтому при обработке документов осуществляется их регистрация, запрос данных справочников из подсистемы NSI. В данной подсистеме предполагается реализация задач интеллектуальной маршрутизации, подготовки шаблона ответа и интеллектуального поиска в системе.

подсистема обеспечения нормативно-справочной информации создает доступ к NSI системы. Массив данных, используемый в системе NSI, классифицируется на: во-первых, используемые при обмене документами между юридическими лицами; во-вторых, спра-

вочники для определения реквизитов документов самого компании. Данная подсистема предоставляет другим подсистемам, входящим в состав СЭД, необходимые данные. В этой подсистеме должны быть реализованы следующие задачи: интеллектуальный каталог; реализация умного гида; семантический поиск слов.

подсистема подготовки отчетной информации предназначена для получения статистической информации о документах, обрабатываемых в системе. помимо предоставления стандартных форм статистической отчетности, существует возможность создания шаблонов форм отчетности, отражающих специфику определенной компании.

подсистема управления шаблонами отчетов и создания форм отчетов предоставляет такие функции, как получение форм отчетов с использованием доступных шаблонов отчетов и создание шаблонов отчетов и определение графика создания форм отчетов, доступных пользователям. Эта подсистема взаимодействует с подсистемой обработки документов и NSI для получения необходимой информации. В подсистеме предполагается формирование: интеллектуальных отчетов; отчета по просроченным документам в режиме реального времени; отчета по каждому исполнителю с детальной нагрузкой каждого исполнителя; отчета по контрольным документам.

подсистема взаимодействия с архивом СЭД обеспечивает передачу в архив СЭД (документов, оформленных в делопроизводстве предыдущего года). Данная подсистема взаимодействует с подсистемой обработки документов и NSI для получения необходимой информации и передачи документов во временное архивное хранилище. подсистема обеспечивает автоматизацию перевода бумажных документов в электронный формат.

подсистема сканирования позволяет хранить электронные документы для разных баз данных и просматривать список отсканированных документов. В этой подсистеме должны быть реализованы задачи распознавания текста в отсканированных документах и применения метода машинного обучения к отсканированным текстам.

подсистема системного администрирования предполагает наличие функций системного администратора. Кроме того, подсистема обеспечивает аудит операций, выполняемых самим системным администратором, за исключением определения прав доступа к системным объектам; администрирование систем, которые выходят за рамки данной подсистемы: резервное копирование, установку системы, настройку параметров системы и т.д.

В целях реализации отмеченных выше задач предлагается использовать тематическое моделирование, представляющее собой метод

построения модели коллекции текстовых документов, определяющий, какие темы связаны с каждым из документов. Тематическая модель набора текстовых документов определяет, какие темы охватываются каждым документом и какие слова (термины) составляют каждую тему. Наиболее популярные методы тематического моделирования можно разделить на две основные группы: алгебраическую и вероятностную (генеративную). Алгебраические модели включают стандартную модель векторного пространства (VSM), латентный семантический анализ (LSA) и среди вероятностных наиболее популярны вероятностные LSA (pLSA) и латентное распределение Дирихле (LDA), а также аддитивная регуляризация тематических моделей (ARTM) на основе этих алгоритмов.

Модель интеллектуальной системы документооборота разработана на основе новых методов и алгоритмов анализа текста на основе машинного обучения, а также мультиагентного подхода. Новизна методов машинного обучения заключается в упрощенной настройке и разработке информационно-поисковых систем и облегченном переключении всей системы документооборота на новую предметную область. Мультиагентный текстовый анализ и извлечение информации состоят из использования двух типов агентов: лексические агенты соответствуют объектам предметной области, обнаруженным в тексте; когнитивно-лингвистические агенты детализируют эти объекты и устанавливают связи между ними. Все агенты действуют параллельно и независимо. Агенты извлекают информацию из текста в виде онтологических структур (фактов, объектов, отношений). Результатом их действий становится информация, представленная сетью агентов, где каждый агент формирует объект или экземпляр отношения, соответствующего какому-либо классу онтологии.

Использование мультиагентного подхода позволяет создавать альтернативы системам анализа текста с последовательной архитектурой. Особенностью подхода является представление разработанной системы с помощью автономных сущностей — агентов, обладающих способностью взаимодействовать со средой и другими агентами. В процессе этого взаимодействия происходит функционирование системы.

Ни одна из существующих традиционных систем электронного документооборота не может быть представлена как умная система документооборота. В связи с этим была разработана модель интеллектуальной системы электронного документооборота, которая характеризуется внедрением новых модулей для совершенствования бизнес-процессов электронного документооборота.

Для дальнейшего внедрения самообучающейся, саморазвиваю-

щейся и саморегулируемой системы документооборота предлагается модель интеллектуальной СЭД (рис. 1). Реализация этой модели позволит совершенствовать механизм маршрутизации документов, статистическую обработку схем маршрутизации (статистика согласований, делегирование, узкие места, временные задержки), реконфигурацию маршрута документов, разработку системы операций с документами, формирование базы знаний, работу с большими потоками документов, распознавание документов и т.д.

К новым методам оптимизации бизнес-процессов систем EDI относятся такие, как: поиск дубликатов, поиск связанных/аналогичных документов, алгоритм более точного прогнозирования атрибутов документов, автоматическая регистрация документов, интеллектуальная маршрутизация, подготовка шаблонов ответных писем и формирование интеллектуальных отчетов. Результатом текстового анализа является совокупность найденных фактов, представленных в виде текстового охвата информационных объектов данной предметной области. Неоднозначность текста на этом уровне проявляется в наличии конфликтующих отношений между объектами, где каждый конфликт, по сути, порождает отдельную версию объектного охвата текста. предложенная проблема разрешения конфликтов заключается в удалении всех неоднозначностей, чтобы система была бесконфликтной и при этом сохраняла как можно больше объектов и отношений. Разработан способ верификации для семейств распределенных и мультиагентных систем, генерируемых контекстно-

Рис. 1. Модель интеллектуальной СЭД.

зависимой сетевой грамматикой особого рода. Этот метод можно применять для проверки свойств многоагентных систем разрешения конфликтов. Набор экземпляров онтологии, найденных в процессе анализа текста, может быть представлен в виде информационной системы Скотта с отношением вывода в виде набора информационных отношений. полученная информационная система Скотта генерирует мультиагентную систему, агенты которой разрешают лексические и семантические неоднозначности и является правильным алгоритмом разрешения неоднозначности.

На основе исследований автора предлагается разработать технологическую среду для создания предметно-ориентированных систем извлечения информации из текстов на базе специализированной мультиагентной платформы. Реализация проектирования технологической среды включает три основных компонента: словарную подсистему, модуль жанрового типирования и модуль многоагентного анализа текста.

Оригинальность подхода заключается в том, что извлечение информации будет осуществляться с использованием алгоритмов машинного обучения. Другой особенностью разработанной технологии является предварительное моделирование процессов анализа текста, при котором модель извлечения информации представлена в виде приписываемого графа с заданными свойствами. предлагаемая технология значительно сокращает время работы над документами, обеспечивает оптимальный документооборот и прозрачность получаемых системой результатов для сотрудника. Разработка словарной подсистемы позволяет осуществлять лексический анализ текста и выделять значимые термины на основе предметно-ориентированных словарей. Создается модуль жанрового типирования, обеспечивающий выполнение жанрового анализа текста на основе жанровых узоров. На базе специализированной мультиагентной платформы можно создать упрощенную реализацию алгоритмов мультиагентно-го текстового анализа. Он будет включать в себя систему инициализации агента, средство проверки условности, компонент для поиска соответствующих моделей управления и реализацию протоколов взаимодействия агента.

Разработанная модель интеллектуальной системы электронного документооборота может быть рекомендована в организациях, где реализована система электронного документооборота. Основным преимуществом предлагаемого подхода является то, что технология, созданная на основе этой модели, значительно сокращает время работы над документами, обеспечивает оптимальный поток документов,

а также обеспечивает прозрачность полученных системой данных.

Библиографический список:

1. Автоматизированная система электронного документооборота // URL: http:// programmist1s.ru/avtomatizirovannaya-sistema-elektronnogo-dokumentooborota.

2. Электронный документооборот: экономия времени и эффективность предприятия // URL: http://www.mdi.ru/press-tsentr/articles/el-docs/managment-buisness-processes/ elektronnyj-dokumentooborot.

3. Облачные технологии 1C: Предприятия // URL: http://v8.1c.ru/overview/Term_0000 00803.htm.

4. 1С:Документооборот. Практическое пособие. М.: КноРус, 2012. 368 c.

5. Бартеньев О. 1С: Предприятие. Программирование для всех. М.: Диалог МИФИ, 2014. 464 c.

6. Тимощук Е.А., Тимощук А.С., Тьяги В.Р. Цифровизация в условиях пандемии: онтология сложности, возможности, риски // Юрист ВУЗа. 2021. №. 9. С. 12-19.

7. Перова М.В., Балаян К.А., Гетман Ю.В. Системы электронного документооборота в период пандемии-технологии удаленной работы // Мир в эпоху глобализации экономики и правовой сферы: роль биотехнологий и цифровых технологий. М.: ООО «Конверт», 2021. С. 196-199.

8. Созаев А.Х. и др. Электронный документооборот в условиях пандемии // Состояние и перспективы развития современной науки и образования. Петрозаводск: Международный центр научного партнерства «Новая Наука» (ИП Ивановская И.И.), 2021. С. 72-78.

9. Бобылева М.П. Управленческий документооборот: от бумажного к электронному // Вопросы теории и практики. М.: ТЕРМИКА, 2016. 360 с.

10. Корнеев И.К. Информационные технологии в работе с документами: учебник. М.: Проспект, 2018. 304 с.

References

1. Automated electronic document management system // URL: http://programmist1s.ru/ avtomatizirovannaya-sistema-elektronnogo-dokumentooborota.

2. Electronic document management: saving time and enterprise efficiency // URL: http:// www.mdi.ru/press-tsentr/articles/el-docs/managment-buisness-processes/elektronnyj-do-kumentooborot.

3. Cloud technologies 1C: Enterprise // URL: http://v8.1c.ru/overview/Term_000000803.htm.

4. 1C: Document flow. Practical guide. M.: KnoRus, 2012. 368 p.

5. Bartenev O. 1C: Enterprise. Programming for everyone. M.: Dialog MEPhI, 2014. 464 p.

6. Timoshchuk E.A., Timoshchuk A.S., Tyagi V.R. Digitalization in a pandemic: ontology of complexity, opportunities, risks // University Lawyer. 2021. № 9. P. 12-19.

7. Perova M.V., Balayan K.A., Getman Yu.V. Electronic document management systems during the pandemic - remote work technologies // The world in the era of globalization of the economy and the legal sphere: the role of biotechnologies and digital technologies. M.: LLC "Convert", 2021. P. 196-199.

8. Sozaev A.Kh. and others. Electronic document management in a pandemic // State and prospects for the development of modern science and education. Petrozavodsk: International Center for Scientific Partnership "New Science" (IP Ivanovskaya I.I.), 2021. P. 72-78.

9. Bobyleva M.P. Management document flow: from paper to electronic // Questions of theory and practice. M.: TERMIKA, 2016. 360 p.

10. Korneev I.K. Information technologies in working with documents: a textbook. M.: Prospekt, 2018. 304 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.