Научная статья на тему 'ИСПОЛЬЗОВАНИЕ ГОТОВЫХ РЕШЕНИЙ НА ОСНОВЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В ЗАЩИТЕ ДОКУМЕНТООБОРОТА ОРГАНИЗАЦИЙ'

ИСПОЛЬЗОВАНИЕ ГОТОВЫХ РЕШЕНИЙ НА ОСНОВЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В ЗАЩИТЕ ДОКУМЕНТООБОРОТА ОРГАНИЗАЦИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
226
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Делопроизводство / электронный документооборот / система электронного документооборота / хостинг-провайдер / сервер / браузер / интерфейс / архитектура / интеллектуальное распознавание / искусственный интеллект / машинное обучение. / Оffice management / electronic document management / electronic document management system / hosting provider / server / browser / interface / architecture / intelligent recognition / artificial intelligence / machine learning.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гордиенко В. В. В. В., Лисицин А. Л. А. Л., Чистилина Е. В. Е. В.

В статье рассматриваются преимущества внедрения систем на основе искусственного интеллекта. Проводится подробный анализ проблем, обусловленных тем, что компаниям все сложнее подобрать подходящую систему электронного делопроизводства из большого спектра предложений уже известных на сегодняшний день. Производится анализ распространенных систем автоматизированного делопроизводства и на фоне достоинств и недостатков подробно рассматривается архитектура, которая строится на методах электронного зрения и способна при необходимости возвращаться на повтор нейронных сетей. Подробно объясняется принцип работы системы, с указанием и описанием ее подсистем. Метод способен учитывать контекст – производство работ с документацией и обеспечивает распознавание с точностью свыше 97%. Адаптация технологий искусственного интеллекта в систему делопроизводства осуществляется на базе машинного обучения, под которым понимается процесс поиска скрытых закономерностей при принятии решений, основанный на обработке массива накопленных данных. Принцип работы раскрывается на примере работы машинного обучения при помощи определения совокупности эталонных документов, которые выстроены вручную по характерному образцу, основанному на текстовом содержании. Этап реализации машинного обучения осуществляется на предположении о соответствии принятия оптимального решения, при этом в качестве примера используется работа с документами, где требуется отнести выбранный документ к определенной категории, основанием которой служит совокупность нужных метаданных и определенных слов. На основе заданных критериев принятия решения система начинает генерировать виртуальную нейронную сеть с неопределенной структурой. Рассматриваемая система выстроена на алгоритмах машинного обучения, нарабатывает опыт на всем массиве документации организации и при нужном подходе к обучению дает точность и позволяет сократить скорость классификации документов. Кроме того, в статье освещается проблематика внедрения систем на основе искусственного интеллекта и даются предложения по их рациональному использованию.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гордиенко В. В. В. В., Лисицин А. Л. А. Л., Чистилина Е. В. Е. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FINISHED DOCUMENT FLOW OF ORGANIZATIONS WITH THE HELP OF THE USE OF READY SOLUTIONS BASED ON ARTIFICIAL INTELLIGENCE

The article discusses the advantages of implementing systems based on artificial intelligence. A detailed analysis of the problems caused by the fact that it is increasingly difficult for companies to find a suitable electronic record-keeping system from a large range of proposals already known today. The analysis of common automated office management systems is carried out and, against the background of advantages and disadvantages, the Directum Ario architecture is considered in detail, which is based on electronic vision methods and is capable of returning to the repetition of neural networks if necessary. The principle of operation of the system is explained in detail, with an indication and description of its subsystems. The method is able to take into account the context of work with documentation and provides recognition with an accuracy of over 97%. The adaptation of artificial intelligence technologies into the office management system is carried out on the basis of machine learning, which is understood as the process of searching for hidden patterns in decision-making based on the processing of an array of accumulated data. The principle of operation is revealed by the example of machine learning using the definition of a set of reference documents that are built manually according to a characteristic pattern based on text content. The stage of machine learning implementation begins with the assumption of compliance with the optimal decision, while, as an example, working with documents is used, where it is required to compare the selected document to a certain category, the basis of which is a set of necessary metadata and certain words. Based on the given decision-making criteria, the system begins to generate a virtual neural network with an indeterminate structure. The system in question is built on machine learning algorithms, gains experience on the entire array of organization documentation and, with the right approach to training, gives accuracy and reduces the speed of document classification. In addition, the article highlights the problems of the introduction of systems based on artificial intelligence and proposals for their rational use

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ ГОТОВЫХ РЕШЕНИЙ НА ОСНОВЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В ЗАЩИТЕ ДОКУМЕНТООБОРОТА ОРГАНИЗАЦИЙ»

УДК 004.048

ИСПОЛЬЗОВАНИЕ ГОТОВЫХ РЕШЕНИЙ НА ОСНОВЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В ЗАЩИТЕ ДОКУМЕНТООБОРОТА ОРГАНИЗАЦИЙ

© 2023 В. В. Гордиенко1, А. Л. Лисицин2, Е. В. Чистилина3

1 кандидат технических наук, доцент кафедры информационной безопасности

e-mail: vika.gordienko.1973@ mail.ru 2старший преподаватель кафедры информационной безопасности e-mail: vip.lisicin@mail.ru 3кандидат технических наук, доцент кафедры информационной безопасности

e-mail: chistilinaelena@rambler.ru

Курский государственный университет

В статье рассматриваются преимущества внедрения систем на основе искусственного интеллекта. Проводится подробный анализ проблем, обусловленных тем, что компаниям все сложнее подобрать подходящую систему электронного делопроизводства из большого спектра предложений уже известных на сегодняшний день. Производится анализ распространенных систем автоматизированного делопроизводства и на фоне достоинств и недостатков подробно рассматривается архитектура, которая строится на методах электронного зрения и способна при необходимости возвращаться на повтор нейронных сетей. Подробно объясняется принцип работы системы, с указанием и описанием ее подсистем. Метод способен учитывать контекст - производство работ с документацией и обеспечивает распознавание с точностью свыше 97%. Адаптация технологий искусственного интеллекта в систему делопроизводства осуществляется на базе машинного обучения, под которым понимается процесс поиска скрытых закономерностей при принятии решений, основанный на обработке массива накопленных данных. Принцип работы раскрывается на примере работы машинного обучения при помощи определения совокупности эталонных документов, которые выстроены вручную по характерному образцу, основанному на текстовом содержании. Этап реализации машинного обучения осуществляется на предположении о соответствии принятия оптимального решения, при этом в качестве примера используется работа с документами, где требуется отнести выбранный документ к определенной категории, основанием которой служит совокупность нужных метаданных и определенных слов. На основе заданных критериев принятия решения система начинает генерировать виртуальную нейронную сеть с неопределенной структурой. Рассматриваемая система выстроена на алгоритмах машинного обучения, нарабатывает опыт на всем массиве документации организации и при нужном подходе к обучению дает точность и позволяет сократить скорость классификации документов. Кроме того, в статье освещается проблематика внедрения систем на основе искусственного интеллекта и даются предложения по их рациональному использованию.

Ключевые слова: делопроизводство, электронный документооборот, система электронного документооборота, хостинг-провайдер, сервер, браузер, интерфейс, архитектура, интеллектуальное распознавание, искусственный интеллект, машинное обучение.

FINISHED DOCUMENT FLOW OF ORGANIZATIONS WITH THE HELP OF THE USE OF READY SOLUTIONS BASED ON ARTIFICIAL INTELLIGENCE

© 2023 V. V. Gordienko1, A. L. Lisitsyn2, E. V. Chistilina3

1 Candidate of Technical Sciences, Associate Professor of the Department of Information Security e-mail: vika.gordienko.1973@ mail.ru 2 Senior Lecturer of the Department of Information Security e-mail: vip.lisicin@mail.ru 3 Candidate of Technical Sciences, Associate Professor of the Department of Information Security e-mail: chistilinaelena@rambler.ru

Kursk State University

The article discusses the advantages of implementing systems based on artificial intelligence. A detailed analysis of the problems caused by the fact that it is increasingly difficult for companies to find a suitable electronic record-keeping system from a large range of proposals already known today. The analysis of common automated office management systems is carried out and, against the background of advantages and disadvantages, the Directum Ario architecture is considered in detail, which is based on electronic vision methods and is capable of returning to the repetition of neural networks if necessary. The principle of operation of the system is explained in detail, with an indication and description of its subsystems. The method is able to take into account the context of work with documentation and provides recognition with an accuracy of over 97%. The adaptation - of artificial intelligence technologies into the office management system is carried out on the basis of machine learning, which is understood as the process of searching for hidden patterns in decision-making based on the processing of an array of accumulated data. The principle of operation is revealed by the example of machine learning using the definition of a set of reference documents that are built manually according to a characteristic pattern based on text content. The stage of machine learning implementation begins with the assumption of compliance with the optimal decision, while, as an example, working with documents is used, where it is required to compare the selected document to a certain category, the basis of which is a set of necessary metadata and certain words. Based on the given decision-making criteria, the system begins to generate a virtual neural network with an indeterminate structure. The system in question is built on machine learning algorithms, gains experience on the entire array of organization documentation and, with the right approach to training, gives accuracy and reduces the speed of document classification. In addition, the article highlights the problems of the introduction of systems based on artificial intelligence and proposals for their rational use.

Keywords: office management, electronic document management, electronic document management system, hosting provider, server, browser, interface, architecture, intelligent recognition, artificial intelligence, machine learning.

Введение. Сегодня, когда скорость развития информационных технологий возрастает, все большее число привычных для общества процессов осуществляются в цифровой форме, при помощи автоматизированных средств и средств телекоммуникаций. Переход к системам электронного документооборота от бумажной документации, повышает скорость обработки всех процессов документирования и позволяет значительно сэкономить временной ресурс, а также помогает оптимизировать финансовые и материальные источники. Электронный документооборот является ключевым аспектом по уменьшению количества избыточных и рутинных операций связанных с поиском, обработкой и хранением документации.

Существующие автоматизированные средства обработки документов делятся на четыре категории. В первом случае на выделенном сервере находится основная модель управления клиента, где происходит процесс обработки документации с использованием особого интерфейса. Вторая категория - это использование специальных модулей обработки, агрегированных с базами SQL, Oracle, при этом сама информация размещается в базе данных. В третьем варианте обработка документа производится автоматизированной системой без использований специальных приложений пользователя, создается удалённый доступ к серверу при использовании web-браузера, который заменяет пользовательский интерфейс. В четвертой категории находятся облачные системы, при работе с которыми используется сервер, предоставленный хостинг-провайдером.

На предприятиях и в организациях, активно ведущих процессы наращивания бизнес-контрактов, отмечается непрерывный рост официальной документации, сдерживать который не представляется возможным по ряду причин, в том числе и по причинам, обусловленным требованиями законодательства. По этой причине использование автоматизированных систем набирает особую популярность.

Автоматизация процесса электронного делопроизводства позволяет осуществлять оперативный поиск информации и надежность ее хранения, консолидирует структуру документооборота и позволяет за короткое время осуществить регистрацию массива документов и возможность их согласования. Кроме того, при хранении документов с использованием разнообразных носителей и удаленных серверов гарантируется, что при возникновении форс-мажорных обстоятельств (пожар, протечка и др.) уничтожение документов сводится к минимуму. Значительно упрощается и процесс аудита с привлечением сторонних специалистов, происходящий, как правило, в электронной форме, а также возможность в минимальный промежуток времени сделать любое количество копий документа.

Также внедрение автоматизированных систем обработки документов имеет и недостатки, связанные с переходом на новый принцип работы, а именно с приобретением и установкой программного обеспечения и необходимостью проведения обучения сотрудников. Ведь, с приобретением стандартного «коробочного» средства электронного документооборота придётся и перестроить основные принципы работы, что усложнит процесс перехода. При этом обслуживание и настройка любой системы электронного обеспечения документооборота требует добавления штатной единицы администратора, однако введение в действие системы Low-code позволит обеспечить надежную работу при помощи бизнес-аналитика, не нуждающегося в навыках программирования. К тому же, предприятию придётся вести две параллельные ветви: цифровую и бумажную, если у контрагента действует еще старый принцип документооборота, работающий на бумажном носителе.

Возникает и проблема с конфиденциальностью, в случае не санкционированного доступа сотрудника или администратора к документам, к которым у него нет допуска. Однако и привычный бумажный документооборот в данном контексте не идеален, ведь хранение документов с определенным грифом в сейфах и шкафах не исключает возможность кражи и потери таких бумаг. Здесь же, кроме всего, и добавлялась проблематика уничтожения уже ненужных бумаг.

К недостаткам можно отнести и то, что внедрение систем электронного делопроизводства не становится точкой отсчета развития прибыльности предприятия, ведь оцифрованный документ - это не просто точная копия такого же на бумажном носителе, а принципиально новая сущность корпоративного контента с процессами обработки, которые организуются прежними средствами, опираясь на прежние

принципы. На первом этапе регламентация, которая, конечно, ускоряется и стремится к гибкости в изменениях, затем исполнение регламента с прикрепленными к данному виду деятельности документами и соответствующего контента. Так что, с применением телекоммуникаций всех уровней загруженность канцелярий по-прежнему велика.

К недостаткам можно отнести и неоднородную методику по хранению данных в разных отделах и подразделениях предприятия, недостаточное структурирование данных в использующихся приложениях, отсутствие регуляторной базы доступа персонала к конкретному бизнес-процессу. А также, форма, в которой содержатся типовые должностные инструкции, применительно к электронному документационному обеспечению не эффективна. Сюда же можно отнести перегрузку информационного потока, связанную с бюрократическими принципами согласования, и сбои по причине неправильного хранения информации в разных приложениях, а также расхождение с отраслевыми нормами и несоответствие систем документооборота нормам, содержащимся в подзаконных нормативных актах.

Таким образом, хотя электронный документооборот и положительно влияет на скорость процессов, происходящих с документами, но не изменяет их суть. Если заменить на предприятиях журналы учета по делопроизводству с бумажных на электронные, то переход от резолютивной части к возможности воспроизведения при помощи планшетного устройства и автоматизации фиксирования будет осуществляться быстрее. В связи с этим, представляется логичным кардинально заменить такие процессы на процессы, которые опираются на искусственный интеллект. Данный шаг значительно повысит перспективы развития электронного делопроизводства и позволит повысить их эффективность.

Анализ предметной области. В эпоху цифровой трансформации и нового подхода к электронному документообороту принципиально меняется и классическая схема «идеального» документа, а именно отсутствие и бумажного и его электронного двойника. В этом виде документ приобретает форму виртуального документа и собирается в нужную конфигурацию лишь в момент необходимости. Так, к примеру, для выполнения регуляторных требований такая сущность формируется в образ, имеющий юридическую силу.

В отличие от автоматизированных средств обработки, технологии искусственного интеллекта с учетом объёма накопившейся информации о совершаемых процессах в делопроизводстве и данных управленческих решений, принимающихся на основе содержания и сущности документа, а также его обязательных элементов, учитывая ряд типовых операций, позволяет аккумулировать необходимую основу материалов, ставших впоследствии основным элементом обучения.

Возможность обучения и развитие искусственного интеллекта открывают пути применения операций, связанных с принятием специальных решений, способных обеспечить эффективность выполняемых процедур обработки данных в документообороте, что поможет персоналу избавиться от огромного числа избыточных процессов. «Национальная стратегия развития искусственного интеллекта на период до 2030 года», которая утверждена Указом Президента РФ от 10.10.2019 г. № 490 «О развитии искусственного интеллекта в Российской Федерации» [1], устанавливает цель и задачи по развитию и искусственного интеллекта в России. В документе описаны меры, направленные на обеспечение интересов в реализации стратегических направлений в области научно-технического развития. Кроме того, стратегия ориентирована на развитие таких технологий с целью заполнения огромной доли мирового рынка. Технологии по распознанию и поиску документов уже применяются и популярны во многих компаниях. Однако с внедрением искусственного интеллекта эти

же технологии будут иметь противоположный вид. Изначально методы распознавания, применяемые в системе документооборота, были использованы для преобразования символов и букв в оцифрованный вид, при этом одной из сложных задач оставалось распознание значений слов (семантики слова), это производилось путем привязки определенной группы символов к конкретному их размещению в документе. В дальнейшем технологии искусственного интеллекта усовершенствовались, а с ними и технологии поиска и распознавания. А именно распределение определенных слов и словосочетаний производится не только на основе присоединения к располагающимся в документе реквизитам, но и по сущности смыслового значения. А также развитие данной концепции дало возможность сформировать механизм, способный выделить отдельные слова или фразы, имеющие смысловое значение, не опираясь на текстовую структуру и форму документа. К примеру, применяется такой метод при желании выделить из текста, например, юридический адрес контрагента или предмет договора и другие признаки из документа.

Технология семантического разбора сможет использоваться для автоматической сортировки потока входящих и исходящих документов, а также для поиска данных по смысловому значению с использованием поискового запроса [2].

По мнению специалистов, в ближайшее время к задачам работы искусственного интеллекта будут отнесены такие ориентиры, как сравнительный анализ версий документов, формирований аннотаций и кратких выдержек из содержимого, составления финансовой отчётности и категорирование финансовых документов, а также тех действий, которые ранее осуществлялись при помощи оператора [3]. Также технологии искусственного интеллекта помогут и тем, кто находится в поисках работы, так как автоматизация проверки резюме на соответствие требованиям вакансии сократит диапазон рутинных задач сотрудников отделов кадров.

Важная перспектива направления в развитии искусственного интеллекта отводится и экспертизе рисков при заключении договоров, так как при использовании данных технологий будет возможно выявление отложенных или неоплаченных платежей, штрафных санкций и сроков, отведенных на предоставление документации. Помимо всего, в договорной деятельности может появиться возможность формирования вероятных замечаний и демонстрации рисков, входящих в зону компетенций каждого контрагента. Для компаний, осуществляющих работу на основе законодательства о закупках, искусственный интеллект может сверить договор на соответствие законодательству [4].

Перспектива развития видится и в том, что использование систем искусственного интеллекта в системах электронного делопроизводства может дать возможность анализа и визуализации информации, накапливаемой в системе в процессе движения документов на всех ступенях их обработки. В течение времени деятельности компаний в системах электронного документооборота скапливается большой поток данных, однако такая информация приумножается и не используется в системе принятия управленческих решений. Оценка и визуализация данных, происходящие в ходе применения технологий искусственного интеллекта, обладают некоторыми сложностями, заключающимися в поиске оптимальных методов анализа информации, соответствующей информационным требованиям пользователя, а также осуществлении оптимального управленческого решения, требуемого для создания системы качественной визуализации данных, при помощи которой можно наглядно и доступно осуществлять анализ этих данных. В случае преодоления проблем, возникающих при внедрении искусственного интеллекта в механизм анализа и визуализации данных, образуется новая предметная область применения систем

электронного делопроизводства, которая станет основой синтеза алгоритмов обработки и анализа данных и их качественной визуализации.

Внедрение технологий искусственного интеллекта в систему делопроизводства осуществляется на базе машинного обучения, под которым понимается процесс поиска скрытых закономерностей при принятии решений, основанный на обработке массива накопленных данных [5]. Раскрыть данное понятие на примере работы машинного обучения можно при помощи определения совокупности эталонных документов, которые выстроены вручную по характерному образцу, основанному на текстовом содержании. Этап реализации машинного обучения осуществляется на предположении о соответствии принятия оптимального решения, при этом в качестве примера используется работа с документами, где требуется сопоставить выбранный документ с определенной категорией, основанием которой служит совокупность нужных метаданных и определенных слов. На основе заданных критериев принятия решения система начинает генерировать виртуальную нейронную сеть с неопределенной структурой, которая на основе входной информации по набору выбранных слов и метаданных, содержащихся в документе, определяет, возможно ли отнести тот или иной документ к необходимым требованиям на выходе. Таким образом, на основании заданных ключевых слов и данных осуществляется отнесение выбранного документа к одному из заданных ранее критериев, а виртуальная нейронная сеть представляет собой результат машинного обучения. Такой механизм характеризуется высокой надежностью принятия верного решения и является следствием четко определенных критериев и процесса обучения, основанных на анализе базы эталонных документов. При использовании машинного обучения появляется возможность точно распределить документы по категориям, как если бы эту же работу выполнял самостоятельно эксперт. Кроме того, такой недостаток человеческой деятельности, как появление случайной ошибки, в системе машинного обучения исключается полностью. Для реализации практических задач разнообразие механизмов на базе нейронных сетей и машинного обучения является важным положительным фактором развития систем электронного делопроизводства.

В практике использования систем электронного документооборота с применением элементов искусственного интеллекта наибольшую популярность получают задачи регрессии и классификации. Регрессия представляет собой результат работы определенного алгоритма, результатом работы которого является присваивание числового параметра, тогда как в задачу классификации входит механизм причисления разных объектов по нужному критерию в необходимую категорию [6].

Сегодня системы искусственного интеллекта ориентированы на классификацию документов, их поиск, а также на получение из текста необходимых метаданных. На этапе становления систем электронного делопроизводства акцент делается на применение готовых и настраиваемых алгоритмов принятия решений. Примером применения готовых алгоритмов является решение Directum Ario, представляющее собой комплекс сервисов, направленных на интеллектуальную обработку обособленного контента, близко функционирующих друг с другом. Эксплуатация набора инструментов, основанных на нескольких технологиях, предоставляет искусственному интеллекту большое количество стандартных рутинных операций, в которые входит:

1) систематизация и занесение отметок о входящих письмах, заполнение первичных учетных документов;

2) формирование директивных решений;

3) подготовка обобщенной характеристики документа;

4) разработка и осуществление автоответа;

5) интеллектуальный поиск информации

Перспектива развития заключается еще и в том, что использование систем искусственного интеллекта в системах электронного делопроизводства осуществит возможность анализа и визуализации информации, накапливаемой в системе при движении документов на всех ступенях их обработки [3]. В системах электронного документооборота скапливается большой поток данных, такая информация приумножается и не используется в системе принятия управленческих решений. Оценка и визуализации данных, происходящие в ходе применения технологий искусственного интеллекта, обладают некоторыми сложностями при поиске оптимальных методов анализа информации, соответствующих информационным требованиям пользователя, а также при осуществлении оптимального управленческого решения, где требуется создать систему качественной визуализации данных, при помощи которой можно наглядно и доступно осуществлять анализ этих данных [4]. В случае преодоления проблем, возникающих при внедрении искусственного интеллекта в механизм анализа и визуализации данных, образуется новая предметная область применения систем электронного делопроизводства, которая встанет в основу синтеза алгоритмов обработки и анализа данных и их качественной визуализации.

Описание применяемой системы. Необходимость использования в анализе данных огромного количества разнообразных способов классификации характеризуется тем, что выполняемые при её помощи задания могут иметь свои особенности, связанные с одним классом или совокупностью классов, а также с объемом и представлением исходных данных. А если учесть их размерность и качество, то необходимо выбрать адекватный классификатор. Поэтому подбор классификаторов, которые удовлетворяли бы поставленным задачам и анализу, - явный фактор получения нужного и быстрого решения. Разнообразные виды классификаторов имеют свои достоинства и недостатки. К примеру, классификаторы, в которых применяются методы статистики, наделены достойной математической обоснованностью, однако в применении сложны, потому что требуют навыков в вероятностном распределении исходных данных и анализе параметров (параметрические), кроме того имеют фиксированную структуру модели. Надо отметить, что статистические методы могут оценить лишь вероятность принадлежности того или иного объекта к какому-либо классу, но не отвечают, по какому из критериев делался выбор. В основанных на машинном обучении классификаторах не требуются оценки параметров для распределения исходных данных, а соответствие и конкретизация происходят при помощи функции расстояния. Такие метрические классификаторы проще в использовании и реализации, чем параметрические, а их результаты удобнее для интерпретации и понимания. Однако метрические классификаторы представляют собой эвристическую модель, которой присуще обеспечение решения в ограниченном количестве практически значимых задач, что означает неточное решение или множественность решений. Поэтому результаты такого решения используются с осторожностью. Одним из компромиссных решений выбора между параметрическими и метрическими методами служит использование для достижения цели классификации нейронных сетей. Действительно, нейронная сеть является непараметрической моделью, которая не использует меры расстояний и предположения о вероятностном распределении данных. Это наделяет классификаторы свойствами универсальности, позволяющими получить результаты даже в тех случаях, когда и параметрические, и метрические классификаторы не дают приемлемого решения. Примером применения готовых алгоритмов на основе нейронной сети является решение Directum Ario, представляющее собой комплекс

сервисов, направленных на интеллектуальную обработку обособленного контента, близко функционирующих друг с другом. Эксплуатация набора инструментов, основанных на нескольких технологиях, предоставляет искусственному интеллекту большое количество стандартных рутинных операций.

Интеллектуальный поиск информации. Архитектура Directum Ario, состоящая из нескольких самостоятельных веб-сервисов и прикладного сегмента, позволяет произвести постепенное добавление в систему новых интеллектуальных инструментов, что даст возможность наладить работу, привычную для корпоративного контента. Сущность сервиса интеллектуального распознавания в Directum SmartService строится на методах электронного зрения и возвращающихся на повтор нейронных сетей. Такой метод способен учитывать контекст работы и обеспечивает распознавание с точностью свыше 97%. Сервис Directum Classifier Service, выстроенный на алгоритмах машинного обучения, нарабатывает опыт на всем массиве документации организации и при грамотном подходе к обучению дает точность 98%, и скорость классификации сокращается до 50 мс. Сервис извлечения значимых данных (Directum FactExtractor Service) имеет способность поиска нужных реквизитов в документе благодаря механизмам обработки естественного языка и представляет их в виде готовых метаданных, помещая в карточки системы. Выбор данных и воспроизведение результатов настраиваются при помощи правил или обученных моделей. Итогом обработки документа таким сервисом сотрудник имеет на выходе заполненную карточку системы, а на извлечение данных отводится около одной секунды. Ход работы с Directum Ario начинается с формирования пакета документов, необходимого для обучения сервиса согласно техническим рекомендациям. Если в компании уже функционирует Directum с необходимым объемом данных, то достаточно задать условия отбора документов из системы. Уникальный классификатор будет готов выполнять свои функции после тренировки, которая займет 12 минут. Это время потребуется для минимального набора информации.

Важным компонентом Directum является функция настраиваемых извлечений фактов. Эта функция позволяет загрузить документ из системы обмена (сканера или электронной почты), после чего при помощи сервисного интеллектуального распознавания система находит и производит выемку нужного текстового слоя. Классификатор, используя базу обученной модели, способен определить с точностью до 98% вид и сущность документа. Последующая обработка документов происходит при использовании правил или обучаемой модели. Настройка модели извлечения данных происходит при участии Ario Visual Image Annotator, являющейся инструментом визуальной разметки. Классификатор устанавливает, какая модель либо правило может использоваться, чтобы из текстового слоя извлечь данные, затем в карточку системы Directum вносятся нужные данные и карточка переходит на контроль специалиста.

Для ускорения процесса регистрации примерно в 2 раза применяется верификация данных, которая позволяет проверить заполнение нужных реквизитов в документе. Заполненные поля автоматически окрашиваются в карточке различным цветом: зеленый - данные соответствуют точности от 80%, сомнительные будут окрашены желтым цветом. При этом окрашивание полей настраивается по усмотрению специалиста в любой цвет, также существует возможность внести коррективы. После проверки специалист сохраняет карточку в системе. Потенциал Directum Ario увеличивается при помощи инструмента «Комплектование и верификация документов», где отсканированные документы автоматически отбираются в комплекты, после чего в едином интерфейсе производится проверка укомплектованности документов и карточек. Система способна наладить сквозные

процессы в холдингах и фирмах, структурированных по сложной схеме. Взаимодействие служб системы направлено на обмен данными между холдинговыми компаниями даже при использовании разных версий системы. Интеграция с системами обмена служит для подключения контрагентов к обмену юридически значимыми электронными документами. Выделение как SQL-серверных, так и файловых хранилищ документов позволяет гибко управлять распределением нагрузки на сервера организации при доступе к документам. Одним из наиболее заметных изменений в DIRECTUM 4.7 стали новые средства удаленной работы пользователей. Работа в DIRECTUM теперь возможна с помощью мобильных устройств, коммуникаторов, смартфонов и планшетных компьютеров, подключенных к сети Интернет. Интерфейс мобильного доступа применим к работе с большим набором мобильных браузеров (Opera Mobile, Safari Mobile, IE Mobile) на известных платформах, в том числе Windows Mobile, iOS и Android. Также свое развитие получил стандартный web-доступ к DIRECTUM, и теперь еще больше объектов и данных системы применяется пользователями при работе с документацией через браузер.

Это значительно сокращает трудозатраты, отведенные на комплектование документов, при этом участие персонала, вовлеченного в этот процесс, сводится к минимуму. Положительным качеством является и гибкое лицензирование системы. Так, для функционирования системы классификации документов и извлечения фактов необходимо приобрести платные серверные лицензии без установления срока действия. Приобретатель вносит оплату за то количество документов, которое будет обрабатываться компанией за один месяц. Кроме того, предоставляются дополнительные опции для сопровождения данного решения, техническая поддержка за первый год использования включает в себя и стоимость программного обеспечения, а также включена и бесплатная поддержка на виртуальных машинах. Системные требования по обеспечению работы решения встроены в программу Directum 5.5.1. Поддержка работы обеспечивается встроенной в программу сортировку веб-клиента, благодаря работе службы обработки событий (IS-Builder Event Processing).

При работе с решением Directum Ario примерное время обработки одного документа составит одну минуту. Для работы с финансовой документацией по определению счетов и статей расходов точность равна более чем 95%. При работе системы с договорами на предмет выявлений изменений потребуется в среднем 5 минут работы, а корректность отбора извлекаемых данных составляет более 92%.

Заключение. На основе проведенного исследования можно сделать вывод о том, что область внедрения систем искусственного интеллекта в технологии электронного документооборота расширяется и широко развивается, но, подвергая анализу возможность применять технологии искусственного интеллекта и учитывая перспективы его развития в дальнейшем, необходимо отметить наличие ряда проблем, которые тормозят применение систем электронного делопроизводства. Одной из проблем является восприятие человеком технологий, основанных на системах искусственного интеллекта. Отсутствие доверия у сотрудника к таким технологиям связано с боязнью утечки конфиденциальной информации, а также с возможностью допущения системой технических ошибок. Кроме того, системы с искусственным интеллектом способны заменить человека во многих процессах, и сотрудники попросту опасаются за сохранение собственных рабочих мест. Явная проблема также состоит в том, что отсутствует законодательное закрепление и в настоящее время требуется оптимальная нормативная база [8]. Как было отмечено ранее, еще одной острой проблемой применения технологии искусственного интеллекта является проблема безопасности. Особенно актуальным вопрос становится в связи с активным внедрением

использования технологии искусственного интеллекта в делопроизводство. Так, на сегодняшний день нет единого мнения по вопросу юридической ответственности искусственного интеллекта за причиненный собственнику моральный или материальный вред. В ряде зарубежных стран имели место случаи соответствующих ситуаций, что только подогрело дискуссию о необходимости правового регулирования ответственности искусственного интеллекта. В РФ аналогичных кейсов на данный момент нет, но постепенное увеличение числа внедрения в электронный документооборот систем с применением искусственного интеллекта демонстрирует, что это является вопросом времени. Одна из проблем связана с применением и обработкой персональных данных, так как эти данные составляют огромный массив работы с документооборотом. В связи с тем что любые операции с документами, совершаемые с персональными данными при использовании средств автоматизации, для исследовательских целей осуществляются только с условием обязательного их обезличивания, представляется целесообразным дополнить закон определенной юридической формулировкой, которая облегчит работу с документооборотом, производящуюся на основе применения систем искусственного интеллекта. При этом в законе дополняется юридическая норма с указанием того, что обработка таких персональных данных осуществляется в целях повышения эффективности государственного или муниципального управления. Данная норма не является единственным новшеством в законодательстве о персональных данных. Законодатель расширил условия обработки специальных категорий персональных данных, которые касаются расовой, национальной принадлежности, политических взглядов, религиозных или философских убеждений, состояния здоровья и иных личных данных. Специальные категории персональных данных обладают особым правовым статусом ввиду потенциальной возможности наступления особо негативных последствий для субъекта при нарушении условий их обработки. Теперь обработка в документах персональных данных, которые касаются здоровья и личной жизни, попавшие в реестр в результате обезличивания, допустимы исключительно в целях повышения эффективности государственного или муниципального управления, что в границах реализации правового режима целесообразно проработать в рамках объединения по обработке анонимизированных данных о клиентах из разных источников (банковские, абонентские данные, а также данные о поведении в Интернете).

Таким образом, компаниям, деятельность которых связана с ежедневной обработкой потоков документов и которые используют системы электронного документооборота, необходимо обратить внимание на трудоемкость и рутинность этого процесса. Именно поэтому рациональное использование электронного делопроизводства осуществит явную разгрузку сотрудников и будет способствовать направлению работников предприятия на решение более сложных задач. Становление систем делопроизводства с применением технологий искусственного интеллекта находится на этапе развития, но многие готовые проектные решения уже сегодня доказывают перспективы успешного использования таких технологий. Пока искусственный интеллект укрепляет позиции, компании все еще пытаются оценить, как использовать его для повышения продуктивности. В обозримом будущем искусственный интеллект не станет угрозой для систем документооборота, однако он будет стимулировать сферу управления контентом к улучшению ее важных компетенций. При постановке правильных вопросов разработчикам и заказчикам появится возможность выстроить привлекательные пользовательские кейсы, связать между собой приложения на основе интеллектуальных систем и использовать готовые данные для создания тактики, которая найдет отклик у клиентов. Явная проблема состоит еще и в том, что отсутствует законодательное закрепление и в настоящее время

требуется оптимальная нормативная база. Трудность применения нормативно-правовой базы состоит в отсутствии юридической ответственности в результате ошибок со стороны систем искусственного интеллекта, в случае неверных действий последнего. Расширение сферы применения искусственного интеллекта в системах электронного делопроизводства существенно сократит затраты многих ресурсов, в том числе сократит трудовую загрузку сотрудников, а также оптимизирует и ускорит сам процесс делопроизводства [8].

Библиографический список

1. Указ Президента РФ от 10.10.2019 N 490 «О развитии искусственного интеллекта в Российской Федерации» (вместе с «Национальной стратегией развития искусственного интеллекта на период до 2030 года») // СПС КонсультантПлюс.

2. Арутюнян, В. Г. Структура ментальных репрезентаций: извлечение текста из памяти, нейронная сеть и искусственный интеллект / В. Г. Арутюнян // Вестник Пермского университета. Российская и зарубежная филология. - 2013. - №4 (24). -C. 92-101.

3. Ефремова, Л. И. Выбор системы электронного документооборота для предприятия / Л. И. Ефремова, А. О. Колекина // Вестник ВУиТ. - 2019. - №1. -С. 121-129.

4. Катасёв, А.С. Нейросетевая технология классификации электронных почтовых сообщений / А. С. Катасёв, Д. В. Катасёва, А. П. Кирпичников // Вестник Казанского технологического университета. - 2015. - №5. - С. 12-20.

5. Колесникова, Г. И. Искусственный интеллект: проблемы и перспективы / Г. И. Колесникова // Видеонаука. - 2018. - №2 (10). - С. 132-141.

6. Обухов, А. Д. Проектирование адаптивной системы электронного документооборота на основе нейросетевой архитектуры / А. Д. Обухов // International Journal of Open Information Technologies. - 2021. - №3. - С. 78-85.

7. Пуртова, Е. А. Использование технологий Legal tech в публичной политике / Е. А. Пуртова // Евразийский союз ученых. - 2019. - № 7-4 (64). - С. 111-118.

8. Соменков, С. А. Искусственный интеллект: от объекта к субъекту? / С. А. Соменков // Вестник Университета имени О. Е. Кутафина. - 2019. - № 2 (54). -С. 232-229.

i Надоели баннеры? Вы всегда можете отключить рекламу.