Научная статья на тему 'Сетевые модели представления знаний для решения задачи анализа документооборота организации'

Сетевые модели представления знаний для решения задачи анализа документооборота организации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
865
118
Поделиться
Ключевые слова
ДОКУМЕНТ / ДОКУМЕНТООБОРОТ / ДОКУМЕНТОПОТОКИ / АВТОМАТИЗАЦИЯ / СИСТЕМА ЭЛЕКТРОННОГО ДОКУМЕНТООБОРОТА / THE DOCUMENT / DOCUMENT CIRCULATION / AUTOMATION / SYSTEM OF ELECTRONIC DOCUMENT CIRCULATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Усманова И. В.

Для достижения максимального эффекта от внедрения системы электронного документооборота необходим предварительный всесторонний анализ содержания создаваемых документов и процедур их оформления, а также оптимизация бизнес-процессов организации. Предложены сетевые модели представление знаний, применение которых обеспечивает возможность качественной оценки состояния документооборота на основе разнородных текущих количественных показателей.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Усманова И. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Network models of representation of knowledge for the decision of a problem of the analysis of document circulation of the organization

The preliminary all-round analysis of the maintenance of created documents and procedures of their registration and also optimization of business processes of the organization are necessary for achievement of the maximum effect from introduction of system of electronic document circulation. Network models representation of the knowledge which application provides possibility of quality standard of a condition of document circulation on the basis of diverse current quantity indicators are offered.

Текст научной работы на тему «Сетевые модели представления знаний для решения задачи анализа документооборота организации»

ИЗВЕСТИЯ

ПЕНЗЕНСКОГО ГОСУДАРСТВЕННОГО ПЕДАГОГИЧЕСКОГО УНИВЕРСИТЕТА имени В. Г. БЕЛИНСКОГО ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ №26 2011

ПГПУ

ИМ. В. Г. БЕЛИНСКОГО

IZVESTIA

PENZENSKOGO GOSUDARSTVENNOGO PEDAGOGICHESKOGO UNIVERSITETA IMENI V.G. BELINSKOGO PHYSICAL AND MATHEMATICAL SCIENCES №26 2011

УДК: 004.413.5+004.91

СЕТЕВЫЕ МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ ДЛЯ РЕШЕНИЯ ЗАДАЧИ АНАЛИЗА ДОКУМЕНТООБОРОТА ОРГАНИЗАЦИИ

© И. В. УСМАНОВА Пензенский государственный педагогический университет им. В. Г. Белинского, кафедра прикладной математики и информатики e-mail: ivusm@mail.ru

Усманова И. В. — Сетевые модели представления знаний для решения задачи анализа документооборота организации // Известия ПГПУ им. В. Г. Белинского. 2011. № 26. С. 412—417.

— Для достижения максимального эффекта от внедрения системы электронного документооборота необходим предварительный всесторонний анализ содержания создаваемых документов и процедур их оформления, а также оптимизация бизнес-процессов организации. Предложены сетевые модели представление знаний, применение которых обеспечивает возможность качественной оценки состояния документооборота на основе разнородных текущих количественных показателей.

Ключевые слова: документ, документооборот, документопотоки, автоматизация, система электронного документооборота, модель представления знаний

Usmanova I. V. — Network models of representation of knowledge for the decision of a problem of the analysis of document circulation of the organization // Izv. Penz. gos. pedagog. univ.

im.i V. G. Belinskogo. 2011. № 26. P. 412—417. — The preliminary all-round analysis of the maintenance of created documents and procedures of their registration and also optimization of business processes of the organization are necessary for achievement of the maximum effect from introduction of system of electronic document circulation. Network models representation of the knowledge which application provides possibility of quality standard of a condition of document circulation on the basis of diverse current quantity indicators are offered.

Keywords: the document, document circulation, документопотоки, automation, system of electronic document circulation, model of representation of knowledge

Применение на предприятии системы электронного документооборота (СЭД) позволяет резко сократить время на выполнение рутинных операций, связанных, прежде всего, с передачей документов заинтересованным должностным лицам, а также повысить сохранность информации. От внедрения СЭД ожидается и увеличение эффективности функционирования организации в целом, проявляющееся преимущественно в повышении качества реализации основных бизнес-процессов.

Внедряемая СЭД часто настраивается с учетом сложившегося порядка работы с документами, вследствие чего все имевшиеся в организации проблемы работы с документами остаются и лишь переносятся на новую технологическую основу.

Поскольку документы порождаются бизнес-процессами предприятия, то любые недостатки в их содержании, порядке прохождения и даже оформлении неизбежно сказываются на эффективности работы предприятия в целом. Достижение максимального эффекта от внедрения СЭД возможно лишь при выполнении работ по анализу содержания создаваемых документов и процедур их оформления, а также оптимизации бизнес-процессов организации, предшествующих автоматизации делопроизводства и документооборота.

Существующие СЭД функционируют в большинстве своем отдельно от систем бухгалтерского и материального учета, систем анализа финансового состояния предприятия, хотя рассматривается как обязательная составляющая системы комплексной автоматизации управления предприятия. Вопрос о внедрении систем класса ЕЕР ставится чрезвычайно редко даже на крупных предприятиях, а присутствующие сегодня на рынке системы этого типа не оснащены программными модулями анализа состояния документооборота, что снижает эффективность их использования.

Применение широко распространенных систем интеллектуального анализа данных для анализа документооборота не дает желаемого результата вследствие отсутствия системы целевых показателей, характеризующих каждый бизнес-процесс предприятия. Анализ публикаций также показывает, что проведение анализа состояния документооборота до сих пор остается субъективным процессом, значительно снижающим эффективность внедрения СЭД, если организация решается на такой шаг. Общепринятой нормой является учет объема документооборота и выявление количества не исполненных в срок документов. Анализ документооборота производится на смысловом, качественном уровне, а сам этот процесс отражает взгляды должностного лица, его производящего. Не существует формализованной методики оценки направления и состава документопотоков из-за отсутствия интегрального показателя качества документооборота или универсальной системы показателей качества документооборота, обладающей свойствами полноты и неизбыточности и не зависящей от специфики деятельности предприятия.

Перечисленные проблемы могут быть решены с использованием методов инженерии знаний, а результаты их применения программно реализованы в виде самостоятельных информационных систем или компонентов СЭД, предназначенных для оперативного анализа состояния документооборота организации.

Корпоративные знания становятся все более важным ресурсом современной организации. Непрерывное возрастание объемов и темпов обработки информации в связи с общим ускорением проектирования и реализации бизнес-процессов делает все более необходимым использование сведений об общих закономерностях, существующих в данной предметной области, при решении различных вопросов. В настоящее время на практике все чаще ставится вопрос о необходимости комплексной автоматизации деятельности предприятия и разработки систем управления знаниями.

Задача анализа документооборота имеет смысловой характер, требует применения эвристических правил, основанных на опыте профессиональной работы, и может быть решена при помощи технологий поиска с использованием семантических сетей, которые давно и успешно применяются для представления самых разнообразных знаний в различных предметных областях.

Для решения задачи анализа документооборота предлагается использовать две сетевые модели представления знаний (МПЗ). Первая из них относится к типу классифицирующих сетей, имеет иерархическую структуру и предназначена для логической организации множества понятий делопроизводства и области деятельности организации. Узлами сети являются понятия предметной области, а дугам соответствуют отношения смысловой зависимости между понятиями. Смысл связей во многом определяется спецификой предметной области, однако в сети могут присутствовать связи типа “входит”, “включает”, “имеет” (Таблица 1).

Основные типы смысловых связей и их значение

Связь

Значение связи

Понятие!] СШГ »|Нонятие2

Связь “синоним”. Понятие! и Понятие2 являются синонимами

Связь “имеет”. Понятие2 является неотъемлемым компонентом Понятия1 (логическое умножение И)

Связь “означает”. Понятие2 описывает Понятие1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Связь “включает”. Понятие1 включает в себя Понятие2 как компонент (логическое сложение ИЛИ)

Связь “может быть”. Понятие2 является разновидностью Понятия1 (исключающее ИЛИ)

Связь “входит”. Понятие1 входит в определение Понятия2.

Связь “описывает”. В определение Понятия1 входит вспомогательное Понятие2.

Пример фрагмента семантической сети, описывающего компоненты понятия “документ”, приведен на рисунке 1.

Рисунок 1 - Фрагмент семантической сети понятий.

Данная модель необходима, прежде всего, для организации обмена сообщениями между пользователем и системой и позволяет выделить подграфы родственных понятий, что сужает область поиска необходимой информации. Применение этой модели обеспечивает возможность ведения диалога с пользователем на профессиональном диалекте естественного языка, открывает дополнительные возможности для проверки степени компетентности персонала и/или его аттестации, а также создает основу для накопления и систематизации сведений о предметной области.

Пусть семантической сети понятий соответствует граф 0(и;У); где V - множество вершин и V -множество ребер, аП^и^^г)- г — ый подграф понятий графа 0(и, V), объединяющий совокупность понятий по некоторому г-ому признаку. Тогда

П

а(и^) = и о^и^),

г=1

А(ии^) п П(V) = 0.

Одной из основных проблем, требующих разрешения в процессе построения этой модели пред-

ставления знаний, является обеспечение однозначности толкования понятий, соответствующих вершинам сети. Формирование понятий - результат исследования предметной области, изучения закономерностей и тенденций ее развития. Поэтому в качестве понятий, соответствующих вершинам семантической сети, следует рассматривать прежде всего те, определения которых закреплены в нормативных документах различного уровня - законах, государственных и отраслевых стандартах, стандартах предприятия.

В любой предметной области всегда существуют вспомогательные понятия, содержание которых не закреплено в нормативах, но которые систематически употребляются в данной предметной области и одинаково понимаются всеми участниками коммуникации. Такие понятия также обязательно должны присутствовать в семантической сети.

Количество типов смысловых связей между вершинами семантической сети должно быть сведено к минимуму и определяться экспертами в данной предметной области.

Формализация связей частично решает проблему пополнения базы знаний, которая возникает в связи с развитием науки и производства. Пополнение базы знаний осуществляется экспертом. При этом необходимо контролировать характер смысловых взаимосвязей вновь создаваемых и существующих фрагментов сети. Для решения этой задачи целесообразно использовать операции над графами.

Пусть П1(и1,У1), 02^2^2), Пз(из^з)- подграфы семантической сети, описывающие соответ-

ственно понятия 1, 2, 3. В процессе редактирования и пополнения базы знаний могут быть выявлены следующие типы взаимосвязей фрагментов сети.

1. Взаимосвязи, выявляемые на основе операции объединения графов. Они позволяют выделить и продемонстрировать эксперту понятие, в определении которого участвует новое понятие, или понятие, более широкое по смыслу, т.е. описывают ситуации вида

П1 = П2 и П3.

1. Взаимосвязи, описываемые с помощью операции пересечения графов: П1 = П2 П П3.

Результатом ее применения является список терминов, которые:

• одновременно участвуют в определении нескольких заданных терминов;

• объединяют по смыслу заданные термины.

1. Взаимосвязи, описываемые с помощью операции вычитания графов:

П1 = П2 \ П3.

Эта операция позволяет выявить термины, участвующие в определении одного термина, но отсутствующие в определении другого термина.

1. В графах могут присутствовать изолированные вершины. Очевидно, что эксперты должны быть особенно внимательны к таким ситуациям.

Семантическая сеть понятий позволяет также выполнить настройку используемых в системе показателей оценки на особенности применяемой процедуры оценки и является основой функционирования второй модели представления знаний.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Данная МПЗ предназначена для логической организации сведений об основных закономерностях между отдельными показателями состояния документооборота и используется для формирования его оценки. Состояние документооборота определяется состоянием наборов данных, описывающих реальную ситуацию на предприятии и характеризующихся степенью их соответствия нормативным документам и концептуальной модели документооборота в сознании человека.

Специфика сведений о состоянии документооборота заключается в их нечеткости и неполной определенности и наиболее полно может быть учтена в предложениях естественного языка. Поэтому вторая модель представления знаний должна быть двухуровневой. Первый уровень образует семантическая сеть, узлами которой являются утверждения, представляющие собой предложения естественного языка. Они содержат частные оценки состояния документооборота и бизнес-процессов, отражают эмпирические закономерности между появлением отдельных показателей состояния и являются основой для формирования прогнозов развития текущей ситуации.

Например, если должностное лицо очевидно перегружено операциями по согласованию документов и является адресатом или получает для исполнения большое количество внутренних и входящих документов, то под угрозой оказываются сроки и качество исполнения бизнес-процессов, в которых он занят. Если эти процессы относятся к категории основных для данной организации, то можно сделать вывод о возникновении опасности снижения каких-либо показателей эффективности деятельности организации в целом. В описании рассмотренной ситуации могут быть выделены несколько утверждений, одним из которых является утверждение “Количество согласований документов сотрудником велико”.

Вершинам сети первого уровня предлагается поставить в соответствие утверждения четырех групп: показатели состояния документооборота; показатели эффективности бизнес-процессов; показатели эффективности деятельности организации; показатели эффективности СЭД. С каждым утверждением связано исходное значение вероятности, выражающее степень влияния данного показателя на показатели эффективности процесса деятельности и определяемое экспертом.

Смысловые отношения вершин представляются дугами различных типов. Каждое отношение характеризуется наличием выраженного влияния одного показателя состояния на другой. Дуга с инцидентными ей узлами есть семантическое представление правила, отражающего установленную эмпирически возможность появления одного показателя в случае появления второго.

Предложения естественного языка позволяют наиболее полно выразить содержание показателей оценки вследствие присущей им нечеткости и неполной определенности. Это обусловливает сложность синтаксиса и семантики предложений и предъявляет серьезные требования к гибкости модели представления знаний и возможности ее настройки на особенности конкретного предприятия.

Поэтому второй уровень рассматриваемой модели образуют семантические представления отдельных утверждений, необходимые для выполнения оценки соответствующего показателя состояния документооборота. Утверждение является семантической конструкцией, узлами которой являются понятия первой МПЗ, а также семантические отношения и операции вычисления утверждений. Дуги указывают на установление семантических отношений между понятиями. Основным требованием к структуре утверждения является его лаконичность. Грамматическая основа утверждения представляет собой логическую посылку для описания констатируемого факта (как, например, в утверждении “Состав документов подразделений неоднороден”) или ожидаемый результат вычислений (“Количество согласований документов сотрудником велико”).

В каждом представлении утверждения выделяются две части. Первая содержит понятия, участвующие в констатации основного факта утверждения, и все семантические отношения, описывающие утверждение. Для последнего утверждения такими понятиями являются “сотрудник”, “документ”, “виза согласования”. Эта часть постоянна и не зависит от применяемых для вычисления значения утверждения моделей и наборов данных.

Вторая часть утверждения образована внешними ссылками, соотносящими понятия утверждения с другими понятиями классификационной схемы первой МПЗ и позволяющими настраивать утверждение на конкретную ситуацию. Например, слово “велико” в разных обстоятельствах может интерпретироваться следующим образом: как максимальное абсолютное значение количества виз согласования, проставляе-

мых конкретным должностным лицом в какой-либо период времени; как наибольшее значение количество процедур согласования, выполняемых каким-либо сотрудником по сравнению с другими; как превышение количества виз согласования, проставляемых должностным лицом, среднего количества виз согласования для сотрудников соответствующего уровня управления на определенную величину.

По существу, каждое представление утверждения есть фрейм-прототип, т.е. описание стереотипной ситуации, задаваемой утверждением. Гибкость структуры фрейма достигается за счет использования слотов, которым соответствуют внешние ссылки семантических представлений утверждений. Для каждого слота следует задать правило присваивания.

Фрейм-пример для каждого утверждения содержит описание конкретной программы для его вычисления. Например, в приведенном выше примере для вычислений должны быть использованы отличающиеся друг от друга выборки данных в зависимости от особенностей текущей ситуации.

Рассмотренная модель представления знаний предполагает использование известного метода Байеса для организации логического вывода с целью оценки состояния документооборота и прогнозирования дальнейшего развития ситуации, сложившейся в организации. Она является инвариантной к предметной области и может быть применена для решения широкого спектра задач в области разработки систем управления документооборотом.