Научная статья на тему 'Подход к определению структуры метаязыка для формализации причинно-следственных связей в системной модели знаний'

Подход к определению структуры метаязыка для формализации причинно-следственных связей в системной модели знаний Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
339
54
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМНАЯ МОДЕЛЬ / МЕТАЯЗЫК / ПРИЧИННО-СЛЕДСТВЕННЫЕ СВЯЗИ / ФОРМАЛИЗАЦИЯ / ТЕОРИЯ КАТЕГОРИЙ / ПРИНЦИП ПРИЧИННОСТИ / УРОВНИ ИЕРАРХИИ ХОМСКОГО / SYSTEM MODEL / METALANGUAGE / RELATIONSHIPS OF CAUSE AND EFFECT / FORMALIZATION / THEORY OF CATEGORIES / PRINCIPLE OF CAUSALITY / LEVELS OF HIERARCHY OF CHOMSKY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Куликов Г.Г., Злобина Т.П., Бабак С.Ф., Шамиданов Д.Г.

Предложен подход к определению системной модели знаний на основе формализации причинно-следственных связей, определяющих предметную область. Найдены необходимые условия для построения терминального формализованного языка как основного инструмента извлечения и представления знаний. Показано, что если диалектические свойства категории причинно-следственных связей в исследуемой предметной области определить как отношение сущностных и экзистенциальных свойств объектов, то эти отношения прежде всего определят правила синтаксиса и далее аксиомы семантики предметно-ориентированного метаязыка. В синтаксис такого формального метаязыка необходимо ввести правило суперпозиции и ассоциативности всего многообразия причинно-следственных связей в объекте и во взаимодействии объектов в исследуемой предметной области. Нелинейность связей между объектами в рассматриваемом случае будет определяться функторами, связывающими различные аспекты представления предметной области Ас.1, Ас.2,…. Приводится пример для определения структуры метаязыка в предметной области информационная деятельность, включающая: естественный метаязык (ЕЯ); графоаналитический метаязык теории категорий (ГАЯ); метаязык программирования (ПЯ) и т.д. Представление описания бизнес-процессов, структура которых представляет систему формализованных причинно-следственных связей, рассматривается в связи с предметноориентированными терминальными метаязыками в соответствии с иерархией Хомского. Выделены и описаны в атрибутивной форме бизнес-правила формирования критериев структурирования контента и извлечения данных из моделей бизнес-процессов. В процессе извлечения знаний предметной области и его интерпретации в качестве основных инструментов представлены предметно-ориентированные терминальные метаязыки, формируемые на основе естественного языка, исходя из контекста предметной области. Переход между уровнями иерархии выполняется за счет описания предметной области в форме метаданных и совокупности хранилищ данных. Процесс извлечения данных информационного пространства для интеллектуального анализа представлен в соответствии с уровнями иерархии Хомского.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Куликов Г.Г., Злобина Т.П., Бабак С.Ф., Шамиданов Д.Г.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPROACH TO DEFINITION OF STRUCTURE OF META LANGUAGE FOR FORMALIZATION OF RELATIONSHIPS OF CAUSE AND EFFECT IN SYSTEM MODEL OF KNOWLEDGE

Approach to definition of system model of knowledge on the basis of formalization of the relationships of cause and effect defining data domain is offered. Necessary conditions for creation of the terminal formalized language as main instrument of extraction and representation of knowledge are found. It is shown that if the dialectic properties of the category cause relationships in the studied subject domain to define as the relation of the essence and existential properties of objects, then these relations, first of all, will define rules of syntax and further an axiom of semantics of subject-oriented meta language. In syntax of such formal meta language it is necessary to introduce the rule of superposition and associativity of all variety of relationships of cause and effect in an object and in interaction of objects in the studied subject domain. Nonlinearity of communications between objects will be defined in the case under consideration by the functors connecting various aspects of representation of subject domain of As.1, As.2,…. The example for definition of structure of meta language in subject domain information activities, including is given: Natural meta language (EYa); Graphic-analytical meta language of the theory of categories (GAYa); meta language of programming (PYa), etc. Submission of the description of business processes which structure represents system of the formalized relationships of cause and effect is considered in connection with subject-oriented terminal metalanguages according to Chomsky's hierarchy. Are allocated and described in an attributive form of the business rule of formation of criteria of structuring content and extraction of the business processes given from models. In the course of extraction of knowledge of subject domain and its interpretation as the main tools the subject-oriented terminal metalanguages formed on the basis of a natural language proceeding from a context of subject domain are presented. Transition between levels of hierarchy is carried out at the expense of the description of subject domain in the form of metadata and set of storages of data. Process of extraction of data of information space for the intellectual analysis is presented according to levels of hierarchy of Chomsky.

Текст научной работы на тему «Подход к определению структуры метаязыка для формализации причинно-следственных связей в системной модели знаний»

2017 Электротехника, информационные технологии, системы управления № 21 УДК 004.62

Г.Г. Куликов, Т.П. Злобина, С.Ф. Бабак, Д.Г. Шамиданов

Уфимский государственный авиационный технический университет,

Уфа, Россия

ПОДХОД К ОПРЕДЕЛЕНИЮ СТРУКТУРЫ МЕТАЯЗЫКА ДЛЯ ФОРМАЛИЗАЦИИ ПРИЧИННО-СЛЕДСТВЕННЫХ СВЯЗЕЙ В СИСТЕМНОЙ МОДЕЛИ ЗНАНИЙ

Предложен подход к определению системной модели знаний на основе формализации причинно-следственных связей, определяющих предметную область. Найдены необходимые условия для построения терминального формализованного языка как основного инструмента извлечения и представления знаний. Показано, что если диалектические свойства категории причинно-следственных связей в исследуемой предметной области определить как отношение сущностных и экзистенциальных свойств объектов, то эти отношения прежде всего определят правила синтаксиса и далее аксиомы семантики предметно-ориентированного метаязыка. В синтаксис такого формального метаязыка необходимо ввести правило суперпозиции и ассоциативности всего многообразия причинно-следственных связей в объекте и во взаимодействии объектов в исследуемой предметной области. Нелинейность связей между объектами в рассматриваемом случае будет определяться функторами, связывающими различные аспекты представления предметной области Ас.1, Ас.2,.... Приводится пример для определения структуры метаязыка в предметной области - информационная деятельность, включающая: естественный метаязык (ЕЯ); графоаналитический метаязык теории категорий (ГАЯ); метаязык программирования (ПЯ) и т.д.

Представление описания бизнес-процессов, структура которых представляет систему формализованных причинно-следственных связей, рассматривается в связи с предметно-ориентированными терминальными метаязыками в соответствии с иерархией Хомского. Выделены и описаны в атрибутивной форме бизнес-правила формирования критериев структурирования контента и извлечения данных из моделей бизнес-процессов. В процессе извлечения знаний предметной области и его интерпретации в качестве основных инструментов представлены предметно-ориентированные терминальные метаязыки, формируемые на основе естественного языка, исходя из контекста предметной области. Переход между уровнями иерархии выполняется за счет описания предметной области в форме метаданных и совокупности хранилищ данных. Процесс извлечения данных информационного пространства для интеллектуального анализа представлен в соответствии с уровнями иерархии Хомского.

Ключевые слова: системная модель, метаязык, причинно-следственные связи, формализация, теория категорий, принцип причинности, уровни иерархии Хомского.

G.G. Kulikov, T.P. Zlobina, S.F. Babak, D.G. Shamidanov

Ufa State Aviation Technical University, Ufa, Russian Federation

APPROACH TO DEFINITION OF STRUCTURE OF META LANGUAGE FOR FORMALIZATION OF RELATIONSHIPS OF CAUSE AND EFFECT IN SYSTEM MODEL OF KNOWLEDGE

Approach to definition of system model of knowledge on the basis of formalization of the relationships of cause and effect defining data domain is offered. Necessary conditions for creation of the terminal formalized language as main instrument of extraction and representation of knowledge are found. It is shown that if the dialectic properties of the category cause relationships in the studied subject domain to define as the relation of the essence and existential properties of objects, then these relations, first of all, will define rules of syntax and further an axiom of semantics of subject-oriented meta language. In syntax of such formal meta language it is necessary to introduce the rule of superposition and associativity of all variety of relationships of cause and effect in an object and in interaction of objects in the studied subject domain. Nonlinearity of communications between objects will be defined in the case under consideration by the functors connecting various aspects of representation of subject domain of As.1, As.2,.... The example for definition of structure of meta language in subject domain -information activities, including is given: Natural meta language (EYa); Graphic-analytical meta language of the theory of categories (GAYa); meta language of programming (PYa), etc.

Submission of the description of business processes which structure represents system of the formalized relationships of cause and effect is considered in connection with subject-oriented terminal metalanguages according to Chomsky's hierarchy. Are allocated and described in an attributive form of the business rule of formation of criteria of structuring content and extraction of the business processes given from models. In the course of extraction of knowledge of subject domain and its interpretation as the main tools the subject-oriented terminal metalanguages formed on the basis of a natural language proceeding from a context of subject domain are presented. Transition between levels of hierarchy is carried out at the expense of the description of subject domain in the form of metadata and set of storages of data. Process of extraction of data of information space for the intellectual analysis is presented according to levels of hierarchy of Chomsky.

Keywords: system model, metalanguage, relationships of cause and effect, formalization, theory of categories, principle of causality, levels of hierarchy of Chomsky.

Анализ решаемой проблемы. Известно, что системные знания базируются на общих философских законах, отражённых в категориях диалектики. Разработанные в материальной диалектике принципы и законы явились основой системной методологии и утверждения системного метода познания [1-5]. Они дали определённый импульс и в развитие формальных математических методов в формальной логике, теории множеств, теории категорий и др. Диалектика в логической форме открывает возможность рассматривать, изучать траектории развития изучаемого объекта, исследовать его взаимодействие с другими предметами, с учётом множества подобъектов и их предметного содержания в границах исследуемой предметной области. Диалектика -

это та научная система, в которой важное место занимают принципы формальной логики: определённость, доказательность, ясность, последовательность, непротиворечивость. Законы и категории диалектики -это способ познания процессов, явлений природы и общества. Они имеют объективное содержание, так как отражают закономерности реального мира.

Закономерный характер имеет одна из форм всеобщей связи -причинно-следственная, так как в природе, обществе, в человеческом мышлении всё обусловлено конкретными причинами. Определение причины явлений - это необходимость в процессе познания. Причина обусловливает какое-либо явление в объекте или между объектами, его появление, изменение или исчезновение в различных аспектах, сечениях, срезах и т.д. Причинная связь имеет многообразный, всеобщий и объективный характер и может проявляться в каких-либо формах, например, через отношения, соответствия, отображения и др. Категория причинности является одной из основных категорий научного исследования, которое нацелено на установление причинно-следственных и следственно-причинных связей.

Принцип причинности означает, что все природные и общественные явления и процессы детерминированы, упорядочены, они появляются, изменяются и исчезают закономерно, обусловлены действием конкретных причин. Принцип детерминизма (повторяемости) лежит в основе научного познания мира, объяснения явлений в объектах (их предметное содержание) и между объектами. Согласно диалектическому материализму причиной называется то явление, которое при определённых условиях с необходимостью вызывает другие явления или обусловливает в нём изменения. Следствие - это явление, которое порождается или изменяется под действием определённой причины в объекте или между объектами, связь между причиной и следствием закономерна и универсальна. Отметим, что понятие явления предполагает и наличие среды, в которой происходит взаимодействие в объекте или между объектами. В действительности нет беспричинных явлений. Между причиной и следствием существует глубокая логическая связь -всеобщая. Всё имеет свои естественные причины. Но причинная связь -не единственная. С ней связаны формы связей, которые отражаются такими категориями, как форма и содержание, возможность и действительность, необходимость и случайность и др.

Постановка задачи исследования. Широкое применение информационных технологий определяет необходимость математической формализации диалектических категорий для исследования множества конкретных предметно-ориентированных областей в творческой деятельности людей. Основой построения системных моделей (категорий знаний) для различных предметно-ориентированных областей деятельности специалистов являются формализованные предметно-ориентированные метаязыки [6, 7], которые, по сути, являются диалектической категорией с объективными адекватными причинно-следственными связями и подчиняются общим законам формальной логики. В таких метаязыках общие законы логики как адекватно отражающие структуры исследуемых предметных областей представляются семантическими правилами построения моделей знаний.

Подход к решению задачи. Законы диалектики представляются как системы аксиом, определяющие истинность этих знаний до идентифицируемых объектов и их причинно-следственных связей в исследуемой предметной области, т.е. семантикой. При этом должна определяться также цепочка причинно-следственных связей между метаязыками, их синтаксисом, семантикой и знаниями о предметной области. Например, для информационной деятельности это может быть: естественный метаязык (ЕЯ); графический метаязык (ГЯ); графоаналитический метаязык (ГАЯ); математический метаязык (МЯ); метаязык программирования (ПЯ) и т.д. Определим соответствие между ЕЯ представления причинно-следственной категории, её подкатегорий и формализованным графоаналитическим языком (ФГАЯ) в рамках математической теории категорий. Для дальнейшей формализации логико-семантического (содержательного) представления категории причинно-следственных связей в различных системных представлениях воспользуемся базовыми положениями математической теории категорий. Для исследования решаемой проблемы определим две категории: предметно-ориентированный формальный метаязык (ПОФМЯ); исследуемую предметную область (ИПО) как область (множество) причинно-следственных связей между реальными объектами.

На основе анализа исследуемой предметной области определим словарный базис (для организации терминального алфавита) категории формального языка диалектической причинно-следственной категории, рассмотренной выше: Ат = {объект; явление, причина; следствие;

система; функция; утверждение; метод; случайность; субстанция; внутреннее; внешнее...}.

Определим словарь для нетерминального алфавита: = {категория; среда, предметная область ...}.

Технология решения задачи. Для дальнейшей формализации данного языка будем использовать принцип построения порождающих контекстных метаязыков Хомского. Для обозначения объектов введём терминальный символ:

Об-, - = 1,...,п). (1)

Для обозначения связей между объектами используем терминальный символ морфизма:

Нош/,,- ОУ = 1,...,я). (2)

Для отображения линейных логико-структурных связей между объектами Об-, и классификации их как элементов причинно-следственных связей используем следующие синтаксические правила:

1. Для каждой пары объектов А, В задаётся множество морфизмов НоШе(А, В);

Примечание: предположим, что морфизмы классифицированы по признаку «аспект исследуемой предметной области».

2. Для пары морфизмов / Е Нош(А, В) и g Е Нош(В, С) определена композиция до f°g Е Нош(А, С).

Примечание: действует для выбранного аспекта.

3. Для каждого объекта А задан тождественный морфизм ¡ёА = Нош(А, А), для которых выполняются аксиомы.

4. Операция композиции ассоциативна: h°(q°f) = (й°д)°/

5. Тождественный морфизм действует тривиально: = ¡^^ = f для f Е Нош(А, В).

Покажем, что представление ИПО с применением данного формального языка позволяет сохранить свойства суперпозиции и ассоциативности всего многообразия причинно-следственных связей в объекте и во взаимодействии объектов в выбранном аспекте. Нелинейность связей между объектами в рассматриваемом случае будет определяться функторами, связывающими различные аспекты Ас.ь Ас2, рис. 1.

Синтаксическими правилами построения «правильных» предложений на данном метаязыке являются правила построения коммутативных диаграмм [11].

Рис. 1. Схема представления нелинейных связей между объектами ИПО на языке теории категорий

Коммутативная диаграмма - это ориентированный граф, в вершинах которого находятся идентифицированные объекты, а стрелками являются идентифицированные морфизмы (наделённые определёнными структурными свойствами причинно-следственных связей), причём результат композиции стрелок есть бинарная операция на множестве объектов. Аксиомы теории категорий определяют синтаксические правила метаязыка и в графических построениях: ассоциативность композиции, тождественность морфизмов и др., т.е. правила композиции объектов и их морфизмов сохраняются и в представлении диаграмм. Таким образом, метаязык является формальным графоаналитическим языком [6]. На рис. 2 приведены синтаксические правила (аксиоматика) формализованного графоаналитического метаязыка.

А

к°(ч°/)= =(Н°д)°/

Б

А

ША

А

В

В

Рис. 2. Графические правила композиции объектов и их морфизмов

Ч

н

Семантические правила, основанные на введённой аксиоматике, позволяют получать непротиворечивые графоаналитические модели ИПО в заданном аспекте, сохраняя принцип двойственности категорий (Ср), в которой объекты совпадают с объектами исходной категории (С), а морфизмы получаются «обращением стрелок»: Ношсор(В, А) = Ношс(А, В).

Также сохраняются свойства изоморфизма, эндоморфизма, автоморфизма по следующим правилам:

Морфизм f Е Нош(А, В) называется изоморфизмом, если существует такой морфизм g Е Нош (В, А), что g°f = ¡¿А и f◦g = ¡¿В.

Два объекта, между которыми существует изоморфизм, называются изоморфными. В частности, тождественный морфизм является изоморфизмом, поэтому любой объект изоморфен сам себе. Морфиз-мы, в которых начало и конец совпадают, называют эндоморфизмами. Множество эндоморфизмов Биё(А) = Нош(А, А) является моноидом относительно операции композиции с единичным элементом ¡¿А. Эндоморфизмы, которые одновременно являются изоморфизмами, называются автоморфизмами. Автоморфизмы любого объекта образуют группу автоморфизмов Аи1;(А) по композиции.

Мономорфизм - это морфизм f Е Нош(А, В) такой, что для любых gь g2 Е Нош(Х, А) из jьgl = j°g2 следует, что gl = g2. Композиция мономорфизмов есть мономорфизм. Эпиморфизм - это такой морфизм f Е Нош(А, В), что для любых g1, g2 Е Нош(В, X) из g1°f = g2°f следует gl = g2. Композиция эпиморфизмов есть эпиморфизм.

Биморфизм - это морфизм, являющийся одновременно мономорфизмом и эпиморфизмом. Любой изоморфизм есть биморфизм, но не любой биморфизм есть изоморфизм. Мономорфизм, эпиморфизм и биморфизм являются обобщениями понятий инъективного, сюръек-тивного и биективного отображения соответственно. Любой изоморфизм является мономорфизмом и эпиморфизмом, обратное верно не для всех категорий.

В соответствии с теоремой о неполноте формальной теории (синтаксический подход) в математической теории категорий вводится понятие инициального и терминального объектов.

Инициальный (начальный, универсально отталкивающий) объект категории - это такой объект, из которого в любом объекте категории существует единственный морфизм. Если инициальные объекты

в категории существуют, то все они изоморфны. Двойственным образом определяется терминальный или универсально притягивающий объект - это такой объект, в котором из любого объекта категории существует единственный морфизм. Объект категории называется нулевым, если он одновременно инициальный и терминальный.

Произведение (пары) объектов А и В - это объект АхВ с морфиз-мами р1: АхВ ^ А и р2: АхВ ^ В такими, что для любого объекта С и любых морфизмов /1: С ^ А и /2: С ^ В существует единственный морфизм g: С ^ АхВ такой, что/ = p\°g и/2 = р2°£.

Морфизмы р1: АхВ ^ А, р2: АхВ ^ В называются проекциями.

Двойственно определяется сумма или копроизведение А + В. Соответствующие морфизмы ¡А: А ^ А + В и ¡В: В ^ А + В называются вложениями. Несмотря на своё название, в общем случае они могут и не быть мономорфизмами.

Функторы - это отображения категорий, сохраняющие внутреннюю структуру, т.е. функтор Г: С ^ Э ставит в соответствие каждому объекту категории С объект категории Э и каждому морфизму / А ^ В морфизм Г(/): ДА) ^ Г(В) так, что ВДО = и Г&) ° Г(/ = Г^ °/).

Контравариантный функтор, или кофунктор можно понимать как ковариантный функтор из С°р в Э, т.е. «функтор, переворачивающий стрелки». А именно каждому морфизму /: А ^ В он сопоставляет морфизм Г(/): Г(В) ^ Г(А), соответственным образом обращается правило композиции: Г^) ° Г(/ = Г(/ ° g).

Правило естественного преобразования определяет связь между двумя функторами. Функторы часто описывают «естественные конструкции», в этом смысле естественные преобразования описывают «естественные морфизмы» таких конструкций.

Если Г и О - ковариантные функторы из категории С в Э, то естественное преобразование п сопоставляет с каждым объектом X категории С морфизм пХ: Г(Х) ^ О(Х) таким образом, что для любого морфизма /: X ^ У в категории С следующая диаграмма коммутативна (рис. 3).

Два функтора называются естественно изоморфными, если между ними существует естественное преобразование, такое, что пХ - изоморфизм для любого X.

Пример. Представление описания бизнес-процессов [8], структура которых представляет систему формализованных причинно-следственных связей, с применением предметно-ориентированных терминальных метаязыков в соответствии с иерархией Хомского. Ие-

рархия Хомского - классификация формальных языков и формальных грамматик, согласно которой они делятся на 4 типа по их условной сложности [10].

Fx) _^_► F(y)

hX

hY

G(X)

G(f)

G(Y)

Рис. 3. Диаграмма коммутативности

Формальную грамматику G по Хомскому можно представить в виде упорядоченной четвёрки:

G = V VN, P, 5>, (3)

где VT - алфавит (множество) терминальных символов - терминалов; VN - алфавит (множество) нетерминальных символов - нетерминалов;

V = Ур ^VN - словарь G, причём УТ = 0, Р - конечное множество

+ *

продукций (правил) грамматики, Р с V х V , 5 - начальный символ (источник).

Здесь V* - множество всех строк над алфавитом V, а V + - множество непустых строк над алфавитом V.

Согласно Хомскому формальные грамматики делятся на четыре типа:

1. Тип 0 - неограниченные. К типу 0 по классификации Хомского относятся неограниченные грамматики - грамматики с фразовой структурой, т.е. все без исключения формальные грамматики. Практического применения в силу своей сложности такие грамматики не имеют.

2. Тип 1 - контекстно-зависимые. К этому типу относятся контекстно-зависимые (КЗ) грамматики и неукорачивающие грамматики. Эти классы грамматик могут использоваться при анализе текстов на естественных языках, однако при построении компиляторов практически не используются в силу своей сложности.

3. Тип 2 - контекстно-свободные. К этому типу относятся контекстно-свободные (КС) грамматики. КС-грамматики широко применяются для описания синтаксиса компьютерных языков.

4. Тип 3 - регулярные. К третьему типу относятся регулярные грамматики (автоматные) - самые простые из формальных грамматик. Они являются контекстно-свободными, но с ограниченными возможностями. Регулярные грамматики применяются для описания простейших конструкций: идентификаторов, строк, констант, а также языков Ассемблера, командных процессоров и др.

Рассмотрим описание бизнес-процесса на примере диаграммы в нотации структурного моделирования ГОЕБО, которое представляет собой методологию функционального моделирования и графическую нотацию, предназначенную для формализации и описания бизнес-процессов [12]. Таким образом, графическая нотация определяет алфавит, а правила построения модели в данной нотации - грамматику. С точки зрения грамматики Хомского синтаксис ГОЕБ можно отнести к контекстно-свободным грамматикам. Диаграмма в нотации ГОЕБО представляют собой две структуры: первая - ориентированный граф, представляющий формальную структуру модели, и глоссарий, определяющий ее семантическое описание:

ГОЕБ = (Ог, ОЬ), (4)

где Ог - ориентированный граф, О1 - глоссарий модели бизнес-процесса,

Ог = (V, А), (5)

где V - непустое множество вершин - входов и выходов бизнес-процессов, А - множество различных ребер - функций преобразования входных ресурсов в выходные.

Исследуем свойство отношения «вход-выход» между элементами диаграммы. В этом случае вершинами графа выступают ресурсы (входы и выходы функциональных блоков), а стрелками - функции преобразования входов в выходы [9].

Положим, что вершины графа являются объектами категории, а стрелки - морфизмами. Поскольку функциональное моделирование строится на принципе декомпозиции, представление обладает следующими свойствами:

1. Ассоциативность: (А11-А12)-А13=А11-(А12-А13), т.е. возможна вариативность при декомпозиции, но результат не зависит от того, какие именно функциональные блоки будут декомпозированы;

2. Некоммутативность: A1íA12°A11, т.е. результат выполнения процесса зависит от последовательности дочерних процессов;

3. Ресурсы могут быть как входами, так и выходами функциональных блоков.

Вершина графа модели в нотации IDEF0 имеет уникальный иерархический идентификатор, следовательно, элементы этой диаграммы являются идентифицируемыми, а связи прослеживаемыми [15]. Задача поиска сводится к выбору нужного элемента диаграммы по известному пути. Представим процесс извлечения данных информационного пространства для интеллектуального анализа в соответствии с уровнями иерархии Хомского (рис. 4).

Рис. 4. Сопоставление процесса составления правил структурирования контента с уровнями иерархии Хомского

Для формирования критериев структурирования контента [13] и извлечения данных из моделей бизнес-процессов необходимо выделить бизнес-правила, описать их в атрибутивной форме и представить в форме условий. Описание бизнес-процесса на естественном языке, представляющее модель процесса, соотносится с нулевым уровнем иерархии Хомского:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

О = <Уг, Ум, Р, £>, (6)

где VT - конечный алфавит терминальных символов (описание бизнес-процесса на естественном языке); VN - конечный алфавит нетерминальных символов (предложения); Р - конечное множество правил порождения (правила построения предложений); 5 - начальный символ (источник).

К первому уровню - контекстно-независимым языкам - можно отнести бизнес-правила, т.е. описание бизнес-процесса на языке конкретной предметной области, например, в форме чертежей или последовательности конструкторско-технологических операций:

Gl = <^1, Р1, 51>, (7)

где VT1 - термины инструкций, например, конструкторско-техноло-гические операции, чертежи конкретной предметной области; VN1 -конечный алфавит нетерминальных символов конкретного бизнес-процесса; Р1 - конечное множество правил порождения; 51 - начальный символ (источник).

Переход от нулевого уровня к первому выполняется за счет описания процесса в терминах конкретной предметной области с применением конкретного жаргона. Это позволяет сократить алфавит, упростить синтаксис, но уточнить семантику языка.

С уровнем контекстно-свободных языков соотносится атрибутивная модель процесса, определяющая описание моделируемого процесса в виде моделей бизнес-процессов:

G2 = ^Т2, VN2, Р2, 52>, (8)

где VT2 - элементы языка моделирования; VN2 - конечный алфавит нетерминальных символов языка моделирования; Р2 - конечное множество правил построения моделей; 52 - начальный символ (источник).

Переход от контекстно-зависимых к контекстно-свободным языкам выполняется за счет моделирования бизнес-процесса с применением инструментов структурного или объектно-ориентированного подхода [14]. Бизнес-процесс, представленный в форме структурной или объектной модели, использует алфавит и синтаксис конкретного языка моделирования, что позволяет описывать процесс независимо от предметной области.

Правила по структурированию контента можно соотнести с третьим уровнем иерархии - уровнем инструкций. По мере перехода на более низкий уровень иерархии происходит сокращение (конкрети-

зация) синтаксиса языка - описание процесса становится более конкретным, смысл правил сужается до конкретных инструкций.

Для третьего уровня иерархии, которому соответствуют инструкции регулярных языков или языков программирования, определим:

G3 = <Vjb, Vn3, Рз, S3>, (9)

где VT3 - элементы языка программирования; VN3 - конечный алфавит нетерминальных символов языка программирования; Р3 - конечное множество правил взаимодействия; S3 - начальный символ (источник).

Переход от контекстно-свободных языков к регулярным выполняется при программировании и реализации бизнес-процесса с использованием автоматизированных систем и высокоуровневых языков программирования [16].

Каждое из множеств языков является подмножеством предыдущего множества (G3 £ G2 £ G1), что обеспечивает передачу семантики между уровнями иерархии. Однако за счет сокращения синтаксиса может быть потеряна некоторая информация и внесены неточности при реализации.

Выводы. В процессе системного описания (извлечения знаний) предметной области и его интерпретации основными инструментами являются предметно-ориентированные терминальные метаязыки (ПОТМЯ), формируемые на основе естественного языка в контексте предметной области.

Переход между уровнями иерархии в данном конкретном случае выполняется за счет описания предметной области в форме метаданных и совокупности хранилищ данных.

Коллектив авторов считает, что возможны дальнейшая формализация данного процесса и его описание в форме категорийных и теоретико-множественных моделей.

Библиографический список

1. Введение в философию: учеб. пособие для вузов / И.Т. Фролов [и др.]. - 3-е изд., перераб. и доп. - М.: Республика, 2003. - C. 623.

2. Аскин Я.Ф. Философский детерминизм и научное познание. -М.: Мысль, 1977. - C. 188.

3. Проектирование экспертных систем на основе системного моделирования / Г.Г. Куликов, А.Н. Набатов, А.В. Речкалов [и др.]. -Уфа: Изд-во Уфим. гос. авиац. техн. ун-та, 1999. - C. 223.

4. Куликов Г.Г., Набатов А.Н., Речкалов А.В. Автоматизированное проектирование информационно-управляющих систем. Системное моделирование предметной области: учеб. пособие для студ. по на-правл. 552800 - «Информатика и вычисл. техника». - Уфа: Изд-во Уфим. гос. авиац. техн. ун-та, 1998. - C. 103.

5. Куликов Г.Г., Конев К.А., Суворова В.А. Теория систем и системный анализ: учеб. пособие. - Уфа: Изд-во Уфим. гос. авиац. техн. ун-та, 2012. - C. 185.

6. Предметно-ориентированный язык [Электронный ресурс]. -URL: Ийр8://га^1к1реё1а.ог§/'шк1/Предметно-ориентированньш_язык (дата обращения: 19.01.2017).

7. Теория категорий [Электронный ресурс]. - URL: Ийр8://га.,шк1реё1а.ог§/'шк1/Теория_категорий (дата обращения: 19.01.2017).

8. Описание бизнес-процессов в соответствии с иерархией Хом-ского / Г.Г. Куликов, А.А. Бармин, М.А. Шилина, Д.Г. Шамиданов // Информационные технологии и системы: тр. Пятой Междунар. науч. конф.; Банное, Россия, 24-28 февраля 2016 г. - Челябинск: Изд-во Че-ляб. гос. ун-та, 2015. - С. 249-254.

9. Структурирование контента информационного пространства технического университета с использованием процессного подхода и семантической идентификации / Г.Г. Куликов, М.А. Шилина, Г.В. Старцев, А.А. Бармин // Вестник Уфим. гос. авиац. техн. ун-та,

2014. - № 4(65). - С. 115-124.

10. Хопкрофт Д. Мотвани Р., Ульман Д. Введение в теорию автоматов, языков и вычислений. - М.: Вильямс, 2002. - С. 528.

11. Милевски Б. Теория категорий [Электронный ресурс]. - URL: https://bartoszmilewski.com/category/category-theory/ (дата обращения: 19.01.2017).

12. Куликов Г.Г., Бармин А.А. Business Intelligence - методологический и информационно-технологический аспект // Информационные технологии и системы: тр. Пятой Междунар. науч. конф., Банное, Россия, 24-28 февраля 2016 г. - Челябинск: Изд-во Челяб. гос. ун-та,

2015. - С. 243-248.

13. Шамиданов Д.Г., Бармин А.А., Шилина М.А. Правила формирования универсальной формальной модели контента информационного пространства // Перспективные информационные технологии

(ПИТ 2016): тр. междунар. науч.-техн. конф. - Самара: Изд-во Самар. науч. центра РАН, 2016. - С. 968-972.

14. Методика интеграции информационно-поисковых систем и корпоративных информационных систем на основе системных моделей бизнес-процессов / Г.Г. Куликов, Г.В. Старцев, А.А. Бармин, О.В. Бармина // Прикладная информатика. - 2014. - № 1. - С. 6-15.

15. Структурирование контента информационного пространства на основе системной модели решаемой задачи с использованием аппарата теории категорий / С.Ф. Бабак, Г.Г. Куликов, А.А. Бармин, Г.В. Старцев // Вестник Уфим. гос. авиац. техн. ун-та. - 2014. -№ 4(65). - С. 105-114.

16. Антонов В.В., Куликов Г.Г., Антонов Д.В. Формализация предметной области с применением инструментов, поддерживающих стандарты // Вестник Уфим. гос. авиац. техн. ун-та. - 2012. - № 3(48). -С. 42-52.

References

1. Frolov I.T. Vvedenie v filosofiiu [Introduction to Philosophy]. Moscow: Respublika, 2003. Р. 623.

2. Askin Ia.F. Filosofskii determinizm i nauchnoe poznanie [The philosophical determinism and scientific knowledge]. Moscow: Mysl', 1977. P. 188.

3. Kulikov G.G., Nabatov A.N., Rechkalov A.V. [et al.]. Proektirovanie ekspertnykh sistem na osnove sistemnogo modelirovaniia [Design of expert systems based on system modeling]. Ufimskii gosudarstvennyi aviatsionnyi tekhnicheskii universitet, 1999. Р. 223.

4. Kulikov G.G., Nabatov A.N., Rechkalov A.V. Avtomatizirovannoe proektirovanie informatsionno-upravliaiushchikh sistem. Sistemnoe modelirovanie predmetnoi oblasti: uchebnoe posobie dlia studentov po napravleniiu 552800 - "Informatika i vychislitel'naia tekhnika" [Computer-aided design of management information systems. System modeling domain]. Ufimskii gosudarstvennyi aviatsionnyi tekhnicheskii universitet, 1998. Р. 103.

5. Kulikov G.G., Konev K.A., Suvorova V.A. Teoriia sistem i sistemnyi analiz [Systems theory and systems analysis]. Ufimskii gosudarstvennyi aviatsionnyi tekhnicheskii universitet, 2012. Р. 185.

6. Predmetno-orientirovannyi iazyk [Subject-oriented language], available at: https://ru.wikipedia.org/wiki/npegMeTHO-opHeHTHpoBaH-hhh_33mk (accessed 19 January 2017).

7. Teoriia kategorii [Theory of categories], available at: https://ru.wikipedia.org/wiki/TeopHa_KaTeropHH (accessed 19 January 2017).

8. Kulikov G.G., Barmin A.A., Shilina M.A., Shamidanov D.G. Opisanie biznes-protsessov v sootvetstvii s ierarkhiei Khomskogo [Description of business processes in accordance with the Chomsky hierarchy]. Trudy Piatoi Mezhdunarodnoi nauchnoi konferentsii "Informatsionnye tekhnologii i sistemy", Bannoe. Rossiia, 24-28 February 2016. Cheliabinskii gosudarstvennyi universitet, 2015, pp. 249-254.

9. Kulikov G.G., Shilina M.A., Startsev G.V., Barmin A.A. Strukturirovanie kontenta informatsionnogo prostranstva tekhnicheskogo universiteta s ispol'zovaniem protsessnogo podkhoda i semanticheskoi identifikatsii [Structuring content Technical University information space using a process approach and semantic identification]. Vestnik Ufimskogo gosudarstvennogo aviatsionnogo tekhnicheskogo universiteta, 2014, no. 4(65), pp. 115-124.

10. Khopkroft D. Motvani R., Ul'man D. Vvedenie v teoriiu avtomatov, iazykov i vychislenii [Introduction to automata theory, languages and computation]. Moscow: Vil'iams, 2002. P. 528.

11. Milevski B. Teoriia kategorii [Category theory], available at: https://bartoszmilewski.com/category/category-theory/ (accessed 19 January 2017).

12. Kulikov G.G., Barmin A.A. Business Intelligence -metodologicheskii i informatsionno-tekhnologicheskii aspekt [Business Intelligence - methodological and information and technological aspect]. Trudy Piatoi Mezhdunarodnoi nauchnoi konferentsii "Informatsionnye tekhnologii i sistemy", Bannoe. Rossiia, 24-28 February 2016. Cheliabinskii gosudarstvennyi universitet, 2015. pp. 243-248.

13. Shamidanov D.G., Barmin A.A., Shilina M.A. Pravila formirovaniia universal'noi formal'noi modeli kontenta informatsionnogo prostranstva [Rules of formation of universal formal model of content of information space]. Trudy Mezhdunarodnoi nauchno-tekhnicheskoi konferentsii "Perspektivnye informatsionnye tekhnologii" (PIT 2016). Samarskii nauchnyi tsentr Rossiiskoi akademii nauk, 2016, pp. 968-972.

14. Kulikov G.G., Startsev G.V., Barmin A.A., Barmina O.V. Metodika integratsii informatsionno-poiskovykh sistem i korporativnykh informatsionnykh sistem na osnove sistemnykh modelei biznes-protsessov [Technique of integration of information retrieval systems and corporate information systems on the basis of system models of business processes]. Prikladnaia informatika, 2014, no. 1, pp. 6-15.

15. Babak S.F., Kulikov G.G., Barmin A.A., Startsev G.V. Strukturirovanie kontenta informatsionnogo prostranstva na osnove sistemnoi modeli reshaemoi zadachi s ispol'zovaniem apparata teorii kategorii [Structuring of information space based on models of business-processes and categories theory]. Vestnik Ufimskogo gosudarstvennogo aviatsionnogo tekhnicheskogo universiteta, 2014, no. 4(65), pp. 105-114.

16. Antonov V.V., Kulikov G.G., Antonov D.V. Formalizatsiia predmetnoi oblasti s primeneniem instrumentov, podderzhivaiushchikh standarty [Formalization of subject domain with use of the tools supporting standards]. Vestnik Ufimskogo gosudarstvennogo aviatsionnogo tekhnicheskogo universiteta, 2012, no. 3(48), pp. 42-52.

Сведения об авторах

Куликов Геннадий Григорьевич (Уфа, Россия) - доктор технических наук, профессор кафедры автоматизированных систем управления Уфимского государственного авиационного технического университета (450005, Уфа, ул. Революционная, 167/3, кв. 74, e-mail: gennadyg_98@ yahoo.com).

Злобина Таисия Павловна (Екатеринбург, Россия) - кандидат философских наук, доцент Уральского государственного университета им. А.М. Горького, Екатеринбург, e-mail: asu@ugatu.ac.ru.

Бабак Сергей Федорович (Уфа, Россия) - кандидат технических наук, доцент кафедры автоматизированных систем управления Уфимского государственного авиационного технического университета, e-mail: asu@ugatu.ac.ru.

Шамиданов Дмитрий Геннадьевич (Уфа, Россия) - аспирант кафедры автоматизированных систем управления Уфимского государственного авиационного технического университета (450005, Российская Федерация, Уфа, ул. Мингажева, 158/1, кв. 402, e-mail: shamidanow@gmail.com).

About the authors

Kulikov Gennady Grivorievich (Ufa, Russian Federation) is a Doctor of Technical Sciences, Professor at the Department of Automated Systems Ufa State Aviation Technical University (450005, Ufa, 167/3, 74, Revoliutsionnaia Str., e-mail: gennadyg_98@yahoo.com).

Zlobina Taisiya Pavlovna (Yekaterinburg, Russian Federation) is a Ph.D., Associate Professor Ural State University named after A.M. Gorky, e-mail: asu@ugatu.ac.ru.

Babak Sergey Fedorovich (Ufa, Russian Federation) is a Ph.D. in Technical Sciences, Associate Professor of the Department Automated Systems Ufa State Aviation Technical University, e-mail: asu@ugatu.ac.ru.

Shamidanov Dmitry Gennadievich (Ufa, Russian Federation) is a Graduate Student of the Department Automated Systems Ufa State Aviation Technical University (450005, Ufa, 158/1, 402, Mingazheva Str., e-mail: shamidanow@gmail.com).

Получено 16.02.2017

i Надоели баннеры? Вы всегда можете отключить рекламу.