Научная статья на тему 'АЛГОРИТМИЗАЦИЯ ФОРМИРОВАНИЯ И ПРАГМАТИЧЕСКОЙ ТРАНСФОРМАЦИИ ОГРАНИЧЕНИЙ СУЩЕСТВОВАНИЯ СВОЙСТВ ПРЕДМЕТНОЙ ОБЛАСТИ'

АЛГОРИТМИЗАЦИЯ ФОРМИРОВАНИЯ И ПРАГМАТИЧЕСКОЙ ТРАНСФОРМАЦИИ ОГРАНИЧЕНИЙ СУЩЕСТВОВАНИЯ СВОЙСТВ ПРЕДМЕТНОЙ ОБЛАСТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
41
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ ФОРМАЛЬНЫХ ПОНЯТИЙ / ОГРАНИЧЕНИЯ СУЩЕСТВОВАНИЯ СВОЙСТВ / ОНТОЛОГИЯ / ОНТОЛОГИЧЕСКИЙ АНАЛИЗ ДАННЫХ / АЛГОРИТМИЗАЦИЯ / FORMAL CONCEPT ANALYSIS / EXISTENCE CONSTRAINTS / ONTOLOGY / ONTOLOGICAL DATA ANALYSIS / ALGORITHMS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Семенова В.А., Смирнов С.В.

Областью исследований является интеллектуальный анализ данных, конкретно - развиваемое авторами направление «онтологический анализ данных», что следует понимать как анализ эмпирических данных о неизученной, неструктурированной предметной области с целью построения ее формальной онтологии. Предметом исследования статьи является формирование набора свойств, которые, как предполагается, характеризуют объекты изучаемой предметной области (и, следовательно, подлежат измерению в самом широком смысле этого слова), но с ограничениями на сочетания таких характеристик у объектов - «ограничениями существования» свойств. Задачи исследования состоят в разработке алгоритмов пошагового формирования набора измеряемых свойств с ограничениями существования, алгоритмов модификации такого набора (замещения и удаления свойств), алгоритма преобразования «естественного» описания этого набора как множества с заданными на нём отношениями в форму, удобную для последующего конструктивного, прагматического использования информации об ограничениях существования в онтологическом анализе данных. В работе используются методы теории множеств и бинарных отношений, модели и методы анализа формальных понятий, а также существующая методология применения ограничений существования для построения формальных онтологий. Отличие и новизна предложенных алгоритмов формирования набора свойств с ограничениями существования заключается в «естественном» и эффективном с точки зрения машинной реализации представлении таких наборов в форме графов и матриц инцидентности. Новизна алгоритмов модификации набора свойств с ограничениями существования - в выполненной впервые алгоритмизации уникальных методов расширения набора измеряемых свойств, непосредственно опирающихся на фундаментальные законы классической логики. Сказанное верно и для алгоритма трансформации набора измеряемых свойств в набор групп свойств, однородных по виду экзистенционального сопряжения свойств-членов. Значение полученных результатов состоит в алгоритмическом обеспечении ряда этапов онтологического анализа данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «АЛГОРИТМИЗАЦИЯ ФОРМИРОВАНИЯ И ПРАГМАТИЧЕСКОЙ ТРАНСФОРМАЦИИ ОГРАНИЧЕНИЙ СУЩЕСТВОВАНИЯ СВОЙСТВ ПРЕДМЕТНОЙ ОБЛАСТИ»

ИНЖИНИРИНГ ОНТОЛОГИЙ

УДК 004.021:004.82 DOI: 10.18287/2223-9537-2020-10-3-361-379

Алгоритмизация формирования и прагматической трансформации ограничений существования свойств предметной области

12 2 В.А. Семенова ' , С.В. Смирнов

1 Самарский государственный технический университет, Самара, Россия

2 Самарский федеральный исследовательский центр РАН,

Институт проблем управления сложными системами РАН, Самара, Россия

Аннотация

Областью исследований является интеллектуальный анализ данных, конкретно - развиваемое авторами направление «онтологический анализ данных», что следует понимать как анализ эмпирических данных о неизученной, неструктурированной предметной области с целью построения ее формальной онтологии. Предметом исследования статьи является формирование набора свойств, которые, как предполагается, характеризуют объекты изучаемой предметной области (и, следовательно, подлежат измерению в самом широком смысле этого слова), но с ограничениями на сочетания таких характеристик у объектов - «ограничениями существования» свойств. Задачи исследования состоят в разработке алгоритмов пошагового формирования набора измеряемых свойств с ограничениями существования, алгоритмов модификации такого набора (замещения и удаления свойств), алгоритма преобразования «естественного» описания этого набора как множества с заданными на нём отношениями в форму, удобную для последующего конструктивного, прагматического использования информации об ограничениях существования в онтологическом анализе данных. В работе используются методы теории множеств и бинарных отношений, модели и методы анализа формальных понятий, а также существующая методология применения ограничений существования для построения формальных онтологий. Отличие и новизна предложенных алгоритмов формирования набора свойств с ограничениями существования заключается в «естественном» и эффективном с точки зрения машинной реализации представлении таких наборов в форме графов и матриц инцидентности. Новизна алгоритмов модификации набора свойств с ограничениями существования - в выполненной впервые алгоритмизации уникальных методов расширения набора измеряемых свойств, непосредственно опирающихся на фундаментальные законы классической логики. Сказанное верно и для алгоритма трансформации набора измеряемых свойств в набор групп свойств, однородных по виду экзистенционального сопряжения свойств-членов. Значение полученных результатов состоит в алгоритмическом обеспечении ряда этапов онтологического анализа данных.

Ключевые слова: анализ формальных понятий, ограничения существования свойств, онтология, онтологический анализ данных, алгоритмизация.

Цитирование: Семенова, В.А. Алгоритмизация формирования и прагматической трансформации ограничений существования свойств предметной области / В.А. Семенова, С.В. Смирнов // Онтология проектирования. - 2020. - Т. 10, №3(37). - С.361-379. - DOI: 10.18287/2223-9537-2020-10-3361-379.

Введение

В инжиниринге онтологий сосуществуют два различных математически хорошо обоснованных подхода, основанных на теоретико-множественной семантике.

Наибольшее признание, распространение и значение (в том числе для развития теории и практики в ряде смежных областей) получил в этом смысле анализ формальных понятий (АФП) [1-3]. Более двух десятилетий он служит базой для развития и совершенствования методов построения, сравнения, объединения и т.д. формальных онтологий (см., например, ретроспективную подборку [4-10]). На наш взгляд, этот успех во многом определяется тем, что концепции и модели АФП оказались адекватны чрезвычайно востребованной ныне парадигме анализа данных, или, как теперь принято говорить, «науки о данных»1.

Фундаментальная форма представления эмпирической информации в анализе данных -таблица «объекты-свойства» [11, 12] - фактически тождественна модели исходных данных АФП - многозначному формальному контексту

(G, M, V, I), (1)

где G = {gi}i = 1,..., r, r = |G| > 1 - множество объектов; M = {m} = i,..., s, s = Ml > 1 - множество признаков объектов («свойств»); V - совокупное множество значений разных свойств, V = Uj = i,., sVj, Vj - область существования значений (домен) свойства mj; I - тернарное отношение между G, M и V (I е G х M х V), определённое для всех пар из G х M. Грануляция (1) с помощью концептуального шкалирования [13, 14] формирует2 ключевую структуру АФП -однозначный формальный контекст (G, M, I), где I - бинарное соответствие между G и M (I е G х M), в котором рассматриваются операторы Галуа %, с (общая нотация «'») [1]:

■ (%X) = X' = {mj | mj e M, Vg e X: I(gi, mj) = True} - общие свойства объектов, составляющих X е G;

■ c(Y) = Y' = {g |g e G, Vmj e Y: I(gi, mj) = True} - объекты, которые обладают всеми свойствами из Y е M;

■ для набора объектов X совокупность их общих признаков X ' служит описанием сходства этого набора объектов, а замкнутое множество X'' является кластером сходных объектов. Анализ соответствия Галуа между булеанами 2G и 2M позволяет выявить бикластеры

(X, Y), X е G, Y е M, X = Y ', Y = X', которые сохраняют информацию об объектах с одинаковым составом свойств и находятся по вложенности составов в отношении частичного порядка. Фундаментальная роль такого анализа (и в целом АФП) состоит в том, что названные его результаты соответствуют в философии и классической логике определению понятия и отношению обобщения на множестве понятий [15, 16]. Т.е. каждый выявленный бикластер (X, Y) описывает понятие (точнее - формальное понятие), у которого X - объем, Y - содержание, и (X1, Y1) < (X2, Y2), если Y1 з Y2 (или, равно, X1 е X2). Если интерпретировать (1) как данные многомерных наблюдений и измерений в исследуемой и моделируемой ПрО [4], то совокупность выявленных формальных понятий и связывающее их бинарное отношение частичного порядка «<» («is a») определяет, по меньшей мере, «скелет» формальной онтологии этой ПрО.

Принципиально иной подход в инжиниринге онтологий предлагают авторы [17-19]. В его основе лежит концепция ограничений существования свойств (ОСС) - исходная данность трёх бинарных отношений на множестве принимаемых во внимание свойств объектов ПрО:

■ обусловленность C: MxM^ {True, False}, которая устанавливает, что всякий объект g обладая свойством mj обладает и свойством mk (хотя обратное может быть неверно), т.е.

1 «На первый план выходят области науки с интенсивным использованием данных (data intensive sciences). Значимый научный продукт или прорывную технологию сегодня можно получить, только если опираешься на колоссальные объемы информации и результаты их глубокой смысловой переработки» (из интервью академика И.А. Соколова газете «Поиск» от 17.10.2015).

2 Роль, аналогичную концептуальному шкалированию, здесь также может играть требование и учёт полной определённости функций отображения «объект - значение свойства», осуществляемых процедурами измерения свойств объектов ПрО [4].

во введённых обозначениях C(mj, mk) о Vg е G: mj е {g}' ^ mk е {g}'. Обусловленность рефлексивна, несимметрична и транзитивна (рисунок 1a);

взаимообусловленность Н: MxM^ {True, False} - рефлексивное, симметричное и транзитивное отношение, индуцируемое отношением обусловленности: H(mj, mk) о C(mj, mk) л C(mk, mj) (рисунок 1б);

несовместимость E: MxM^ {True, False}, когда всякий объект g, обладая свойством mj, не может иметь mk в качестве другого свойства, и наоборот, т.е. E(mj, mk) о Vg е G: mj е {g}' ^ mk £ {g}'. Отношение E антирефлексивно, симметрично и нетранзи-тивно, но характеризуется так называемой «транзитивностью относительно обусловленности» («EC-транзитивностью»), что означает V х, y, z е M: С(х, y) л E(y, z) ^ E(x, z) (рисунок 1в).

А»

С.

Z X_z

x

(а)

эквивалентные изображения

(б)

(в)

Q - свойство;

обусловленность;

'- несовместимость;

Рисунок 1 - Примеры ограничений существования свойств (самообусловленность свойств не изображена)

Тогда формирование онтологии ПрО из набора характеризующих её свойств (т.е. свойств объектов ПрО) и набора ограничений существования (т.е. ОСС как набора сопряжённых пар свойств, реализующих экзистенциональные отношения обусловленности и несовместимости свойств) состоит в выявлении всех нормальных подмножеств актуальных свойств ПрО, которые замкнуты и совместимы:

■ У ^ М замкнуто, если оно содержит все свойства, обусловленные любым элементом У, т.е. Уш^ е У: (Зшк е М, шк ф ш): С(ш7-, шк)) ^ шк е У;

■ У ^ М совместимо, если любые два элемента У не связаны отношением несовместимости, т.е. УШ) е У: (Зшк е М, шк Ф ш): Е(ш), шк)) ^ шк £ У.

Нормальные подмножества актуальных свойств ПрО описывают все формальные понятия искомой онтологии, которые по вложенности составов нормальных множеств свойств организуются в граф наследования «гэ а».

В контексте вышесказанного наш вклад состоит в развитии онтологического анализа данных (ОАД) - комплекса моделей и методов вывода формальных онтологий ПрО из характеризующих её неполных и противоречивых эмпирических данных, представленных в форме обобщённой таблицы «объекты-свойства» [20, 21]. При этом установлена общность очерченных формальных подходов в аспекте единства их гипотетико-дедуктивной основы и необходимость их совместного использования в ОАД [22, 23]. Последнее объясняет интерес к формированию наборов измеряемых свойств ПрО и ОСС как в аспекте их генезиса и когнитивных задач - эти вопросы рассмотрены в [22, 23], - так и чисто в структурном плане, что является предметом этой работы.

В предлагаемой статье решается задача алгоритмизации пошагового формирования и модификации субъектом ОАД набора свойств с ОСС, а также его преобразования в набор частично пересекающихся групп сопряжённых свойств, обеспечивающих эффективную

x

z

z

идентификацию нормальных множеств свойств ПрО. В отличие от техники нормализации, основанной на булевых функциях и уравнениях, которая предложена в [17, 18], используется «естественное» описание ОСС в форме графов (см. рисунок 1) и матриц инцидентности. Это по нашему убеждению предопределяет больший когнитивный и «объясняющий» потенциал такого представления для субъекта ОАД, а также эффективную машинную реализацию соответствующих алгоритмов. Кроме того, алгоритмы модификации реализуют не имеющие аналогов методы расширения набора актуальных свойств с ОСС, которые опираются непосредственно на фундаментальные законы классической логики [22, 23].

1 Пошаговое формирование набора свойств с ограничениями существования

Для обозначения свойств объектов исследуемой ПрО, или измеряемых свойств, в данном разделе используются идентификаторы, у которых первым символом является строчная латинская буква, например, х е М.

Здесь и далее до определённого момента не принимается во внимание (в силу локальности действия) имманентная самообусловленность каждого свойства. Тогда нетрудно видеть, что с каждым свойством в наборе свойств с ОСС связаны три множества (рисунок 2):

■ С(х) - множество свойств, обусловливающих свойство х, 0 < \С(х)\ < \М\ - 1,

■ С (х) - множество свойств, обусловленных свойством х, 0 < \ С (х) \ < \М\ - 1,

■ Е(х) - множество свойств, несовместимых со свойством х, 0 < \Е(х)\ < \М\ - 1,

- причём лишь С(х) и С (х) могут пересекаться. Очевидно несложное выявление С(х), С (х) и Е(х) будем относить к числу базовых алгоритмических примитивов, которые не детализируются.

С(х) <

..> Ол-)

Рисунок 2 - Множества свойств, ассоциированные в наборе свойств с ограничениями существования с каждым отдельно взятым свойством (пояснение графических образов см. на рисунке 1)

В разделе рассматриваются два следующих элементарных созидательных действия: добавление нового свойства в существующий набор измеряемых свойств; добавление новой сопряжённости пары свойств - обусловленности или несовместимости - в набор ОСС.

Все этапы последующего изложения иллюстрирует граф на рисунке 3, который описывает матрица инцидентности, представленная на рисунке 4.

1) 2)

1.1 Расширение набора свойств

Задача добавления множества новых свойств в набор измеряемых свойств с ОСС, когда не выдвигается требование их какой-либо сопряжённости с уже существующими в этом наборе свойствами, тривиальна. Однако постановку этой задачи можно обобщить, считая, что в добавляемом множестве свойств могут присутствовать «свои» ОСС. Поскольку акты

добавления свойств и включения их в экзистенциональные отношения (добавления сопря-жённостей) разумно разделять, то такое в целом полезное обобщение задачи целесообразно ограничить. Здесь во внимание следует принять когнитивный смысл расширения набора измеряемых свойств [22, 23], а также практические соображения по упрощению реализации алгоритмических примитивов, используемых при построении матрицы инцидентности, пример которой приведён на рисунке 4. С учётом этого рационально ограничиться тремя возможностями расширения набора измеряемых свойств, алгоритмы которых приводятся ниже.

t

' i ) - i-и шаг построения набора свойств и ограничении их существования;

ч__/

—1 - группа сопряжённых свойств как результат одного шага построения J набора свойств с ограничениями существования;

- пометка сопряжённостей, автоматически достраиваемых в результате /-го шага построения набора свойств с ограничениями существования (здесь вследствие транзитивности обусловленности и относительной транзитивности несовместимости).

Рисунок 3 - Пример пошагового построения набора свойств с ограничениями существования (пояснение ряда графических образов см. на рисунке 1)

Алгоритм «Добавление к несопряжённых свойств», к > 1

1) for i := 1 to к

2) х := new P P - класс «Свойство»

3) M := M u {х} 'добавление свойства х в набор измеряемых свойств

4) next i

Алгоритм «Добавление к взаимообусловленных свойств», к > 2

1) n := M

2) Добавление_к_несопряжённыхсвойств 'см. описание выше

3) for i := 1 to к

4) for j := i +1 to к

5) C(M[n + i], M[n + j]) := True 'сопрягаемые свойства извлекаются из набора M

6) C(M[n + j], M[n + i]) := True 'с помощью примитива [•]

7) next j

8) next i

Алгоритм «Добавление k попарно несовместимых свойств», k > 2

1) n := M

2) Добавление_к_несопряжённых_свойств

3) for i := 1 to k

4) for j := i +1 to k

5) E(M[n + i], M[n + j]) := True

6) next j

7) next i

На рисунках 3, 4 шаг 1 добавляет три попарно несовместимых свойства, шаг 2 - четыре несопряжённых свойства, шаг 6 - три взаимообусловленных (ВЗО-) свойства, шаг 8 - два несопряжённых свойства.

I 1 1 V 1 /

' 2 '

[ 6 ;

I 8 ;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I з

,-Jv 4 r-i

'v 5 f —

[ 7 t---

ч,__у

1 9 Г.-.--J

N _ _ ✓ / \

Ю f-

/ \ч ✓ '11

\ 1 1 1 ~ — — I

'12

v ---------

Рисунок 4 - Пример пошагового построения матрицы инцидентности «сопряжённости пар свойств - свойства», описывающей набор свойств с ограничениями существования: Н-пара - пара несовместных свойств; О-пара - пара свойств с обусловленностью, где знак инцидентности «О» указывает обусловленное свойство (пояснение других графических образов см. на рисунке 2)

1.2 Добавление сопряжённости пары свойств

Желание субъекта ОАД добавить в набор ОСС сопряжённость пары свойств х, у е M -будь то обусловленность любой «направленности» (О-пара), либо несовместимость (Н-пара) - должно быть отклонено, если:

■ указанная сопряжённость уже существует;

■ указанная сопряжённость противоречит существующей сопряжённости х и у, т.е. потребована либо несовместимость х и у, а эта пара так или иначе уже состоит в отношении обусловленности, либо наоборот (Ух, у е M: Е(х, у) л (С(х, у) v С(у, х)) = False);

■ добавление указанной сопряжённости нарушит законы транзитивности экзистенциальных отношений. Нетрудно показать, что нарушение ЕС-транзитивности произойдёт лишь при попытке добавления в ОСС О-пары (х, у) в случае, когда 3z е С(х) п Е(у), а нарушение транзитивности обусловленности - при попытке добавления Н-пары (х, у) в случае, когда 3z е С(х) п С(у).

Сказанное вполне определяет порядок проверки допустимости добавления сопряжённости пары свойств, а собственно добавление сопряжённости пары свойств, инициированное субъектом ОАД, в общем случае вызывает необходимость добавления в ОСС других новых со-пряжённостей свойств в силу транзитивности экзистенциальных отношений. Эти действия составляют содержание алгоритмов добавления О- и, отдельно, Н-пары свойств.

Алгоритм «Добавление О-пары (х, у)», х, у е M

1) if not С(х, у) = True and not Е(х, у) = True and |С(х) п Е(у)| = 0 then

2) С(х) := С(х) и {х} 'х и обусловливающие его свойства

3) С(у) := С(у) и {у} 'у и обусловливаемые им свойства

4) 'Добавление в ОСС новых О-пар (включая указанную субъектом ОАД),

'если они там отсутствуют и речь не идёт об образовании самообусловленности; 'тем самым транзитивность обусловленности оказывается выполненной: for each z1 in С(х)

5) for each z2 in С(у)

6) if С^1, z2) = False and z1 ф z2 then С(z1, z2) := True

7) next z2

8) next z1

9) M := 0 'начало формирования множества свойств,

'несовместимых с каждым свойством из С(у)

10) for each z1 in С(у)

11) for each z2 in E(z1) M := M и {z2} next z2 'бесповторное добавление свойства z2

12) M := M и {z2} next z2 'бесповторное добавление свойства z2

13) next z2

14) next z1

15) 'Добавление в ОСС новых Н-пар (z1, z2) -

'несовместимости каждого свойства из С(х) с каждым свойством в M, 'если она в ОСС отсутствует;

'тем самым ЕС-транзитивность оказывается выполненной: for each z1 in С(х)

16) for each z2 in M*

17) if E(z1, z2) = False then E(z1, z2) := True

18) next z2

19) next z1

20) end if

На рисунках 3, 4 шаг 5 добавляет О-пару (m_4, m_2), и для выполнения транзитивности экзистенциональных отношений автоматически добавляются О-пара (m_5, m_2) и Н-пары (m_4, m_3), (да_4, m), (m_5, m_3), (m_5, m). Аналогично при добавлении О-пары (m_8, m il)

автоматически формируются О-пары (m_10, m_11), (m_9, m_11), а при добавлении О-пары (m_11, m_12) - О-пары (m_9, m_12), (m_10, m_12), (m_8, m_12), (m_6, m_12).

Алгоритм «Добавление Н-пары (x, y)», x, y e M

1) if not E(x, y) = True and not (C(x, y) = True or C(x, y) = True) and |C(x) n C(y)| = 0 then

2) C(x) := C(x) u {x} 'x и обусловливающие его свойства

3) C(y) := C(y) u {y} 'y и обусловливающие его свойства

4) 'Добавление в ОСС новых Н-пар (включая указанную субъектом ОАД),

'если они там отсутствуют; тем самым EC-транзитивность оказывается выполненной: for each z1 in C(x)

5) for each z2 in C(y)

6) if E(z1, z2) = False then E(z1, z2) := True

7) next z2

8) next z1

9) end if

На рисунках 3, 4 шаг 7 добавляет Н-пару (m_6, m_8), и для выполнения EC-транзитивности автоматически добавляются Н-пары (m_6, m_10), (m_6, m_9).

2 Алгоритмы модификации набора свойств с ограничениями существования

В данном разделе вначале анализируются такие элементарные модификации набора измеряемых свойств с ОСС как удаление свойства из набора измеряемых свойств и удаление сопряжённости пары свойств из ОСС. Затем рассматриваются более «нагруженные» в когнитивном смысле модификации набора измеряемых свойств и ОСС, возникающие в результате концептуального шкалирования измеряемых свойств, и, наконец, замещение свойства группой взаимообусловленных свойств.

2.1 Удаление сопряжённости пары свойств

Вне сомнения, изъятие из ОСС сопряжённости свойств x, y e M чревато нарушением транзитивности экзистенциональных отношений измеряемых свойств:

■ транзитивность обусловленности нарушится, если из ОСС удалить О-пару (x, y), являющуюся «замыканием» двухзвенной цепочки обусловленностей, т.е. 3z e M, z ^ x, z ^y: C(x, z) л C(z, y) = True;

■ транзитивность несовместимости относительно обусловленности - EC-транзитивность -нарушится, если из ОСС удалить Н-пару (x, y), являющуюся «замыканием» двухзвенной цепочки «обусловленность-несовместимость», конкретно 3z e M, z ^ x, z ^ y: C(x, z) л E(z, y) v C(y, z) л E(z, x) = True (дизъюнкция в последней формуле объясняется симметричностью несовместимости пары свойств).

Таким образом, основным содержанием алгоритмов удаления сопряжённостей пар свойств из ОСС является проверка допустимости такого действия.

Алгоритм «Удаление О-пары (x, y)», x, y e M

1) if | С(у) n C(y)| = 0 then 'О-пара (x, y) не является «замыкающей»

2) C(x, y) := False 'удаление обусловленности свойством x свойства y

3) end if

Алгоритм «Удаления Н-пары (x, y)», x, y e M

1) if | С(у) n E(y)| + | С(у) n E(x)| = 0 then 'Н-пара (x, y) не является «замыкающей»

2) E(x, y) := False 'удаление несовместимости свойств x и y

3) end if

Например, в наборе свойств с ОСС на рисунке 3 попытка удаления О-пары (т_6, т_12) или Н-пары (т, т_5) будет отклонена, а удаление О-пары (т_4, т_2) или Н-пары (т, т_3) возможно.

2.2 Удаление свойства

Удаление свойства х е M - абсолютно неконфликтная модификация набора измеряемых свойств с ОСС, поскольку она предполагает удаление всех сопряжённостей этого свойства, причём отсутствие нарушений транзитивности экзистенциональных отношений измеряемых свойств гарантируется «автоформированием» условия

3 z е M, z Ф х, z Ф у: С(х, z) л C(z, у) = True, С(х, z) л E(z, у) v С(у, z) л E(z, х) = True, а удаление несопряженного свойства из набора измеряемых свойств тривиально. Алгоритм «Удаление свойства х», х е M

1) for each у in С(х) 'удаление сопряжения с обусловливаемыми свойствами

2) С(х, у) := False

3) next у

4) for each у in С(х) 'удаление сопряжения с обусловливающими свойствами

5) С(у, х) := False

6) next у

7) for each у in Е(х) 'удаление сопряжения с несовместимыми свойствами

8) Е(у, х) := False

9) next у

10) M := M \ {х}

2.3 Когнитивное шкалирование свойств

В [22, 23] обоснована концепция, согласно которой набор измеряемых свойств с ОСС -продукт, возникающий в результате выдвижения субъектом ОАД гипотез о понятийной структуре, описывающей исследуемую ПрО.

Например, добавление в набор измеряемых свойств одного нового свойства знаменует образование множества новых гипотетических понятий, содержания которых возникают как определенные комбинаторные объекты из нового и существовавших измеряемых свойств, а также новых гипотетических понятий, обобщающих такие комбинаторные объекты.

Два (и только два) других способа формирования новых гипотетических понятий - известные в классической логике деление и ограничение существующего понятия [15, 16] - вызывают модификации набора измеряемых свойств, которые следует расценивать как соответственно дизъюнктивное и уточняющее концептуальное шкалирование свойств [22, 23]:

■ дизъюнктивное (номинальное) шкалирование свойства выполняется путём разделения его домена на к > 2 непересекающихся частей и приводит к замещению шкалируемого свойства набором к новых несовместимых свойств;

■ уточняющее (порядковое) шкалирование свойства устанавливается покрытием его домена двумя областями, первая из которых есть домен целиком, а вторая - какая-то его часть («строгая часть»). Тогда у объектов исследуемой ПрО добавляется новое свойство, которое некоторым образом определяет выделенную часть домена шкалируемого свойства и обусловливает последнее. Обобщением такого приема является уточняющее шкалирование одновременно к > 2 свойств, когда добавляемое новое свойство описывает одновременно все выделенные части (среди которых хотя бы одна строгая) доменов шкалируемых свойств и, следовательно, обусловливает все к шкалируемых свойств.

2.3.1 Дизъюнктивное шкалирование свойства

Анализ возможности дизъюнктивного шкалирования свойства х е М иллюстрирует рисунок 5, где, в частности, демонстрируется неопределённость результата шкалирования обусловленного свойства (|С(х)| > 0), возникающая в силу ЕС-транзитивности отношения несовместимости свойств. Поэтому предлагается постулировать невозможность дизъюнктивного шкалирования обусловленного измеряемого свойства, и алгоритм такого шкалирования начинать с соответствующей проверки.

О—хэ

* У

Домены свойств и их покрытия, формируемые в процессе дизъюнктивного шкалирования

{x1, x2, x3} - свойства, замещающие свойство x

Рисунок 5 - Пример дизъюнктивного шкалирования: замещение тремя несовместимыми свойствами {x1, x2, x3} свойства x, сопряжённого со свойством у; приведены случаи: x без сопряжения, у e E(x), y e C(x), y e C(x)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(пояснение ряда графических образов см. на рисунке 1)

Алгоритм «Дизъюнктивное шкалирование свойства x с замещением шкалируемого свойства к новыми свойствами», x e M, к > 2

1) if |C(x)| = 0 then 'дизъюнктивное шкалирование свойства x возможно

2) 3)

10) 12)

n := |M|

Добавление_к_несопряжённых_свойств 'см. описание выше for i := 1 to к

for each у in E(x)

Добавление_Н-пары_(М[п + i], у) 'см. описание выше next y

for each у in C(x)

Добавление_О-пары_(М[п + i], у) 'см. описание выше next y next i

Удаление_свойства_x 'см. описание выше

13) end if

2.3.2 Уточняющее шкалирование свойства

Анализ, аналогичный тому, что очерчен для дизъюнктивного шкалирования, позволяет

установить, что невозможно реализовать обобщённую версию уточняющего шкалирования

* *

множества M ^ M, |M | > 2 измеряемых свойств, если хотя бы два из них несовместимы

*

(естественно, для уточняющего шкалирования одного свойства, т.е. при |M | = 1, последнее условие не возникает; формально это следует из антирефлексивности отношения несовместимости свойств).

Например, присутствующее на рисунке 3 множество свойств {m_4, m_5, m_6} не может быть подвергнуто уточняющему шкалированию, а множество {m_4, m_5, m_7} шкалировать таким образом допустимо.

В приводимом далее алгоритме смысл проверки возможности уточняющего шкалирова-

*

ния заданного множества M з M свойств передан, но её реализация может быть эффективнее, т.к. первое же обнаружение несовместимости пары свойств вM проясняет ситуацию.

*

Алгоритм «Уточняющее шкалирование множества свойств M

* *

с добавлением нового свойства», M з M, |M | > 1

1) b := True 'флажок «Шкалирование возможно»

2) if |M*| > 2 then

3) for each х in M*

4) for each у e M* \ {x}

5) if Е(х, у) = True then b := False

6) next у

7) next х

8) end if

9) if b = True then 'уточняющее шкалирование множества M возможно

10) n := M|

11) Добавление_к_несопряжённых_свойств, к = 1

12) for each х in M*

13) Добавление_О-пары_(M[n + 1], х)

14) next х

15) end if

2.4 Замещение свойства группой взаимообусловленных свойств

По определению во множестве гипотетических понятий, отвечающих формируемому субъектом ОАД набору измеряемых свойств с ОСС, содержание отдельно взятого понятия отличается от содержаний других понятий, по меньшей мере, одним свойством. Когда таких отличительных свойств в содержании какого-то понятия несколько, то в аспекте ОСС они взаимообусловлены [22]. Действительно, у всех объектов из объёма этого гипотетического понятия (и только у них среди всех объектов, гипотетически присутствующих в исследуемой ПрО) кроме, возможно, других свойств наличествуют все рассматриваемые отличительные свойства. Следовательно, устанавливая, что наблюдаемый в ПрО объект обладает любым одним таким отличительным свойством, согласно выдвинутой гипотетической картине следует констатировать, что он характеризуется и всеми остальными отличительными свойствами, и, таким образом, любое одно такое отличительное свойство обусловливает все другие, а это означает, что все обсуждаемые отличительные свойства взаимообусловлены.

Опыт показывает, что формируя гипотезы о понятийной структуре, описывающей исследуемую ПрО, субъект ОАД нередко решает, что вместо одного отличительного свойства некоторое гипотетическое понятие о ПрО должно характеризоваться несколькими, например, уточняя, что интересующие его люди должны характеризоваться не только фамилией, но и именем. Поэтому целесообразно при формировании набора измеряемых свойств с ОСС располагать возможностью замещения одного свойства группой ВЗО-свойств.

Очевидно, что в силу транзитивности экзистенциональных отношений между свойствами каждое из ВЗО-свойств, замещающих выбранное измеряемое свойство, «наследует» все его сопряжённости в наборе измеряемых свойств (это также следует из того, что отношение вза-

имообусловленности Н в силу характеризующих его свойств симметрии - см. введение - разбивает множество измеряемых свойств на классы эквивалентности). Реализация наследования сопряжённостей замещаемого свойства замещающими его ВЗО-свойствами составляет основное содержание рассматриваемого алгоритма замещения.

Алгоритм «Замещение свойства х группой к ВЗО-свойств», х е M, к > 2

1) Добавление_к_взаимообусловленных_свойств 'см. описание выше

2) у := M[n + к] 'последнее из замещающих ВЗО-свойств,

'которое далее наследует все сопряжённости замещаемого свойства х;

'при этом остальные замещающие ВЗО-свойства получат все эти сопряжённости

'автоматически - см. алгоритмы добавления сопряжённостей пар свойств

3) for each z in С(х)

4) Добавление_О-пары_(у, z)

5) next z

6) for each z in С(х)

7) Добавление_О-пары_^, у)

8) next z

9) for each z in Е(х)

10) Добавление_Н-пары_^, у)

11) next z

12) Удаление_свойства_х

Иллюстрацию замещения измеряемого свойства группой ВЗО-свойств можно найти на рисунке 3, если предположить, что группа ВЗО-свойств {m_8, m_9, m_10} - результат замещении некоторого «протосвойства» m_8910, которое было несовместимо со свойством m_6 и обусловливало свойства m_11, m_12.

3 Трансформация ограничений существования свойств

В отличие от метода построения онтологий, прямо основанного на анализе ОСС [17-19], в ОАД информация об ОСС используется при дефаззификации нестрогого формального контекста, который возникает вследствие неполноты и противоречивости имеющихся эмпирических данных, причём локально для каждого объекта, попавшего в поле зрения исследователя [20, 21]. Однако и та и другая методики связаны выявлением подмножеств свойств, совместимых с ОСС, т.е. нормальных подмножеств измеряемых свойств. Разбор формального определения нормального подмножества свойств (см. введение) позволяет указать в наборе свойств с ОСС субструктуры, которые будучи выявлены, открывают путь к быстрой констатации «нормальности» актуальных подмножеств измеряемых свойств3:

■ группа ВЗО-свойств (ВЗО-группа) принадлежит нормальному подмножеству только целиком (что естественно для отдельно взятого свойства, которое формально в силу самообусловленности следует считать частным случаем ВЗО-группы);

■ группа с односторонней обусловленностью (О-группа), в которой одно свойство или, эквивалентно, группа ВЗО-свойств обусловливает другое свойство или, эквивалентно, группу ВЗО-свойств, либо входит в нормальное подмножество целиком, либо своей обусловливаемой частью. Отношение обусловленности между ВЗО-группами обобщает отношение между свойствами в том смысле, что каждое свойство-член одной группы обусловливает все свойства-члены другой (формальный анализ этого отношения можно найти в [19]);

Именно это - выяснение нормально или нет некоторое данное подмножество свойств, - а не выявление всех нормальных подмножеств набора свойств с ОСС, необходимо при дефаззификации формального контекста в ОАД [20].

■ группа попарно несовместимых свойств (Н-группа) может быть представлена в нормальном подмножестве только одним своим членом.

Таким образом, актуальна задача трансформации «естественного» представления набора измеряемых свойств с ОСС как конечного множества с заданными на нём бинарными отношениями в набор групп свойств, однородных по виду экзистенционального сопряжения свойств-членов. Решение этой задачи в форме матрицы инцидентности «однородные группы свойств - свойства» для набора свойств с ОСС, представленного на рисунках 3, 4, демонстрирует рисунок 6.

m m 2 m 3 m 4 m 5 m S m 7 m 3 m 9 m 10 m 11 m 12

ВЗО-группа О

ВЗО-группа 0

ВЗО-группа О

ВЗО-группа О

ВЗО-группа О

ВЗО-группа О

ВЗО-группа О

ВЗО-группа О О О

ВЗО-группа О О

О-групп а О

О-групп а О

О-групп а По X

О-групп а ишжт Ж ¡¡¡¡¡¡¡в О О

О-групп а X X О О

Н-группа X X X

Н-группа X X X

Н-группа X X X

Н-группа X X

Н-группа X X

Н-группа X X

Н-группа X 1 X

Рисунок 6 - Пример описания набора свойств с ограничениями существования в виде матрицы инцидентности «однородные группы свойств - свойства»

3.1 Выявление групп взаимообусловленных свойств

Во-первых, каждое в отдельности измеряемое свойство является самостоятельной ВЗО-группой. Во-вторых, ясно, что признаком ВЗО-группы является не только взаимообусловленность входящих в неё свойств, но и отсутствие пересечения с другими ВЗО-группами (исключая, разумеется, некоторые ВЗО-группы, состоящие из одного свойства). Поэтому после выявления очередной ВЗО-группы её свойства-члены следует исключить из дальнейшего анализа, что сокращает трудоёмкость выявления каждой следующей такой группы.

Алгоритм «Выявление ВЗО-групп»

1) M := M 'получение копии множества свойств

2) do while M*l > 0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3) х := M [1] 'очередное свойство, не состоящее в ранее выявленных ВЗО-группах

4) G := new VZO VZO - класс «ВЗО-группа»;

'G используется здесь лишь как множество свойств-членов группы G

5) G := G и {х} 'х - ядро и, возможно, единственный член новой ВЗО-группы

6) for each у in С(х)

7) for each z in С(у)

8) if z = х then G := G u {у}

9) next z

10) next у

11) M*:= M* \ G

12) loop 'множество свойств конечно

3.2 Выделение групп с односторонней обусловленностью

Поскольку по определению О-группа - это две ВЗО-группы, одна из которых обусловливает другую, то алгоритм выделения О-групп строится в предположении, что все ВЗО-группы в наборе измеряемых свойств с ОСС уже выявлены.

Алгоритм «Выявление О-групп»

1) for each G2 in VZOs 'перебор всех построенных ВЗО-групп

'G2 используется здесь лишь как множество свойств-членов группы G2

2) M* := C(G2[1]) \ G2

'множество свойств-членов ВЗО-групп, отличных от ВЗО-группы G2; 'каждое из этих свойств обусловливает каждый член ВЗО-группы G2

3) for each G1 in VZOs 'перебор всех построенных ВЗО-групп

'G1 используется здесь лишь как множество свойств-членов группы G1

4) if |G1 n M | > 0 then 'ВЗО-группа GОбусловливает ВЗО-группу G2

5) G := new O O - класс «О-группа»

6) G. С : = G2 'обусловливаемые свойства-члены О-группы

7) G.C : = G1 'обусловливающие свойства-члены О-группы

8) end if

9) next G1

10) next G2

3.3 Выявление групп попарно несовместимых свойств

Проблемой выявления Н-групп в наборе измеряемых свойств с ОСС является не только их пересечение между собой, но, прежде всего, вложенности одних таких групп в другие -как правило, подобные структуры эффективно обрабатываются лишь путём рекурсии. Например, на рисунке 3 Н-группы {m, m_2, m_3} и {m, m_3, m_5} пересекаются, а в Н-группу {m, m_2, m_3} вложены Н-группы {m, m_2}, {m, m_3}, {m_2, m_3}.

Алгоритм «Выявление Н-групп»

1) for each х in M

2) G := Ассоциированные_с_х_Н-группы

'множество Н-групп, каждая из которых включает свойство х и 'определённое подмножество попарно несовместимых с ним свойств

3) Ns := Ns u G 'бесповторное (по составу свойств-членов) накапливание Н-групп

4) next х

Алгоритм рекурсивной функции «Ассоциированные_с_х_Н-группы» выявляет как все пересекающиеся, так и вложенные одна в другую Н-группы, включающие в себя свойство х.

Алгоритм «Ассоциированные с х Н-группы», х е M

1) Gs := 0 'множество Н-групп, ассоциированных со свойством х

2) for each у in Е(х)

3) M := Е(у) n Е(х) 'свойства, несовместимые как со свойством у, так и со свойством х

4) if |M | < 1 then 'M пусто или содержит одно свойство

5) G := new N 'N - класс «Н-группа»

'G используется здесь и как множество свойств-членов группы G

6) G := G u {у}

7) if M*| = 1 then G := G u M*

8) else

9) G := Ассоциированные^j"_H'-группы 'рекурсия для свойстваy

10) end if

11) Gs := Gs u G 'бесповторное накопление Н-групп

12) next z

13) for each G in Gs

14) G := G u {х}

15) next G

16) Ассоциированные_с_х_Н-группы := Gs

Заключение

Представленные в статье алгоритмы формирования набора свойств, подлежащих измерению у объектов исследуемой ПрО, с набором ограничений существования этих свойств призваны обеспечить поддержку и сохранение результатов априорных когнитивных актов субъекта, намеревающегося получить данные измерений, а затем формально вывести из этой эмпирической информации онтологическую модель интересующей его ПрО. Полнота, достаточность и эффективность алгоритмической поддержки этой деятельности субъекта-исследователя достигнута как за счёт теоретического обоснования логического смысла рассматриваемых актов, так и благодаря целесообразному ограничению мыслимых возможностей такой поддержки.

Алгоритмы трансформации исходного «естественного» представления набора измеряемых свойств с ограничениями существования в набор субструктур, однородных по виду эк-зистенционального сопряжения свойств-членов, обеспечивают возможность эффективного практического использования априорных соображений субъекта онтологического анализа эмпирических данных. Основанием для такого вывода является возможность прямого соотнесения внутреннего устройства названных субструктур с прагматически важным и теоретически строгим понятием нормального подмножества измеряемых свойств.

Представленный в статье комплекс алгоритмов предполагается реализовать в разрабатываемой в Институте проблем управления сложными системами РАН системе онтологического анализа данных на массовой программной платформе.

Благодарности

Работа выполнена при финансовой поддержке Министерства науки и высшего образования Российской Федерации (регистрационный номер НИОКТР АААА-А19-119030190053-2).

Список источников

[1] Ganter, B. Formal Concept Analysis. Mathematical foundations / B. Ganter, R. Wille. - SpringerVerlag Berlin Heidelberg, 1999.

[2] Ferré, S. Formal Concept Analysis: From Knowledge Discovery to Knowledge Processing / S. Ferré, M. Huchard, M. Kaytoue, S.O. Kuznetsov, A. Napoli // In: P. Marquis, O. Papini, H. Prade (eds.): A Guided Tour of Artificial Intelligence Research. Vol. II: AI Algorithms. - Springer International Publishing, 2020 - P.411-445.

[3] Formal Concept Analysis Homepage - http://www.upriss.org.uk/fca/fca.html

[4] Смирнов, С.В. Онтологический анализ предметных областей моделирования / С.В. Смирнов // Известия Самарского научного центра РАН. - 2001. - Т. 3, № 1. - С.62-70.

[5] Obitko, M. Ontology Design with Formal Concept Analysis / M. Obitko, V. Snasel, J. Smid // In: V. Snasel, R. Belohlavek (eds.): Proc. of the CLA 2004 Int. Workshop on Concept Lattices and their Applications (Ostrava, Czech Republic, September 23-24, 2004). - VSB-Technical University of Ostrava, Dept. of Computer Science, 2004. - P.111-119.

[6] Sertkaya, B. A survey on how description logic ontologies benefit from FCA / B. Sertkaya // In: Proc. of the 7th Int. Conf. on Concept Lattices and Their Applications (October 19-21, 2010). - University of Sevilla, 2010. P.2-21.

[7] Priya, M. A Survey of State of the Art of Ontology Construction and Merging using Formal Concept Analysis / M. Priya, Ch.A. Kumar // Indian journal of science and technology. - 2015. - Vol. 8, Issue 24. - P.1-7.

[8] Ganter, B. Conceptual Exploration / B. Ganter, S. Obiedkov. - Springer-Verlag Berlin Heidelberg, 2016. - 315 p.

[9] Bhuyan, Z. FCA Based Ontology Revision / Z. Bhuyan, S.M. Hazarika // In: J.K. Mandal, G. Saha, D. Kandar,

A.K. Maji (eds.): Proc. of the Int. Conf. on Computing and Communication Systems I3CS 2016 (NEHU, Shillong, India 2016). Lecture Notes in Networks and Systems, vol 24. - Springer Singapore, 2018. - P.745-755.

[10] Zhao, M. Matching biomedical ontologies based on formal concept analysis / M. Zhao, S. Zhang, W. Li, G. Chen // Journal of Biomedical Semantics. - 2018. - Vol. 9:11. - 27 p.

[11] Загоруйко, Н.Г. Когнитивный анализ данных / Н.Г. Загоруйко. - Новосибирск: Академическое изд-во «Гео», 2013.

[12] Барсегян, А.А. Анализ данных и процессов / А.А. Барсегян, М.С. Куприянов, И.И. Холод, М.Д. Тесс,

C.И. Елизаров. - СПб.: БХВ-Петербург, 2009. - 512 с.

[13] Ganter, B. Conceptual scaling / B. Ganter, R. Wille // In: F. Roberts (ed.): Applications of Combinatorics and Graph Theory to the Biological and Social Sciences. - New York Springer-Verlag, 1989. - P.139-167.

[14] Ignatov, D.I. Introduction to Formal Concept Analysis and Its Applications in Information Retrieval and Related Filds / D.I. Ignatov // In: P. Braslavski, N. Karpov, M. Worring, Y. Volkovich, D.I. Ignatov (eds.): Information Retrieval. Revised Selected Papers 8th Russian Summer School, RuSSIR 2014 (Nizhniy Novgorod, Russia, August 18-22, 2014). - Springer International Publishing, 2015. - P.42-141.

[15] Гетманова, А.Д. Логика. Углубленный курс / А.Д. Гетманова - М.: КНОРУС, 2016.

[16] Ивин, А.А. Словарь по логике / А.А. Ивин, А.Л. Никифоров. - М.: Гуманит. изд. центр ВЛАДОС, 1997.

[17] Lammari, N. Building and maintaining ontologies: a set of algorithms / N. Lammari, E. Metais // Data & Knowledge Engineering. - 2004. - Vol. 48, No. 2. - P.155-176.

[18] Lammari, N. POEM: an Ontology Manager based on Existence Constraints / N. Lammari, C. du Mouza, E. Metais // In: S.S. Bhowmick, J. Küng, R. Wagner (eds.): Database and Expert Systems Applications. Proc. 19th Int. Conf. DEXA 2008 (Turin, Italy, September 1-5, 2008). Lecture Notes in Computer Science, vol. 5181. - Springer-Verlag Berlin Heidelberg, 2008. - P.81-88.

[19] Пронина, В.А. Использование отношений между атрибутами для построения онтологии предметной области / В.А. Пронина, Л.Б. Шипилина // Проблемы управления. - 2009. - №1. - С.27-32.

[20] Самойлов, Д.Е. Анализ неполных данных в задачах построения формальных онтологий / Д.Е. Самойлов,

B.А. Семенова, С.В. Смирнов // Онтология проектирования. - 2016. - Т. 6, №3(21). - С.317-339. DOI: 10.18287/2223-9537-2016-6-3-317-339.

[21] Samoylov, D.E. Defuzzification of the initial context in Formal Concept Analysis / D.E. Samoylov, V.A. Semenova, S.V. Smirnov // In: V Fursov, Y Goshin, D Kudryashov (eds.): Information Technology and Nan-otechnology ITNT 2019: Data Science. Proc. of the Data Science Session at the V Int. Conf. on Information Technology and Nanotechnology (Samara, Russia, May 21-24, 2019). - CEUR Workshop Proceedings, 2019. - Vol. 2416. - P.1-9. - DOI: 10.18287/1613-0073-2019-2416-1-9.

[22] Samoylov, D.E. Multilevel recursive model of properties existence constraints in machine learning /

D.E. Samoylov, V.A. Semenova, S.V. Smirnov // Journal of Physics: Conf. Series 1096 (2018) 012096. DOI: 10.1088/1742-6596/1096/1/012096

[23] Смирнов, С.В. Две методологии вывода формальных понятий: когда и как они должны работать вместе /

C.В. Смирнов // Знания - Онтологии - Теории: Материалы VII международной конференции. - Новосибирск: Институт математики СО РАН, Новосибирский государственный ун-т, 2019. - С.355-363.

Сведения об авторах

Семенова Валентина Андреевна, 1994 г. рождения. Бакалавр Самарского государственного аэрокосмического университета им. С.П. Королёва по направлению «Прикладная математика и информатика» (2015), магистр Самарского университета по направлению «Механика и математическое моделирование» (2017). Аспирантка Самарского государственного технического университета по направлению «Информатика и вычислительная техника», младший научный сотрудник Института проблем управления сложными системами Самарского федерального исследовательского центра РАН. Автор и соавтор 19 научных трудов в области интеллектуального анализа данных и проектирования программных систем. ORCID: 0000-00020557-3890; Author ID (Scopus): 57204366624. queenbjjr@gmail.com

Смирнов Сергей Викторович, 1952 г. рождения. Окончил Куйбышевский авиационный институт им. С.П. Королёва в 1975 г., д.т.н. (2002). Главный научный сотрудник Института проблем управления сложными системами Самарского федерального исследовательского центра РАН, профессор Поволжского государственного университета телекоммуникаций и информатики. Член Российской ассоциации искусственного интеллекта, Международной ассоциации по онтологиям и их приложениям (IAOA). В списке научных трудов более 170 работ в области прикладной математики, компьютерного моделирования сложных систем, создания интеллектуальных систем поддержки принятия решений. ORCID: 0000-0002-33325261; Author ID (РИНЦ): 17628; Author ID (Scopus): 57205017287. smirnov@iccs.ru

Поступила в редакцию 10.08.2020, после рецензирования 01.09.2020. Принята к публикации 14.09.2020.

Algorithms for the formation and pragmatic transformation of Existence Constraints

12 2 V.A. Semenova ' , S.V. Smirnov

1 Samara State Technical University, Samara, Russia

2 Samara Federal Research Scientific Center RAS, Institute for the Control of Complex Systems RAS, Samara, Russia Abstract

The research area of this article is data mining, specifically the direction "ontological data analysis" developed by the authors, which should be understood as the analysis of empirical data on an unexplored, unstructured knowledge domain in order to build its formal ontology. The research subject of this article is the formation of a set of properties which are supposed to characterize objects of the studied knowledge domain (and, therefore, are subject to measurement in the broadest sense of the word), but with restrictions on the combination of such characteristics in objects — properties "existence constraints". The objectives of the research are to develop algorithms for the step-by-step formation of a set of measured properties with existence constraints, algorithms for modifying such a set (replacing and deleting properties), an algorithm for transforming the "natural" description of this set as a set with relations specified on it into a form convenient for the subsequent constructive use of information about existence constraints in ontological data analysis. In the paper we use the methods of set theory, binary relations, models and methods of formal concept analysis and the methodology for applying the existence constraints to construct formal ontologies. The difference and novelty of the proposed algorithms for the formation of a set of properties with existence constraints lies, first of all, in the "natural" and efficient representation of such sets in the form of graphs and incidence matrices (from the point of view of machine implementation). The novelty of the algorithms for modifying a set of properties with existence constraints lies in performed for the first time algorithmization of unique methods for expanding the set of measured properties that address directly the fundamen tal laws of classical logic. The same is true for the algorithm for transforming a set of measured properties into a set of properties groups that are homogeneous in the form of existential conjugation of member properties. The significance of the results obtained lies in the algorithmic support of a number of stages of ontological data analysis.

Key words: Formal Concept Analysis, Existence Constraints, ontology, ontological data analysis, algorithms.

Citation: Semenova VA, Smirnov SV. Algorithms for the formation and pragmatic transformation of Existence Constraints [In Russian]. Ontology of designing. 2020; 10(3): 361-379. DOI: 10.18287/2223-9537-2020-10-3-361-379.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Acknowledgment: This research was funded by Ministry of Science and Higher Education of the Russian Federation, R&D registration numbers AAAA-A19-119030190053-2.

List of figures

Figure 1 - Examples of Property Existence Constraints (self-conditionality of properties is not shown) Figure 2 - Sets of properties associated with each individual property in a set of properties and a set of existence constraints (for an explanation of graphical images, see Figure 1)

Figure 3 - An example of a step-by-step formation of a set of properties and a set of existence constraints

(for an explanation of graphical images, see Figure 1) Figure 4 - An example of a step-by-step formation of incidence matrix of "conjugation of pairs of properties - properties", which describes a set of properties and a set of existence constraints:

"Н-пара" - a pair of incompatible properties; "О-пара" - a pair of properties with conditionally, where the incidence "О" indicates the conditioned property (for an explanation of other graphical images, see Figure 2) Figure 5 - Example of disjunctive scaling: substitution of property x (associated with property y) with three incompatible properties {x1, x2, x3}; the following situations are given: x not related, y e E(x), y e C(x), y e C(x) (for an explanation of some graphical images, see Figure 1) Figure 6 - An example of describing a set of properties and a set of existence constraints

in the form of an incidence matrix "homogeneous groups of properties - properties"

References

[1] Ganter B, Wille R. Formal Concept Analysis. Mathematical foundations. Springer Berlin-Heidelberg, 1999.

[2] Ferré S, HuchardM, Kaytoue M, Kuznetsov SO, Napoli A. Formal Concept Analysis: From Knowledge Discovery to Knowledge Processing. In: P Marquis, O Papini, H Prade (eds.): A Guided Tour of Artificial Intelligence Research. Vol. II: AI Algorithms. Springer International Publishing, 2020: 411-445.

[3] Formal Concept Analysis Homepage. Source: http://www.upriss.org.uk/fca/fca.html

[4] Smirnov SV. Ontological analysis of modeling domain [In Russian]. Bulletin of the Samara Scientific Center of RAS, 2001; 3(1): 62-70.

[5] Obitko M, Snasel V, Smid J. Ontology Design with Formal Concept Analysis. In.: V Snasel, R Belohlavek (eds.): Proc. of the CLA 2004 Int. Workshop on Concept Lattices and their Applications (Ostrava, Czech Republic, September 23-24, 2004). VSB-Technical University of Ostrava, Dept. of Computer Science, 2004: 111-119.

[6] Sertkaya B. A survey on how description logic ontologies benefit from FCA. In: Concept Lattices and Their Applications: Proc. of the 7th Int. Conf. (Sevilla, Spain, 2010, October 19-21). University of Sevilla, 2010: 2-21.

[7] Priya M, Kumar ChA. A Survey of State of the Art of Ontology Construction and Merging using Formal Concept Analysis. Indian journal of science and technology, 2015; 8(24): 1-7.

[8] Ganter B, Obiedkov S. Conceptual Exploration. Springer, 2016.

[9] Bhuyan Z, Hazarika SM. FCA Based Ontology Revision. In: JK Mandal, G Saha, D Kandar, AK Maji (eds.): Proc. of the Int. Conf. on Computing and Communication Systems. Lecture Notes in Networks and Systems, vol 24. Springer Singapore, 2018: 745-755.

[10] Zhao M, Zhang S, Li W, Chen G. Matching biomedical ontologies based on formal concept analysis. Journal of Biomedical Semantics, 2018; 9:11.

[11] Zagoruyko NG. Cognitive data analysis [In Russian]. Novosibirsk: "Geo" Publisher, 2013.

[12] Barsegyan AA, Kupriyanov MS, HolodII, TessMD, Elizarov SI. Data and Process Analysis [In Russian]. St. Petersburg: BHV-Petersburg, 2009.

[13] Ganter B, Wille R. Conceptual scaling. In: F Roberts (ed.): Applications of Combinatorics and Graph Theory to the Biological and Social Sciences. Springer-Verlag New York, 1989: 139-167.

[14] Ignatov DI. Introduction to Formal Concept Analysis and Its Applications in Information Retrieval and Related Fields. In: P Braslavski, N Karpov, M Worring, Y Volkovich, DI Ignatov (eds.): Information Retrieval (Revised Selected Papers 8th Russian Summer School, RuSSIR 2014 (Nizhniy Novgorod, Russia, 2014, August 18-22, 2014). Springer International Publishing, 2015: 42-141.

[15] Getmanova AD. Logic. Advanced course [In Russian]. Moscow: KNORUS Publisher, 2016.

[16] Ivin AA, Nikiforov AL. Logic dictionary [In Russian]. Moscow: VLADOS Publisher, 1997.

[17] Lammari N, Metais E. Building and maintaining ontologies: a set of algorithms. Data & Knowledge Engineering, 2004; 48(2): 155-176.

[18] Lammari N, du Mouza C, Metais E. POEM: an Ontology Manager based on Existence Constraints. In: S.S. Bhowmick, J. Küng, R. Wagner (eds.): Database and Expert Systems Applications. Proc. 19th Int. Conf. DEXA 2008 (Turin, Italy, September 1-5, 2008). Lecture Notes in Computer Science, vol. 5181. Springer-Verlag Berlin Heidelberg, 2008: 81-88.

[19] Pronina VA, Shipilina LB. Using the relationships between attributes to build domain ontology [In Russian]. Control Science, 2009; 1: 27-32.

[20] Samoilov DE, Semenova VA, Smirnov SV. Incomplete data analysis of for building formal ontologies [In Russian]. Ontology of designing. 2016; 6(3): 317-339. DOI: 10.18287/2223-9537-2016-6-3-317-339.

[21] Samoilov DE., Semenova VA, Smirnov SV. Defuzzification of the initial context in Formal Concept Analysis. In: V Fursov, Y Goshin, D Kudryashov (eds.): Information Technology and Nanotechnology ITNT 2019: Data Science. Proc. of the Data Science Session at the V Int. Conf. on Information Technology and Nanotechnology (Samara, Russia, May 21-24, 2019). CEUR Workshop Proceedings, 2019; 2416: 1-9. DOI: 10.18287/1613-0073-20192416-1-9.

[22] Samoilov DE., Semenova VA, Smirnov SV. Multilevel recursive model of properties existence constraints in machine learning. Journal of Physics: Conf. Series 1096 (2018) 012096. DOI: 10.1088/1742-6596/1096/1/012096

[23] Smirnov SV. Two methodologies for formal concepts inference: when and how they should work together [In Russian]. In: Znaniya - Ontologii - Teorii: Materials of VII int. conf. - Novosibirsk: Sobolev Institute of mathematics of the Siberian Branch of RAS, Novosibirsk State University, 2019: 355-363.

About the authors

Semenova Valentina Andreevna (b. 1994). Bachelor in Applied Mathematics and Computer Science (Samara State Aerospace University, 2015) and Master in Mechanics and Mathematical Modeling (Samara University, 2017). Postgraduate student of Samara State Technical University in the direction of Informatics and Computer Engineering, junior researcher at Institute for the Control of Complex Systems of Russian Academy of Sciences. Author and co-author of 19 scientific papers in the field of data mining and software engineering. ORCID: 0000-0002-0557-3890; Author ID (Scopus): 57204366624. queenbfjr@gmail.com

Sergey Victorovich Smirnov (b. 1952) graduated from the Kuybyshev Aerospace Institute (Kuibyshev-city) in 1975, D. Sc. Eng. (2002). Chief Researcher at Institute for the Control of Complex Systems of Russian Academy of Sciences, professor at Povolzhskiy State University of Telecommunication and Informatics. He is a member of Russian Association of Artificial Intelligence and International Association for Ontology and its Applications. He is a co-author of more than 170 publications in the field of applied mathematics, complex systems simulation and development knowledge based decision support systems in control and management. ORCID: 0000-0002-3332-5261; Author ID (RSCI): 17628; Author ID (Scopus): 57205017287. smirnov@iccs.ru

Received August 10, 2020. Revised September 01, 2020. Accepted September 14, 2020.

i Надоели баннеры? Вы всегда можете отключить рекламу.