Научная статья на тему 'ВЫДЕЛЕНИЕ ОБЩИХ СВОЙСТВ ОБЪЕКТОВ ДЛЯ СОЗДАНИЯ ЛОГИЧЕСКИХ ОНТОЛОГИЙ'

ВЫДЕЛЕНИЕ ОБЩИХ СВОЙСТВ ОБЪЕКТОВ ДЛЯ СОЗДАНИЯ ЛОГИЧЕСКИХ ОНТОЛОГИЙ Текст научной статьи по специальности «Математика»

CC BY
60
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛОГИЧЕСКАЯ ОНТОЛОГИЯ / ПРЕДИКАТНЫЕ ФОРМУЛЫ / ИЗОМОРФИЗМ ПРЕДИКАТНЫХ ФОРМУЛ

Аннотация научной статьи по математике, автор научной работы — Косовская Татьяна Матвеевна, Косовский Николай Николаевич

Предлагается подход к формированию онтологии, основанный на описаниях объектов в терминах языка исчисления предикатов. При таком подходе объект представлен как множество своих элементов, на котором задан набор предикатов, характеризующих свойства этих элементов и отношения между ними. Описанием объекта является конъюнкция литералов, истинных на элементах объекта. Под онтологией понимается ориентированный граф с описаниями подмножеств в качестве вершин, такой что элементы множества в конце дуги обладают свойствами элементов множества в начале этой дуги. Предлагаются следующие формулировки задачи построения онтологии: все предикаты двузначные и заданы подмножества исходного множества объектов; все предикаты двузначные и требуется найти подмножества исходного множества; среди предикатов имеются многозначные и заданы подмножества исходного множества объектов. Основным инструментом построения такого графа является выделение элементарной конъюнкции литералов предикатных формул, изоморфной подформулам некоторых формул. Дается определение изоморфизма элементарных конъюнкций атомарных предикатных формул. Для каждой из предложенных задач формулируются алгоритмы построения онтологии. Приводится иллюстративный пример.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EXTRACTION OF COMMON PROPERTIES OF OBJECTS FOR CREATION OF A LOGIC ONTOLOGY

The paper describes an approach to the formation of ontology based on descriptions of objects in terms of the predicate calculus language. With this approach, an object is represented as a set of its elements, on which a set of predicates is defined that defines the properties of these elements and the relationship between them. A description of an object is a conjunction of literals that are true on elements of an object. In the present work, ontology is understood as an oriented graph with descriptions of subsets as nodes and such that the elements of a set at the end of an oriented edge have the properties of the elements of the set at the beginning of this edge. Three settings of an ontology construction problem are considered: 1) all predicates are binary and subsets of the original set of objects are given; 2) all predicates are binary and it is required to find subsets of the original set; 3) among the predicates there are many-valued ones and subsets of the original set of objects are given. The main tool for construction such a description is to extract an elementary conjunction of literals of predicate formulas that is isomorphic to subformulas of some formulas. The definition of an isomorphism of elementary conjunctions of atomic predicate formulas is given. The method of ontology construction is formulated. An illustrative example is provided.

Текст научной работы на тему «ВЫДЕЛЕНИЕ ОБЩИХ СВОЙСТВ ОБЪЕКТОВ ДЛЯ СОЗДАНИЯ ЛОГИЧЕСКИХ ОНТОЛОГИЙ»

УДК 004.82 Вестник СПбГУ. Прикладная математика. Информатика... 2022. Т. 18. Вып. 1

МвС 03В70

Выделение общих свойств объектов для создания логических онтологий*

Т. М. Косовская, Н. Н. Косовский

Санкт-Петербургский государственный университет, Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7-9

Для цитирования: Косовская Т. М., Косовский Н. Н. Выделение общих свойств объектов для создания логических онтологий // Вестник Санкт-Петербургского университета. Прикладная математика. Информатика. Процессы управления. 2022. Т. 18. Вып. 1. С. 37-51. https://doi.org/10.21638/11701/spbul0.2022.103

Предлагается подход к формированию онтологии, основанный на описаниях объектов в терминах языка исчисления предикатов. При таком подходе объект представлен как множество своих элементов, на котором задан набор предикатов, характеризующих свойства этих элементов и отношения между ними. Описанием объекта является конъюнкция литералов, истинных на элементах объекта. Под онтологией понимается ориентированный граф с описаниями подмножеств в качестве вершин, такой что элементы множества в конце дуги обладают свойствами элементов множества в начале этой дуги. Предлагаются следующие формулировки задачи построения онтологии:

1) все предикаты двузначные и заданы подмножества исходного множества объектов;

2) все предикаты двузначные и требуется найти подмножества исходного множества;

3) среди предикатов имеются многозначные и заданы подмножества исходного множества объектов. Основным инструментом построения такого графа является выделение элементарной конъюнкции литералов предикатных формул, изоморфной подформулам некоторых формул. Дается определение изоморфизма элементарных конъюнкций атомарных предикатных формул. Для каждой из предложенных задач формулируются алгоритмы построения онтологии. Приводится иллюстративный пример.

Ключевые слова: логическая онтология, предикатные формулы, изоморфизм предикатных формул.

1. Введение. В философии под онтологией понимают абстракции, принимающие во внимание одни признаки предметов (или отношения между частями этих предметов) и игнорирующие другие.

Для математиков онтология — это ориентированный граф, в каждой вершине которого находится множество объектов, обладающих одними и теми же свойствами (или отношениями между частями объектов этого множества). Причем все объекты, находящиеся в конце дуги, обладают свойствами, присущими всем объектам в начале дуги и некоторыми дополнительными [1].

Создание онтологии предметной области является одним из направлений представления знаний для использования их в системах искусственного интеллекта и извлечения знаний из баз данных [2-5]. При решении задач искусственного интеллекта широко применяются подходы, основанные на различных методах дискретной математики, например графах [6] и нечетких множествах [7].

Если объект представлен как совокупность своих элементов, обладающих конкретными свойствами и связанных заданными отношениями, то описание объекта мо-

* Работа выполнена при финансовой поддержке Санкт-Петербургского государственного университета (проект № 73555239).

© Санкт-Петербургский государственный университет, 2022

жет быть задано формулой исчисления предикатов, в частности элементарной дизъюнкцией литералов [8].

Для выделения из множества таких объектов подмножества, обладающего общими свойствами, в [8, 9] было предложено построение многоуровневого описания исходного множества объектов, существенно уменьшающего вычислительную сложность задач распознавания и анализа сложных объектов. Фактически эти описания являются иерархическими, но для них (в отличие от онтологий) описания объектов на верхних уровнях являются частными случаями описаний на нижних уровнях. В настоящей работе предлагается использовать идеи такого построения для формирования онтологии.

Основным инструментом создания данного описания служит выделение элементарной конъюнкции литералов предикатных формул, изоморфной подформулам некоторых других элементарных конъюнкций. В п. 2 даются определения и формулируется утверждение, необходимые для понимания дальнейшего изложения.

В п. 3 приводятся математические постановки двух задач построения онтологии для объектов, описываемых двузначными предикатами, среди аргументов которых нет числовых переменных, и приводятся алгоритмы их решения.

В п. 4 рассматривается постановка задачи построения онтологии для множества объектов, описания которых содержат многозначные предикаты. Эта постановка сводится к применению в их описаниях двузначных предикатов, среди аргументов которых имеются количественные переменные. Описываются алгоритм решения такой задачи и иллюстративный пример.

2. Основные определения. В основе дальнейшего изложения лежит понятие изоморфизма элементарных конъюнкций предикатных формул. Приведем определение этого понятия.

Определение 1. Две элементарные конъюнкции атомарных формул исчисления предикатов Р(а1,..., ат) и Q(b1,.Ьт) называются изоморфными, т. е.

Р(аъ. .. 7 ат Ьт )7

если существуют такая элементарная конъюнкция Я(х1,...,хт) и подстановки аргументов ,..., а^т и ,..., Ь^т формул Р (а1,..., ат) и Q(b1,..., Ьт) соответственно вместо всех вхождений переменных х1,..., хт формулы Я(х1,..., хт), что результаты этих подстановок Я(о,г1,..., а^т) и Я(Ь^1,..., ) совпадают с формулами Р(а1,..., ат) и Q(b1,..., Ьт) соответственно с точностью до порядка литералов.

При этом полученные подстановки (а^ ^ х1,...,а^т ^ хт) и (Ь^ ^ ) называются унификаторами формул Р (а1,..., ат) и Q(bl,..., Ьт) соответственно с формулой Я(х1,... ,хт).

Отметим, что аргументами элементарных конъюнкций Р(а1,..., ат), Q(bl,..., Ьт) могут быть как предметные переменные, так и предметные константы. При этом понятие изоморфизма элементарных конъюнкций является отношением эквивалентности, и формулу Я(х1,..., хт) можно считать обобщенным описанием этого класса: Я(х1, ..., хт) ~ Р (а1, ..., ат) и Я(х1, ..., хт) ~ Q(bl, ..., Ьт) ■

Кроме того, понятие изоморфизма элементарных конъюнкций атомарных формул исчисления предикатов отличается от понятия равносильности этих формул, так как они могут иметь существенно различные аргументы. По сути дела для изоморфных формул существуют такие перестановки их аргументов, что они задают одно и то же отношение между своими аргументами.

В [10] доказано, что задача проверки формул на изоморфность полиномиально эквивалентна задаче проверки изоморфизма графов, являющейся «открытой» задачей, для которой не доказаны ни ее принадлежность классу Р, ни ее NP-пoлнoтa. Ласло Бабай в 2017 г. [11] предложил квазиполиномиальный алгоритм ее решения. Полученная им оценка п) ) до сих пор проверяется.

Для построения онтологии потребуется выделение из двух заданных элементарных конъюнкций максимальных подформул, изоморфных друг другу.

Определение 2. Элементарная конъюнкция называется максимальной формулой, изоморфной подформулам двух заданных элементарных конъюнкций, если она изоморфна некоторым подформулам этих элементарных конъюнкций, но после добавления в нее любого литерала она не изоморфна ни одной подформуле хоть одной из них.

В дальнейшем изложении не будем использовать предикатные формулы, вид которых отличается от элементарной конъюнкции литералов. Поэтому вместо длинного термина «элементарная конъюнкция литералов» часто будем применять термин «формула».

Приведем пример максимальной формулы, изоморфной подформулам двух заданных элементарных конъюнкций.

Пусть

Р(а, Ь, с) = рх(а, Ь) & —рх(а, с) & р2(Ь, с, а), Q(a, Ь, с) = рх(Ь, а) & —р\(а, с) & р2(а, с, Ь). Эти элементарные конъюнкции имеют общую подформулу

К\(а, с) = —рх(а, с) с одним литералом и подформулу

Щх,у) = рх(х,у) & р2(у,с,х), изоморфную подформулам формул Р(а, Ь, с) и Q(a, Ь, с), так как

Р(а, Ь, с) = Н(а, Ь) & рх(а, с),

Q(a, Ь, с) = Е(Ь, а) & рх(а, с).

Добавление в формулу К2 (х, у) литерала (х, х) превращает ее в изоморфную формуле Р(а, Ь, с), но не изоморфную формуле Q(a, Ь, с). Добавление же в нее литерала —р\(у, х) превращает ее в изоморфную формуле Q(a, Ь, с), но не изоморфную формуле Р(а, Ь, с)

Таким образом, как литерал —р\(х, х), так и элементарная конъюнкция Я(х, у) = р\(х, у) & р2(у, с, х) являются максимальными формулами, изоморфными подформулам формул Р(а, Ь, с) и Q(a, Ь, с).

В [12] приведен алгоритм выделения максимальной формулы, изоморфной подформулам двух заданных элементарных конъюнкций. Отметим, что в отличие от задачи проверки формул на изоморфность задача выделения из двух заданных элементарных конъюнкций максимальных подформул, изоморфных друг другу, является NP-тpyднoй.

Для дальнейшего изложения важным также будет понятие «наибольшее общее свойство элементов из заданного множества».

Пусть задано множество объектов О, в котором каждый объект ш является совокупностью своих элементов ш = {ш1,...,шг}. На этих объектах задан набор предикатов р 1,...,рп, характеризующих свойства эле ментов из ш и отношения между ними.

Если все предикаты р1,...,рп двузначные, то логическим о писанием Б (ш) обь-шш ментами логического описания Б(ш) объекта ш являются константы.

Обобщенным логическим описанием Рш (хш) объекта из называется элементарная конъюнкция, задающая класс эквивалентности по отношению изоморфизма формул во множестве логических описаний объектов из О. При этом аргументами обобщенного логического описания Рш (хш) объекта из могут быть как переменные, так и константы.

Логическим, описанием Б (О) множества О называется множество обобщенных логических описаний Рш(хш) объектов со € О,:

5(0) = {Ри(хш) :оз ей}.

Заметим, что логическое описание Б(О) множества О не содержит изоморфных формул.

О

называется наибольшая по количеству литералов формула, для которой в каждом О

Утверждение. Если 1) множества П1 и О2 являются подмножествами множе-О

объекты, описания которых изоморфны его описанию; 2) элементарные конъюнкции Р^хх) и Р2(х2) являются наибольшими общими свойствами элементов из множеств и соответственно; 3) Р\{х1) изоморфна некоторой подформуле формулы Р2СЁ2), то О1 С О2-

3. Постановки задач построения логической онтологии с двузначными предикатами.

Задача 1. Пусть все предикаты р1,...,рп, характеризующие свойства элемен-ш

двузначны.

Во множестве О выделены (возможно, пересекающиеся) подмножества О1,...,

От

ты, описания которых изоморфны его описанию. Эти подмножества соответствуют некоторым известным свойствам объектов, которые будут присутствовать в онтологии.

Требуется построить ориентированный граф, у которого вершина с нулевым заО

О

Если из вершины О к выходят дуги к вершинам, помеченным множествами Ок1,..., Окг, то

1) Ок = и¡=1 Ок^;

2) для каждого г = 1 ,...,г каждая формула в описании об ъектов из Ок± изоморфна одной из формул в описании О к, т. е. объекты из Оki обладают всеми свойствами,

Ок

3) если г = ], то наибольшие общие свойства элементов из О^ и Ок^ различны.

Для решения этой задачи выделим максимальные общие свойства <31 1 );•••; <3т(хт) объектов из ..., 0.т и перенумеруем их в порядке убывания количества литералов в элементарных конъюнкциях (ж 1),..., Рт (жт).

Для г = 1,...,т выполняем следующие действия:

1) среди формул Рг+1 (жг_|_1),..., Рт(хт) находим формулы, изоморфные некоторым подформулам формулы Рг(ж4);

2) соединяем ориентированными ребрами вершину, помеченную РДа^), с найденными формулами;

3) если для некоторого ]> г, для которого добавлено ребро из Р^х^) в уже имеется ребро из Рк{хк) в (к < г < ]), то это ребро удаляем (рис. 1);

4) к вершинам, которые в полученном графе имеют нулевой заход, добавляем ориентированные ребра от корневой вершины.

Удаление «лишних» ребер соответствует следующему. Пусть множество А со свойством изначально было определено как подмножество множества В со

свойством Рк(хк). При анализе множества А выяснилось, что оно является подмножеством множества С со свойством Рг(а^) (левая часть рис. 1). Поэтому непосредственную связь между множествами А и В удалили (правая часть рис. 1).

Рис. 1. Удаление «лишних» ребер

Задача 2. Пусть все предикаты р\,...,рп, характеризующие свойства элементов из ш и отношения между ними, по которым требуется построить онтологию, двузначные.

Заданы множество О и его логическое оп исание Б (О), содержащее п0 неизоморфных формул.

Требуется выделить (возможно, пересекающиеся) подмножества О\,..., От, обладающие общими свойствами, и построить ориентированный граф, имеющий свойства из задачи 1.

Для решения этой задачи можно воспользоваться алгоритмом построения многоуровневого описания класса [8, 9] по обучающей выборке:

1) для каждой пары элементарных конъюнкций Рг(а^) и (1 ^ г < ] ^ по), входящих Б(£1), выделяем максимальную формулу <5^(5;^), изоморфную их подформулам.

Если среди выделенных максимальных формул имеются изоморфные, то оставляем только одну из них и перенумеровываем эти формулы без повторений Р/(ж}),..., Р^ (х^ ). Из вершины, помеченной Б(П), проводим ориентированные ребра к вершинам, помеченным Р1(х\) при 1 ^ % ^ п\]

2) повторяем (при I = 2,...,Ь)процесс выделения максимальных формул,

*) Процесс завершится, так как на каждой итерации длины подформул уменьшаются.

изоморфных подформулам для пар Р! 1(х\ и Р'^ 1{х1- х), 1 < г < ] < п\, получив формулы

2а) если среди выделенных максимальных формул имеются изоморфные, то оставляем только одну из них и перенумеровываем эти формулы без повторений . . . , (хщ),

26) из вершин, помеченных Р1^1 (х1^1) и проводим ориентированные

ребра к вершине, помеченной формулой Р1(х1к), изоморфной подформулам формул

2в) если среди выделенных максимальных формул имеется изоморфная ранее выделенной, то вершину, соответствующую последней, «склеиваем» с вновь выделенной (вместе с ребрами, ицидентными этой вершине).

Отметим, что при выполнении алгоритма невозможно возникновение «порочного круга», при котором вершина, полученная в результате «склейки», находится в ориентированном цикле.

Действительно, пусть «склеиваются» вершины, соответствующие элементарным конъюнкциям Рй+1(а4+1) и Р1,(х1к,). Данные формулы изоморфны и, следовательно, имеют одинаковую длину. При похождении вдоль ориентированного пути длины элементарных конъюнкций убывают, так как формула в следующей вершине изоморфна подформуле в предыдущей вершине. Следовательно, невозможен ориентированный путь между «склеиваемыми» вершинами.

На рис. 2 формула Рк+1(х1^1) изоморфна ранее полученной формуле Р1,(х1к,) (в левой части рисунка). В результате «склейки» вершин с изоморфными формулами (правая часть рисунка) возникают дуги из к ранее определенным верши-

нам, к которым прежде шли дуги из Р1,(х1к,).

4. Постановки задач построения логической онтологии с многозначными предикатами. Заметим, что можно рассматривать не обязательно двузначные предикаты р1,...,рп. Они могут быть конечнозначными (задающими свойство по-

падания числового признака объекта в конечный промежуток или, например, цвет элемента объекта) или даже бесконечнозначными (задающими, например, длину, вес и т. п.). Многозначный п-местпый предикат дп со значениями из множества Бдп можно трактовать как (п + 1)-местный предикат дп+1, определяемый равносильностью дп+1(х;у) -фф- (/"(ж) = у, и где переменные из списка х являются переменными для имен самого объекта, а переменная у — это переменная для значений из Бдп.

Фактически это означает, что среди аргументов предиката имеются не только переменные для имен элементов объекта ш или сами имена, но и числовые аргументы. Такие предикаты и числовые аргументы у них будем называть количественными.

Для того чтобы в формуле отличать переменные для имен элементов объекта ш или сами эти имена от имен числовых аргументов, при записи обозначения формулы будем писать Р(х\а\\...; ат), где х — список аргументов для имен элементов объекта, ах;...; ат — списки количественных аргументов для различных вхождений многозначных предикатов. При проверке формул на изоморфизм приходится отождествлять (ставить им в соответствие одну и ту же переменную) разные элементы разнообразных объектов (но не различные элементы одного объекта). При наличии количественных аргументов их отождествление фактически означает отождествление разных значений многозначного предиката. Поэтому при построении онтологии для работы с количественными аргументами требуется разработать отдельный алгоритм.

Продемонстрируем невозможность использования понятия изоморфизма формул при наличии многозначных предикатов. Формулы А = р(а, Ь) & р(Ь, с) и В = р(Ь, с) & р(с, а) с двузначным предикатом р изоморфны, так как получаются из Я = р(х, у) & р(у, х) с унификаторами (а ^ х,Ь ^ у, с ^ х) и (Ь ^ х,с ^ у, а ^ х) соответственно. Но говорить об изоморфности формул А' = р'(а, Ь; & р'(Ь, с; 12) и В' = р'(Ь, с; 13) & р'(с, а; 14) с двузначным предикатом р', определяемым посредством многозначного предиката дкшр'(х, у; I) ^ (д(х, у) = I), нельзя. Даже если множество значений д состоит го трех элементов {Ь, ?, /} (как в трехзначной логике Лукасеви-ча), то А' = р'(а, Ь; Ь) & р'(Ь, с; /) ^ д(а, Ь) & —д(Ь, с), а В' = р'(Ь, с; /) & р'(с, а; Ь) ^

—д(Ь, с) & д(с, а). Для двух последних формул такой формулы Я и унификатора не су-

А'

В'

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Задача 3. Пусть среди предикатов р\,...,рп, характеризующих свойства эле-ш

имеются многозначные.

Во множестве О выделены (возможно, пересекающиеся) подмножества О1,..., От, причем в каждом из них вместе с конкретным объектом содержатся и все объекты, описания которых изоморфны (учитывая только двузначные предикаты) его описанию.

Требуется построить ориентированный граф, у которого вершина с нулевым заО

О

Если из вершины О^ выходят дуги к вершинам, помеченным множествами Ок1,... ,Окг, то

1) Ок = Ок

2) для каждого г = 1 ,...,г каждая формула в описании об ъектов из Ок± изоморфна одной из формул в описании О^, т. е. объекты из Оki обладают всеми свойствами,

Ок

3) если i = j то наибольшие общие свойства элементов из Qki и Qkj различны.

Как при решении задачи 1, выделяем наибольшие общие свойства объектов, для каждого множества Qi,..., Qm учитывая только двузначные предикаты.

Приступаем к анализу количественных свойств объектов. В описании каждого из выделенных подмножеств Qi,..., Qm множества Q находим наибольшее общее свойство его элементов Pi(xi),..., Рт(хт) и упорядочиваем их по количеству аргументов (числовых переменных) в порядке убывания Ркг (3%), • • •, Pkm(xkm)-

Для i = 1,...,т выполняем следующие действия:

1) среди формул Pki+1(xki+1), ■ ■ ■, Pkm(xkm) устанавливаем формулы с наименьшим количеством аргументов, полученные из Р^(жд^) отождествлением числовых аргументов;

2) из вершины, помеченной Q^, проводим дуги к вершинам, соответствующим найденным формулам.

При добавлении к выделенным подмножествам еще одного подмножества Q находим наибольшее общее свойство его элементов Р(х~). Определяем его место среди Pfcj (xki ),■■■, Ркт (хкт), присваиваем ему соответствующий номер «о и увеличиваем на единицу индексы номеров формул с г ;:г го- Получаем Р^ (х^ ),•••, Pkio (xkio ),■■■,

-ffcm + l (Xkm+1 )'

Затем выполняем действия 1, 2 для i = ig.

5. Иллюстративный пример: онтология четырехугольников. Рассмотрим множество четырехугольников. Каждый объект (четырехугольник) задается последовательностью четырех различных имен вершин, соединенных друг с другом в цикл.

Каждый объект характеризуется длинами своих сторон и величинами его внутренних угловОписание каждого четырехугольника содержит бескопечнозначные предикаты: \xy \ — длина отрезка [x, y] и Zx — внутренний угол при вершине x.

В связи с этим введем в рассмотрение двузначные предикаты, определяющие соответственно отношения «длина стороны xy равна l» и «внутренний угол при вершине x равен а»:

length(x, y; l) — \xy\ = l, angle(x; a) Zx = a.

Для удобства дальнейшего изложения будем использовать привычные обозначения: \xy\ = l и Zx = а. Здесь x и y — предметные аргументы, l и а — количественные аргументы.

Пусть в выборке даны четырехугольники, описания которых изоморфны (с точностью до значений количественных аргументов) четырехугольникам, изображенным на рис. 3, a h.

Так как в выборке присутствуют не только выпуклые четырехугольники, следует ввести еще один предикат W(x, y, z, w) «один из углов четырехугольника (x, y, z, w) больше развернутого». Он позволит на первом же шаге разделить все множество объектов на выпуклые и невыпуклые, так как у первых будет присутствовать литерал вида —W (x, y, z, w), а у вторых — литер ал вида W (x, y, z, w) (рис. 4).

В этом примере не будем дальше рассматривать множество невыпуклых четырехугольников. В множестве выпуклых четырехугольников все описания содержат литерал —W(x,y, z,w) с двузначным предикатом W, поэтому для дальнейшего построения онтологии не будем принимать его во внимание.

Все углы не равны п (что исключает треугольники с поставленной точкой на одной из сторон и отрезки с поставленными на них двумя точками) и сумма всех внутренних углов равна 2п (что исключает пересечение сторон, не имеющих общих концов).

Рис. 3. Вид четырехугольников в выборке

Четырехугольники

Выпуклые четырехугольники

Не выпуклые четырехугольники

Рис. 4• Начало построения онтологии

Ниже количество входящих в формулу А(х; а) числовых переменных будем обозначать посредством

В общем виде описание выпуклого четырехугольника (т. е. формула, истинная для каждого выпуклого четырехугольника) в выбранной сигнатуре имеет вид

Q(x, у, х, ; ¡1, ¡2, ¡3, ¡4; а, Ь, с, в) & & \ху \ = ¡1 & \ух\ = ¡2 & \хw\ = ¡3 & = ¡4 & & /х = а & /у = Ь & /х = с & /w = в,

количество входящих в это описание числовых переменных Ыд = 8. Для параллелограммов:

Р (х, у, х, w; ¡1 ^2; а) & Q(x, у, х, w; ¡\, ¡2, ¡\^¡2; а,п — а,а,п — а) & & \ху\ = ¡1 & \ух\ = ¡2 & \хw\ = ¡1 & ^х\ = ¡2 & & /х = а & /у = п — а & /х = а & /w = п — а,

количество входящих в это описание числовых переменных = 3. Для прямоугольников:

Я(х,у,х^; ¡1 ,¡2;) &

& \ху\ = ¡1 & \ух\ = ¡2 & \хw\ = ¡1 & ^х\ = ¡2 & & /ж = | & ¿.у = | & /г = | & ¿.ь) = |,

количество входящих в это описание числовых переменных = 2. Для квадратов:

^ §, §, §, §) ^

& \ху\ = ¡ & \ух\ = ¡ & \хw\ = ¡ &^х\ = ¡ & & /ж = | & ¿у = | & /г = | & ¿.V) = |,

количество входящих в это описание числовых переменных = 1. Вестник СПбГУ. Прикладная математика.

Для ромбов:

КН(х, у, г, л; ¡; а) ■ Q(x, у, г, л; ¡, ¡, ¡, ¡; а,п — а,а,п — а) ■ ■ \ху\ = I & \уг\ = I & \ги)\ = I & \тх\ = I & & Ах = а & Ау = п — а & Аг = а & Ал = п — а,

количество входящих в это описание числовых переменных М^ = 2. Для трапеций в общем виде*-1:

Т (х, у, г, л; 1\, ¡2,1з, а, Ь) ■ Q(x, у, г, л; 1\, ¡2,1з, 1а; а,п — а,Ь,п — Ь) ■

■ \ху\ = ¡1 & \уг\ = ¡2 & \ги)\ = ¡3 & \шх\ = ¡4 & & Ах = а & Ау = п — а & Аг = Ь & Ал = п — Ь &

& ¡2 = ¡4,

количество входящих в это описание числовых переменных Мт = 6. Для равнобедренных трапеций:

Т1(х, у, г, л; ¡1, ¡2, ¡4; а) ■ Q(x, у, г, л; ¡1, ¡2, ¡1, ¡4; а,п — а,п — а, а) ■

■ \ху\ = ¡1 & \уг\ = ¡2 & \ги)\ = ¡1 & \лх\ = ¡4 & & Ах = а & Ау = п — а & Аг = п — а & Ал = а &

& ¡2 = ¡4,

количество входящих в это описание числовых переменных Мт1 = 4.

Упорядочим формулы, определяющие выделенные выше объекты, в порядке убывания числа количественных переменных:

Объект Число

количественных переменных в описании

Наибольшее число количественных переменных (шесть) имеется в описании трапеции. Среди определяющих ее формул есть те, которые соответствуют равнобедренной трапеции. Среди них нет формул, определяющих какие-либо другие объекты. Поэтому имеем часть онтологии, изображенную на рис. 5, о.

Наибольшее число количественных переменных (три) среди оставшихся описаний — в описании параллелограмма. Среди определяющих его формул имеются те, которые задают ромб и прямоугольник (с числом количественных переменных 2). Поэтому имеем часть онтологии, изображенную на рис. 5, б.

Во множествах формул, задающих ромб и прямоугольник, есть общее подмножество, задающее квадрат (с числом количественных переменных 1). Поэтому имеем онтологию, изображенную на рис. 5, в.

*) На вопрос о том, является ли параллелограм частным случаем трапеции, в разной литературе имеются различные ответы. Будем считать, что это не так, и поэтому добавим конъюнктивный член 12 = ¿4. Если его не писать, то Р(х,у, ¡±,¡2; а) = Т(х,у, 11, ¡2,11,12; а), что соответствует другой точке зрения и будет построена другая онтология. В частности, на рис. 5, в будет добавлена стрелка от «Трапеция» к «Параллелограмм».

Трапеция

Равнобедренная трапеция

Параллелограмм

Ромб

Прямоугольник

Квадрат

Трапеция

Равнобедренная трапеция

Выборка

Трапеция

Равнобедренная трапеция

Выборка

Параллелограмм

Ромб

Прямоугольник

Трапеция

Равнобедренная трапеция

Выборка

Параллелограмм

Ромб

Прямоугольник

Квадрат

Рис. 5. Построение онтологии (объяснение в тексте)

Продемонстрируем возможность расширения онтологии при выделении в выборке еще одного множества.

Имеется еще одно интересное множество четырехугольников дельтоиды. Их описания образуют множество формул, которое может содержаться в описании четырехугольников в другой выборке и не совпадать ни с одним из перечисленных выше. Типичный представитель дельтоидов изображен на рис. 6.

Рис. 6. Дельтоид

Описания этих объектов удовлетворяют формулам

D(x, y, z, w; li, 12; a, b, c) ■ Q(x, y, z, w; ¡i, ¡2,¡2,11; a, b, c, a) ■ ■ \xy\ = 11 & \yz\ = 12 & \zw\ = 12 & \wx\ = 11 & Zx = = a & Zy = b & Zz = c & Zw = a

при ¡1 = ¡2 и ¡1 = ¡2 (и как следствие при а = с и а = с соответственно).

У дельтоида число количественных переменных Nо = 5. Поэтому в онтологии это множество четырехугольников сформируется после множества трапеций. Кроме того, если ¡1 = ¡2, то не тол ько а = с, ноиа = с = п — Ь. Следовательно, ромб является частным случаем дельтоида. Поэтому имеем онтологию, изображенную на рис. 7.

6. Заключение. В статье описываются постановки трех задач построения логической онтологии в зависимости от того, заданы или нет множества объектов, для которых требуется установить наследственные связи. Для постановки задачи, в которой такие множества заданы, рассмотрены случаи двузначных и многозначных предикатов.

Задача построения логической онтологии, в постановке которой заранее не известны множества объектов, входящих в онтологию и описанных с помощью многозначных предикатов, является наиболее сложной. По-видимому, ее можно свести к построению онтологии, учитывающей только двузначные признаки, а затем внутри каждого из полученных множеств строить онтологию на основе многозначных признаков. При этом возникает задача объединения онтологий.

В дальнейшем внимание будет уделено детальной проработке решения последней задачи.

Литература

1. Noy N. F., McGuinness D. L. Ontology development 101: A guide to creating your first ontology. Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI-2001-0880. Stanford. March 2001.

2. Вениаминов E. M. Некоторые проблемы широкого внедрения онтологий в IT и направления их решений // Симпозиум «Онтологическое моделирование»: сб. науч. трудов. Москва: ИЛИ РАН, 2008. С. 71-82.

3. Когаловский М. Р., Паринов С. И. Семантическое структурирование контента научных электронных библиотек на основе онтологий // Современные технологии интеграции информационных ресурсов: сб. науч. трудов. СПб.: Президентская библиотека, 2011. Вып. 2. С. 1—13.

Рис. 7. Расширение онтологии

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Дяченко О. О., Загорулько Ю. А. Подход к коллективной разработке онтологий и баз знаний // Знания — Онтологии — Теории. Всерос. конференция с международным участием / гл. ред. Д. Е. Пальчунов. Новосибирск: Ин-т математики им. С. Л. Соболева СО РАН, 2013. С. 141-149.

5. Mykhailiuk АPetrenko М. Machine learning and ontologies as two approaches for building intellectual information systems // Intern. J. "Information Technologies & Knowledge". 2019. Vol. 13. N 1. P. 55-75.

6. Карпов А. Г., Клемешев В. AКуранов Д. Ю. Определение работоспособности системы, структура которой задана графом // Вестник Санкт-Петербургского университета. Прикладная математика. Информатика. Процессы управления. 2020. Т. 16. Вып. 1. С. 41-49.

https:// doi.org//10.11702/spbul0.2020.104

7. Гончарова А. Б. Постановка предварительного медицинского диагноза на основе теории нечетких множеств с использованием меры Сугено // Вестник Санкт-Петербургского университета. Прикладная математика. Информатика. Процессы управления. 2019. Т. 15. Вып. 4. С. 529-543. https://doi.org/10.21638/11702/spbul0.2019.409

8. Kosovskaya Т. Predicate calculus as a tool for AI problems solution: Algorithms and their complexity // Intelligent System. Pt 3. Open access peer-reviewed. Ed. vol. Chatchawal: Chatchawal Wongchoosuk Kasetsart University, 2018. P. 1-20.

9. Косовская Т. M. Подход к решению задачи построения многоуровневого описания классов на языке исчисления предикатов // Труды СПИИРАН. 2014. № 3 (34). С. 204-217.

10. Косовская Т. М., Косовский Н. Н. Полиномиальная эквивалентность задач, изоморфизм предикатных формул и изоморфизм графов // Вестник Санкт-Петербургского университета. Математика. Механика. Астрономия. 2019. Т. 6 (64). Вып. 3. С. 430-439. https://doi.org/10.21638/11701/spbul0.2019.308

11. Babai L. Graph isomorphism in quasipolynomial time (Version 2.1. Unfinished Revision of Version 2 Posted on arXiv May 23, 2017). URL: http://people.cs.uchicago.edu/ laci/17groups/version2.1.pdf (дата обращения: 21.03.2019).

12. Косовская Т. М., Петров Д. А. Выделение наибольшей общей подформулы предикатных формул для решения ряда задач искусственного интеллекта // Вестник Санкт-Петербургского университета. Прикладная математика. Информатика. Процессы управления. 2017. Т. 13. Вып. 3. С. 250-263. https://doi.org/10.21638/11702/spbul0.2017.303

Статья поступила в редакцию 21 августа 2021 г. Статья принята к печати 1 февраля 2022 г.

Контактная информация:

Косовская Татьяна Матвеевна — д-р физ.-мат. наук, проф.; kosovtm@gmail.com Косовский Николай Николаевич — канд. физ.-мат. наук, доц.; kosovnn@gmail.com

Extraction of common properties of objects for creation of a logic ontology*

Т. M. Kosovskaya, N. N. Kosovskii

St Petersburg State University, 7-9, Universitetskaya nab., St Petersburg, 199034, Russian Federation

For citation: Kosovskaya Т. M., Kosovskii N. N. Extraction of common properties of objects for creation of a logic ontology. Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes, 2022, vol. 18, iss. 1, pp. 37-51. https://doi.org/10.21638/11701/spbul0.2022.103 (In Russian)

The paper describes an approach to the formation of ontology based on descriptions of objects in terms of the predicate calculus language. With this approach, an object is represented as a set of its elements, on which a set of predicates is defined that defines the properties of these elements and the relationship between them. A description of an object is a conjunction of literals that are true on elements of an object. In the present work, ontology is understood as

* This work was carried out with the financial support of St Petersburg State University (project N 73555239).

an oriented graph with descriptions of subsets as nodes and such that the elements of a set at the end of an oriented edge have the properties of the elements of the set at the beginning of this edge. Three settings of an ontology construction problem are considered: 1) all predicates are binary and subsets of the original set of objects are given; 2) all predicates are binary and it is required to find subsets of the original set; 3) among the predicates there are many-valued ones and subsets of the original set of objects are given. The main tool for construction such a description is to extract an elementary conjunction of literals of predicate formulas that is isomorphic to subformulas of some formulas. The definition of an isomorphism of elementary conjunctions of atomic predicate formulas is given. The method of ontology construction is formulated. An illustrative example is provided.

Keywords: logic ontology, predicate formula, isomorphism of predicate formulas.

References

1. Nov N. F., McGuinness D. L. Ontology development 101: A guide to creating your first ontology. Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI-2001-0880. Stanford, March 2001.

2. Beniaminov E. M. Nekotorye problemy shirokogo vnedreniia ontologii v IT i napravleniia ikh reshenii [Some problems of the widespread introduction of ontologies in IT and the directions of their solutions]. Simpozium "Ontologicheskoe modelirovanie". Sbornik nauchnykh trudov [Symposium "Ontologieal modeling". A collection of scientific papers]. Moscow, Institute IPI RAN Publ., 2008, pp. 7182. (In Russian)

3. Kogalovskii M. R., Parinov S. I. Semanticheskoe strukturirovanie kontenta nauchnykh elektronnykh bibliotek na osnove ontologii [Semantic structuring of the content of scientific electronic libraries based on ontologies]. Sovremennye tekhnologii integratsii informatsionnykh resursov. Sbornik nauchnykh trudov [Modern technologies for the integration of information resources. A collection of scientific papers]. St Petersburg, President Library Publ., 2011, iss. 2, pp. 1-13. (In Russian)

4. Diachenko O. O., Zagorulko Yu. A. Podkhod k kollektivnoi razrabotke ontologii i baz znanii [An approach to the collective development of ontologies and knowledge bases]. Znaniia— Ontologii — Teorii. Vserossiiskaia konferentsiia s mezhdunarodnym uchastiem [Knowledge — Ontologies — Theories. All-Russian Conference with international participation]. Eds. by D. E. Palchunov. Novosibirsk, S. L. Sobolev Institute of Mathematics SO RAN Publ., 2013, pp. 141-149. (In Russian)

5. Mykhailiuk A., Petrenko M. Machine learning and ontologies as two approaches for building intellectual information systems. Intern. J. "Information Technologies & Knowledge", 2019, vol. 13, no. 1, pp. 55-75.

6. Karpov A. G., Klemeshev V. A, Kuranov D. Yu. Opredelenie pabotosposobnosti sistemy, struktura kotoroy z ad ana grafom [Determining the ability to work of the system, the structure of which is given using graph]. Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes, 2020, vol. 16, iss. 1, pp. 41-49. https://doi.Org//10.11702/spbul0.2020.104 (In Russian)

7. Goncharova A. B. Postanovka predvaritelnogo meditsinskogo diagnoza na osnove teorii nechetkih mnozhestv s ispolzovaniem mery Sugeno [Preliminary medical diagnostics based on the fuzzy sets theory using the Sugeno measure]. Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes, 2019, vol. 15, iss. 4, pp. 529-543. https://doi.Org//10.21638/11702/spbul0.2019.409 (In Russian)

8. Kosovskaya T. Predicate calculus as a tool for AI problems solution: Algorithms and their complexity. Intelligent System. Pt, 3. Open access peer-reviewed. Ed. vol. Chatchawal, Chatchawal Wongchoosuk Kasetsart University Press, 2018, pp. 1-20.

9. Kosovskaya T. M. Podhod k resheniyu zadachi postroeniya mnogourovnevogo opisaniya klassov na yazyke ischisleniya predikatov [An approach to the construction of a level description of classes by means of a predicate calculus language]. SPIIRAS Proceedings, 2014, no. 3(34), pp. 204-217. (In Russian)

10. Kosovskaya T. M., Kosovskii N. N. Polinomialnaya ekvivalentnost zadach izomorfizm predikatnyh formul i izomorfizm grafov [Polynomial equivalence of the problems predicate formulas isomorphism and graph isomorphism]. Vestnik of Saint Petersburg University. Mathematics. Mechanics. Astronomy, 2019, vol. 6(64), iss. 3, pp. 430-439. https://doi.Org//10.21638/11701/spbul0.2019.308 (In Russian)

11. Babai L. Graph isomorphism in quasipolynomial time (Version 2.1. Unfinished Revision of Version 2 Posted on arXiv May 23, 2017). Available at:

http://people.cs.uchicago.edu/ laci/17groups/version2.1.pdf (accessed: March 21, 2019).

12. Kosovskaya T. M., Petrov D. A. Vydelenie naibolshey obschty podformuly predikatnyh formul

dlya resheniya ryada zadach iskusstvennogo intellekta [Extraction of a maximal common sub-formula of predicate formulas for the solving of some artificial intelligence problems]. Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes, 2017, vol. 13, iss. 3, pp. 250-263. https://doi.Org//10.21638/11702/spbul0.2017.303 (In Russian)

Received: August 21, 2021. Accepted: February 01, 2022.

Authors' information:

Tatiana M. Kosovskaya — Dr. Sci. in Physics and Mathematics, Professor; kosovtm@gmail.com Nikolai N. Kosovskii — PhD in Physics and Mathematics, Associate Professor; kosovnn@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.