О формализации моделей представления знаний в интеллектуальных информационных системах

Федотов Владислав Харитонович; Будников Юрий Владиславович

УДК 004.8:681.306(075.8)

В.Х. ФЕДОТОВ, Ю.В. БУДНИКОВ

О ФОРМАЛИЗАЦИИ МОДЕЛЕЙ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ

В ИНТЕЛЛЕКТУАЛЬНЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ

Информационные системы (ИС), ядром которых является база знаний (БЗ), будем называть интеллектуальными (ИИС). Под БЗ будем понимать взаимосвязанную информацию о предметной области (ПО), опирающуюся на формализованную модель представления знаний (МПЗ). Выбор и реализация МПЗ в ИС влияют на эффективность наполнения БЗ семантическим содержанием и, соответственно, на ее коэффициент интеллекта. Основной проблемой представления знаний остаются построение формализованных МПЗ и анализ их общих свойств [1].

Целью работы является развитие формализованного теоретико-множественного подхода к построению сетевых МПЗ в ИИС. Показано, что базы знаний на основе сетевых МПЗ обладают достаточной степенью общности для описания сложных объектов реального мира и позволяют описывать объекты, допускающие омонимическую и синонимическую неоднозначность.

Они применяются при разработке систем понимания естественного языка, экспертных и поисковых систем, новых технологий Интернет.

1. Формализация МПЗ. Теоретико-множественный подход. Сети объектов. Под сетью объектов будем понимать систему состоящую из конеч-

ного множества М объектов, конечного множества типов отношений Я между объектами и конечного набора отношений Ь между парами объектов.

Определение. Сеть объектов Б - это тройка (М,Я,Ь), где

- М = {т1, т2,..., тп} - конечное множество объектов, п>0;

- Я = {т1, т2,..., тк} - конечное множество типов отношений, к>0;

- Ь=Ь(М,Я)={/у(гг)} - конечное множество бинарных отношений между объектами тг- и т, связанными отношением типа тг; 1,}=1,_,п ; /=1, ,к.

Далее для удобства используются равнозначные формы записи сети

Б=Б(МДЬНМДЬ).

Объекты. Человек разделяет окружающий его мир на отдельные элементы, которые можно называть объектами и считать различными. Оперируя с объектами, мы мысленно отделяем их друг от друга, используя отношения типа «часть-целое». Объекты могут иметь любую природу (абстрактную -число, слово или физическую - стол, человек и др.). Объекты имеют названия, с помощью которых мы ассоциируем с ними те или иные элементы окружающего мира. Каждый объект, в свою очередь, представляет собой сложную структуру, части которой также связаны между собой и т. д. Такие ассо-

циации представляют собой субъективные идеализации объективного мира и не являются однозначными.

Отношения. Отношения описывают связи между объектами, например -«являться частью», «включать в себя», «находиться на» и др. С формальной точки зрения отношения принято разделять на нульарные, унарные, бинарные и т.д. Бинарные отношения Ь={/у(т)}, где г,}=1,_,п; 1=1,_,к задают связи между парами объектов и их можно задавать трехмерной матрицей отношений, элементами которой являются величины | /у(тг) |, вычисляемые по правилу: | /2}(т/) | =1, если 3 отношение Т1 между объектами тг и т} и | /у(т) | =0 иначе; г,}=1,_,п; /=1,_,к.

Пример 1. Сеть объектов 5= Б(М,Я,Ь), где М={тьт2,т3,т4}, Я={тьт2,т3}, Ь={112(т2), /41 (т3), /42(т3), /43(тх)} описывает систему из четырех взаимосвязанных абстрактных объектов 8=(т1 «т2» т2, т4 «т3» ть т4 «т3» т2, т4 «Г1» т3). В этой системе первый объект т1 связан со вторым объектом т2 отношением типа т2, четвертый объект т4 связан с первым т1 и вторым т2 объектами отношением типа т3, а с третьим объектом т3 отношением типа ть Других объектов, отношений и связей в данной системе нет. Это идеальная система, в которой трудно заметить какие-либо неоднозначности.

Пример 2. Конкретизируем предыдущий пример на некоторую ПО, например экономику. Экономические объекты это - предприятия, ресурсы, поставщики, получатели, производственные отношения и т.д.

В этом случае множество объектов М={ть т2, т3, т4}={Предприятие-А, Предприятие-В, Предприятие-С, Предприятие-Д}, множество типов отношений Я={тьт2,т3}= {«потребитель», «поставщик», «включает»}, Ь = {А2(т1), /4х (т3), 142(т3), /43(т2)}. Тогда 5=(Предприятие-А «потребитель» Предприятия-В, Предприятие-Д «включает» {Предприятие-А и Предприятие-В}, Предпри-ятие-Д «поставщик» Предприятия-С). Тем самым мы описали сеть экономических объектов, связанных производственными отношениями. Однако такая сеть не содержит почти никакой информации о самих предприятиях - виде деятельности, численности и др.

Проблема полноты. Из приведенных выше примеров видно, что сетевая МПЗ обладает высокой степенью общности (универсальности) представления информации, но ограниченной полнотой. Возникает вопрос - какова полнота сетевой модели, т. е. насколько точно и однозначно может быть описана информационная структура в рамках МПЗ?

Определение. Под информационной полнотой МПЗ будем понимать максимально возможное число различных отношений в сети объектов, т.е. =шах^ХХ| /г](т/) |, где | /гу(т/) | =1, если 3 отношение т/ между объектами тг и т} и | /}(т) | =0 иначе; г,}=1,_,п; /=1,_,к.

Утверждение 1. Для сети объектов Б=8(М,Я,Ь), где М={тьт2,...,тп}; Я={т1,т2,...,тк}; Ь=Ь(М,Я)={/г}(т/)}, с бинарными отношениями, имеет место не-

равенство ЫЬ<п(п-\)к. Это соотношение является верхней оценкой информационной полноты модели.

Доказательство. В сети объектов с ненаправленными (симметричными) бинарными отношениями между каждой парой объектов допустимо только одно отношение каждого типа. Учитывая, что число различных пар объектов Сп2= п!/((п-2)!2), а число различных типов отношений равно к, получим Ых< п! к/((п-2)!2). В случае направленных (несимметричных) отношений, между каждой парой объектов возможно отношение, направленное в другую сторону. Поэтому Кь< п! 2к/((п-2)!2).= п! к/(п-2)!= п(п-1)к. Утверждение доказано.

Пример 3. Выберем ПО - технику. Имеется конструкция - на болт надета шайба, после которой навинчена гайка. Требуется представить ее в виде сети объектов и оценить ее полноту.

В данной конструкции фигурируют три элемента - гайка, болт и шайба. Если рассматривать их как отдельные объекты, то множество М={т1,т2,т3}= ={гайка, болт, шайба}.

Для описания конструкции, очевидно, необходимо, как минимум, три типа отношений (к=3). Например Я={г1,г2,г3}={«навинчено на», «надето на», «следует после»}. Тогда Ь ={/32(г2), 112(г ОХ 113(г3)}. Получим сеть 5^=(шайба «надета на» болт, гайка «навинчена на» болт, гайка «следует после» шайбы).

Оценим информационную полноту модели. В данном случае п=3 и к=3. Поэтому, в соответствии с утверждением 1, получим ЛЬ<3х2х3=18. Это означает, что выбранная сеть позволяет задать не более восемнадцати направленных отношений.

Попытаемся мысленно восстановить по сетевому описанию исходную конструкцию. При этом обнаруживается, что в сети нет информации о том, на каком расстоянии расположена шайба от гайки, в какой степени гайка накручена на болт и т.д., хотя этой информации и нет в описании моделируемой конструкции. Это означает, что сеть описывает требуемую конструкцию неполно. Значит, при выбранных параметрах сетевой модели нельзя однозначно восстановить исходную конструкцию по ее описанию и выбранных отношений недостаточно.

Заметим далее, что мы использовали только три отношения из 18 возможных. Остались свободными 15 отношений {/32(г1), /32(г3), /12(г2), /12(г3), /13(г1), /13(г2),...}. Непосредственной проверкой легко убедиться в том, что все они не имеют технического (физического) смысла. Так, не имеют смысла отношения /32(г1) - шайба «навинчена на» болт или 132(г3) - шайба «следует после» болта и т.д.

Ясно, что для однозначного восстановления информации, нужна дополнительная информация. Но даже, если мы введем ее, указав, на каком расстоянии от головки болта расположена шайба и насколько закручена гайка, все равно не удастся однозначно восстановить исходную конструкцию. Так объект «гайка» может обладать свойством «шестигранная», «четырехгранная» и т.д. Объект «болт» - свойствами «металлический и др. И т.д. до бесконечности.

Отметим также такие дополнительные атрибуты, как «шестигранный», «металлический» и другие, являются свойствами объектов и их некорректно рассматривать как отдельные объекты. Свойства объектов являются характеристикой объекта и естественнее было бы рассматривать их как параметры объектов или специфические типы отношений.

Утверждение 2. Для любой сети объектов существует другая сеть объектов, информационная полнота которой больше, чем у исходной.

Доказательство. Идея доказательства основана на том, что наши знания

о мире всегда неполны, так как любая истина относительна и процесс накопления информации бесконечен.

Пусть некая система состоит из п взаимосвязанных объектов. Рассмотрим сеть Б=8(М,Я,Ь), где М={тьт2,...,тп}; Я={тьт2,...,тк}; Ь=Ь(М,Я)={/у{Тк)}. Информационная полнота такой сети ЫЬ<п(п-1)к. Дополним сеть новым отношением тк+1. Получим новую сеть 5'=5”(М,Я',Ь ), полнота которой ^'Ь=шах^ХХ| /у(г) |, где г,}=1,_,п; /=1,_,к+1.Отсюда ^'Ь=шах^ХХ| /у(т) | + +шах^ХХ| /}{Тк+\) | = ^ь+ шах^ХХ| //(т) | > Л^Ь+1> ЫЬ. Утверждение доказано.

Проблема неоднозначности. Еще одна проблема связана с однозначностью представления информации в базе знаний ИС. При этом существенны следующие три соображения.

1. Объекты М={тг}, где г=1,_,п в соответствии с теоретико-множественной концепцией предполагаются различными, т.е. в сети не допускаются одинаковые объекты. Так, если на столе находятся две ложки, то они рассматриваются в сети как разные - ложка-1 и ложка-2. Такой подход соответствует физическим и философским представлениям о том, что двух абсолютно одинаковых объектов в реальном мире не существует.

2. Зачастую различные объекты реального мира имеют одинаковые имена (омонимия, полисемия). Так, имя Иванов Иван Иванович может принадлежать разным людям, т.е. относится к некоторой группе объектов. Соответственно, базы знаний также должны допускать появление неоднозначных элементов и правильно классифицировать их.

3. Для некоторых объектов реального мира используются различные обозначения (синонимия). Так термины «ребенок», «малыш», «дитя» и др. очень близки по смыслу - обладают одинаковой семантикой. Базы знаний должны идентифицировать «понимать» объекты-синонимы.

Из вышеизложенного вытекает необходимость уточнения понятия объекта. Что же следует считать объектом, пригодным для описания реальности с неоднозначной семантикой в сетевой модели представления знаний?

Для ответа на этот вопрос детализируем понятие объекта с использованием семантических ассоциаций. Представим объект в виде набора: главное имя объекта, множество альтернативных имен объекта и связей между главным именем объекта и его альтернативными именами.

Определение. Именованный объект - это сеть объектов 5И=(МИ,ЯИ,ЬИ), гдеМи = ии^„, здесь пеи- главное имя именованного объекта, Жи=ЩЦ; Ьи -

множество отношений типов Ru между u и остальными элементами множества Wu; A - конечное множество символов (алфавит); W- множество всех слов на A, U - конечное множество главных имен (U-имен) на A.

Подчеркнем, что в именованном объекте обязательно присутствуют только одно главное имя и все его отношения с остальными объектами сети. Именованный объект имеет структуру одноуровневой сети - дерева, корнем которого является главное имя объекта. Использование модели именованной сети позволяет однозначно представить неоднозначности, существующие в окружающем мире.

Определение. Именованная сеть объектов SU=uSu, где Su - именованный объект, u=1,..., | U|.

Пример 4. Пусть имеются два Ивановых Ивана Ивановича, один из которых проживает в г. Москве, а другой - в г. Чебоксары. Предположим также, что в различных документах допускается и латинская запись фамилии имени и отчества в виде Ivanov Ivan Ivanovich. В приведенных данных имеется семантическая неоднозначность. Омонимия присутствует в виде одинаковых фамилии, имени и отчества у двух различных объектов. Синонимия присутствует в виде возможности написания одной и той же фамилии на кириллице или латинице.

Представим эту информацию в виде именованной сети SU из 2 именованных объектов S1 и S2:

алфавит А={А-Я, а-я, A-Z, a-z, 0-9}, здесь А-Я означает от А до Я и т.д., множество уникальных имен U={1,2},

множество слов W={1,2, Иванов Иван Иванович, Ivanov Ivan Ivanovich, Москва, Чебоксары},

Wu={Иванов Иван Иванович, Ivanov Ivan Ivanovich, Москва, Чебоксары}, Si={MbRiLi} , где:

M1={1,Иванов Иван Иванович, Ivanov Ivan Ivanovich, Москва, Чебоксары}, R1=={«иметь ФИО», «жить в городе»},

L1={1 «иметь ФИО» Иванов Иван Иванович, 1 «иметь ФИО» Ivanov Ivan Ivanovich, 1 «жить в городе» Москва}.

S2={M2,R2,L2}, где:

M2={2,Иванов Иван Иванович, Ivanov Ivan Ivanovich, Москва, Чебоксары}, R2=={«иметь ФИО», «жить в городе»},

L2={2 «иметь ФИО» Иванов Иван Иванович, 2 «иметь ФИО» Ivanov Ivan Ivanovich, 2 «жить в городе» Чебоксары }

Тогда вся именованная сеть: SU=SiuS2=(MR,L) , где:

M={1,2,Иванов Иван Иванович, Ivanov Ivan Ivanovich, Москва, Чебоксары}, R={«иметь ФИО», «жить в городе»},

L={1 «иметь ФИО» Иванов Иван Иванович,

1 «иметь ФИО» Ivanov Ivan Ivanovich,

1 «жить в городе» Москва,

2 «иметь ФИО» Иванов Иван Иванович,

2 «иметь ФИО» Ivanov Ivan Ivanovich,

2 «жить в городе» Чебоксары}.

Из приведенного примера видно, что детализация объектов с помощью механизма именованной сети позволяет корректно различать как синонимы (Иванов Иван Иванович, Ivanov Ivan Ivanovich), так и омонимы (Иванов Иван Иванович, проживающий в Москве и Иванов Иван Иванович, проживающий в Чебоксарах).

Таким образом, МПЗ в виде сети объектов позволяют преодолеть возможную семантическую неоднозначность представления информации и адекватно представить информацию об объектах реального мира (включая и синонимию, и омонимию) в базе знаний информационной системы.

Утверждение 3. МПЗ в виде именованной сети объектов позволяет однозначно представить любое конечное число неоднозначностей (омонимов и синонимов) в информации.

Доказательство. Очевидно исходя из определения.

Структура сети. Сетевая МПЗ представляет собой сложную разветвленную структуру, в которой можно выделить существенные элементы - элементарные сети, подсети различной сложности, различные сети и надсети.

Элементарные сети. Простейшей нуль-сетью является сеть, не содержащая ни одного объекта и соответственно ни одного отношения n=k=0. При n=1 и k=0 получается сеть из одного объекта, не связанного никакими отношениями. Такая сеть соответствует изолированному (без отношений) объекту и может быть интерпретирована как новая информация, относительно которой не имеется никаких дополнительных сведений. При n=2 и k=0 получим сеть из двух не связанных между собой объектов.

Определение. Элементарной сетью Sэлеы=(М,R,L) или элементарным сетевым элементом назовем сеть из двух объектов mi и mj и одного отношения lij любого типа rмежду ними. При этом n=2, 1=любое иM={mi, mj}; R={rl}; L={lj}.

Очевидно, что элементарная сеть является однородной и может быть представлена двойкой Sэлем=(МR,L)=(МL)• Однако объединение однородных сетей может быть и неоднородной сетью. Простейшие сети представляют интерес с точки зрения исследования механизмов пополнения базы знаний новой информацией.

Подсети. База знаний предполагает работу с систематизированной (структурированной) информацией. Следующим важным структурным элементом сети объектов является подсеть (контейнер), т.е. одноуровневый фрагмент сети. Контейнер включает сам объект (центр), его ближайших «соседей» и отношения центра с его ближайшими «соседями». Контейнеры представляют собой укрупненные, семантически-связанные структуры, отражающие основную информацию об объекте.

Надсети. Объединение всевозможных сетей объектов Si=S(Мi,Ri,L1), М1^М, Ri^R, LicL образует надсеть (мегамножество, класс) <S>=uSi,

i=1,2,3,... сетей объектов.

Алгебра сетей объектов. Класс сетей объектов <S> можно рассматривать как универсальную базу знаний или универсальное информационное мегамножество. Операции с сетями соответственно могут рассматриваться

как операции над базой знаний интеллектуальной информационной системы. Введем следующие операции с сетями.

Сравнение сетей. Две сети Si=S(Мi,Яi,Lг) и Б]=8(МрЯрЦ) равны, если попарно равны все составляющие их элементы, т.е. М,=Мр Я,=Я^ для любых i, j=1,2,3,_.

Отметим, что равенство двух сетей означает эквивалентность представляемой ими информации. В то же время неравенство сетей не обязательно означает неэквивалентность соответствующей им информации.

Таким образом, поэлементное равенство сетей можно рассматривать как достаточное условие информационной эквивалентности сетей. Аналогичное утверждение справедливо и для взвешенных сетей объектов.

Сложение сетей. Суммой сетей 8,=8(МъЯьЪ) и 81=>(МрЯрЦ) назовем сеть, образованную по правилу Si+Sj=(Мi,^uМj,Яi,^uЯj,Li^uLj)= (М, +М, Я+Я^ Ь+Ь}).

Пример 5. Пусть даны две сети Sl(МьЯьLl) и S2(М2,Я2,L2)> где М1={1,2},

^ = ^1^ ^ = {/12} М2={2,3,4}, Я2={г1 } ^={/34,/42}.

Тогда М1+М2={1,2,3,4}, Я^ЧМ, Ll+L2={/l2,/з4,/,2} и ^2=({1,2,3,4},

{г1 },{/12, /34,/42}).

Операцию сложения сетей по аналогии с операциями над множествами можно также называть логической или абстрактной суммой [2]. Рассмотрим свойства операции сложения сетей.

Свойство 1.1. Сложение сетей объектов коммутативно, т.е. Sг■+S^■=S^■+Sг■ ; V г,]=1,_^.

Доказательство. С одной стороны, ^^= S(Мi,Яi,Li)+ S(Мj,Яj,Lj)= S(Мi+Мj, Яг+Яр Li+LJ)= | по свойству множеств | = S(Мj+Мi, Яj+Яi, Lj+Li). С другой стороны, ^^,-+5,г= S(Мj+Мi, Я}+Я,, L/+Lг■). Из равенства правых частей двух полученных соотношений следует и равенство левых. Свойство доказано.

Свойство 1.2. Сложение сетей объектов ассоциативно, т.е. Sг■+(S^■+Sk)= ^^}^к; V г,],к=1,_^.

Доказательство. С одной стороны, Sг■+(S^■+Sk)=S(Мг,Яг,Lг■)+(S(Мj,Я^,L^■)+ +S(Мk,Яk,Lk))= | раскроем скобки | = S(Мi,Яi,Li)+S(Мj+ki,Яj+Яk,Lj+Lk) = | выполним сложение двух сетей | = S(Мi+Мj+Mk, Яi+Яj+Яk, Lг■+L^■+Lk). С другой стороны, действуя аналогично, получим (Si+Sj)+Sk= S(Мi+Мj+Mk, Яi+Яj+Яk, Li+Lj+Lk). Из равенства правых частей двух полученных соотношений следует и равенство левых. Свойство доказано.

Свойство 1.3. Существует нулевая сеть объектов (нуль-сеть), т.е. So=0: ^^о= So+Si= Si; V г'=1,_,5.

Доказательство. Осуществим предъявлением примера. Определим нулевую сеть следующим образом So=0= S(0,0, 0). Тогда ^+£0= S(Мi,Яi,L1)+ +S(0,0, 0)= S(Мi+0,Яi+0,Li+0)= S(Мi,Яi,Li); V /=1,_,^. С учетом коммутативности сложения свойство доказано.

Примечание. Отметим, что нуль-сеть носит формальный (сигнатурный) характер, т.е. отмечает нуль только символически. Использование сигнатурного нуля в бинарных операциях не предполагается.

Свойство 1.4_ (без доказательства). Для любой ненулевой сети объектов ^ не существует обратная относительно операции сложения сеть - Si такая, что $+(-й')=0 или -Si+Si=0; V /=1,_,^.

Утверждение 4. Класс сетей объектов <8> образует коммутативную (абелеву) полугруппу относительно операции сложения.

Доказательство. Следует из свойств 1.1-1.4.

Примечание. Полугруппы с сигнатурным нулем называют также моноидами.

Умножение сетей. Произведением сетей (левым) Si=S(Мi,Яi,Li) и Sj=S(Мj,Яj,Lj) назовем сеть, образованную по правилу SixSj=(Мi,+Мj Яi,+Яj,Li+Lj+Lij), где гj};V i,j: т,еМ,, т;еМ;.

Аналогично вводится понятие правого умножения сетей объектов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пример 6. Пусть даны две сети Sl(МьЯьLl) и S2(М2,Я2,L2) , где М1={1,2},

Я1 = {г1} L1 = {/12}, М2={2,3}, Я2={г1} -^2={/23}.

Тогда М1+М2={1,2,3}, Я1+Я2ЧГ1}, Ll+L2={/l2, /23}, Ll2={/lз,/22} и левое произведение S1xS2= ({1,2,3},{г1},{/12,/23,/13,/22}). Правое произведение

S1xS2=({1,2,3}, {г1}, {/12,/23,/21,/22,/31,/32}) существенно отличается от левого.

Из приведенного примера видно, что операция левого умножения сетей является обобщением операции сложения сетей объектов. В отличие от последней, она способна порождать новые отношения в сети, т.е. генерировать новое знание в базе знаний ИС.

Рассмотрим свойства операции умножения сетей объектов

Свойство 2.1. Умножение сетей объектов некоммутативно, т.е. 3 i,j: SixSjфSjxSi.

Доказательство следует из приведенного выше примера.

Свойство 2.2. Умножение сетей объектов ассоциативно, т.е. Six(SjxSk) = = ($xSj)xSk V ij=1,_,s.

Доказательство. С одной стороны, Six(SjxSk) = Six(S(Мj,Яj,L])xS(Мk,Яk,Lk)) =

= S(МгЛL1)x(S(М+Мk,,ЯJ+Яk,,L+Lk+L]Lk) =

S(Мi+Мj+Мk,Яi+Яj+ЯhLi+Lj+Lk+LjLk+Li(Lj+ +Lk+L^Lk)) = | с учетом ассоциативности сложения | = S(Мi+Мj+Мk,Яi+Яj+Яk, Li+Lj+Lk+LjLk+LiLj+LiLk+LiLjLk).

С другой стороны, (SixS])xSk = (S(Мi,Яi,Li)x ^(М}-,Я},Ц)^к = (S(Мi+Мj,Яi+ +Яj,Li+Lj+LiLj))xS(Мk,Яk,Lk)) = S(Мi+Мj+Мk,Яi+Яj+Яk,Li+L]+LiLj+Lk+(Li+Lj+LiLj)Lk)) = = S(Мf+Мj+Мk,Яf+Яj+Яk,Li+Lj+LiLj+Lk+LiLk+LjLk+LiLjLk)= l с учетом коммутативности сложения | = S(Мi+Мj+Мk,Яi+Яj+Яk,Li+Lj+Lk+LjLk+LiLj+LiLk+LiLjLk). Из равенства правых частей двух полученных соотношений следует и равенство левых. Свойство доказано.

Свойство 2.3. Существует единичная сеть объектов, т.е. SE=£,: SixE=Si; или ExSi=Si V i=1,_,s. Причем она совпадает с нуль-сетью SE= So.

Предположим, что сеть существует SE=E=S(МE,ЯE,LE). Операция умножения должна сохранять как число объектов в сети, так и число связей. Тогда для умножения справа единичная сеть должна удовлетворять условиям: М+Ме=М-, Я+Яе=Яь Li+LE+LiLE =Li. Отсюда МесМь ЯесЯь LE+LiLE сЦ. По-

следнее соотношение может выполниться только тогда, когда LE=0, а также Яе=0, Ме=0. Таким образом, SE= S0. Аналогично проверяется справедливость данного свойства для умножения слева. Свойство доказано.

Примечание. Отметим, что единичная сеть, так же как и нуль-сеть, носит сигнатурный характер и отмечает единицу только символически.

Свойство 2.4 (без доказательства). Для любой ненулевой сети объектов Si не существует обратная относительно операции умножения сеть ^)_1 такая, что Six(Si)~1=E или (Si)-1xSi=E; V i=1,_,s.

Свойство 2.5 (без доказательства). Умножение сетей дистрибутивно и справа и слева, т.е. (Si+Sj)xSk=SixSk+SjxSk и . Six(Sj+Sk)=SixSj+SixSk V i=1,_,s.

Утверждение 5. Класс сетей объектов <8> образует некоммутативную полугруппу (моноид) относительно операции умножения.

Доказательство. Следует из свойств 2.1-2.4.

Утверждение 6. Класс сетей объектов <8> образует полукольцо относительно операций сложения и умножения.

Доказательство. Следует из утверждений 1-2 и свойства 2.5.

Рассмотрим еще одно важное свойство сетей объектов - возможность представлять неточную информацию. Именно такая информация свойственна объектам реального мира. Более того, абсолютно точной информации в природе просто не существует.

Взвешенные сети объектов. Под взвешенной сетью объектов будем понимать систему £ состоящую из заданного множества М связанных объектов и заданного набора Я отношений между ними. Связи между парами объектов задаются весами Ж, характеризующими силу связи.

Определение. Взвешенная сеть объектов это тройка S=(М,Я,W), где

- М = {т1, т2,..., т п}- конечное множество объектов, п>0;

- Я = {г1, г2,..., г к} - конечное множество типов отношений, к>0;

- W= W(M,R)={wij(Гl)} - конечное множество весов отношений типа г между объектами mi и т-, где i, -=1,_,п; /=1,...,к.

Нечеткие отношения. Бинарные отношения L={/гj(гl)}, где i,j=1,_,n; /=1,_,к будем задавать трехмерной матрице отношений, элементами которой являются величины | /-(г/) | , вычисляемые по правилу: | /у(г{) | =wij, если 3 отношение Г1 между объектами mi и т- и | /-(г/) | =0 иначе; i,j=1,_,n; /=1,_,к.

Взвешенные сети являются обобщением введенных выше невзвешенных сетей объектов. Взвешенность сети означает, что сетевые объекты могут быть связаны между собой с разной силой. Таким образом, можно задавать нечеткие отношения, свойственные объектам реальной природы, т.е. учитывать физические градации отношений, задавая их количественную меру. При равенстве всех ненулевых весов между собой Wij(Гl)=ConSt, взвешенная сеть совпадает с невзвешенной.

Определение. Элементарной взвешенной сетью Sэлем={М,Я,W) или взвешенным сетевым элементом назовем сеть из двух объектов mi и т- и одного весового отношения wij типа гк между ними. При этом п=2, к=любое и М = {т;-, т-}; Я = {гк}; W = ^у(гк)}.

Пример 7. Пусть два объекта связаны отношением «находиться на». Если на первом объекте находится второй, то он может лежать свободно или быть, например прилепленным к первому в той или иной мере.

Зададим взвешенную сеть S следующим образом М={т1, т2, т3}, Я={г1, г2}, W={w12(г1)=1, w13(г2)=2, w32(г2)=3, w23(г1)=1}. Такая сеть описывает систему взаимосвязанных абстрактных объектов 8=(т1 «г1» т2, т1 «2г2» т3, т3 «3г2» т2, т2 «г1» т3). Это означает, что некий объект т1 связан с объектом т2 первым отношением г1 с единичным весом и с объектом т3 вторым отношением с весом, равным двум. Третий объект т3 связан со вторым т2 вторым отношением г2 с весом, равным трем, и наконец второй объект т2 связан первым отношением г1 с объектом т3 и весом, равным единице.

Пример 8. Выберем конкретную ПО - физику. Зададим множество объектов М={т1,т2,т3}={солнце, лес, вода} и отношений Я={г1,г2}={«над», «у»}.

Тогда 8=(солнце «над» лес, солнце «у» вода дважды, вода «у» лес трижды, лес «над» вода). Эту сеть можно интерпретировать так - солнце у воды, а вода у леса. Однако солнце в меньшей мере у воды, чем вода у леса. Или -солнце дальше от воды, чем лес. Более точно - в 3/2=1,5 раза. Другая интерпретация возможна, например, если вес отношения «у» интерпретировать как меру дальности, а не близости, то солнце ближе к воде в 1,5 раза.

2. Классификация отношений. Новая концепция Семантического Web (www.semanticweb.org) представляет собой набор новых технологий, структурирующих и классифицирующих хранимые в Сети данные на основе их смысла. Основой этих технологий является понятие отношений как одного из наиболее общих средств описания реального мира, в котором существует большое число отношений различных типов (>100).

В общем случае отношение представляет собой набор слов в некотором языке.

1. По способу (машинного) анализа выделим виды (вычисления) отношений:

- предикативные (вычисляются через встроенные предикаты, значения 0 или 1);

- лингвистические (вычисляются синтаксическим анализом предложения, значения 0 или 1);

- функциональные (вычисляются программно, значения 0 или 1).

2. В зависимости от семантики (смысла) отношения выделим типы отношений:

- - вхождения (е, с, быть представителем класса, входить в множество, являться членом _);

- - порядка (= ,<, >, >=, больше, меньше, больше равно _);

- логические (л,V,—, и, или, не _);

- свойства-атрибуты (быть синим, быть большим, иметь свойство Х_ );

- пространственные (близко, над, за _);

- временные (раньше, позже _);

- операционные (строить, делать, следить ...);

Взаимосвязь вышеуказанных видов и типов представлена в табл. 1.

Взаимосвязь видов и типов отношений

Типы отношений Виды отношений

предикативные лингвистические функциональные

Вхождения е, с, (пример 5еЫ) принадлежит, является членом Принадлежит(п1,К)

Порядка <, >, >=,= (пример 7>5) больше, меньше, ... (семь больше пяти) Больше(х1,х2) (Больше(7,5))

Логические л^,— и, или, не ЛогическоеИ(г1,г2)

Свойства-атрибуты — быть синим, быть большим Синий(х1)

Пространственные — Близко, над, за Близко(х1,х2), Далеко(х1,х2)

Окончание табл. 1

Типы отношений Виды отношений

предикативные лингвистические функциональные

Временные — раньше, позже Раньше(81,82), Позже(81,82)

Операционные — строить, делать, следить ВыполятьРаботу(), Ждать^1д2)

Из этой табл. 1 видно, что отношения одного типа (например, порядка) может быть реализовано в разных видах: как в предикативном «7>5» , так и в лингвистическом - «семь больше пяти», и в функциональном: Больше(7,5).

Бинарные отношения всех видов можно записать в следующей общей форме Р(т,,т,)={0,1}, где Р - предикат или программа синтаксического разбора предложения или программно реализованная функция.

3. В зависимости от значений, принимаемых Р(т,,т,), классифицируем отношения как:

- строго направленные, если Р(т,т) =1 и Р(т,,т,)=0 , Р(тг,тг)=0;

- нестрого направленные, если Р(тг,т;)=1 и Р(т;,тг)=0 , Р(тг,тг)=1;

- ненаправленные, если Р(т,,т ,) =1 и Р(т;,тг)=1.

Детальнее это свойство представлено в табл. 2.

Таблица 2

Классификация отношений по направленности ________________________

Тип отношения Р(т,,т,) Р(т,-,т,) Р(т,,т,) 1, Пример

Строго направленное 1 0 0 т ,-^т,- >

0 1 0 т ,-^т, <

Нестрого направленное 1 0 1 т,=^т,- >=

0 1 1 т,-^=т,- <=

Ненаправленное 1 1 1 т,—т, =

1 1 0 т,—Фт, Находиться рядом

Л-арные отношения. В сети объектов предполагаются только бинарные отношения. Однако это не снижает общности сетевой МПЗ, поскольку, на наш взгляд, отношения более высокого порядка (и-арные) могут быть выражены через бинарные. Обсуждение этой важной гипотезы выходит за рамки настоящей статьи и будет рассмотрено в отдельном сообщении.

Таким образом, модели представления знаний в виде сетей объектов обладают высокой семантической выразительностью и могут применяться в качестве основы при конструировании баз знаний для интеллектуальных информационных систем.

Выводы. В работе предложена модель представления знаний в виде сетей объектов и именованных сетей объектов, которые можно рассматривать как формализованные модели семантических сетей. Исследованы некоторые общие свойства этих сетей. Введены некоторые операции над сетями и доказано, что сети объектов образуют полукольцо относительно операций сложения и умножения сетей. Таким образом, все известные алгебраические свойства полуколец могут быть распространены на класс сетей объектов. Показано, что базы знаний на основе сетевых МПЗ обладают достаточной степенью общности для описания сложных объектов реального мира и позволяют описывать объекты, допускающие омонимическую и синонимическую неоднозначность. С МПЗ можно оперировать как с формальной системой с известными свойствами, что позволяет повысить степень интеллектуальности информационных систем. Рассмотрены вопросы представления нечетких знаний и полноты сетевых МПЗ. Доказано утверждение о неполноте сетевых моделей представления знаний и высказана гипотеза о возможности представления и-арных отношений через бинарные. Дана классификация бинарных отношений с точки зрения их машинной реализации и семантического наполнения.

Рассмотренная модель представления знаний может быть положена в основу конструирования интеллектуальных кибернетических устройств нового поколения.

Литература

1. Гаврилова Т.А., В.Ф. Хорошевский В.Ф. Базы знаний интеллектуальных систем. СПб.: Питер, 2000.

2. Корн Г., Корн Т. Справочник по математике для инженеров. С.100.

ФЕДОТОВ ВЛАДИСЛАВ ХАРИТОНОВИЧ родился в 1954 г. Окончил Чувашский государственный университет. Кандидат химических наук, доцент. Заведующий кафедрой информационных систем Чувашского университета. Область научных интересов - математическое и компьютерное моделирование физико-химических процессов, базы и знаний, нейронные сети, интеллектуальные информационные системы. Число опубликованных работ - 104.

БУДНИКОВ ЮРИЙ ВЛАДИСЛАВОВИЧ родился в 1953 г. Окончил Чувашский государственный университет. Ведущий инженер информационновычислительного центра Чувашского университета. Область научных интересов -компьютерное моделирование технологических процессов, сети Петри, программирование, системы защиты информации. Число опубликованных работ - 6.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Федотов Владислав Харитонович, Будников Юрий Владиславович

Текст научной работы на тему «О формализации моделей представления знаний в интеллектуальных информационных системах»