СИСТЕМНЫЙ АНАЛИЗ И УПРАВЛЕНИЕ
УДК 51G.64
РАСШИРЕНИЕ АППАРАТА ТЕОРИИ НЕЧЕТКИХ МНОЖЕСТВ И ЛИНГВИСТИЧЕСКОМ ПЕРЕМЕННОЙ ДЛЯ ПРЕДСТАВЛЕНИЯ ЭКСПЕРТНЫХ ЗНАНИЙ
Белгородский государственный национальный исследовательский университет
В.В. РУМБЕШТ
В работе предлагается подход к расширению аппарата теории нечетких множеств и лингвистической переменной за счет лингвистического моделирования модальностей уверенности/неуверенности .
e-mail: [email protected]
Ключевые слова: искусственный интеллект, представление знаний, нечеткие множества, лингвистическая переменная, модальная логика, модальность уверенность/неуверенность.
В системах искусственного интеллекта часто используются знания экспертов. Такие знания, как правило, имеют значительный уровень неопределенности, обусловленный межличностными средствами передачи информации, например, таких, как естественный язык. Знания, представленные на естественном языке, потенциально содержат несколько видов лингвистической неопределенности. Прежде всего, это нечеткость и недостоверность. В частности, одним из проявлений недостоверности является неуверенность эксперта в том, что, его знания верно отражают действительность, а также выраженный им на естественном языке смыл высказываний, будет правильно воспринят окружающими. Все это вместе взятое существенно осложняет формализацию такого описания. Однако, возможность формализации появляется при выделении в тексте логических связок, модальностей [1] и так называемых лингвистических переменных.
Для формализации нечеткости в естественном языке Л.А Заде была предложена теория нечетких множеств [2] и понятие лингвистической переменной [3]. Модальности, встречающиеся в естественных языках, изучались еще Аристотелем, однако, в самостоятельное направление математической логики модальные исчисления оформились лишь в начале прошлого века. В становление и развитие модальной логики внесли вклад такие выдающиеся ученые, как К. Льюис [4], Я. Хинтикка [5], С. Крипке [6], и др. Однако, средств, предоставляемых модальными логиками, оказывается недостаточно для формализации модальности, как инструмента для выражения неуверенности. Кроме этого аппарат, предложенный Л. А. Заде, не предусматривал каких-либо средств для представления этих модальностей.
Целью данной статьи является расширение аппарата теории нечетких множеств и понятия лингвистической переменной для единообразного представления нечеткости и недостоверности экспертных знаний, содержащих модальности уверенности/неуверенности.
Такое расширение оказывается возможным при моделировании указанных модальностей средствами, предоставляемыми формализмом лингвистической переменной.
Понятие лингвистической переменной. Лингвистическая переменная [3] характеризуется пятеркой: < х , 0 б ,и, М > , в которой х - название лингвистической переменной,
символ & обозначает синтаксическое правило, порождающее названия вербальных (лингвистических) значений лингвистической переменной. Все вербальные значения, порожденные синтаксическим правилом, образуют множество, которое обозначается символом 0 . Конкретное название вербального значения называется термом лингвистической переменной, а множество 0 -
терм-множеством. В терм-множестве 0 выделяется специальное подмножество 0 Б , которое называется базовым терм-множеством. Базовое терм-множество конечно и содержит, обычно, от 2 до 7 значений. Оно задано и непосредственно фигурирует в определении лингвистической переменной. Остальные термы, порождаемые синтаксическим правилом, строятся из элементов 0 б с помощью конечного набора лингвистических модификаторов и связок. Термам лингвистической
переменной ставятся в соответствие нечеткие множества в универсуме и , при этом соответствующее нечеткое множество выражает смысл конкретного вербального значения. Смысл каждого из
элементов 0 задается семантическим правилом М , которое устанавливает соответствие "терм лингвистической переменной - нечеткое множество". Вообще говоря, синтаксические правила различных лингвистических переменных могут отличаться друг от друга.
Семантическое правило М лингвистической переменной является соответствием из
множества термов 0 , порожденных синтаксическим правилом & , во множество нечетких
подмножеств универсума и , то есть
М : 0 ^ Ри2ф(и) . Это соответствие означает, что, если
Т £ 0 , то М (Т) - нечеткое множество, выражающее смысловое содержание терма Т .
Функции принадлежности нечетких множеств, описывающих смысл элементов базового терм-множества лингвистической переменной, определяются в диалоге с экспертом, который
заключается в построении так называемой функции совместимости ^ х [3]. Эта функция задает степень совместимости каждого элемента универсума с каждым понятием, обозначаемым базовым
термом - V х : 0 б ^ и [0, . При этом считается, что при V х (Т> и) = 1 , элемент и полностью
совместим с понятием Т , а при V х (Т’ и) 0 - элемент и абсолютно не совместим с понятием Т .
Во всех остальных случаях V х(Т’и) выражает субъективное представление эксперта о совместимости и и Т .
После того, как функция совместимости определена, приступают к построению нечетких
0
множеств, порождаемых семантическим правилом для элементов Б . По определению нечеткого
Т £ 0 М(Т) = {М м,тЛи) / и | и £ и}
множества, для любого элемента Б : М (Т ) , где
У и £ и, М М (Т ) (и ) = V х(Т, и)
Функции принадлежности нечетких множеств, порождаемых семантическим правилом
для элементов Т £ 0 Б , должны удовлетворять условиям нормальности, выпуклости, полноты и непротиворечивости, сформулированных в работе [7]. При линейно упорядоченном универсуме этим условиям отвечает трапециевидная функция принадлежности. Выбор такой формы обоснован следующими соображениями:
1) эта функция всегда выпукла;
2) график функции может быть построен по четырем точкам на действительной плоскости;
3) учитывая, что нечеткое множество для терма лингвистической переменной должно быть нормальным, для задания функции принадлежности достаточно всего четыре числа, как показано на рис. 1.
4) для построения трапециевидных функций принадлежности необязательно полностью (для всех элементов универсума) определять функцию совместимости - достаточно воспользоваться простой методикой [8].
' Mw(u) b
C
x A=(a,0); i\ B=(b,1); j \ C=(c,1);
! \D=(d,0).
A
D
0 a
b
c d u
Рис. 1. Трапециевидная функция принадлежности
Методика построения трапециевидных функций принадлежности заключается в том, что надо ответить на следующие вопросы.
1. Какой отрезок универсума полностью совместим с определяемым понятием?
2. Какая часть универсума абсолютно не совместима с определяемым понятием?
Остальные нечеткие множества, порождаемые семантическим правилом, определяются в соответствии с синтаксическим правилом путем применения конечного количества операций, соответствующих применяемым лингвистическим модификаторам и связкам, над нечеткими множествами, построенным для базовых термов.
Лингвистическое моделирование модальных понятий. Для явного выражения недостоверности знаний, и связанному с ней чувству неуверенности, в естественном языке существует специальное средство: модальность, которая принадлежит к группе основных категорий естественного языка и выражает "разные виды отношения высказывания к действительности, а также разные виды субъективной квалификации сообщаемого" [1]. С другой стороны, под модальностью в модальных логиках понимают выраженную в суждении дополнительную оценочную информацию о связях между явлениями, о логическом статусе суждения, о регулятивных, временных и других его характеристиках. В модальном суждении явно или неявно используется модальные операторы: "возможно", "необходимо", "доказано", "плохо", "запрещено" и т. д.
Для выражения чувства уверенности/неуверенности удобнее всего применять алетические модальности, которые включают такие понятия, как "необходимо", "возможно", "случайно", "невозможно". При этом понятия "необходимо" и "невозможно" можно отнести к модальностям уверенности, а понятия "возможно" и "случайно" - к модальностям неуверенности.
Модальные суждения могут различаться видом модальности, который определяет разновидность отношения суждения к реальной действительности, например, отражает ли суждение истинное положение дел с необходимостью или оно только возможно. Кроме этого, модальности одного и того же вида могут отличаться друг от друга "силой" отношения. Так, если сравнить, например, модальности "возможно” и "очень возможно”, то становится ясно, что вторая модальность в большей степени определяет возможность суждения, чем первая.
Таким образом, любую модальность можно представить парой: <вид модальности, градация модальности>, где вид модальности определяет разновидность отношения между суждением и реальной действительностью, а градация - силу этого отношения. Градацию
Ответ на первый вопрос определяет ядро нечеткого множества: , с] , а ответ
на второй вопрос определяет дополнение носителя нечеткого множества: — Support (W ) , где Support (W ) = (a , d ) .
Аналитически трапециевидная функция принадлежности имеет вид:
ft,
1 1 a
b < u < с; a < u < b;
с < u < d;
(u < a) V (u > d).
(1)
модальности удобнее всего выражать количественно, в виде процентного отношения между определяемой модальностью и максимально возможной модальностью этого вида.
Эти наблюдения позволяют оформить синтаксическое правило, конструирующее символы модальных операторов: символы должны содержать префикс и следующее за ним число. Префикс определяет конкретный вид модальности из некоторого, наперед заданного, конечного множества видов, а число - количественное выражение градации этой модальности. В нашем случае виды модальностей ограничиваются алетическими.
Пусть модальностям "невозможность", "случайность", "возможность" и "необходимость"
{Imv Prob Poss Nec } соответствуют префиксы 1 ’ —’ —’ J. Число, следующее за префиксом и
выражающее градацию соответствующей модальности, должно быть натуральным и не должно
превосходить сотни. Построенные таким образом символы модальности читаются так: ^m]p_N -
Prob_N Poss_N
"с N процентной невозможностью"; — - "с N процентной случайностью"; — - "
Nec N
с N процентной возможностью"; — - "с N процентной необходимостью", где N - выраженное
в процентах значение градации.
Следовательно, при заданном алфавите, включающем следующие группы символов: виды
{Imp , Prob , Poss , Nec } л {о, 1, 2, 3, 4, 5, 6, 7, 8, о}
модальностей - и цифры - , символ
модальности может быть описан формой Бекуса-Наура (БНФ), заданной выражением (2).
цифра ::= 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 ноль ::= 0
N ::=< цифра > | < цифра >< ноль > | < цифра >< цифра > | 100 [- (2) префикс ::= Imp_ | Prob_ | Poss_ | Nec_ m ::=< префикс >< N >
Пусть Mod - множество символов модальных операторов, порожденных с помощью БНФ (2). Рассмотрим лингвистическую переменную
< уверенность / неуверенность, Mod, [0, 1], G, M > , вербальные значения которой будем трактовать как модальности, порожденные с помощью этой БНФ.
Базовое терм-множество этой лингвистической переменной составляют символы модальности, правила построения которых определяются (2). Хотя базовое терм-множество и конечно, но достаточно велико - содержит 400 термов, поскольку модальности вида "невозможность", "случайность", "возможность" и "необходимость" имеют по 100 градаций.
Синтаксическое правило G порождает только элементы базового терм-множества, то есть: ® Mod . универсумом лингвистической переменной "уверенность/неуверенность"
является отрезок [0, 1] , который означает, что областью рассуждений, в данном случае, является все возможные оценки уверенности. Семантическое правило M является соответствием из
множества символов модальностей в множество нечетких подмножеств [0, 1] , то есть M : Mod Fuzzy([0, 1]) .
Указанное семантическое правило M в лингвистической переменной "уверенность/неуверенность" имеет ряд особенностей.
Во-первых, оно включает только одно частное правило трансляции, поскольку все термы переменной "уверенность/неуверенность" являются базовыми. Согласно этому правилу, нечетки множества, соответствующие термам должны задаваться извне.
Во-вторых, модальная семантика накладывает ряд ограничений на моделирующие ее нечеткие множества. Например, невозможно линейно упорядочить базовое терм-множество лингвистической переменной "уверенность/неуверенность", так как некоторые понятия оказываются несравнимы между собой. Очевидно, что линейный порядок существует только среди модальностей одного вида, когда они сравниваются по градации. Таким образом, модальности одного вида следует рассматривать независимо от остальных и, с учетом этого, необходимо
несколько изменить условие полноты базового терм-множества, а условие непротиворечивости заменить условием согласованности.
Q Support(M (T)) Ф 0 Условие полноты запишется как: TeMod , что означает - не должно
существовать элементов универсума абсолютно не совместимых ни с одним из термов.
Пусть рассматривается определенный вид модальности. Упорядочим термы по
возрастанию градации. Метасимвол TN обозначает символ модальности с градацией N . Тогда
M(TN) С M(TN + 1) N = 1 99 а ™
условие согласованности запишется как: , где N 1 99 . Это означает, что
если модальности упорядочены по градациям, то их смысл упорядочен по включению.
Остальные условия, сформулированные в работе [7] для нечетких множеств, порождаемых
семантическим правилом для элементов базового терм-множества, остаются в силе.
Следует заметить, что рассмотренные ограничения не влияют на наше предположение о
трапециевидных функциях принадлежности таких нечетких множеств, и мы можем
воспользоваться приведенной выше методикой их построения.
В-третьих, не требуется определять значение M для каждого из 400 возможных термов. Достаточно рассмотреть всего 4 случая, соответствующих видам модальностей.
Прежде чем рассматривать эти 4 случая сделаем следующие общие замечания.
С каждым видом модальности связана своя собственная шкала (отрезок [0, 1] ). Любое модальное понятие вида "невозможность", "случайность", "возможность" и "необходимость", имеющее градацию N, содержит в себе оценку, которой на соответствующей шкале соответствует N
n =----
точка 100 .
Между модальностями "невозможно", "случайно", "возможно" и "необходимо", а значит и между соответствующими им шкалами, существуют следующие отношения.
1. Невозможным является то, что не является возможным, и наоборот. То есть эти понятия
- антиподы, и оценке n на одной шкале соответствует оценка 1 - n на второй.
2. Необходимым является то, что не случайно, и наоборот. Как и в предыдущем случае,
необходимость и случайность - антиподы, и оценке n на одной шкале соответствует оценка 1 - n на второй.
3. Необходимо все то, что возможно. Обратное не верно. Точнее, оценка возможности всегда превосходит оценку необходимости, то есть точке n на шкале необходимости может
соответствовать точка из отрезка [n 1] на шкале возможности.
Универсум лингвистической переменной "уверенность/неуверенность" следует интерпретировать как шкалу возможности, в которой ноль означает отсутствие возможности, а единица - абсолютную возможность. Все остальные оценки располагаются между этими двумя граничными случаями, и выражают степень возможности.
Таким образом, ставится задача об определении совместимости оценок возможности с
Imp N, Prob N, Poss N, Nec N модальными понятиями .
N
n =----
Случай 1. Модальности вида "возможность". Пусть 100 - точка на шкале возможности. Если рассмотреть следующие постулаты: 1) если мы говорим о возможности чего-либо, предполагая большую возможность, то мы правы; 2) говорить о возможности при ее
Розз N
отсутствии не верно, то становится очевидным, что с модальным понятием полностью
совместимы все те оценки возможности, которые не меньше п , а абсолютно не совместима
единственная оценка, равная нулю. Таким образом: Кегпе! {М (розя_МУ) [и, 1] ,
Support (M (Poss_N )) = (0, 1]
. Следовательно, принимая во внимание (і) мы можем записать:
f0, u = 0;
MM(Poss _N) (u) = ■ u, 0 < u <n;
1, n < u < 1.
Модальности вида "возможность" имеют функции принадлежности представленные на рис. 2.а.
Случай 2. Модальности вида "невозможность". Рассмотрим модальное понятие
N
, n =---
Imp_N и его противоположность Poss_N , где N = 100 - n . Пусть 100 - точка на шкале
л ч N'
(1 - n) = Ш0 -
невозможности, а 100 - соответствующая ей точка на шкале возможности. Поскольку
Imp N Poss N '
- антипод , то с ним полностью совместима единственная оценка возможности,
равная нулю, а абсолютно не совместимы все те оценки, которые не меньше 1 - n . Таким образом:
Kernel (M (Imp_N)) = {0}, Support (M (Imp_N)) = [0, 1 - n) . Учитывая (і), мы можем записать:
1, u = 0;
- 1
u + 1, 0 < u < (1 - n);
ММ (Ітр N ) (и ) = \х_п
0, (1 - п) < и < 1.
Модальности вида "невозможность" имеют функции принадлежности представленные на рис. 2.б.
N
Случай 3. Модальности вида "необходимость". Пусть п - ^ - точка на шкале
необходимости. На шкале возможности ей может соответствовать любая точка из отрезка [п, 1] . Учитывая постулат: "если что-то хоть как-то необходимо, то оно безусловно возможно", можно
Ыес N
утверждать, что с модальным понятием 1'1ес_1'1 полностью совместима единственная оценка возможности, равная единице, а абсолютно не совместимы все те оценки, которые меньше п . Таким образом: Кегпе1 (М- {1} , 5иррогі(М(Ыес_Ы)) - [п, 1] . По формуле (і) имеем:
0, 0 < и < п;
1 п
Мм(месЮ(и) - — и -і—, п < и < 1;
( _ ) 1 - п 1 - п
1 и - 1.
Модальности вида "необходимость" имеют функции принадлежности представленные на рис. 2.в.
Случай 4. Модальности вида "случайность". Рассмотрим модальное понятие
N
п —----
Рго и его противоположность /ес_/ , где / - 100 - п . Пусть 100 - точка на шкале л ч N
„ (1 - п) - 77^ „ „
случайности, а 100 - соответствующая ей точка на шкале необходимости, которой может
[1 — п Ц РгоЬ N
соответствовать любая точка отрезка на шкале возможности. Поскольку -
Ыес N'
антипод , то с ним полностью совместимы все те оценки возможности, которые меньше
1 - п , а абсолютно не совместима единственная оценка, равная единице. Таким образом:
Кжті(м (рг°Ъ_Щ - [0, 1 - п) , $ирроП(м(рг°Ь_Ы)) - [0, 1) . следовательно, по (1) мы можем записать:
и
(u)
0 < u < (1 - n);
-1 1
u + _, (1 - n) < u < 1; n n
О, и = 1.
Модальности вида "случайность" имеют функции принадлежности представленные на рис.
2.Г.
Рис. 2. Виды функций принадлежности модальностей а) "Возможность"; б) "Невозможность"; в) "Необходимость"; г) "Случайность"
На рис. 2. сплошными линиями показаны функции принадлежности соответствующие граничным градациям модальности (1 и 100 ), а пунктирными линиями - некоторой
N
промежуточной градации
1 < N < 100, n =
100 '
Заключение. Достоинством предложенного в данной статье подход к расширению аппарата теории нечетких множеств и лингвистической переменной является представление в рамках одного и того же математического аппарата нечеткости и уверенности/неуверенности в экспертных знаниях. Кроме того, это интересно тем, что позволяет представлять различные по характеру оттенки уверенности/неуверенности, и позволяет эксперту самому определять их смысловое содержание.
Литература
1. Модальность // Лингвистический энциклопедический словарь. - М.: Советская Энциклопедия, 1990. - С.303-304.
2. Zadeh L.A. Fuzzy set / / Information and Control. - 1965. - Vol. 8. - P.338-353.
3. Заде Л.А. Понятие лингвистической переменной и его применение к принятию приближенных решений. - М.: Мир, 1976. - 165с.
4. Lewis C., Langford C. Symbolic logic. - New York, 1932. - 117р.
5. Hintikka Ja. Models for modalities. - Dordrecht, 1969. - 127р.
6. Kripke S. Semantical considerations on modal logic / / Acta philisophica finnica. - 1963. - Vol.1. - P.24-33.
7. Обработка нечеткой информации в системах принятия решений / А.Н. Борисов, А.В. Алексеев, Г.В. Меркурьева и др. - М.: Радио и связь, 1989. - 304с.
8. Нечеткие множества в моделях управления и искусственного интеллекта / А.Н. Аверкин, И.З. Батыршин, А.Ф. Блишун, и др.; Под. ред. Д.А. Поспелова. - М.: Наука, 1986. - 312с.
1
THE EXPANSION OF THE APPARATUS OF THE THEORY OF FUZZY SETS AND LINGUISTIC VARIABLE FOR THE SUBMISSION OF EXPERT KNOWLEDGE
V.V. RUMBESHT
Belgorod National Research University
e-mail: [email protected]
In the article proposes an approach to the expansion of the apparatus of the theory of fuzzy sets and linguistic variable due to linguistic modeling the modality of certainty/uncertainty.
Keywords: artificial intelligence, representation of knowledge-making, fuzzy sets, linguistic variable, modal logic, the modality of certainty/uncertainty.