Научная статья на тему 'Разработка метода принятия решений на основе присоединенных процедур нечеткого вывода на знаниях'

Разработка метода принятия решений на основе присоединенных процедур нечеткого вывода на знаниях Текст научной статьи по специальности «Математика»

CC BY
113
30
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Белогурова Анна Викторовна

Для идентификации виновников загрязнения рек предлагается MYCIN-подобный метод нечеткого вывода на знаниях, который базируется на известных процедурах учета неопределенности присоединенного типа, но ориентирован на продукционную модель предметной области задачи. Метод реализует процедуру учета неопределенности, предложенную в системе MYCIN, со схемой вывода из системы PROSPECTOR, что позволяет соединить сильные стороны обоих подходов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Белогурова Анна Викторовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Development of decision making method based on adjoint uncertainty inference procedures

For the solution of a task of identification of the river pollution culprit the MYCIN-similar inference method is offered. The method realizes the uncertainty account procedure offered in system MYCIN, with the inference engine from system PROSPECTOR. The rule based uncertainty inference algorithm and program are developed. The computing experiments under the culprit identification for a real situation of pollution of the Seversky Donets river are realize.

Текст научной работы на тему «Разработка метода принятия решений на основе присоединенных процедур нечеткого вывода на знаниях»

Литература: 1. Дикарев В.А. Локальные возмущения и фокусировка распределений марковских процессов // Радиоэлектроника и информатика. Системы и процессы управления. 1999. N 4. С.37-39. 2. Розанов Ю.А. Теория вероятностей, случайные процессы и математическая статистика. М.: Наука, 1986. 320 с. 3. Бондаренко М.Ф., Герасин С.Н. Расчет предельного распределения неоднородных процессов Маркова, инфинитезимальные матрицы которых имеют точки фокусировки //Радиоэлектроника и информатика. 1999. N 4. С.37-39. 4. Боровков А.А. Математическая статистика. Оценка параметров. Проверка гипотез. М.: Наука, 1984. 472 с.

Поступила в редколлегию 14.09.2000

Рецензент: д-р физ.-мат. наук, проф. Колосов А.И.

Дикарева Тамара Александровна, доцент кафедры “Финансы” Украинской государственной академии железнодорожного транспорта. Научные интересы: эко-номичекая статистика, статистика промышленности. Увлечения: брэйн-ринг. Адрес: Украина, 61000, Харьков, ул. Фейербаха, 7, тел. 20-69-54.

Евграфов Вячеслав Николаевич, студент группы ПМСАУ-97-1 факультета прикладной математики и менеджмента ХТУРЭ. Научные интересы: теория вероятностей. Адрес: Украина, 62040, пгт. Дергачи, ул. Суворова 7, тел. (263) 3-33-61.

Кобылинский Константин Валерьевич, студент группы ПМ- 97-1 факультета прикладной математики и менеджмента ХТУРЭ. Научные интересы: теория вероятностей и математическая статистика. Адрес: Украина, 61183, Харьков, ул. Дружбы Народов, 267, кв. 108.

Котелевцев Александр Владимирович, студент группы ПМ- 97-1 факультета прикладной математики и менеджмента ХТУРЭ. Научные интересы: теория вероятностей, функциональный анализ. Адрес: Украина, 61105, Харьков, пер. Забайкальский, 4, кв. 13, тел. (0572) 5140-46.

Шершень Владислав Николаевич, студент группы ПМСАУ-97-1 факультета прикладной математики и менеджмента ХТУРЭ. Научные интересы: случайные процессы, линейная алгебра. Адрес: Украина, 61147, Харьков, пр. Людвига Свободы, 51б, комн. 213.

УДК 007.681.518.2:628.3

РАЗРАБОТКА МЕТОДА ПРИНЯТИЯ РЕШЕНИЙ НА ОСНОВЕ ПРИСОЕДИНЕННЫХ ПРОЦЕДУР НЕЧЕТКОГО ВЫВОДА НА ЗНАНИЯХ

БЕЛОГУРОВА А.В._________________________

Для идентификации виновников загрязнения рек предлагается MYCIN-подобный метод нечеткого вывода на знаниях, который базируется на известных процедурах учета неопределенности присоединенного типа, но ориентирован на продукционную модель предметной области задачи. Метод реализует процедуру учета неопределенности, предложенную в системе MYCIN, со схемой вывода из системы PROSPECTOR, что позволяет соединить сильные стороны обоих подходов.

Анализ процессов принятия решений в экспертных системах показывает, что процедуры учета неопределенности занимают в них важное место. В данной статье рассматриваются механизмы нечеткого логического вывода присоединенного типа, в которых именно метод учета неопределенности является наиболее важным и определяющим основные черты используемой схемы вывода. Целями статьи являются анализ наиболее известных механизмов нечеткого вывода, разработка нового алгоритма и проверка полученных результатов на реальной задаче выявления виновников загрязнения водного объекта.

1. Сравнительный анализ существующих схем нечеткого вывода

Самыми известными представителями экспертных систем, реализующих присоединенные процедуры

учета неопределенности, являются системы MYCIN (диагностика и лечение инфекционных заболеваний крови) и PROSPECTOR (разведка рудных месторождений). Обе системы реализуют вероятностный подход к оценке правдоподобия факта, но вид оценок и формулы для их пересчета при связи “КОМБ” для них различаются.

В системе PROSPECTOR используется оценка правдоподобия факта в виде шанса

W(A) = P(%A); W(A) є (0, <ю),

где Р(А) — вероятность истинности факта А; P(A) -вероятность ложности факта А [2,5]. Особенность базы правил системы PROSPECTOR заключается в том, что каждому правилу A ^ B приписывается пара оценок LS и LN. Оценка LS указывает, насколько наше доверие к факту В возрастает при установлении истинности факта А, а LN - насколько наше доверие к факту В падает из-за установления факта A [4,5].

В системе MYCIN степень доверия к фактам и правилам выражена коэффициентом уверенности

CF(A) є[-1,1. Говорят, что CF(A) > 0 определяет меру доверия к факту, а CF(A) < 0 - меру недоверия к факту А [3,6]. Мера CF(B|A) показывает, насколько истинность факта А подтверждает (опровергает) истинность факта В.

Оба метода при связи по “И” или по “ИЛИ” используют обычные правила нечеткой логики. Существенные различия наблюдаются в методах вычисления мер определенности фактов при связи “КОМБ”. Метод системы PROSPECTOR ориентирован на теорему Байеса. Исходными данными при этом являются:

64

РИ, 2001, № 1

Р(В) - априорная вероятность истинности факта В;

Р(А) - априорная вероятность истинности факта А;

Р(В|А) - условная вероятность истинности (ложности) факта В при установлении истинности факта

А; P(B | A) - условная вероятность истинности (ложности) факта В при установлении ложности факта А.

Начальные значения априорных вероятностей всех фактов составляют 1/2. Распространение информации по сети вывода начинается, когда в систему поступают факты с апостериорной информацией

P(A||) * X [2].

Исходными при расчете по связи “КОМБ” являются: P(B||Д, P(B||2),---,P(B|Ik) - подтверждение факта В различными k путями; Р(В) — априорная вероятность истинности В.

Необходимо определить обьединенную вероятность истинности факта В P(B | |ь—,|k). Расчет производится по следующим формулам:

P(B|li,-, Ik)

W(B||b-, Ik)

1 + W(B||i,-, Ik)

(1)

W(B||i,-,Ik) = Xi-X2 ....-Xk • W(B), (2)

x. = W(B||j)

1 W(B) ’

(3)

W(B)

P(B)

P(B)

(4)

В системе MYCIN для расчета по связи “КОМБ” предложена эвристическая функция:

CF[B,AW] =

1, если CF[B, A1] = 1 или CF[B, A2 ] = 1, а CF[B, A1 ] + CF[B, A2 ] - CF[B,A1 ] • CF[B, A1 ], если CF [B, A1 ] > 0 и CF[B, A2 ] > 0, б CF[B, A1 ] + CF[B,A2], если CF [B, A1 ] • CF[B, A2 ] < 0,

CF[B,A1] *+1 и CF[B,A2] *+1, в

CF[B, A1 ] + CF[B,A2] + CF[B,A1]• CF[B,A2], ’ (5) если CF [B, A1 ] < 0 и CF[B,A2] < 0, г

-1, если CF[B, A1 ] = -1 или

CF[B, A2 ] = -1. д

Применение формулы (5) связано с двумя особенностями:

1. Коэффициент уверенности CF, полученный из трех и более различных доказательств, надо выводить, последовательно применяя (5) к полученному на предыдущем шаге общему CF и к одному из их перечня, пока он не исчерпается.

2. При получении нескольких разнознаковых CF сначала необходимо разбить их на группу подтверждающих и группу опровергающих, применить к каждой из них формулу (5) (б) и (г), а затем сложить разнознаковые результаты по (5) (в).

Из описанного выше можно увидеть, что для использования способа учета неопределенности по MYCIN от эксперта требуется задать меньшее количество параметров, чем для PROSPECTOR. Для более полного сравнения этих способов учета неопределенности была написана программа. Тестирование показало, что для задачи идентификации виновников загрязнения рек способ учета неопределенности по MYCIN предпочтительнее, чем по PROSPECTOR, так как дает более правдоподобные оценки.

Системы MYCIN и PROSPECTOR различаются также и по схеме вывода. В MYCIN применяется обратный логический вывод. PROSPECTOR имеет более развитую схему вывода. Для поиска нужного свидетельства применяется обратная цепочка логи -ческого вывода, а распространение информации по сети осуществляется по прямой цепочке вывода. Такая схема позволяет на каждом шаге для рассмотрения выбирать более достоверную гипотезу и таким образом ускорять поиск решения.

Анализируя предметную область задачи идентификации виновников загрязнения рек, можно заметить, что априорные вероятности гипотез, определяющих виновников и причины, не могут быть изначально равными 0,5 (как требуется в PROSPECTOR), поскольку для каждого случая экстремально высокого загрязнения (ЭВЗ) возможные виновники загрязнения различаются как основные (наиболее вероятные) и второстепенные (вероятность виновности для которых мала, но не настолько, чтобы их можно было исключить из рассмотрения). С другой стороны, схема вывода системы PROSPECTOR более гибкая, чем в системе MYCIN. Поэтому для решения задачи идентификации виновников загрязнения рек необходимо разработать свой метод нечеткого логического вывода, реализующий достоинства систем MYCIN и PROSPECTOR.

где CF[B,(A1,2)] — мера неопределенности свидетельства В, подтверждаемого (опровергаемого) по правилам A1 ^ B и A2 ^ B; CF(B,A1) — мера неопределенности факта В исходя из наличия факта А1; CF(B, A2) — мера неопределенности факта В исходя из наличия факта А2.

2. Описание MYCIN-подобного метода нечеткого вывода на знаниях

Для решения задачи идентификации виновников загрязнения рек разработан метод нечеткого логического вывода (MYCIN-подобный метод), ориентированный на модель предметной области. Этот метод характеризуется следующими основными чертами.

РИ, 2001, № 1

65

1. Ориентация на базу знаний продукционного типа с применением трех типов логических связей между фактами “И”, ”ИЛИ”, ”КОМБ”.

2. Представление меры неопределенности в виде скаляра W, W є [- U]. Меру неопределенности (далее вес) имеют факты и знания, представленные в виде правил. Принимается, что если факт имеет вес меньше нуля, то он вообще не достоверен. Если правило A ^ B имеет вес меньше нуля, то это означает, что наличие факта А опровергает истинность факта В.

3. Реализация трех функций пересчета мер неопределенности:

— функция, определяющая вес антецедента по весам его компонентов по обычным правилам нечеткой логики при связи по “И” или по “ИЛИ;

— функция, определяющая вес консеквента правила по весу его антецедента и весу самого правила Wr:

W(B) = h(W(A), Wr) = W(A) • Wr, при W(A) > 0; (6)

— функция, определяющая обобщенный вес W(B0) гипотезы B0, выведенной из консеквентов В1 и В2, имеющих веса W(B1) и W(B2) соответственно:

W(B0) = ^W(Bj),W(B2^ =

1, если W(Bj) = 1 или W(B2) = 1,

W(Bj) + W(B2) - W(B1) • W(B1),

если 0 < W(B1) < 1 и 0 < W(B2) < 1,

_ W(B1) + W(B2), если W(B1) • W(B2) < 0,

W(B1) *+1 и W(B2) *+1, (7)

W(B1) + W(B2) + W(Bj) • W(B2),

если -1 < W(Bj) < 0 Ц -1 < W(B2) < 0,

-1, если W(Bj) = -1 или W(B2) = -1.

Функция g(«) совпадает с аналогичной функцией (5) в системе MYCIN и должна применяться с теми же особенностями, которые указаны в разделе 1. Схема вывода для MYCIN-подобного метода реализует комбинированную цепочку вывода, как в системе PROSPECTOR.

Таким образом, процесс решения задачи разработанным методом представляет собой итерационный цикл, состоящий из четырех этапов.

1. Выбор следующей гипотезы осуществляется по приоритету. Сначала, когда гипотезы имеют нулевые веса, приоритетом является величина априорно возможной вины эвентуального источника загрязнения (априорной вероятности соответствующей гипотезы) при характеристиках данного ЭВЗ (чем больше возможная вина, тем выше приоритет). Когда гипотезы получают некоторые веса, то приоритетом становится сам вес (чем выше вес, тем выше приоритет).

2. Выбор свидетельства, для которого необходимо получить информацию на данной итерации, осуще-

ствляется по обратной цепочке вывода от выбранной на прошлом этапе гипотезы. Пользователь отвечает по шкале [-5, 5], как в PROSPECTOR, где

ответ Re = 5 означает абсолютную истинность Е,

Re = -5 означает абсолютную истинность факта

E, а Re = 0 — невозможность получения ответа. Фактически такое свидетельство выпадает из рассмотрения. Вес полученного факта определяется путем деления Re на пять. Такая методика позволяет дифференцировать уверенность пользователя в истинности фактов.

3. Пересчет весов всех возможных антецедентов, консеквентов и гипотез выполняется в соответствии с формулами (6), (7) по прямой цепочке вывода. Пересчет весов возможен для тех фактов, которые могут быть выведены из имеющегося на данный момент набора ответов пользователя. При этом все обработанные правила разделяются на группы “выполнившиеся” и “невыполнимые” для этой консультации. Выполнившимся называется такое правило, для которого в рабочей области памяти ЭС есть данные, полностью подтверждающие антецедент этого правила. Невыполнимым называется такое правило, для которого в рабочей области памяти ЭС есть данные, противоречащие его антецеденту.

4. Выработка заключений осуществляется, когда все правила разделены на “выполнившиеся” и “невыполнимые”. В результате вывода некоторые гипотезы получают отрицательные веса, это означает, что они не подтвердились. Все ИЗ, соответствующие гипотезы которых имеют вес больше нуля, считаются виновными с мерой, соответствующей весам гипотез. Информация об источниках загрязнения выдается пользователю для окончательного заключения. Пользователь может решить, провести ли дополнительное расследование или признать виновным один, несколько или все ИЗ, определенные ЭС.

Разработана блок-схема алгоритма. Программа, реализующая алгоритм приведенного метода, написана на языке BASIC.

3. Решение задачи идентификации виновников загрязнения рек

Задача состоит в том, чтобы по результатам измерения показателей качества речной воды и по априорным данным о множестве возможных источников загрязнения реки определить тот источник, действия которого привели к появлению чрезвычайной ситуации на данном водном объекте. Математическая постановка данной задачи приведена в работе [1].

В данном случае вычислительные эксперименты проводятся для участка реки Северский Донец в районе г.Рубежное и Северодонецк. В качестве тестовой ситуации принят реальный факт ЭВЗ реки фенолами. Исходные данные для решения задачи взяты из документов комиссии, расследовавшей данную ситуацию. Эти исходные данные позволя-

66

РИ, 2001, № 1

ют провести представительное количество вычислительных экспериментов, поскольку возможное число вариантов ситуаций ЭВЗ только при бинарных ответах пользователя (“да” и “нет”) составляет 29, а общее число ответов по целочисленной ткале от -5 до 5 равно 119.

— не реагирует на изменение соотношения между исходными условными вероятностями, если их сумма равна единице (см. верхнюю группу строк таблицы), и очень слабо реагирует, если эта сумма постоянна, но не равна единице (см. вторую группу строк);

Проведенные вычислительные эксперименты позволили сравнить два метода расчета весов для схемы “КОМБ”: метод, предложенный в системе MYCIN (см. формулу (5)), и метод системы PROSPECTOR (выражения (1)-(4)). Необходимость проведения такого эксперимента вызвана отсутствием теоретического сопоставления этих двух методов.

Выборочные результаты вычислений апостериорной вероятности по схеме “КОМБ” методами, использованными в ЭС MYCIN и PROSPECTOR, приведены в таблице. Параметрами, которые необходимо было изменять в целях исследования вычислительных характеристик алгоритмов, являются условные вероятности P(B0|B1)=p1, P(B0|B2)=p2 и априорная вероятность Р(В0)=р. Результаты расчета апостериорной вероятности по схеме “ КОМБ”

приведены в строках

MYCIN

PROSPECTOR .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

P1.P2 P 0.1,0.9 0.1 0.2,0.8 0.1 0.3,0.7 0.1 0.4,0.6 0.1 0.5,0.5 0.1

MYCIN 0.91 0.84 0.79 0.76 0.75

PROSPECTOR 0.9 0.9 0.9 0.9 0.9

P1.P2 0.15,0.95 0.2,0.9 0.3,0.8 0.4,0.7 0.6,0.5

P 0.1 0.1 0.1 0.1 0.1

MYCIN 0.96 0.92 0.86 0.82 0.8

PROSPECTOR 0.97 0.95 0.94 0.93 0.93

P1T2 P 0.1,0.1 0.1 0.1,0.2 0.1 0.1,0.3 0.1 0.1,0.4 0.1 0.1,0.8 0.1

MYCIN 0.19 0.2 8 0.37 0.46 0.82

PROSPECTOR 0.1 0.2 0.3 0.4 0.8

P1.P2 P 0.5,0.6 0.5 0.6,0.5 0.6 0.6,0.5 0.7 0.6,0.5 0.8 0.6,0.5 0.9

MYCIN 0.8 0.8 0.8 0.8 0.8

PROSPECTOR 0.6 0.5 0.39 0.27 0.14

Результаты экспериментов показали, что для расчетов по схеме “КОМБ” метод системы MYCIN является более предпочтительным, так как метод системы PROSPECTOR:

— не учитывает влияния малых значений условных вероятностей (см. третью группу строк таблицы);

— при увеличении априорной вероятности уменьшает апостериорную (см. нижнюю группу строк), что для данной задачи экспертами считается неверным.

Следует заметить, что в последнем случае и MYCIN дает результаты, не соответствующие представлениям экспертов (его “КОМБ” вообще не зависит от априорной вероятности), однако это все же считается более приемлемым, чем результаты системы PROSPECTOR. Изложенное показывает, что в задаче идентификации виновников загрязнения рек для пересчета вероятностей по схеме “КОМБ” формулы (5) более приемлемы, чем формулы (1) -

(4).

Вычислительные эксперименты показали, что разработанный MYCIN-подобный метод нечеткого вывода свободен от этих недостатков и вполне пригоден для решения задачи идентификации виновников загрязнения рек.

Литература: 1. Белогурова А.В. Идентификация виновников аварийного загрязнения воды // АСУ и приборы автоматики. Харьков: ХТУРЭ. 1997. № 105. C. 112-116. 2. Ивашко В.Г., Кузнецов С.О. Оценки правдоподобия в продукционных экспертных системах // Экспертные системы: состояние и перспективы. М.: Наука. 1989. С. 92-103. 3. Представление и использование знаний: Пер. с япон. / Под ред. Х. Уэно, М. Исидзука. М.: Мир, 1989. 220 с. 4. Уотермен Д. Руководство по экспертным системам: Пер. с англ. М.: Мир, 1989. 388 с. 5. Development of the PROSPECTOR consultation system for mineral exploration: SRI Report / Duda R., Hart P.E., Nilsson N.J. et al. - Stanford Research Institute, CA (uSa), 1978. 6. Shortlife E., Buchanan B. A model of inexact reasoning in medicine // Math. Biosciences. 1975. Vol.23. P. 351-379.

Поступила в редколлегию 21.07.2000

Рецензент: д-р физ.-мат. наук Коваленко Г.Д.

Белогурова Анна Викторовна, канд. техн. наук, ассистент кафедры прикладной математики и вычислительной техники Харьковской академии городского хозяйства. Научные интересы: принятие решений в экспертных системах, методы оптимизации. Хобби: туризм. Адрес: Украина, 61000, Харьков, ул. Уборевича, 12, кв. 204, тел. 45-90-31.

РИ, 2001, № 1

67

i Надоели баннеры? Вы всегда можете отключить рекламу.