Научная статья на тему 'Представление разнотипных знаний в системах поддержки принятия решения'

Представление разнотипных знаний в системах поддержки принятия решения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
131
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРЕДСТАВЛЕНИЕ ЗНАНИЙ / РАЗНОТИПНЫЕ ДАННЫЕ / СТОХАСТИЧЕСКИЕ ИНДИКАТОРЫ / ФУНКЦИЯ ПРИНАДЛЕЖНОСТИ / DIVERSE DATA / IDENTITY FUNCTION / KNOWLEDGE REPRESENTATION / STOCHASTIC INDICATORS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Морозов Д. В.

Рассмотрены проблемы приведения точных, вероятностных и нечетких данных к единому формальному представлению для дальнейшей обработки в системах поддержки принятия решения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Морозов Д. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Representation of Diverse Knowledge in the Systems of Decision-Making Support

The problems of accurate, probable and fuzzy data reduction to single formal representation for further processing in the systems of decision-making support are considered.

Текст научной работы на тему «Представление разнотипных знаний в системах поддержки принятия решения»

УДК 044.82

ПРЕДСТАВЛЕНИЕ РАЗНОТИПНЫХ ЗНАНИЙ В СИСТЕМАХ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЯ

Д.В. Морозов

Кафедра «Автоматизированные системы управления» Тамбовское высшее военное авиационное инженерное училище радиоэлектроники (военный институт)

Представлена членами редколлегии профессором Ю.Л. Муромцевым и профессором В.И. Коноваловым

Ключевые слова и фразы: представление знаний; разнотипные данные; стохастические индикаторы; функция принадлежности.

Аннотация: Рассмотрены проблемы приведения точных, вероятностных и нечетких данных к единому формальному представлению для дальнейшей обработки в системах поддержки принятия решения.

Формальное представление знаний в системах поддержки принятия решения (С1111Р) определяется как представление знаний, а компонент, который использует для решения проблем знания экспертов, описанные в заранее выбранной для них форме представления, является механизмом вывода. В системах с базами знаний представление знаний является фундаментальным понятием, а решение о выборе способа представления знаний оказывает влияние на любую их составную часть. Можно сказать, что представлением знаний определяются возможности системы обработки знаний, и наоборот, чтобы система обработки знаний отвечала определенным прикладным потребностям, должно быть создано соответствующее представление знаний [3].

Для решения задачи формализации и конструирования знаний об объекте планирования, как о сложной системе будем использовать фреймовую модель представления знаний. Тогда в качестве структурированных знаний будут выступать фреймы или фреймовые системы.

Цель работы - изложение подхода к проблеме представления разнотипных знаний в интеллектуальных системах на основе фреймовых структур с целью дальнейшей разработки адекватного математического аппарата для формальной обработки разнородной информации.

Фреймом или фреймовой системой М\ будем называть специальную информационную структуру, отображающую некоторую часть множества информационных характеристик объекта х{.

х =( А А),

где АI - множество имен свойств (атрибутов) /-го объекта; В, - множество доменов соответствующих атрибутов.

М, = (ш; р, Р2, ..., Рп),

где ш - имя фрейма (понятия); Р1, Р2, ..., Рп - слоты фрейма, описывающие его, либо субфрейм нижнего уровня [2].

Предлагаемый подход к общему представлению точных, вероятностных и нечетких знаний в СППР в условиях неопределенности базируется на построении обобщенного класса М = {Мт,Мн,Мв } моделей, удовлетворяющих специфическим ограничениям подклассов точных Мт, нечетких Мн и вероятностных Мв знаний, и обусловлен общим принципом векторно-матричного описания признаков объекта с доменным представлением его характеристик в единой структуре информационного пространства фрейм-моделей (рис. 1).

Относительно структурной сложности модели являются разноуровневыми и представляют собой формализованные порции информации с указанным смыслом (семантикой). Например, число или числовой кортеж описывается фреймом 0-го уровня; вектор или функция - фреймом 1-го уровня; матрица или композиция функций - фреймом 2-го уровня и т.д. Такая структуризация знаний обеспечивает возможность разработки проблемно-ориентированных методов принятия решений в различных условиях неопределенности, используя точные, нечеткие или вероятностные модели знаний.

Фрейм 1-го уровня представляет собой осмысленную, поименованную структуру данных об объекте предметной области (ОПР) в виде конечного доме-низированного вектора, домены которого разделены двоеточием « : » и отвечают признакам (разнотипным характеристикам) объекта, а компоненты доменов -значениям признаков. В детерминированном подходе (при оперировании точными данными) /-я компонентау-го домена должна содержать «1», если наблюдается 1-е значениеу-го признака ОПР, в противном случае /-я компонента равна «0».

/1 Л =

} л2 } 01:0010:010

/Г B =

} л2 } 10:0100:010

Если каждый домен фрейма 1-го уровня содержит строго по одной «1» в каждом домене, то он называется элементным, в противном случае - интервальным векторным фреймом. Например, точкам А и В пространства фрейм-моделей на рис. 1 соответствуют элементные векторные фреймы с семантическими кодами

/1хА и /1хВ точных знаний [5].

Заштрихованному интервалу С на рис. 1 отвечает точный интервальный векторный фрейм 1-го уровня

fiTC =

xi х 2 х 3 11:0110:010

Заметим, что интервальный /1С можно представить матричным точным

фреймом 2-го уровня /2£С, состоящим из объединения 4-х элементных векторных фреймов 1-го уровня [5]

f2TC =

Л1 л 2 А 3 11:0010:010

10:0010:010

01:0100:010

10:0100:010

При оперировании вероятностными величинами значения признака приобретают стохастический характер, например.

X ={1

pi = 0,2 V1

p2 = 0,8 V1

р3 = 0}.

(1)

Запись 1

р}- означает вероятность того, что ]-я компонента /-го домена равна 1.

Если же само понятие домена определено плохо, то для описания понятия или ситуации применяется нечеткая форма представления объекта.

х ={ д1 = 0,35 д2 = 0,95 д3 = 0,35}. iVXi xi J

(2)

Также, само понятие может быть вполне определенной величиной, но вероятность того, что компонента домена примет истинное значение, определена плохо.

Вычислим вероятности случайных величин в выражении (1), для чего введем и определим некоторые математические понятия теории стохастической индикации [4].

Индикатором множества А называется функция вида

IA = IA (х=

(1, х е A;

0, х g A.

(3)

Для заданной функции / (х)

/ ч / ч Г / (х), х е А; 'а (Х) 7 (Х) = {0 х 1 .А. <4)

Пусть множество А с и является случайным событием (где и - универсальное множество, достоверное событие). Тогда его стохастический индикатор ю а будет представлять собой случайную величину со следующими свойствами:

|Х если А произойдет; со. = { (5)

10, если А не произойдет (произойдет -А).

ФооА (ю) (ю) + р5(ю-1); (6)

^ (ю) =qД(ю) + рД(ю-1), (7)

где фщА - плотность распределения стохастического индикатора щ а ; РщА - его функция распределения; р = Р (А); q = 1 - р = Р (0.).

Итак, с учетом (5) - (7) осуществляется переход от случайных событий к случайным величинам - их индикаторам:

р = Р (А ) = Р ( ЮА = 1)= М [ЮА ]= ЮА. (8)

Пусть и - множество действительных чисел (действительная прямая либо, в общем случае, векторное пространство); и2 = ихи - двумерное множество действительных чисел (действительная плоскость); а, Ь - константы (возможно векторные); у, 2 - переменные (возможно векторные); <, >, <, > - отношения порядка.

Тогда а < Ь, а > Ь, а < Ь, а > Ь - высказывания; 2 < а, 2 > а, 2 < Ь, 2 > Ь - одноместные предикаты; 2 < у, 2 > у, 2 < у, 2 > у - двухместные предикаты.

Если, например, 2 является случайной величиной, то, например, А @ (2 < а) также будет являться случайным событием, тогда

/ а

р = Р (А ) = Р (2 < а)= / (2) = (а). (9)

Пусть ю а - стохастический индикатор множества А = (—¥, а). Тогда из выражений (8) и (9) следует, что Р (ю. = 1) = (а), и выражения (6), (7) примут вид:

фю (ю)= Щ (а) 5 (ю) + ^ (а) 5 (ю -1), (10)

ю А

^ (ю) = Щ (а) Д (ю) + ^ (а) Д (ю -1). (11)

ю А

Пусть 2 < у - двухместный предикат. Ситуация, в которой соответствующее этому предикату высказывание истинно, может быть неопределенной как по одной (любой), так и по двум переменным.

Допустим что Ау @ (Т < у), тогда

p = р (у) = Р (Лу ) = Р (Т < у)= У ёЕ, (т) = Е,^ ( у) = Р [сол (у) = 1], (12)

—¥

где Юл (У) - стохастический индикатор множества Лу = (—¥,у), законы распределения которого имеют следующие выражения:

Фшл (ю;у)= Я, (У)5(Ю)+ Е, (У)5(Ю — 1); (13)

л У

рюлу (ю;у)= К2 (У)Д (Ю) + ^ (У) д (Ю — 1), (14)

а числовые характеристики определяются следующим образом:

Г 1 ¥

МIССЛ (У) I = ЮЛ (У) = 1 Ю^Ю л (ю;у) = Е, (у) ; (15)

I- -1 Лу

—¥

М [шл (У)] = ЮЛ (У) = Е, (у); (16)

Б [Ю Л (У)] = С Л (У) = С Л (У) — С Л (У) = Е, (у) Я т (у). (17)

Таким образом, если переменная Т случайна, то в предикате Т < а константа а определяет границу детерминированного множества Л = (—¥,а), а в предикате Т < у переменная у определяет границу переменного множества Лу =(—¥,у),

при попадании в которое случайной величины Т индикаторы ш л и шл (У) принимают значение 1.

Из всего вышеизложенного следует, что для практического применения математического аппарата стохастических супериндикаторов необходимо знать законы их распределения. Для теоретического обоснования методов определения этих законов применяются специальные теоремы о функциях распределения супериндикаторов [4].

Далее стоит задача оптимального выбора критерия достоверности вероятностной величины каждой соответствующей компоненты домена (1). Для решения этой задачи воспользуемся теоремой Сэвиджа об ожидаемой полезности [6].

Пусть - множество состояний, X - множество исходов, а Е - множество всех функций на 5 со значениями в X. Пусть Л, В с 5; х, у е X и f, g е Е. Отношение Р на Е является исходным бинарным отношением, а отношения безразличия ~ и нестрогого предпочтения < определяются как обычно.

Тогда, если отношение Р * определено на множестве всех подмножеств 5 посредством А Р * В ^ / Р g, если (х Р у , / = у на Л, /= х на Лс, g = у на В,

g = х на В°), то на семействе всех подмножеств 5 существует единственная веро-

*

ятностная мера Р , удовлетворяющая соотношению

А Р* В ^ Р*(А) < Р*(В) для всех А, В с 5, (18)

и обладающая следующим свойством:

(В с 5, 0 < р < 1) ^ Р*(С) = рР*(В) (19)

для некоторых С с В .

Кроме того, при таком Р * существует вещественнозначная функция и на X, для которой

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

П " (20)

f Р g E u (f (s)), P* < E u (g (s)), P

для всех f, g е Е, и если функция и удовлетворяет этому соотношению, то она ограничена и единственна с точностью до положительного линейного преобразования.

Для реальных систем также характерно наличие неформализованной разнородной информации, такой как лингвистические критерии и ограничения, экспертные заключения, информация о режимах функционирования подсистем, областях допустимости и эффективности, целевых функциях, предпочтительности одних режимов работы перед другими, о риске работы на каждом из режимов для подсистем и т. д.

Поэтому необходимо учитывать нечеткую информацию при конструировании моделей разноуровневых неоднородных знаний.

Нечеткое подмножество А множества Б характеризуется функцией принадлежности т. : Б ® [0,1], которая ставит в соответствие каждому элементу ё е Б

число т. (ё) из интервала [0, 1], характеризующее степень принадлежности элемента ё подмножеству А. Причем 0 и 1 представляют собой соответственно низшую и высшую степени принадлежности элемента к определенному подмножеству [1].

Запись отдельного нечетко-определенного домена принимает вид х ={°°1} при д3е Одоп, д1, Д21 Одоп,

где т1, т2 , I 3 - значения функции принадлежности нечеткого понятия || х, в

точках ее пересечения с фиксированными детерминированными значениями соответствующих компонент точного домена (рис. 2); Одоп - область допустимых значений для функции принадлежности - носитель нечеткого понятия с учетом введенных экспертных ограничений.

Таким образом, ставится задача построения функции принадлежности для нечеткого понятия и определения области Одоп или максимизирующего множества.

Функция принадлежности должна быть согласована отношением

ДБ (^ )£ ДБ (у2 V р ^ (21)

где У1, У2 - две альтернативы.

На практике применяются методы определения функций принадлежности по выборкам и на основании априорной информации, в которую входят ограничения на эти функции. Если априорной информации недостаточно, приходится прибегать к эвристическим методам нахождения этих функций. В [1] представлены основные применяемые функции принадлежности.

Задача принятия решения для нечетких множеств по существу сводится к синтезу глобального критерия, на основании которого исчисляются значения функции принадлежности в точках, соответствующих детерминированным (заданным экспертами) альтернативам (значениям домена)

компоненты компоненты компоненты понятия

домена домена домена

Рис. 2. Функция принадлежности для нечеткого представления домена

ц(V) = ц[/! (V) ,...-к (V)] (22)

и далее делается вывод о принадлежности заданных значений домена нечетко заданному понятию (ситуации), то есть вывод о присвоении признаку единичного либо нулевого значения (см. рис. 2).

Выражение (22) должно удовлетворять условию [6]

Ц[ -1 (V) ,...Л (V)] = Ц[ц (V),...,ц* (V)] . (23)

Это может быть достигнуто путем правильного выбора частных критериев. Причем

-, (V) +-,

Цу (V ) = , (24)

где I у - максимальное значение у-го критерия; - минимальное значение у-го критерия.

Построенный согласно этим требованиям критерий ц у (V) является показателем степени принадлежности нечеткого понятия к подмножеству допустимых (точных) определений в домене и изменяется на интервале [0,1], что соответствует определению функции принадлежности Заде. Поэтому к сформированным таким образом критериям применимы минимаксные операции Заде, и решение многокритериальной задачи может быть записано в виде

Цв М = Ц1 Мл...лцк (у) . (25)

Таким образом, получен механизм представления точных, вероятностных и нечетких данных единой моделью, что позволяет в дальнейшем обрабатывать

такие знания обобщенными методами. Фреймовые конструкции знаний являются сложными многоуровневыми моделями, формируемыми на основании экспертной информации. Вероятностные величины формируются на основе математического аппарата стохастических индикаторов и преобразуются к принятому виду представления знаний на основании теоремы Сэвиджа. Приведение нечетких знаний к виду фреймовых моделей требует синтеза глобального критерия, на основании которого строится функция принадлежности для плохо определенного объекта и определяется максимизирующее множество функции. Если детерминированная величина домена является элементом данного множества, то ей присваивается единичное значение.

Список литературы

1. Алтунин, А.Е. Модели и алгоритмы принятия решений в нечетких условиях / А.Е. Алтунин, М.В. Семухин. - Тюмень : Изд-во Тюмен. гос. ун-та, 2000. -352 с.

2. Новосельцев, В.И. Системный анализ / В.И. Новосельцев. - Воронеж : Кварта, 2002. - 320 с.

3. Осуга, С. Обработка знаний / С. Осуга. - М. : Мир, 1989. - 164 с.

4. Петухов, Г.Б. Методологические основы внешнего проектирования целенаправленных процессов и целеустремленных систем / Г.Б. Петухов, В.И. Якунин. -М. : АСТ, 2006. - 504 с.

5. Сироджа, И.Б. Квантовые модели и методы искусственного интеллекта для принятия решений и управления / И. Б. Сироджа. - Киев : Наукова думка, 2002. - 490 с.

6. Фишберн, П. Теория полезности для принятия решений / П. Фишберн. -М. : Наука, 1978. - 352 с.

Representation of Diverse Knowledge in the Systems of Decision-Making Support

D.V. Morozov

Department «Automated Systems of Control», Tambov Higher Military Aviation Engineering College of Radio-Electronics (Military Institute)

Key words and phrases: diverse data; identity function; knowledge representation; stochastic indicators.

Abstract: The problems of accurate, probable and fuzzy data reduction to single formal representation for further processing in the systems of decision-making support are considered.

Darstellung der uneinheitlichen Kenntnisse in den Systemen der Unterstützung der Beschlussannahme

Zusammenfassung: Es sind die Probleme der Anführung der genauen, wahrscheinlichen und nicht deutlichen Daten zur einheitlichen formalen Darstellung für die weitere Bearbeitung in den Systemen der Unterstützung der Beschlussannahme untersucht.

Représentation des connaissances de différents types dans les systèmes du maintient de la prise des solutions

Résumé: Sont examinés les problèmes de la réduction des données exactes, éventuelles et vagues à une représentation unifée pour le traitement ultérieur dans les systèmes du maintient de la prise des solutions.

i Надоели баннеры? Вы всегда можете отключить рекламу.