Научная статья на тему 'Апостериорные оценки вероятностей в идеале конъюнктов∗)'

Апостериорные оценки вероятностей в идеале конъюнктов∗) Текст научной статьи по специальности «Математика»

CC BY
150
56
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АЛГЕБРАИЧЕСКАЯ БАЙЕСОВСКАЯ СЕТЬ / НЕОПРЕДЕЛЕННОСТЬ ЗНАНИЙ / ФРАГМЕНТ ЗНАНИЙ / ЛОКАЛЬНЫЙ АПОСТЕРИОРНЫЙ ВЫВОД / СВИДЕТЕЛЬСТВО / НЕПРОТИВОРЕЧИВОСТЬ / ALGEBRAICAL BAYESIAN NETWORK / KNOWLEDGE UNCERTAINTY / KNOWLEDGE PATTERN / LOCAL A POSTERIORI INFERENCE / EVIDENCE / CONSISTENCY

Аннотация научной статьи по математике, автор научной работы — Тулупьев Александр Львович

Предложен подход к вычислениям апостериорных оценок элементов идеала конъюнктов при свидетельствах различного вида (детерминированном, стохастическом, неточном). Показано, что такого рода локальный апостериорный вывод выполняется либо согласно определению условных вероятностей, либо возникающие экстремальные задачи сводятся к серии задач линейного программирования. Если совокупность апостериорных оценок удается получить, она непротиворечива. Библиогр. 15 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Posteriori probabilistic estimates in conjuncts ideal

The paper presents an algorithm for evidence propagation in a conjuncts ideal in order to calculate a posteriori probabilistic estimates of the ideal elements. Calculations are reduced either to those in the conditional probability definition or to solving a linear problems series. If the a posteriori estimates are feasible, they are also consistent.

Текст научной работы на тему «Апостериорные оценки вероятностей в идеале конъюнктов∗)»

Сер. 10. 2010. Вып. 1

ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

УДК 004.8 А. Л. Тулупьев

АПОСТЕРИОРНЫЕ ОЦЕНКИ ВЕРОЯТНОСТЕЙ В ИДЕАЛЕ КОНЪЮНКТОВ *>

Настоящая работа опирается на систему терминов, обозначений и результатов из ряда источников [1—8], посвященных теории алгебраических байесовских сетей (АБС).

АБС - это набор идеалов конъюнктов, причем каждому конъюнкту приписана оценка его вероятности, а сам набор в общем случае снабжен структурой графа смежности [5, 6]. С точки зрения исследований в области искусственного интеллекта, такого рода идеалы конъюнктов могут быть рассмотрены как логико-вероятностные модели фрагментов знаний с неопределенностью, а сама АБС - как модель базы фрагментов знаний. Для краткости идеал конъюнктов с определенными на нем оценками вероятностей называется далее фрагментом знаний (ФЗ).

Когда АБС уже построена и ее элементам назначены оценки вероятности, встает, в частности, вопрос о том, как обработать свидетельство, поступившее в один из ФЗ АБС.

В теории АБС свидетельства представляются как ФЗ. Три вида свидетельств: детерминированные, стохастические и неточные (неопределенные) - выделяются согласно виду оценок в таком ФЗ: бинарных, скалярных (точечных), интервальных соответственно [1, 3-5, 7]. Детерминированное свидетельство может быть рассмотрено как стохастическое, а стохастическое - как неточное. Стохастическое и неточное свидетельства называются недетерминированными.

Цель работы - предложить математические модели для представления свидетельств указанного выше вида и трактовку их вероятностной семантики, а также описать подход в сжатом виде, который позволит учесть влияние поступившего свидетельства на оценки вероятностей в ФЗ, т. е. предложить схему локального апостериорного вывода (вывода апостериорных оценок истинности в ФЗ).

1. Виды свидетельств. Пусть о ситуации или объектах в предметной области становится что-то известно: поступает свидетельство (оно может быть атомарным или составным, т. е. кортежем свидетельств). Требуется рассчитать оценки апостериорных вероятностей элементов ФЗ, а уже на основе изменившихся оценок может быть принято или отвергнуто какое-то решение.

Тулупьев Александр Львович — кандидат физико-математических наук, доцент кафедры информатики математико-механического факультета Санкт-Петербургского государственного университета, ведущий научный сотрудник Санкт-Петербургского института информатики и автоматизации РАН. Количество опубликованных работ: 155. Научные направления: представление и обработка данных и знаний с неопределенностью, применение методов математики и информатики в социокультурных исследованиях, применение методов биостатистики и математического моделирования в эпидемиологии, технология разработки программных комплексов с СУБД. E-mail: ALT@iias.spb.su, ALT4488@peterstar.ru.

Часть публикуемых материалов получена в рамках работы, выполненной при финансовой поддержке Российского фонда фундаментальных исследований (грант № 09-01-00861-а).

© А. Л. Тулупьев, 2010

В простейшем случае вычисление апостериорной вероятности сводится к расчету условной вероятности вида р^\Е), где Z - интересующее нас утверждение (конъюнкция литералов), а Е - поступившее свидетельство. Вместе с тем не всегда расчет оценки апостериорной вероятности может быть выполнен по формуле из определения условной вероятности. Кроме того, свидетельство не обязательно представляет собой утверждение, которое истинно (или ложно) с вероятностью 1, да и его компоненты могут находиться между собой в некоторой недетерминированной зависимости.

В первую очередь решим задачу представления свидетельств в рамках теории АБС на логико-вероятностном языке, затем рассмотрим способы распространения их влияния в ФЗ на частных примерах и, наконец, коснемся вопроса о непротиворечивости получающихся апостериорных оценок.

Часто вместо слов «распространение влияния свидетельства» говорят «пропагация свидетельства». Она возможна не только в отдельно взятом ФЗ, но также в цепи ФЗ и ациклической сети [4].

Как было отмечено ранее, свидетельства делятся на два класса: атомарные и составные (иначе говоря, сложные свидетельства или кортежи свидетельств). Атомарное свидетельство строится над одной атомарной пропозициональной формулой; составное свидетельство содержит в себе сведения об истинности небольшого числа пропозициональных формул, сформированных над некоторым количеством атомарных.

Детерминированным атомарным свидетельством являются сведения о том, что какое-то утверждение, соответствующее атомарной пропозиции, оказалось либо истинным, либо ложным. Например, установлено, что утверждение х истинно; тогда соответствующее свидетельство запишется как (х). Если же выявлено, что утверждение х ложно, свидетельство будет содержать в своей записи отрицание этой атомарной пропозиции: (х) .

Кортеж детерминированных свидетельств состоит из цепи атомарных детерминированных свидетельств, например или (х\х2), или (х\Х2), или (Х\х2), или (Х\Х2), или (х\х2х3) и т. д. Запись кортежа детерминированных свидетельств может приобретать вид (X), что служит сокращением для более длинной записи (X) = (х\х2 .. .хт).

Аналогично ^Х^ = (х^2 .. .хт). В последнем случае подчеркиваем, что интерес представляет некоторое означивание (а не все возможные) цепочки конъюнкций X, рассматриваемое в качестве поступившего кортежа детерминированных свидетельств. Далее такое обозначение чаще всего используется в формулах для описания пропагации недетерминированных (стохастических и неточных) свидетельств или их кортежей.

Обратим внимание, что апостериорная вероятность интересующего нас утверждения Z из АБС запишется в следующем виде:

• ра^\ (х)), при детерминированном свидетельстве (х);

• ра^\ (х)), при детерминированном свидетельстве (х);

• pa(Z\ (х)), при рассмотрении «общего случая» детерминированного свидетельства (х);

• ра^\ (х\х2)), при кортеже детерминированных свидетельств (х\х2);

• pa(Z\ ^Х^), при рассмотрении «общего случая» кортежа детерминированных

свидетельств X.

В частности, при поступлении свидетельства (х), если в ФЗ имеется скалярная оценка вероятности р(х^), можно рассчитать ра^\ (х)) по формуле из определения условной вероятности

ра{г\{х))=р{г\х) = ?Щ.

p(x)

Стохастическое атомарное свидетельство характеризуется апостериорной вероятностью своей истинности. В этом случае запись свидетельства выглядит таким образом: (p[a](X)), т. е. мы знаем апостериорную скалярную оценку вероятности всех двух означиваний x. (Здесь и далее предполагается, что апостериорное распределение вероятностей p[a] в свидетельстве задано непротиворечиво.)

Теперь обозначение апостериорной вероятности примет более сложный вид, поскольку, фактически, в качестве свидетельства поступает некоторое новое, апостериорное распределение вероятностей: pa(Z| (p[a](X))).

Кортеж стохастических свидетельств характеризуется апостериорным распределением вероятностей на конъюнкциях означиваний атомарных пропозициональных формул, входящих в кортеж. Формальная запись кортежа стохастических свидетельств (p[a] (X)^ или (p[a](XiX2 ... Xm)), т. е. известна апостериорная оценка вероятности всех

означиваний ^X^ = (X1X2 ... Xm). Заметим, что в теории АБС соответствующее распределение вероятностей задается на идеале вида {xi, X2,..., Xm}A как скалярные оценки вероятности истинности его элементов. Кроме того, подчеркнем, что апостериорное распределение вероятностей характеризует связи между атомарными свидетельствами и между их наборами. Возможность учитывать такие зависимости является важным свойством аппарата АБС, а также сказывается на результатах апостериорного вывода.

Апостериорное распределение вероятностей в случае кортежа стохастических свидетельств обозначается как

pa(Z )= p(Z |( p[a](X ))).

Если же представить себе семейство апостериорных распределений вида

Pr[X] = Pr[XiX2 . ..Xm],

[a]L J [a]L

заданное на идеале интервальными оценками вероятностей (обязательно непротиворечивыми!), то получим кортеж неточных свидетельств и как частный случай - отдельное неточное атомарное свидетельство. Такой кортеж запишется так:

p[a](X) е Pr[X ] ) или подробнее - (p[a](XiX2 ... Xm) е Pr[Xi X2 . . .Xm]

[a] [a]

Неточное атомарное свидетельство задается соответственно как (p[a](X) е Pr [a][X]) , т. е. в этом случае достаточно задать интервальную оценку P[a](X).

Для краткой записи произвольного свидетельства или кортежа свидетельств станем пользоваться обозначением (()), а называть такое обозначение будем свидетельством общего вида.

Первой задачей апостериорного вывода является оценка вероятности (или ожидаемой вероятности) появления некоторого свидетельства (()) над заданным ФЗ C (или заданной БФЗ NKPB): p((()) 1C) и соответственно p((()) |М<рв).

*) Далее в наших рассуждениях будут встречаться два вида апостериорных распределений вероятностей. Распределение р[а] первого вида содержится в свидетельстве, а распределение ра второго вида получается на элементах ФЗ после пропагации свидетельства, т. е. в результате апостериорного вывода.

Результаты первой задачи можно использовать [1, 9, 10], например, в формуле Байеса, если у нас есть несколько классов ситуаций, описанных ФЗ или базой ФЗ (БФЗ), которым [классам] присвоено априорное распределение вероятностей, однако в настоящей работе эта задача представлена не будет; вопросы, с ней связанные, получили рассмотрение в [4].

Второй задачей апостериорного вывода является оценка апостериорной вероятности или ожидаемой апостериорной вероятности цепочек конъюнкций Z, входящих в ФЗ или БФЗ, но не имеющих общих атомарных пропозиций с поступившим свидетельством или кортежем свидетельств: ра(^| (())).

Если известно, как рассчитывать (подход к расчетам представлен в п. 2) апостериорные вероятности р^I (х)) в случае поступления детерминированного свидетельства (х) и р^I ) в случае поступления кортежа детерминированных свидетельств

^Х^, то тогда обработка атомарных стохастических свидетельств (p[a](x)) или их кор-

Здесь точка над х и X означает, что означивания х и X слева и справа от знака равенства не связаны; связаны только означивания этих переменных и конъюнкций под знаком суммирования.

Формулы (1) и (2) обобщим на случай кортежей неточных свидетельств [4, 13]:

где [min; max] представляет собой замкнутый промежуток, а экстремальные значения берутся от стоящей справа суммы.

Полученные формулы (1)—(4) для расчетов оценок апостериорных вероятностей обобщаются и на случай, когда результатом апостериорного вывода по детерминированному свидетельству становятся не скалярные, а интервальные оценки pa(Z| ^X^): несколько упрощая, можно сказать, что соответствующие операции производятся с верхними и нижними границами интервалов [4, 11, 12].

2. Скалярные априорные оценки. Рассмотрим более детально обработку свидетельства, построенного над атомами из V, при его поступлении в отдельный ФЗ со скалярными оценками вероятностей - соответствующий идеал конъюнктов задан над атомарными пропозициями цепочки VX, при этом подцепочки V и Х общих элементов не имеют. Ограничимся двумя видами свидетельств: кортежем детерминированных свидетельств и кортежем стохастических свидетельств \Р[а\ . Здесь

тежей {р[а]{Х)у будет производиться по формулам, напоминающим таковые для расчета математических ожиданий }\

х

[min; max]

Р[а](Х)еРГ[а] [х] X

(3)

P[a}(X)epV[a} [X] X

На самом деле, так оно и есть. Можно определить соответствующую случайную величину и рассчитывать ее математическое ожидание [3, 4, 11, 12].

не будем рассматривать подробно расчет вероятности появления кортежа свидетельств над ФЗ. Соответствующие вычисления описаны, например, в [4, 13].

Кортеж стохастических свидетельств фактически рассматривается как набор кортежей детерминированных свидетельств всех возможных означиваний, построенных над одной и той же цепочкой конъюнкций V, при этом на наборе задано вероятностное распределение р^а] . Результаты пропагации кортежа стохастических свидетельств

Р[а] получаются как «смесь», т. е. как усреднение (линейнар комбинация) ре-

зультатов пропагации кортежей детерминированных свидетельств ^V^, построенных над одними и теми же атомарными пропозициями из V, по вероятностному распределению р[а] , заданному над V. Заметим, что вероятности р[а] могут быть заданы

как над квантами V, так и над элементами идеала VЛ.

Кортеж детерминированных свидетельств можно рассмотреть как частный случай кортежа стохастических свидетельств, в котором ненулевую вероятность (а значит, равную единице) имеет только одно означивание аргументных мест в цепи свидетельств.

Обозначим априорные вероятности элементов идеала как р, а апостериорные вероятности - как ра. При принятых обозначениях влияние кортежей свидетельств выражается следующим набором формул:

Ра (VX^V)) = р^х¡V) =

р р ІУХ)

Р V

р V

= р (X¡V

(5)

ра (XкV)) = р(х¡V) =

р V X

р V

= р (X¡V

ра ^ ¡(р[а] (V))) = р (VX ІV) р[_а] (V)

р (VXV)

р V

р[а]

V =

ра ^ Кр[а] [У

|1>ы и=і:

V V р \ у

р V

р[а] V , (6)

,р (V X)

р[а]

V .

Обратим внимание на то, что выражение (6) вводит апостериорную вероятность таким образом, что на квантах V она совпадает с вероятностью соответствующего означивания в поступившем кортеже стохастических свидетельств:

^ (^1 (Р[а] (У))) = £*>» (™1 (Р[а] (V))) =

X

X

р V

V =

Особо следует рассмотреть случай [4], когда при одном или нескольких означиваниях V вероятность р( V) = 0. При таких V считается, что оценка условной вероятности вырождается в р^IV) € [0; 1] .

Совпадение условных вероятностей в формуле (5) позволяет в случае кортежа детерминированных свидетельств не хранить апостериорные вероятности над всем исходным идеалом конъюнктов (УХ)Л; достаточно хранить апостериорные вероятности над подыдеалом XЛ исходного идеала, в который не входят конъюнкты, содержащие хотя бы один атом из кортежа свидетельств.

3. Интервальные априорные оценки. В случае апостериорного вывода в ФЗ со скалярными оценками вероятностей при поступлении и детерминированного, и стохастического свидетельства расчеты сводятся к употреблению формулы из определения условной вероятности. В случае интервальных оценок в ФЗ получение оценок апостериорных вероятностей становится задачей гиперболического программирования.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Не вдаваясь в детальный разбор общего случая (с ним можно познакомиться в [4, 11, 13]), приведем примеры, демонстрирующие важную особенность апостериорного вывода: в предложенной модели БФЗ с неопределенностью возникающие задачи гиперболического программирования удается свести к задачам линейного программирования. Соответствующий класс задач, с точки зрения теории оптимизации, рассматривался, например, в [14].

Пример 1. (Апостериорный вывод, интервальные оценки, атомарное свидетельство.)

Рассмотрим ФЗ третьего порядка С = {х\, х2, хз, х\х2, х\хз, х2х^, х\х2хз}, построенный над А = {х1,х2,хз}. Заданы непротиворечивые интервальные оценки истинности элементов ФЗ Т>А’3:

p1 p(xi) p+%

p2- p(x2 ) P+,

p1 p(x3) p+,

pi12 p(xi x2) Pl2,

p-3 p(xix3) PÍз,

Р-з p(x2 x3) P+з,

. p123 p(xix2x3) p123

На вход поступает детерминированное свидетельство (жз). Для простоты будем предполагать, что р(хз) имеет либо скалярное значение, отличное от нуля, либо интервальную оценку с различающейся верхней и нижней границами. Эта интервальная оценка в качестве нижней границы может содержать нуль.

Вторая задача апостериорного вывода сводится к решению серии задач гиперболического программирования для Z G {xi,x2,xiX2}:

p~(Z\ (ж3)) = min p+(Z\ (x3)) = max^^.

1 y n ТСЛ.З p(x3) ’ 1 y IX n KA, 3 p(x3)

Покажем, что возникшие экстремальные задачи сводятся к задачам линейного программирования. Введем величину £ = При сделанных предположениях она

строго положительна; более того, £ G [1; ж). Умножим неравенства из множества RA’3 = EА’3 U DA’3, соответствующего рассматриваемому ФЗ, на переменную £. Неравенства не поменяют знак, поскольку £ строго положительна. Заменим переменные £p(f) = d(f). Отметим, что d(x3) = 1. В получившееся множество неравенств включим дополнительный элемент - линейное неравенство £ ^ 1. Это множество неравенств

/Т"> А ,3

назовем Rd .

Вторая задача апостериорного вывода свелась к решению серии задач линейного программирования:

p1 (Z| (x3)) = min d(Z), p+(Z| (x3)) = max d(Z), Z G{xi,x2,xix2}.

КЛ,3 кл,з

В явном виде множество неравенств R^’3 выглядит следующим образом:

ЛА’3 — Rd —

£ > 1,

d(xiх2хз) ^ 0,

d(xiхз) — d(xix2x3) ^ 0,

d(x2x3) — d(xix2x3) ^ 0,

1 — d(xix3) — d(x2x3) + d(xix2x3) ^ 0, d(xix2) — d(xix2x3) ^ 0, d(xi) — d(xix2) — d(xix3) + d(xix2x3) ^ 0, d(x2) — d(xix2) — d(x2x3) + d(xix2x3) ^ 0, £ — d(xi) — d(x2) — 1 + d(xix2)+

+d(xix3) + d(x2x3) — d(xix2x3) ^ 0, £p2 < d(xi),

£P2 < d(x2 ^

£% < 1,

£^2 < d(xix2),

£p23 < d(xix3), 0223 < d(x2x3), £^223 < d(xix2x3),

d(x2 ) < £P+,

1 < £p+,

d(xix2) < £p+2, d(xix3) < £p+3,

d(x2x3) <

d(xix2x3) < £p+23.

Пример 2. (Апостериорный вывод, интервальные оценки, кортеж свидетельств.)

Снова рассмотрим построенный над А = {хі, х2, хз} ФЗ

С = {хі, Х2, Хз, Х\Х2,Х\Хз, Х2Х3, х1х2хз}•

В отличие от примера 1, на вход поступает кортеж детерминированных свидетельств (Х2Х3}. Будем предполагать, что р(х2хз) имеет либо ненулевое скалярное значение, либо интервальную оценку с различающимися границами. Эта интервальная оценка в качестве нижней границы может содержать нуль.

Заданы те же непротиворечивые интервальные оценки истинности элементов ФЗ Vа’3, что и в примере 1.

Вторая задача апостериорного вывода сводится к решению задач гиперболического программирования:

р-(2|(х2х3» = йш,Й5^2 р+(2|(х2хз)) = т»хЙ^>, 2б{«}.

Покажем, что возникшие экстремальные задачи снова сводятся к задачам линейного программирования. Введем величину £ = При сделанных предположениях

она строго положительна; более того, £ € [1; то). Умножим неравенства из множества Ял,3 = ЕА’3 у Рл’3, соответствующего рассматриваемому ФЗ, на переменную £. Неравенства не поменяют знак, поскольку £ строго положительна. Заменим переменные £р(1) = ). Отметим, что ¿(х2х3) = 1. В получившееся множество неравенств вклю-

чим дополнительный элемент - линейное неравенство £ ^ 1. Назовем это множество

ЯЛ'Х V

а{х2Хз)

Вторая задача апостериорного вывода в случае ФЗ третьего порядка и двулитерного кортежа детерминированных свидетельств сводится к решению задач линейного программирования:

р (^| (х2х3}) = тіп ), р+ (^| (х2х3}) = тах ), Z Є {х1}.

п

¿{х2х2)

к

¿{х2Х2)

Само множество

а,3

’в,(х2Хз)

в явном виде выглядит так:

п-

А’3

й(х2Х3)

£ > 1,

¿(хіХ2Х3) ^ 0,

¿(хіХ2) — ¿(хіХ2Х3) ^ 0,

¿(хіХ3) — ¿(хіХ2Х3) ^ 0,

¿(хі) — ¿(хі Х2) — ¿(хі Х3)

1 — ¿(хіХ2Х3) ^ 0,

¿(х2) — ¿(хіХ2) — 1 + ¿(хіх2Х3) ^ 0, ¿(х3) — ¿(хіХ3) — 1 + ¿(хіх2Х3) ^ 0, £ — ¿(хі) — ¿(х2) — ¿(Х3) + ¿(хіх2) + +с!(хіХ3) + 1 — ¿(хіХ2Х3) ^ 0, £р- < ¿(хі ),

£р- < ¿(х2 ), £р- < ¿(х3),

£р-2 < ¿(хіХ2), £р-3 < ¿(хіХ3), £р-3 < 1,

¿(х2 ) < £р+, ¿(х3) < £р+, ¿(хіХ2 ) < £р+2,

¿(хіХ3) < £р+3,

1 < £р23

£р123 < ¿(хіх2Х3), ¿(хіх2Х3) < £р+23.

В примерах 1 и 2 разобраны только положительно означенные детерминированные свидетельства. В случае другого означивания свидетельств или иного порядка атомарных свидетельств в кортеже следовало бы применить алгоритмы переобозначения или перестановки элементов идеала цепочек конъюнкций соответственно.

Обобщение апостериорного вывода на случай стохастических свидетельств и неточных свидетельств производится по формулам (1)-(4).

Хотя примеры 1, 2 и формулы (1)-(4) дают достаточно четкое представление о том, как производить апостериорный вывод, при разработке алгоритмов для последующей программной реализации может потребоваться более детальное описание подхода. Удобная с точки зрения разработки программных приложений формализация процесса и объектов, в нем участвующих, предложена, например, в [4, 15, 16]; кроме того, там же систематически описан подход к обработке стохастических и неточных свидетельств.

4. Непротиворечивость апостериорных оценок. Утверждение. Пусть X - это цепочка атомов, формирующая поступившее свидетельство, а Z используется так же, как в примерах 1, 2, и п. 1: оно обозначает произвольный конъюнкт из исходного ФЗ, не содержащий ни одного атома из поступившего свидетельства. Тогда совокупность апостериорных оценок вероятностей

■ . ¡р(хг)} ¡р(хг)} ]

тт{й^Гтах{йШ.

задает непротиворечивый ФЗ над конъюнктами вида Z, если соответствующие экстремальные задачи имеют решение.

Примечание 4.1. Утверждение верно, даже если в исходном ФЗ р(Х) = 0. В этом случае интересующие нас оценки выродятся в [0; 1] [13].

Примечание 4.2. Совокупность конъюнктов вида Z образует идеал; он является подыдеалом идеала-носителя исходного ФЗ.

Примечание 4.3. Предполагается, что апостериорные оценки вероятностей удалось получить. В противном случае, если соответствующие задачи гиперболического программирования не имеют решения, исходные данные были противоречивы.

Доказательство. Обратим внимание на важное свойство совокупности величин вида d(XZ), где Z «пробегает» соответствующий идеал.

Пусть £ = Тогда, используя матрицы 1„ и векторы р(") из [4, 5], запишем

применявшееся в примерах 1 и 2 преобразование системы неравенств, вытекающей из требований вероятностной логики.

Определим новый вектор = £ • Р(п). Его «нижний» подвектор, содержащий вероятности конъюнктов вида XZ, где Z «пробегает» конъюнкты, не содержащие атомов их X, обозначим ^т), где т равно разности числа атомов в ФЗ и числа атомов в свидетельстве:

Іп X Р(п) > 0<п>,

е • І„ X Р(п) > "о

ІП X Є • Р(п) > о(п>,

іп х а(п) > 0°п>.

Из последнего неравенства следует

в силу того, что матрица Іп имеет структуру

* *

0 1т

Учтем, что, согласно определению, ¿(X) = 1.

Таким образом, оказывается, что на величины вида d(XZ) = р(^\Х) наложены требования аксиоматики вероятностей, т. е. после проведения апостериорного вывода (и если все соответствующие задачи гиперболического программирования имеют решение) получим непротиворечивую совокупность оценок апостериорных вероятностей над идеалом конъюнктов с элементами вида Z.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

За счет переозначиваний и перестановок переменных случай, когда детерминированное свидетельство содержит атомы с отрицанием, сводится к рассмотренному в утверждении. Соответствующие вопросы рассмотрены в [4]; на матрично-векторном языке преобразования, связанные с апостериорным выводом при произвольном детерминированном свидетельстве, выполнены в [15], а еще более общая ситуация рассмотрена в [16].

Как уже отмечалось, при обработке стохастического свидетельства сначала пропа-гируется по-отдельности каждое означивание цепи конъюнкций из всех атомов, входящих в такое свидетельство. Затем из результатов пропагации строится «смесь» -линейная комбинация с весами рщ^). Поскольку линейная комбинация непротиворечивых ФЗ образует непротиворечивый ФЗ, то результаты пропагации стохастического свидетельства также непротиворечивы.

Литература

1. Городецкий В. И. Байесовский вывод: препринт Ленингр. ин-та информатики и автоматизации АН СССР, № 149. Л., 1991. 38 с.

2. Тулупьев А. Л. Алгебраические байесовские сети: теоретические основы и непротиворечивость. СПб.: С.-Петерб. ин-т информатики и автоматизации РАН, 1995. 76 с.

3. Тулупьев А. Л. Алгебраические байесовские сети: логико-вероятностный подход к моделированию баз знаний с неопределенностью. СПб.: С.-Петерб. ин-т информатики и автоматизации РАН, 2000. 282 с.

4. Тулупьев А. Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. СПб.: Наука, 2006. 607 с.

5. Тулупьев А. Л. Алгебраические байесовские сети: локальный логико-вероятностный вывод: учеб. пособие. СПб.: С.-Петерб. гос. ун-т; ООО Изд-во «Анатолия», 2007. 80 с.

6. Тулупьев А. Л. Алгебраические байесовские сети: глобальный логико-вероятностный вывод: учеб. пособие. СПб.: С.-Петерб. гос. ун-т; ООО Изд-во «Анатолия», 2007. 40 с.

7. Тулупьев А. Л. Непротиворечивость оценок вероятностей над идеалами конъюнктов и дизъюнктов // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2009. Вып. 2. С. 121-131.

8. Тулупьев А. Л. Непротиворечивость оценок вероятностей в алгебраической байесовской сети // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2009. Вып. 3. С. 144-151.

9. Городецкий В. И. Адаптация в экспертных системах // Изв. АН СССР. Сер. Техническая кибернетика. 1993. № 5. С. 101-110.

10. Городецкий В. И. Алгебраические байесовские сети - новая парадигма экспертных систем // Юбил. сб. трудов институтов Отделения информатики, вычислительной техники и автоматизации РАН. М.: Изд-во РАН, 1993. Т. 2. С. 120-141.

11. Тулупьев А. Л., Николенко С. И., Никитин Д. А., Сироткин А. В. Синтез апостериорных оценок истинности суждений в интегрированных базах знаний: детерминированный вариант // Изв. высш. учеб. заведений. Приборостроение. 2006. № 11. С. 35-39.

12. Тулупьев А. Л., Николенко С. И., Сироткин А. В. Синтез апостериорных оценок при поступлении свидетельств с неопределенностью в интегрированную систему знаний о неточных вероятностях // Изв. высш. учеб. заведений. Приборостроение. 2006. № 11. С. 39-44.

13. Тулупьев А. Л., Никитин Д. А. Экстремальные задачи в апостериорном выводе над идеалами цепочек конъюнкций // Труды СПИИРАН. 2005. Вып. 2, т. 2. СПб.: Наука, 2005. С. 12-52.

14. Гавурин М. К., Малоземов В. Н. Экстремальные задачи с линейными ограничениями: учеб. пособие. Л.: Изд-во Ленингр. ун-та, 1984. 175 с.

15. Сироткин А. В., Тулупьев А. Л. Матрично-векторные уравнения локального логиковероятностного вывода в алгебраических байесовских сетях // Труды СПИИРАН. 2008. Вып. 6. СПб.: Наука, 2008. С. 131-149.

16. Тулупьев А. Л., Сироткин А. В., Николенко С. И. Байесовские сети доверия: логико-вероятностный вывод в ациклических направленных графах. СПб.: Изд-во С.-Петерб. ун-та, 2009. 400 с.

Статья рекомендована к печати член-кор. РАН, проф. Г. А. Леоновым.

Статья принята к печати 24 сентября 2009 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.