Научная статья на тему 'Матричные уравнения локального логико-вероятностного вывода оценок истинности элементов в алгебраических байесовских сетях'

Матричные уравнения локального логико-вероятностного вывода оценок истинности элементов в алгебраических байесовских сетях Текст научной статьи по специальности «Математика»

CC BY
126
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕРОЯТНОСТНАЯ ЛОГИКА / БАЙЕСОВСКИЕ СЕТИ / ЛОГИКО-ВЕРОЯТНОСТНЫЙ ВЫВОД / ЗНАНИЯ С НЕОПРЕДЕЛЕННОСТЬЮ / РАСПРОСТРАНЕНИЕ СВИДЕТЕЛЬСТВ / НЕПРОТИВОРЕЧИВОСТЬ / PROBABILISTIC LOGIC / BAYESIAN NETWORKS / PROBABILISTIC-LOGIC INFERENCE / UNCERTAIN KNOWLEDGE / EVIDENCE PROPAGATION / CONSISTENCY

Аннотация научной статьи по математике, автор научной работы — Тулупьев А. Л., Сироткин А. В.

Обработка фрагментов знаний с вероятностной неопределенностью в интеллектуальных системах поддержки принятия решений основывается на трех видах локального логико-вероятностного вывода: проверка и поддержание непротиворечивости, априорный и апостериорный вывод. В настоящей статье вычислительные формулы, на которые опираются перечисленные виды логико-вероятностного вывода, представлены на матрично-векторном языке, что сокращает, упрощает и делает более строгой последующую спецификацию алгоритмов вывода. Кроме того, использование матрично-векторного языка открывает новые возможности для исследования свойств результатов локального логико-вероятностного вывода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Matrix-Vector Equations for Local Probabilistic-Logic In- ference in Algebraic Bayesian Networks

The processing of probabilistically uncertain knowledge patterns in intellectual decision support systems falls into three kinds of probabilistic-logic inference, such as reconciliation, a priori and a posteriori inference. The paper presents formulae that allow for putting the process down in terms of matrix-vector language.

Текст научной работы на тему «Матричные уравнения локального логико-вероятностного вывода оценок истинности элементов в алгебраических байесовских сетях»

УДК 004.8

Вестник СПбГУ. Сер. 1. 2012. Вып. 3

МАТРИЧНЫЕ УРАВНЕНИЯ ЛОКАЛЬНОГО ЛОГИКО-ВЕРОЯТНОСТНОГО ВЫВОДА ОЦЕНОК ИСТИННОСТИ ЭЛЕМЕНТОВ В АЛГЕБРАИЧЕСКИХ БАЙЕСОВСКИХ СЕТЯХ*

А. Л. Тулупьев1, А. В. Сироткин2

1. С.-Петербургский государственный университет,

д-р физ.-мат. наук, профессор, [email protected]

2. С.-Петербургский государственный университет, мл. научн. сотр., [email protected]

1. Введение. Существуют различные подходы к построению баз фрагментов знаний с вероятностной неопределенностью для интеллектуальных систем, ориентированных на поддержку принятия решений. Одним из подходов является парадигма алгебраических байесовских сетей, предложенная В. И. Городецким в 1983 году [1-3] (название предложено в [2] в 1993 г.).

В теории алгебраических байесовских сетей (АБС) математической моделью фрагмента знаний (ФЗ) является идеал конъюнктов, или идеал цепочек конъюнкций, с оценками вероятности истинности входящих в него элементов. Определение идеала конъюнктов будет дано ниже. Из набора ФЗ строится сама АБС.

Для формализации понятия вероятности истинности пропозициональной формулы используется способ, основанный на подходе Н. Нильссона [4].

Цель настоящей работы — дать на матрично-векторном языке формальное описание операций локального логико-вероятностного вывода в ФЗ АБС.

2. Базовые объекты и индексация. В первую очередь, зафиксируем конечное множество атомарных пропозициональных формул (атомов) — алфавит А = {х^}"^1. Отметим, что для удобства мы будем вести нумерацию переменных с нуля. Определим над указанными атомами два набора «базовых» пропозициональных формул.

Первый набор формул — идеал цепочек конъюнкций (идеал конъюнктов) —

{х^ Хъ2 . .. х^к |0 ^ ¿1 < ¿2 < ... <гн ^ п — 1, 0 ^ к ^ п} ,

где ж^ х^2 ... х^ означает конъюнкцию соответствующих переменных; сам знак конъюнкции мы для удобства опустим. Каждому из конъюнктов вида ж^ х^2 ... х^ можно сопоставить число 2®1 +2®2 +.. .+2гк — номер конъюнкта. Более того, если представить полученное число в двоичной записи, то переменная х^ будет входить в конъюнкт тогда и только тогда, когда ¿-й бит номера будет равен единице (нумеровать биты предлагается, начиная с младшего разряда, считая его нулевым битом).

Для определения второго набора формул — множества квантов — будет полезным следующее обозначение. Литерал (аргументное место) х^ означает, что на его месте в пропозициональной формуле может стоять либо хлибо его отрицание х^. Тогда множество квантов над алфавитом А = {х^}"=01 — Q = {хох1 .. .х„_1}. Иными словами, квант — это конъюнкция, которая для любой переменной из алфавита содержит

* Работа выполнена при частичной финансовой поддержке РФФИ (грант №09-01-00861-а). © А. Л. Тулупьев, А. В. Сироткин, 2012

либо ее саму, либо ее отрицание. Для нумерации квантов мы воспользуемся способом, аналогичным нумерации конъюнктов. Выделим «положительную» часть кванта (множество положительно означенных переменных) и рассмотрим ее как конъюнкт. Номер этого конъюнкта и будет номером рассматриваемого кванта. Таким образом, единице в двоичной записи номера соответствует положительное вхождение переменной, а нулю — отрицательное, при этом рассматриваются все п бит (то есть с учетом лидирующих нулей).

После введения нумерации квантов и конъюнктов можно определить векторы вероятностей квантов и конъюнктов:

Рс

( 1 \

Р(с 1)

V Р(С2"-1)

и Р„

( Р(Я0) \

рЫ 1) V Р(?2"-1) /

где с —конъюнкт номер г, а ? — г-й квант. Появление единицы в первом случае вполне оправдано, так как согласно определению со —пустой конъюнкт, соответствующий тождественной истине. После введения перенумерации и определения базовых объектов (конъюнктов и квантов) перейдем к определению вероятности над пропозициональными формулами.

3. Оценки вероятностей над пропозициональными формулами. Пусть Г (А) — множество всех пропозициональных формул над заданным алфавитом А = {ж«}п=о1. Определим множество отличающихся формул как фактор-множество всех формул по условию эквивалентности: Г (А) = Го (А)/ =. Над п атомарными переменными подобных формул существует ровно 22 .

По теореме о совершенной нормальной дизъюнктивной форме любая пропозициональная формула может быть представлена в виде дизъюнкции конечного числа квантов. Так как при любом зафиксированном означивании всех литералов хо, Х1, ..., ж„-1 никакие два разных кванта не могут быть одновременно истинны, а, с другой стороны, один из них заведомо истинен, можно рассмотреть множество Я как множество элементарных событий. Задав вероятность на квантах, можно, в свою очередь, построить вероятностное пространство, на котором будет определена вероятность любой пропозициональной формулы [5-7]. За более подробным описанием аксиоматики вероятностной логики можно обратиться, например, к [4, 8, 9].

Определение вероятности на элементах множества Я потребует следующих ограничений (фактически, речь идет о задании распределения вероятности на множестве элементарных событий):

V? е Я р(ч) > о,

Е р(?) = 1-

(1) (2)

дея

Пользуясь введенными выше векторами, перепишем эти условия следующим образом:

Ря > 0;

(1, Ря) = 1.

(3)

(4)

В алгебраических байесовских сетях мы, в основном, работаем не с квантами, а с конъюнктами.

Теорема 1. Вероятности квантов и вероятности конъюнктов выражаются друг через друга с помощью следующих соотношений:

РЯ — In X Pc,

Рс — Л« х Pq,

(5)

(6)

где

I« = 11 ® 1„_1 = 11 << 11« 1] = 11п], а 11 =

Л« = Л1 << Л„_1 = Л1 << Л1" 1] = Л1"], а Л1 =

1

11 о1

Здесь и далее < обозначает кронекерово (тензорное) произведение матриц [10]. Доказательство. Доказательство приведенной теоремы можно найти в [8, 5,

11].

После применения приведенных в теореме соотношений ограничения (1)-(2) принимают вид

I« х Рс ^ 0.

(7)

Здесь п — число атомов, а матрица I« — матрица перехода от вероятностей квантов к вероятностям конъюнктов, описанная в теореме. Заметим, что если вычислить вероятности квантов на основе вероятностей конъюнктов, удовлетворяющих условию (7), то условия (1) и (2) будут выполнены автоматически [8].

Заметим, что (5) можно рассматривать как матрично-векторную запись формулы включений—исключений.

4. Непротиворечивость фрагмента знаний. Основным «конструкционным блоком» АБС является фрагмент знаний (ФЗ); исследуем вопросы его непротиворечивости. ФЗ представляет с собой идеал конъюнктов с оценками истинности. При этом можно выделить два основных случая.

1. Оценка вероятности истинности каждого конъюнкта задана скалярно (точечно); совокупность всех оценок представлена в виде вектора оценок Рс; тогда для проверки непротиворечивости достаточно проверить выполнение условий (7).

2. Заданы два вектора — верхние и нижние оценки вероятностей истинности конъюнктов в идеале — Р- и Р+; мы говорим, что подобные оценки непротиворечивы, если

Vi : 1 < г < 2« - 1 Vе : Р-[г] < е < Р+[г] ЗРс : (Р- < Рс < Р+) & (Рс[г] = е) & (I« X Рс > 0).

Здесь запись вида Рс [г] означает г-й элемент вектора Рс. Если выразить словами, то для любой оценки любого конъюнкта (кроме нулевого, оценка для которого всегда единица), лежащей в границах, определенных векторами Р- и Р+, существует совокупность оценок вероятностей всех остальных конъюнктов, лежащих в границах, определенных Р- и Р+, и задающих непротиворечивый фрагмент знаний со скалярными оценками.

1

Как уже было сказано, в первом случае нам достаточно проверить по формуле (7), непротиворечива оценка или нет. В случае с интервальными оценками вопрос не только в том, что непротиворечивы они или нет, но и если противоречивы, то можно ли их сузить до непротиворечивых. Решения этих двух вопросов взаимосвязаны. Для проверки непротиворечивости необходимо решить серию задач линейного программирования (ЗЛП) [8]. Переменными данных задач будут точечные вероятности Рс, а ограничения будут двух типов: Р- ^ Рс ^ Р+ и 1п х Рс ^ 0. Осталось определить только целевые функции. Целевыми функциями будут максимизация и минимизация Рс [¿] для каждого г :1 ^ г ^ 2" — 1 (решать задачу для г = 0 не требуется, так как по определению Рс [0] = 1). Решение этой серии ЗЛП позволяет определить, непротиворечив ли ФЗ; в этом случае все ЗЛП будут разрешимы и соответствующие максимумы и минимумы совпадут с заданными границами. Если хотя бы одна из ЗЛП дала результат, отличный от заданных границ, то соответствующие максимумы и минимумы дадут наибольший по включению набор интервальных оценок, задающий непротиворечивый ФЗ и лежащий в указанных границах. А если хоть одна из ЗЛП оказалась неразрешима, то значит такого сужения не существует и ФЗ — противоречив.

5. Локальный априорный вывод. Сформировав непротиворечивый ФЗ, перейдем к вопросу об оценивании вероятности произвольной пропозициональной формулы, заданной над теми же атомами, что и фрагмент знаний. Суть априорного вывода — построение оценок для некоторой формулы на основе оценок другого набора формул. В контексте АБС наиболее естественно в качестве набора формул, уже имеющих оценки, рассматривать элементы ФЗ. Мы не будем подробно останавливаться на вопросах обработки формул и переходу к их совершенной дизъюнктивной нормальной форме (СДНФ), за этим можно обратиться к статье [12].

Рассмотрим пропозициональную формулу /, вероятность истинности которой требуется оценить. Обозначим через Lf вектор, содержащий 2" элементов, каждый из которых является единицей или нулем в зависимости от того, входит или не входит соответствующий по номеру квант в СДНФ формулы / (нумерация квантов была описана в разделе 2).

Пусть задан фрагмент знаний с оценками истинности, то есть мы имеем ограничения вида Р- ^ Рс ^ Р+, где Рс —вектор вероятностей конъюнктов, входящих в ФЗ, а Р- и Р+ —векторы, состоящие из соответствующих нижних и верхних оценок.

Вероятность формулы / можно выразить следующим образом:

р(/) = (Ь/, Рч).

Для перехода к вероятностям конъюнктов воспользуемся уже применявшейся выше формулой (5) и получим

р(/) = (Ь;, 1П х Рс) = (1П х , Рс).

Таким образом, мы выразили вероятность произвольной формулы через вероятности конъюнктов. Чтобы оценить р(/), построим задачу линейного программирования.

Переменными нашей ЗЛП, как и в случае поддержания непротиворечивости, будут элементы вектора Рс. Ограничениями будут Р- ^ Рс ^ Р+, заданные в ФЗ, и

неравенства I« X Рс ^ 0, заданные аксиоматикой теории вероятностей. Целевая функция описывается выражением р(/) = (Щ X Ьf, Рс). Решив ЗЛП, найдем максимум и минимум целевой функции — это и будут искомые оценки вероятности формулы /. Если же построенная ЗЛП не будет иметь решения, то это означает, что исходный набор оценок был противоречив.

Кроме такого подхода к априорному выводу можно рассмотреть еще построение (или уточнение) оценок ФЗ на основе оценок произвольного набора формул, оно происходит аналогично процессу поддержания непротиворечивости, только в ЗЛП добавляется условие р- ^ (Щ X Ьf, Рс) ^ где р- и р+ —нижняя и верхняя оценки вероятности формулы /. Более подробное описание ЗЛП в данном случае можно найти в [8], а вопросы автоматизации обработки формул в указанном контексте и выбора представления данных для программной реализации были подробно рассмотрены в [12].

6. Перестановки, переозначивания и свидетельства. Для описания последнего вида вывода нам потребуется описать логико-вероятностную модель свидетельств в теории АБС, а так же ввести ряд вспомогательных обозначений, которые позволят нам изложить оставшийся материал тоже на матрично-векторном языке.

Под свидетельством мы понимаем новые «обусловливающие» данные, которые поступили во фрагмент знаний, и с учетом которых нам требуется пересмотреть все (или некоторые) оценки. Сама суть апостериорного вывода заключается в оценивании условной вероятности элементов ФЗ относительно поступившего свидетельства.

Свидетельства, применяемые в теории АБС, разделяются на несколько видов:

• детерминированные свидетельства;

• стохастические свидетельства;

• неточные свидетельства.

В данной статье мы рассмотрим только детерминированное свидетельство; оставшиеся два случая могут быть сведены к пропагации серии детерминированных свидетельств [8]. Мы говорим, что на вход системы поступило детерминированное свидетельство, если новые сведения представимы в виде конъюнкции атомарных переменных и их отрицаний. Примерами таких свидетельств могут быть (х1), (хХз), (Ж1Х3Ж4}; угловые скобки используются для обозначения того, что соответствующая конъюнкция рассматривается нами как свидетельство. Заметим, что такое свидетельство можно разбить на «положительный» и «отрицательный» конъюнкты. В первый входят все положительно означенные атомарные переменные свидетельства, а во второй — отрицательно. При этом и положительной, и отрицательной части можно сопоставить индекс в соответствии с перенумерацией, приведенной во втором разделе настоящей работы, и наши свидетельства можно будет записать следующими эквивалентными обозначениями:

(х1 } = (Х1 } = (2; 0} = (000102; 000002),

(Х2Х3) = (х2,Хз) = (4; 8} = (001002; 010002}, (х1Х3Х4) = (Х1Х4, Х3) = (18; 8} = (100102; 010002) .

Далее, мы полагаем, что нам поступило свидетельство (г;]}. В первую очередь, обратим наше внимание к вектору вероятностей квантов и попробуем вычислить

условные вероятности квантов при условии поступившего детерминированного свидетельства. Для этого нам понадобится следующая матрица:

Н<<-з> = Н

-1

® Н® ... Н

где

н

н+,

Н-,

н°

причем Н+

Н-

если хк входит в если хк входит в е5-;

иначе; Н°

/1 0 ; Н° /1 0 у 0 0 ) ; Н V 0 1

При вычислении произведения Н^5 х Ра мы как бы «вычеркиваем» вероятности квантов, противоречащие поступившему свидетельству, заменяя их на нули. При этом на каждой позиции будет стоять вероятность конъюнкции кванта и поступившего свидетельства.

Теперь рассмотрим величину (1, Н^5 х Ра). Она в точности соответствует вероятности поступившего свидетельства. Теперь для того чтобы получить условные вероятности, осталось найти отношение совместной вероятности к вероятности свидетельства, то есть вычислить

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1

(1, х Ра)

•Н^ х Ра.

Таким образом мы нашли условные вероятности квантов. Для того чтобы получить условные вероятности конъюнктов, нам необходимо умножить полученный вектор на Л„. Кроме того, подставим в нашу формулу известное нам соотношение (5). Обозначив вектор условных вероятностей конъюнктов через Р

1

(¿;5)

с , получим

Р^ = Л„ х

(1, х Ра)

• Н^ х 1„ х Рс

По определению вектора Рс на нулевом месте всегда стоит единица. Это же утверждение справедливо для Р произведение

(¿;5)

. Это значит, что если мы рассмотрим ненормированное Л" х Н( '^) х I" х Рс,

то на нулевой позиции полученного вектора будет стоять (1, Н^5 х Ра), а значит, нет необходимости вычислять эту величину отдельно.

Введем обозначение Т^5 = Л„ х Н^'^ х 1„ х Рс, тогда верно следующее. Теорема 2. Матрица оператора ненормированного апостериорного вывода может быть вычислена по следующей формуле:

Т^ = Т ® Т "¿-2 ® ... Т 0¿'j),

где

причём Т+ 68

Т+, если хк входит в c¿;

Т-, если хк входит в е^; Т°

01 01

Т-

иначе;

1 —1 00

Т°

10 01

0

к

к

Доказательство. Напомним, что матрицы 1„, 1„ и Н^7 х 1„ представляют собой кронекерово произведение матриц небольшой размерности. Учитывая это и используя свойство кронекерова произведения, получаем

= Л" х х I" х Рс =

= (Л1 ® ... ® Л1) х (Н"¿- ® Н"¿-2 ® ... Н0¿'j)) х (II ® ... ® 11) =

(Л1 х Н"¿- х 11) ® (Л1 х Н"¿-2 х 11) ® ... ® (Л1 х Н0¿'j) х 11) =

Т "¿-1 ® Т "¿-2 ®... Т 0¿'j)

Откуда Т = Л1 х Н ^ х 11. Осталось воспользоваться определением матриц 11,

ЛТТ (¿,7) 1 (¿,5 )

1 и Н к и, проведя элементарные вычисления, получить значения матриц 1 к ,

указанные в теореме.

Собрав все вышесказанное, мы получаем, что:

р(чз) — _1_ . -т^'Л х Р

с _(Т(м)хРс)[0] с' ^

Мы описали процесс пропагации детерминированного свидетельства. Заметим, что в более ранних работах [8, 13] процесс пропагации детерминированного свидетельства предлагалось делать в несколько шагов:

1) замена переменных таким образом, чтобы поступившее свидетельство содержало только положительную часть;

2) пропагация положительно означенного свидетельства;

3) обратная замена переменных.

Такой подход естественен, так как пропагацию положительно означенного свидетельства можно легко провести, не переходя от вероятностей конъюнктов к вероятностям квантов. Благодаря доказанной выше теореме, мы уже знаем, что пропагацию положительного свидетельства (ш;0) можно провести, домножив исходные оценки на Т(т,0) и поделив на нормировочный коэффициент.

Покажем, как провести указанную замену, и докажем, что при таком подходе результат совпадет с доказанным выше.

Пусть задан непротиворечивый вектор вероятностей Рс над множеством атомарных пропозиций {х0, х1,..., х„_1}. Как, имея эти данные, выразить через него вектор Рс 1), который представляет собой вектор вероятностей, аналогичный Рс, но построенный над множеством атомов {х0, х1,..., х„_1}? Верхний индекс вида (—к) мы будем использовать для обозначения атомарных пропозиций, получающих отрицательное означивание, при этом само к — максимальный индекс конъюнкта, состоящий только из отрицательно означенных атомов, входящих в свидетельство.

Теорема 3. Оценки вероятностей конъюнктов, после замены части атомарных переменных на их отрицания, могут быть найдены по формуле

Рс-к) = В(-к) х Рс,

где

в(-к) = в ® в ®... В 0-к),

причем

в}

<-й>

10 1 -1 10 01

е сл и^ь ас о — ас о

е сл* и^ь ас о — о

Доказательство. Рассмотрим Ря = ^ X Рс и рЯ 1> = ^ X Рс 1>. Заметим, что векторы Ря и рЯ 1> отличаются только порядком элементов. Построим соответствующую матрицу переходов

/

А(-1>

\

01 10

0

0 0

0

01 10

0

0

0 0

0 0

0

01 10

\

В общем случае матрица

А( к> = А«-1 < ... < Ао

где

если хо

если ж,- = ж,-

Здесь а^ = ж^ соответствует случаю, когда г-я переменная переозначивается (г-й бит к равен единице). Заметим, что если мы изменим матрицу Ао с одного возможного значения на другое, то для матрицы А такая замена приведет к перестановке строчек. При этом строки, «отвечающие» за вхождение ж^, поменяются со строчками, «отвечающими» за вхождение ж^. Можно так же показать, что матрица А^-к> будет содержать по одной единице в каждой строке, при этом г-я строка будет содержать единицу в столбце с номером (г Л —к) V (—г Л к), логические операции здесь следует читать как побитовые.

Матрица А^-к> задает нам переозначивание на квантах. Построим на ее основе матрицу В^-к>, определяющую оператор переозначивания на конъюнктах:

Рс-к> = Л„ X РЯ-к> = Л„ X (А<-к> X Ря) =

= Л„ X (А<-к> X (I« X Рс)) = (Л„ X А<-к> X I«) X Рс;

получаем, что

В(-к> = Л„ х А<-й> х I« х Рс

(Л1 < ... < Л1) X (А«-! < А«-2> < ... А^0-к>) X (Il < ... < Il) =

(Л1 X А«--1 X Il) < (Л1 X А«-| X Il) < ... < (Л1 X А0-к> X Il) =

В

<-й> «-1

<8> В

<-й> «-2

<8>... В

<-й>

0

0

откуда можно вывести, что

в 4

10 1 -1 10 01

если ж?- = Ж?-

если ж?- = ж?-.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Что и требовалось доказать.

Мы описали оператор преозначивания, действующий на вероятности конъюнктов.

Теорема 4. Пусть задан непротиворечивый фрагмент знаний со скалярными оценками, и поступило детерминированное свидетельство, содержащее отрицательно означенные атомы. Тогда результаты пропагации через переозначивание будут совпадать с результатами пропагации с помощью матрицы Т.

Доказательство. Благодаря свойствам кронекерова произведения нам достаточно проверить, что

Т- = В<-1> X Т+ X В<-1>. Подставив числа легко увидеть, что это так:

1 -1 \ = ( 1 0 \ ( 01 \ ( 1 0 0 0^1 = ^1 -1у1 ^ 0 1у1 ^ 1 -1

Формула (8) дает нам точное выражение для апостериорной вероятности элементов ФЗ при поступившем свидетельстве, если исходные оценки были скалярные (то есть оценки вероятности конъюнктов имели вид Рс [1] = р;, где р; — числа из интервала [0; 1]). Если оценки были не скалярные, а интервальные, то нам потребуется решать серию ЗЛП [8].

Пусть задан ФЗ с оценками Р- и Р+, тогда опишем ЗЛП для получения апостериорной вероятности на элементах ФЗ. Полученная формула однородна по Рс, то есть, если подставить вместо него А • Рс, где А > 0, то результат не изменится. Рассмотрим в качестве переменных нашей ЗЛП А • Рс[1] и обозначим их через ^1]. Очевидно, что ^0] = А. Над новыми переменными можно выписать ограничения вида ^1] ^ АР+[1] и АР-[1] ^ ^1], кроме этого мы должны включить ограничения !„ X d ^ 0. Кроме указанных ограничений, добавим ограничения (Т^^> X Рс)[0] = 1 и А ^ 0. Внеся это ограничение, мы ничего не потеряем, так как всегда можно подобрать такое А > 0, что это будет верно, а в силу однородности мы не исключим не одного возможного значения для элементов Р^'^ (подробнее применительно к АБС можно посмотреть в [8], а применительно к общему случаю сведения задачи гиперболического программирования к ЗЛП — в [14]). Последнее ограничение позволяет переписать выражение для Рсг'^>, а именно Рс^ = Т^'> X d.

Теперь нам осталось только решить полученные ЗЛП и найти при заданных условиях максимумы и минимумы для элементов Рсг'^> [1], они и будут оценками апостериорной вероятности.

7. Заключение. Мы рассмотрели все основные виды локального логико-вероятностного вывода в АБС: поддержание непротиворечивости, априорный и апостериорный виды вывода, — представив соответствующие формулы для вычислений на матрично-векторном языке. Полученные ЗЛП могут быть без особых трудностей

решены на ЭВМ, более того, матричные и векторные структуры, описанные в статье, имеют достаточно простое и эффективное машинное представление в виде массивов. Однако открытым остается вопрос, можно ли упростить предложенные матричные операции и, тем самым, сократить вычислительную сложность алгоритмов.

Литература

1. Городецкий В. И. Байесовский вывод. Препринт №149. Л.: ЛИИАН, 1991. 38 с.

2. Городецкий В. И. Алгебраические байесовские сети — новая парадигма экспертных систем ll Юбилейный сборник трудов институтов Отделения информатики, вычислительной техники и автоматизации РАН. Т. 2. М.: РАН, 1993. С. 120-141.

3. Городецкий В. И., Тулупьев А. Л. Формирование непротиворечивых баз знаний с неопределенностью Ц Изв. РАН. Сер. Теория и системы управления. 1997. Т. 5. C. 33-42.

4. Nilsson N. J. Probabilistic Logic Ц Artificial Intelligence. 1986. Vol.47. Amsterdam: Elsevier Science Publishers B. V., 1986. P. 71-87.

5. Тулупьев А. Л. Алгебраические байесовские сети: локальный логико-вероятностный вывод: Учеб. пособие. Элементы мягких вычислений. СПб.: СПбГУ; ООО Изд-во «Анатолия», 2007. 80 c.

6. Тулупьев А. Л. Байесовские сети: логико-вероятностный вывод в циклах. СПб.: Изд-во С.-Петерб. ун-та, 2008. 140 c.

7. Тулупьев А. Л., Сироткин А. В. Алгебраические байесовские сети: принцип декомпозиции и логико-вероятностный вывод в условиях неопределенности ll Информационно-измерительные и управляющие системы. 2008. Т. 6, №10. С. 85-87.

8. Тулупьев А. Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. СПб.: Наука, 2006. 607 с.

9. Тулупьев А. Л., Сироткин А. В., Николенко С. И. Байесовские сети доверия: логико-вероятностный вывод в ациклических направленных графах. СПб.: Изд-во С.-Петерб. ун-та, 2009. 400 c.

10. Беллман Р. Введение в теорию матриц. М.: Наука. Гл. редакция физико-математической литературы, 1969. 368 с.

11. Тулупьев А. Л. Ациклические алгебраические байесовские сети: логико-вероятностный вывод ll Нечеткие системы и мягкие вычисления: Научный журнал Российской ассоциации нечетких систем и мягких вычислений. 2006. Т. 1, №1. С. 57-93.

12. Сироткин А. В., Тулупьев А. Л. Локальный априорный вывод в алгебраических байесовских сетях: комплекс основных алгоритмов ll Труды СПИИРАН. Вып. 5. 2007. СПб.: Наука, 2007. С. 100-111.

13. Тулупьев А. Л. Алгебраические байесовские сети: логико-вероятностный подход к моделированию баз знаний с неопределенностью. СПб.: СПИИРАН, 2000. 282 c.

14. Гавурин М. К., Малоземов В. Н. Экстремальные задачи с линейными ограничениями: учеб. пособие. Л.: Изд-во Ленингр. ун-та, 1984. 175 с.

Статья поступила в редакцию 26 апреля 2012 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.