Научная статья на тему 'Непротиворечивость оценок вероятностей в идеалах конъюнктов и дизъюнктов'

Непротиворечивость оценок вероятностей в идеалах конъюнктов и дизъюнктов Текст научной статьи по специальности «Математика»

CC BY
202
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕРОЯТНОСТНАЯ ГРАФИЧЕСКАЯ МОДЕЛЬ / НЕОПРЕДЕЛЕННОСТЬ ЗНАНИЙ / ФРАГМЕНТ ЗНАНИЙ / БАЙЕСОВСКАЯ СЕТЬ / ВЕРОЯТНОСТНАЯ ЛОГИКА / ВЫВОД / ИНТЕРВАЛЬНАЯ ОЦЕНКА / НЕПРОТИВОРЕЧИВОСТЬ / PROBABILISTIC GRAPHICAL MODEL / KNOWLEDGE UNCERTAINTY / KNOWLEDGE PATTERN / BAYESIAN NETWORK / PROBABILISTIC LOGICS / INFERENCE / INTERVAL ESTIMATE / CONSISTENCY

Аннотация научной статьи по математике, автор научной работы — Тулупьев Александр Львович

Алгебраические байесовские сети (АБС) относятся к тому же классу вероятностных графических моделей баз фрагментов знаний с неопределенностью, что байесовские сети доверия (БСД) и марковские сети (МС). Общая идея, заложенная в архитектуру и алгоритмы обработки указанных вероятностных сетей, состоит в том, что знания о предметной области могут быть декомпозированы на достаточно небольшие фрагменты (фрагменты знаний, ФЗ), а фрагменты знаний могут быть связаны друг с другом, причем отдельно взятый ФЗ может быть связан лишь с небольшим числом других ФЗ. Связанные между собой фрагменты знаний образуют базу фрагментов знаний (БФЗ). С точки зрения локальной структуры, алгебраические байесовские сети отличаются от других вероятностных сетей используемой математической моделью фрагмента знаний: в основе этой модели лежит идеал конъюнктов со скалярными или интервальными оценками вероятности истинности. Целями настоящей статьи являются анализ идеала конъюнктов с оценками вероятности их истинности как математической модели фрагмента знаний, использующейся в теории АБС, а также определение и исследование операций поддержания непротиворечивости и априорного вывода в рамках указанной модели. Кроме того, рассматривается вопрос о проверке непротиворечивости альтернативной модели фрагмента знаний, носителем которой является идеал дизъюнктов, и вводится ряд определений, которые позволяют применять матрично-векторный язык для представления исследуемых объектов и операций над ними. Как было показано, по известным оценкам вероятностей конъюнктов можно оценить вероятность любой пропозициональной формулы, построенной над атомарными пропозициональными формулами, вошедшими в идеал конъюнктов, поскольку она однозначно и линейно выражается через вероятности этих конъюнктов. Вывод такой оценки в случае исходных интервальных данных опирается на решение задач линейного программирования. В отношении фрагмента знаний, построенного над идеалом дизъюнктов, справедливы аналогичные рассуждения; процессы проверки и поддержания непротиворечивости, а также априорного вывода сводятся в нем либо к непосредственной проверке матрично-векторных неравенств, либо к решению задач линейного программирования. Предложенный подход к представлению и обработке оценок вероятностей элементов идеалов конъюнктов (или дизъюнктов) опирается на весьма ясную вероятностную семантику соответствующих фрагментов знаний: непротиворечивому фрагменту знаний со скалярными оценками соответствует единственное распределение вероятностей на квантах, с интервальными оценками семейство таких распределений, а противоречивому (с любым видом оценок) -пустое семейство. Последние два случая невозможно обработать в рамках традиционных теорий БСД и МС. Библиогр. 16 назв. Табл. 1.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Тулупьев Александр Львович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Probabilistic estimates consistency in conjuncts and disjuncts ideals

Algebraical Bayesian networks (ABN) belong to the same class of probabilistic graphical modes of knowledge pattern bases with uncertainty as Bayesian belief networks (BBN) and Markov networks (MN) do. The general idea incorporated in these probabilistic networks architecture and inference algorithms is that domain knowledge can be decomposed into relatively small knowledge patterns (KP); in turn, these knowledge patterns can be interlinked though any KP can have just a few links with others. Interlinked knowledge patterns make a knowledge patterns base (KPB). From the viewpoint of their local structure, Algebraical Bayesian networks differ from other probabilistic networks with the mathematical model for the knowledge pattern representation. The model is based on a conjuncts ideal with either scalar or interval estimates of their probabilities. The paper goal is to analyze a conjuncts ideal with estimates of their probabilities as a knowledge pattern mathematical model used in the theory of ABN as well as to give concepts for and make study of reconciliation of the model and a priori inference in it. An alternative KP model based on disjuncts ideal will have similar consideration. At the beginning, the paper provides a set of definitions that allows for later usage of the matrix-vector formal language for representation of the objects and operations under consideration. In particular, an ABN knowledge pattern is represented with a specially ordered vector of conjuncts probabilities. The elementary outcomes space (each elementary outcome is referred to as a quantum proposition) is represented with another specially ordered vector of their probabilities. These two vectors can be mapped to each other with invertible linear mappings. The matrices corresponding to the forward mapping and its inversion have been explicitly specified with the Kronecker matrix degree; the formulae for generating the matrices elements are also given. Probabilistic logic axioms can be applied to quantum propositions immediately; subsequent restrictions on the quantum proposition probabilities can be expressed with the matrix-vector language. Appropriate variable substitutions in these restrictions lead to the matrix-vector inequality for scalar probabilistic estimates of conjuncts. The set of these estimates is consistent if and only if the inequality is true. In case of interval estimates, the initial data and the inequality form a set of linear programming problems with conjunct probabilities considered as the problem objectives. If a problem happens to be infeasible, the initial data are inconsistent; otherwise, the interval estimate can become narrower (i.e. more precise). Thus, verification and reconciliation of an ABN knowledge pattern renders to solving a set of linear programming problems. The probability of any propositional formula can be expressed as a linear function of conjunct probabilities. If conjuncts probabilities estimates are given, the probability estimate of this formula can be inferred. This procedure is referred to as a priori inference, it also renders to solving a set of linear programming problems. An alternative knowledge pattern model based on a disjuncts ideal can be considered with the same technique: the model verification and reconciliation as well as a priori inference in it render to the same types of calculations: either to matrix-vector transformations, or to solving linear programming problems in case of interval initial estimates. The proposed approach to the representation of conjuncts (or disjuncts) ideals and inference with them comes from a clear and precise probabilistic semantics of the corresponding knowledge patterns: a consistent knowledge pattern with scalar probabilistic estimates refers to a single probabilistic distribution over quantum propositions, a consistent one with interval estimates refers to the family of such distributions, and an inconsistent one refers to an empty family of distributions. The latter two cases are forbidden in traditional calculus of Bayesian belief networks and Markov networks.

Текст научной работы на тему «Непротиворечивость оценок вероятностей в идеалах конъюнктов и дизъюнктов»

ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

Сер. 10. 2009. Вып. 2

УДК 004.8 А. Л. Тулупьев

НЕПРОТИВОРЕЧИВОСТЬ ОЦЕНОК ВЕРОЯТНОСТЕЙ В ИДЕАЛАХ КОНЪЮНКТОВ И ДИЗЪЮНКТОВ*)

Введение. В искусственном интеллекте рассматривается ряд математических моделей баз фрагментов знаний с неопределенностью, среди которых особое место занимают вероятностные сети трех видов: марковские сети (МС), байесовские сети доверия (БСД) и алгебраические байесовские сети (АБС). Общая идея, заложенная в архитектуру и алгоритмы обработки указанных сетей, состоит в том, что знания о предметной области могут быть декомпозированы на достаточно небольшие фрагменты (фрагменты знаний, ФЗ), а фрагменты знаний могут быть связаны друг с другом, причем отдельно взятый ФЗ - лишь с небольшим числом других ФЗ. Связанные между собой фрагменты знаний образуют базу фрагментов знаний (БФЗ).

Внутри фрагментов могут быть с достаточной степенью детальности исследованы утверждения, в них вошедшие, и отношения между ними; затем уже учитываются отношения между ФЗ на уровне всей сети. Хотя логико-вероятностный вывод внутри каждого отдельного ФЗ может формально оказаться вычислительно сложным (например, сложность вычислений или требующийся объем данных может расти экспоненциально в зависимости от числа атомарных утверждений, вошедших в ФЗ), это обстоятельство нивелируется в силу изначального предположения о том, что любой ФЗ должен быть невелик по числу вошедших в него утверждений.

Набор основных операций логико-вероятностного вывода, которые применимы к вероятностным сетям, состоит из определения и поддержания непротиворечивости сети, априорного вывода (вывода не заданных напрямую оценок истинности утверждений по известным) и апостериорного вывода (распространения влияния свидетельства).

Вероятностные сети (МС, БСД, АБС) отличаются тем, какие математические модели рассматриваются для представления отдельного ФЗ и всей БФЗ, и тем, как формально определяются и осуществляются основные операции логико-вероятностного вывода в рамках выбранных математических моделей.

Целями настоящей статьи являются анализ идеала конъюнктов с оценками вероятности их истинности как математической модели ФЗ, использующейся в теории АБС, а также определение и исследование операций поддержания непротиворечивости и априорного вывода в рамках указанной модели.

Тулупьев Александр Львович — кандидат физико-математических наук, доцент кафедры информатики математико-механического факультета Санкт-Петербургского государственного университета, ведущий научный сотрудник СПИИРАН. Количество опубликованных работ: 133. Научные направления: представление и обработка данных и знаний с неопределенностью, применение методов математики и информатики в социокультурных исследованиях, применение методов биостатистики и математического моделирования в эпидемиологии, технология разработки программных комплексов с СУБД. E-mail: ALT@iias.spb.su, ALT4488@peterstar.ru.

+ ) Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (грант № 09-01-00861-а).

© А. Л. Тулупьев, 2009

Определения. Пусть имеется алфавит - множество атомарных пропозициональных формул (атомарных пропозиций, атомов) А = {хо,... ,хт-1}, которые представляют собой простейшие высказывания о предметной области, истинность которых нам удается оценить. Введем обозначение аргументного места (или литерала, что является синонимом) х. Аргументное место может принимать одно из двух значений х € {х, х}, где х € А, а х - его логическое отрицание. Как было бы и в случае со случайной бинарной величиной х, для аргументного места х положительным означиванием считается х, а отрицательным - х. Набор всех возможных пропозициональных формул (конечной длины) над А обозначим Г° = Г° (А), а набор квантов - цепочек конъюнкций аргументных мест максимальной длины т со всеми возможными означиваниями, назовем Q = Q(A) = {хохх ...хт-1}. Символ операции конъюнкции Л в цепочках, мы, как правило, будем опускать. Здесь и далее рассматриваем, на самом деле, классы формул, т. е. работаем с фактор-множеством

Г = Г (А) = Г °(А)/ = .

Фактор-множество Г состоит из классов пропозициональных формул, построенных над алфавитом А, в один класс попадают эквивалентные формулы. В частности, мы не различаем цепочки конъюнкций с одинаковым набором аргументных мест и/или атомарных пропозициональных формул. По умолчанию считаем, что пустая конъюнкция эквивалентна тождественной истине: ед = Т.

Идеалом конъюнктов (идеал положительно-означенных цепочек конъюнкций атомарных пропозициональных формул) над заданным множеством атомарных формул назовем

С = С (А) = |х^ х^ ...х^к : (гь г2, ...гк) € 20(1)(т-1), к € 0(1)т} .

Запись ё,1^2)^, где все ] € Ж, здесь и далее означает, что рассматриваем множество целых чисел {г € Ж : с],1 ^ г ^ Сз, г = с],1 + Ьс],2, Ь € Ж,Ь ^ 0} , а запись г = )Сз или

г € ]1(с],2 )Сз - что индекс г принадлежит соответствующему множеству или, при ином прочтении (но с тем же смыслом), «пробегает» целые числа от с],1 до Сз с шагом ]2.

Частичный порядок на идеале обусловлен отношением вхождения цепочек друг в друга; здесь существенно отметить, что вхождение определяется для множеств атомарных пропозиций, составляющих соответствующие цепочки. Более глубоко со свойствами идеала можно познакомиться в [1].

Идеал дизъюнктов - все положительно-означенные цепочки дизъюнкций атомарных пропозициональных формул

Су = Су (А) = {х^ V х^ V ... V х^к : (гьг2, ...ги) € 20(1)(т-1), к € 0(1)т} .

При переходе к матрично-векторному языку нам понадобится упорядочить конъюнкты и кванты. Для этого на множестве квантов и конъюнктов требуется ввести перенумерацию. Вопросы перенумерации были детально рассмотрены в [2, 3], здесь же приведем таблицу, позволяющую на интуитивном уровне освоить правила сопоставления номера, кванта и конъюнкта. Идея перенумерации заключается в том, что положительное вхождение атома х^ в квант или конъюнкт с номером к соответствует единице на соответствующей (г-й) позиции в двоичной записи числа к. В таблице используется обозначение [т]2 - двоичная запись неотрицательного целого числа то < 2Г, состоящая ровно из г двоичных цифр, т. е. (0 „ . 0)2 ^ то = [то]^ ^ (1 1)2-

Г Г

Обратим внимание, что в двоичной записи присутствует нужное количество ведущих нулей, если это необходимо. С числом, представленным в такой форме, можно выполнять побитовые логические операции. Нижний индекс в записи [т]2 будем, как правило, опускать: [т]г.

Перенумерация квантов и конъюнктов

Нумерация А = {хі} А = {хі, ж2} А = {хі,х2,хз}

№ю Ю \щ* Я АО Я А° я А°

0 02 0002 XI ЄЛ Х2Х1 ел ХЗХ2Х1 ел

1 І2 00І2 XI XI Х2Х\ XI Х3Х2Х1 XI

2 ю2 ою2 Х2Х\ Х2 Х3Х2Х1 Х2

3 1І2 0112 Х2Х\ Х2Хі Х3Х2Х1 Х2Х\

4 юо2 юо2 Х3Х2Х! х3

5 1012 1012 Х3Х2Х1 Х3Х!

6 1102 1102 Х3Х2Х1 Х3Х2

7 1112 1112 Х3Х2Х1 Х3Х2Х1

Краткая запись Х[і] будет обозначать і-й квант, а (АХ)[г] - г-й конъюнкт, где кванты и конъюнкты строятся над атомарными пропозициями из цепочки X. Разумеется, здесь необходимо договориться о порядке следования элементов - при перенумерации для удобства считается, что атомы в цепочках конъюнкций следуют в порядке, обратном алфавитному.

Определим понятие вероятности над пропозициональными формулами. Строгое изложение подхода Н. Нильссона (его оригинальный вклад - [4, 5], последующие формализации других авторов - [6, 7]) к введению вероятности на пропозициональных формулах Г (А) основывается на теореме о СДНФ. Формализация, предложенная группой Хальперна, Фаджина и Меджидо, будет ниже изложена с упрощениями; на русском языке она с достаточной полнотой представлена в [8].

Рассмотрим набор всех квантов Q как множество элементарных событий (или множество возможных миров). Зададим на нем исходное распределение вероятностей (дискретную плотность вероятности) р° : Q —> [0; 1] такое, что

У Є Q) р°(д) > 0, (1)

Е Р°(Ч) = 1- (2)

Введем вероятность р : 2Я —> [0; 1] следующим образом: (У Б С Q) р(Б) = ^ р°(ч).

На этом шаге было получено вероятностное пространство ^, 2Я ,р). Определим вероятностную меру на множестве Г так: (У/ Є Г) р(/) = р(Б(Г)).

Взяв за основу такое распространение вероятности на множество пропозициональных формул, получим новое вероятностное пространство: ^,Г,р). Эта [упрощенная] структура вероятностного пространства по Н. Нильссону задает вероятность над всеми пропозициями, построенными над множеством атомарных формул А.

Исходя из вышеописанного способа введения вероятности на пропозициональных формулах, имеем р(Т) = 1 и р(¥) = 0, что согласуется с нашими интуитивными представлениями.

В ряде доказательств удобнее оперировать не вероятностями конъюнкций, а вероятностями над случайными бинарными последовательностями (СБП). При этом вероятность, заданная над конъюнциями в соответствии с вероятностной логикой,

и вероятность, определенная на случайной бинарной последовательностью, суть одна и та же.

Рассмотрим набор означиваний цепочки конъюнкций вида U = XY; соответствующая случайная бинарная последовательность U = XY принимает значения из этого набора. Предполагается, что X и Y как множества атомов не пересекаются. Обозначим подобное множество для СБП X через Set [X], тогда указанное выше условие примет вид Set [X] П Set [Y] = 0.

Строгой записью вероятности приобретения СБП U значений вида U была бы такая: p(U = U), но вместо нее станем применять сокращенный вариант p(U) везде, где это не будет вносить неясностей в изложение.

Во всех дальнейших определениях, если не оговорено иного, будем использовать случайные бинарные последовательности, соотносящиеся следующим образом:

Set [X] П Set [Y] = 0, Set [Y] П Set [Z] = 0, Set [Z] П Set [X] = 0,

U = XY, v = Y Z, W = XY Z.

Зная распределение вероятностей p(XY) над цепочкой XY - конъюнкцией непересе-кающихся подцепочек X и Y, можно получить индуцированное распределение вероятностей над любой подцепочкой. Такой переход называется операцией маргинализации или маргинализацией. Примером маргинализации при имеющихся обозначениях может послужить следующее суммирование: p(X) = p(XY).

Y

Пусть дано распределение вероятностей СБП p(XY). Если yX yY p(XY) = p(X)p(Y), то соответствующие СБП X, Y называются (вероятностно) независимыми.

Заметим, что СБП £Л все время приобретает единственное значение £Л. Эта СБП не зависит ни от какой другой, как, впрочем, никакая другая СБП от нее также не зависит; £Л соответствует достоверному событию в теории вероятностей и тождественной истине - в логике.

Пусть известно распределение вероятностей p(W). При заданных условиях СБП X и Z называются условно независимыми (относительно СБП Y), тогда и только тогда, когда справедливо утверждение: yW p(XYZ)p(Y) = p(XY)p(YZ).

Заметим, что если Y = еЛ, то из условной независимости следует независимость: p(XZ) = p(X)p(Z). Кроме того, при заданных условиях СБП X и Z условно независимы (относительно СБП Y) тогда и только тогда, когда справедливо следующее утверждение: yY (p(Y) = 0) ^ (p(XZjY) = p(X\Y)p(Z\Y)).

Рассмотрим теперь два набора бинарных последовательностей U и V, над каждым из которых задано соответствующее распределение вероятностейpi(U) и p2(V). Причем U = XY и V = YZ, а p\(Y) = p2(Y). Утверждается, что тогда над W = XYZ можно построить распределение вероятностей p(W) такое, что p(U) = pi(U) и p(V) = p2(V). Здесь следует напомнить, что YY обозначает одну и ту же последовательность аргументных мест, а когда она встречается в формуле, то во всех ее частях имеет место одно и то же означивание аргументной последовательности одновременно. Нужно также добавить, что, поскольку аргументные места поименованы, порядок их следования не важен, в вычислениях их можно располагать как угодно. Выразим и докажем эту мысль в теореме, но перед этим определим понятие композиции распределений вероятностей над цепочками конъюнкций.

Пусть даны два набора бинарных последовательностей U и V, над которыми указаны распределения вероятностей pi(U) и p2(U), и набор бинарных

последовательностей IV, соотносящиеся как приведено выше. Тогда распределение вероятностей р(]¥) будем называть композицией распределений вероятностей р\(й) и Р2(У).

Теорема. Распределение верояностей, заданное формулой

{0, если р\(У) = 0,

рх{ху)р2{уг) ,~г, /п (з)

--------------, если Р1{У) ф 0,

Р\\У)

является композицией распределений вероятностей р\(и) и р2(У) [8, 10].

Замечание 1. В знаменателе формулы (3) может стоять также вероятность р2(У), поскольку по условию теоремы она равна вероятности р\(У).

Фрагменты знаний. В теории АБС фрагмент знаний С со скалярными оценками вероятности определяется как упорядоченная пара {С,р), где С - идеал конъюнктов над подмножеством атомов Б = {хо,..., хт-\}, лежащий в основе ФЗ, а р - функция на С, задающая скалярные (точечные) оценки вероятностей: р : С —> [0; 1]. Значения этой функции на конъюнктах из С, упорядоченные согласно возрастанию индексов последних, как было описано выше [8, 11], записывают в виде вектора Р. Компоненты вектора нумеруются от 0 до 2т — 1. Следует обратить внимание, что в векторе Р его нулевой компонент Ро = 1, так как пустой конъюнкт соответствует тождественной истине.

Используя введенные векторные обозначения, тот же фрагмент знаний С со скалярными оценками можно рассмотреть и как пару {С, Р), состоящую из идеала конъюнктов и вектора скалярных оценок вероятности истинности этих конъюнктов.

Определим также альтернативную математическую модель фрагмента знаний, которая будет образована над идеалом дизъюнктов.

Фрагмент знаний над идеалом дизъюнктов Са со скалярными оценками вероятности определяется как упорядоченная пара {Су ,р), где Су - идеал дизъюнктов над подмножеством атомов Б, лежащий в основе ФЗ, а р - функция на Су, задающая скалярные оценки вероятностей: р : Су —> [0; 1]. Значения этой функции на дизъюнктах из Су, упорядоченные, как было описано выше, записывают в виде вектора О (иногда как Ра, а вероятности конъюнктов - как Рс). Компоненты вектора нумеруются от 0 до 2т — 1. Следует обратить внимание на то, что в векторе О его нулевой компонент Оо = 0, так как пустой дизъюнкт соответствует тождественной лжи.

Используя введенные векторные обозначения, тот же фрагмент знаний над идеалом дизъюнктов со скалярными оценками можно рассмотреть и как пару {Су, О), состоящую из идеала дизъюнктов и вектора скалярных оценок этих дизъюнктов.

Непротиворечивость фрагментов знаний. В теории АБС допускаются как рассмотренные выше скалярные оценки вероятностей конъюнктов (и дизъюнктов), так и интервальные.

Условия (1) и (2), накладываемые аксиоматикой вероятностной логики на вероятности квантов, не допускают произвольного назначения их оценок. Те же условия опосредованно накладывают существенные ограничения на возможности для назначения оценок вероятностей над идеалом конъюнктов, что требует четкого оформления понятия непротиворечивости (непротиворечивого) [12, 13] фрагмента знаний и исследования его свойств.

Для описания процессов проверки и подержания непротиворечивости необходимо ввести дополнительно ряд векторов и матриц.

Обозначим вектор, состоящий из 2т нулей, как 0т\ вектор той же размерности, состоящий из единиц, как 1т, единичную матрицу размерности 2т х 2т как Е(т). Если размерность будет очевидна из контекста, то верхний индекс в нулевом и единичном векторах, а также в нулевой и единичной матрицах будем опускать.

Пусть I

1 —

1 -1

0 1

г[т]

Л

1—

. Тогда для ш ^ 2 определим матрицы

порядка 2т: Іт — II ], Лт

ЛІт], где [т] означает кронекерову (или прямую) степень

матрицы. Матрицы 1т и Лт взаимно обратны: 1т х Лт = Лт х 1т = Е(т).

Пусть г, ] = 0(1)(2т — 1), г индексирует кванты, а ] - конъюнкты, тогда при выбранном подходе к перенумерации квантов и конъюнктов, а также на основе формулы включений-исключений в [2, 3] было показано, что

р(Х [з ])

р (4х )Н)

Е (і®®з)р{Нх)H)),

1)(2т \Лг

Е р(х 3

г=0(1)(2т-1),

(4)

(5)

і=0(1)(2т-1), г=гЛЛ^

где ЛЛ - логическая операция побитового «и», ®® - логическая операция побитового «исключающего или», а выражение ~ (г ® ®3) приобретает значение «1», если в числе-результате операции побитового «исключающего или» содержится четное число единичных битов, и «—1» - в противном случае.

По существу, выражения (4) и (5) - это один из способов записи формулы включений-исключений. Его особенность - удобство программной реализации, связанной с перенумерацией квантов и конъюнктов.

Заметим, что соотношения (4) и (5) являются линейными и позволяют выразить ^(т) через Р(т) и наоборот. Значит, каждому соотношению соответствует матрица линейного преобразования. Можно показать [14, 15], что 1т и Лт как раз такие:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Іт X Р(т) — Я

(т)

Лт X Я(т) — Р(т).

Здесь ограничимся лишь формулировками основных утверждений, встречающихся в процессе доказательства.

Утверждение 1’. Рассмотрим матрицу 1т и выражение (4). Пусть ] = 0(1)(2т — 1) индексирует столбцы матрицы (и конъюнкты), а г = 0(1)(2т — 1) - строки матрицы (и кванты), тогда элемент /) матрицы 1т, стоящий в ^’-й строке, г-м столбце, приобретает значение «нуль», когда справедливо ] = ] Л Лг.

Замечание 2. Это утверждение говорит о том, что в матрице 1т нулевые элементы появляются при тех же г и ], когда нулевые коэффициенты стояли бы в выражении (4). В формальной записи выражения (4) члены с нулевыми коэффициентами просто не входят в сумму.

Утверждение 1”. Рассмотрим матрицу 1т и выражение (4). Пусть ] = 0(1)(2т — 1) индексирует столбцы матрицы (и конъюнкты), а г = 0(1)(2т — 1) - строки матрицы (и кванты), тогда ненулевой элемент 1^™матрицы 1т, стоящий в ]-й строке, г-м столбце, приобретает значение «1», когда число ненулевых битов в (г ® ®3) четно, и « — 1» -иначе.

Введем обозначение

т(т) _ / 0, 3 = 3 Л Лг, (6)

^ _ \ - (3 ®®г), 3 = 3 ЛЛг. ()

Утверждение 1. Рассмотрим матрицу 1т. Пусть 3 = 0(1)(2т — 1) индексирует

столбцы матрицы, а г = 0(1)(2т — 1) - строки матрицы, тогда элемент 1^™) матрицы

1т, стоящий в 3-й строке, г-м столбце приобретает значение согласно (6).

В случае скалярных оценок вероятностей над множеством квантов требования аксиоматики вероятностной логики (1) и (2) в матрично-векторном виде выразятся таким образом:

д(т) ^ 0т,

^Ц(т), = 1.

Для проверки непротиворечивости назначения скалярных оценок вероятностей над идеалом конъюнктов сначала требуется перейти к вероятностям над квантами, а затем проверить, что получившиеся вероятности неотрицательны. Второе условие -условие нормировки - будет выполнено автоматически, поскольку

1 (т) =

±т х

1 —1

0 1

11

м

[т]

[т]

[т]

1 0 0

и соответственно

((1т X Р(т)) , 1<т^ = (Р(т), 1т X 1<т>)

Р(т)

\

1 0 0

I р(ел) \

\

/

1 0

V0)

1

\ . /

1 0

V0)

1.

В матричном виде условие «неотрицательности» (которое обозначается Е(т)) выражается следующим образом: тт х Р

(т) ^ о<т>. На основе сведений из предметной области над идеалом конъюнктов может быть задано множество (которое обозначается В(т)) исходных интервальных оценок вероятностей, представимое в векторном виде как Р0 ,(т) ^ Р(т) ^ Р+,(т), где Р0 ,(т) - вектор, составленный из констант - (исход-

ч ~ Т1+?(т)

ных) нижних границ вероятностей соответствующих конъюнктов, а Р0 - такой

же вектор, но содержащий верхние границы. Компоненты обоих векторов с нулевым индексом всегда равны единице. Объединение двух множеств ограничений, исходящих

х

т

1

X

0

из аксиоматики вероятностной логики и предметной области, имеет свое особое обозначение: М(т) = В(т) и Е(т). Решая для каждой формулы ] из идеала конъюнктов задачи линейного программирования (ЗЛП) вида

можно обнаружить либо несовместность системы ограничений М(т), и тогда признать

интервальные оценки вероятностей над идеалом противоречивыми, либо получить непротиворечивые уточненные оценки вероятностей каждого элемента идеала. Векторы, содержащие уточненные нижние и верхние оценки вероятностей, обозначаются

его можно восстановить из контекста. Задачи линейного программирования в векторных обозначениях запишутся таким образом:

Р- = шш { Р) , Р+ = тах { Р) ,

к к

где поиск минимума и максимума осуществляется почленно и независимо.

Введем дополнительно несколько обозначений:

Первый вектор будет состоять из 2т единиц, второй - из того же числа нулей, третий - из того же числа элементов, причем все будут нулевыми, кроме самого верхнего, четвертый - из того же числа элементов, причем все будут нулевыми, кроме самого нижнего. Согласно [11], в новых обозначениях можно записать Іт х 1т — 0т.

из нулей, но на ее второй главной диагонали располагаются единицы. Когда матрица такого вида воздействует на вектор соответствующей размерности, он «переворачивается», т. е. его элементы переходят на симметричные относительно середины вектора

Операция умножения Em X Qm равносильна замене означиваний литералов на противоположные в векторе вероятностей квантов Qm.

Определим Pт = lm - Pm; получившийся вектор содержит вероятность отрицания каждого конъюнкта или, по правилу де Моргана, вероятность каждого дизъюнкта, составленного из отрицаний атомов.

Далее индекс m и знак операции умножения матриц X будем иногда опускать, где возможно это сделать без потери смысла.

Пусть K = JEL Заметим, что K2 = E: K2 = JEIJEI = JEEI = JI = E^ Более того, справедливы равенства KP = P, KP = P^ Далее, по правилам де Моргана, имеют место соотношения l - P = D, l - D = P■ Таким образом, K (l - D) = P^

Для фрагмента знаний C = {C, P) задание скалярных оценок считается непротиворечивым [11], если IxP ^ 0^ Определим предикат Consistent [C], который истинен, когда фрагмент знаний (аргумент предиката) непротиворечив. В остальных случаях предикат принимает ложное значение. При необходимости для фрагментов знаний со скалярными и интервальными оценками вероятностей можно использовать более подробную запись Consistent [{C,p)] и Consistent [{C, p)] соответственно или запись с векторами оценок.

Р-.(т) и Р+-(т) соответственно. Отметим, что показатель (т) часто опускается, если

Получившаяся матрица Em состоит

позиции. Например: Eт X 0т = 0т, Eт X 0т = (0т■

Для фрагмента знаний Cd = {Cy, D) задание скалярных оценок считается непротиворечивым, если ID ^ 0. На языке введенных матрично-векторных обозначений это

условие непротиворечивости выводится следующим образом:

IK (1 - D) = IP = Q > 0, ^TJ^EI (1 - D) > 0, EI (1 - D) > 0,

E

I (1 - D) > 0, I1 - ID > 0, ID < I1, ID < 0.

Определим предикат Consistent [Cd\, который истинен, когда фрагмент знаний (аргумент предиката) непротиворечив; как и в предыдущем случае, можно рассмотреть те же альтернативные записи аргумента предиката.

В случае системы интервальных оценок истинности в идеале дизъюнктов для проверки и поддержания непротиворечивости можно сформировать задачи линейного программирования, сходные с теми, которые приходится решать в случае идеала конъюнктов.

Когда сведения относительно одного и того же небольшого набора утверждений поступают из разных источников, над одним и тем же идеалом конъюнктов может быть сформировано несколько фрагментов знаний. Так случается, например, когда опрашиваются несколько экспертов.

Каждому ФЗ в зависимости от нашего доверия к источнику можно приписать неотрицательный вещественный вес так, чтобы сумма весов равнялась единице. Тогда на основе построенных ФЗ и выбранных весов можно построить фрагмент знаний (над тем же одинаковым для всех исходных ФЗ идеалом), где оценка каждого конъюнкта получается как линейная комбинация с соответствующими весами оценок таких же конъюнктов из набора исходных ФЗ. Такой фрагмент знаний назовем линейной комбинацией набора исходных ФЗ.

Если исходные ФЗ были непротиворечивы, то и их линейная комбинация также непротиворечива [8, 10, 16]. Эта операция позволяет комбинировать свидетельства разных экспертов (или различных источников) с учетом нашей оценки их надежности или достоверности.

Уточним, что линейная комбинация интервалов (точнее, отрезков) является интервалом, где нижняя граница есть линейная комбинация нижних границ исходных интервалов, а верхняя - линейная комбинация верхних. Необходимо указать, что если взять непротиворечивые ФЗ одинаковой структуры, но с разными распределениями и построить новый ФЗ такой же структуры, но в качестве нижней оценки для каждого конъюнкта взять минимум по всем нижним оценкам этого конъюнкта, а в качестве верхней - максимум по верхним, то получившийся ФЗ будет непротиворечив.

Априорный вывод. Заметим, что вероятность любой пропозициональной формулы f из F(А) выражается как сумма вероятностей некоторых квантов из Q(A). Вероятности же квантов линейно выражаются через вероятности конъюнктов. Следовательно, вероятность f линейно выражается через вероятности конъюнктов:

(Vf £ F(А)) 3 ! L(m) : p(f) = (L(m), P(m)) , (7)

где L(m) — вектор вещественных констант, совпадающий по размерности с P(m). Если требуется оценить вероятность формулы f, опираясь на оценки вероятностей элементов идеала конъюнктов, то пополнив множество R(m) уравнением p(f) = (L(m), P(m))

и решив ЗЛП по минимизации и максимизации переменной p(f), получим искомую оценку. Если же требуется учесть наше знание об интервальной оценке величины p(f), то подобным же образом множество R(m) пополняется ограничением (7) и ограничением, исходящим из предметной области: p-(f) ^ p(f) ^ p(f)+.

Априорный вывод заключается в том, чтобы по известным вероятностным оценкам истинности заданных пропозициональных формул построить вероятностную оценку пропозициональной формулы, не вошедшей в число заданных.

Если исходные данные совместны, то в результате поддержания непротиворечивости и априорного вывода формируются интервальные оценки, которые представляют собой отрезок (замкнутый промежуток), возможно, вырождающийся в точку. Для каждой точки такого отрезка можно выбрать точки во всех оставшихся оценках-отрезках так, чтобы получившаяся совокупность скалярных оценок оказалась непротиворечивой. Это важный факт: он говорит о том, что такая оценка именно интервальная, а не обладает какой-то более сложной структурой. Доказательство [8, 10, 16] опирается на то, что ограничения ЗЛП задают выпуклое множество.

Заключение. В теории алгебраических байесовских сетей математической моделью ФЗ является идеал конъюктов с оценками вероятности истинности. Процессы проверки и поддержания непротиворечивости, а также априорного вывода в таком ФЗ сводятся либо к матрично-векторным операциям (при скалярных оценках), либо к решению задач линейного программирования (при интервальных оценках).

Противоречивому ФЗ сопоставляется пустое семейство распределений вероятностей, непротиворечивому ФЗ со скалярными оценками - единственное распределение вероятностей на квантах, а с интервальными - непустое семейство таких распределений.

В работе остался без упоминания расчет оценок чувствительности получающихся результатов. Как оказалось, в случае поддержания непротиворечивости и априорного вывода он сводится к решению серии задач линейного программирования. Подробности доступны, например, в работе [8], где также можно почерпнуть сведения о некоторых теоретических оценках чувствительности.

Литература

1. Владимиров Д. А. Булевы алгебры. СПб.: Изд-во С.-Петерб. ун-та, 2000. 616 с.

2. Тулупьев А. Л. Генерация множества ограничений на распределение оценок вероятности над идеалом цепочек конъюнкций // Вестн. молодых ученых. 2004. № 4. Сер. Прикладная математика и механика. № 1. С. 35—43.

3. Тулупьев А. Л., Никитин Д. А. Экстремальные задачи в апостериорном выводе над идеалами цепочек конъюнкций // Труды СПИИРАН. 2005. Вып. 2, т. 2. СПб.: Наука, 2005. С. 12—52.

4. Nilsson N. J. Probabilistic Logic // Artificial Intelligence. 1986. Vol. 47. Amsterdam: Elsevier Science Publishers B.V., 1986. P. 71-87.

5. Nilsson N. J. Probabilistic Logic Revisited // Artificial Intelligence. 1993. Vol. 59. Amsterdam: Elsevier Science Publishers B.V., 1993. P. 31-36.

6. Fagin R., Halpern J. Y., Megiddo N. A Logic for Reasoning about Probabilities: Report RJ 6190 (60900) 1988.04.12. P. 1-41.

7. Fagin R., Halpern J. Y. Uncertainty, Belief, and Probability-2 // Proc. of the IEEE Symposium on Logic and Computer Science. 1991. Vol. 7. P. 160-173.

8. Тулупьев А. Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. СПб.: Наука, 2006. 607 с.

9. Тулупьев А. Л. Композиция распределений случайных бинарных последовательностей // Информационные технологии и интеллектуальные методы. 1996. Вып. 1. СПб.: СПИИРАН, 1996. С. 105112.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Тулупьев А. Л. Алгебраические байесовские сети: теоретические основы и непротиворечивость. СПб.: СПИИРАН, 1995. 76 с.

11. Тулупьев А. Л. Алгебраические байесовские сети: локальный логико-вероятностный вывод: учеб. пособие. СПб.: С.-Петерб. гос. ун-т; ООО Изд-во «Анатолия», 2007. 80 с.

12. Городецкий В. И., Тулупьев А. Л. Формирование непротиворечивых баз знаний с неопределенностью // Изв. РАН. Сер. Теория и системы управления. 1997. № 5. С. 33—42.

13. Городецкий В. И., Тулупьев А. Л. Непротиворечивость баз знаний с количественными мерами неопределенности // КИИ’98: сб. науч. трудов. Т. 1. Пущино, 1998. С. 100—106.

14. Тулупьев А. Л. Дерево смежности с идеалами конъюнктов как ациклическая алгебраическая байесовская сеть // Труды СПИИРАН. 2006. Вып. 3, т. 1. СПб.: Наука, 2006. С. 198—227.

15. Тулупьев А. Л. Алгебраические байесовские сети: логико-вероятностная модель баз фрагментов знаний с неопределенностью // Труды Всерос. науч. конференции по нечетким системам и мягким вычислениям НСМВ-2006 (20—22 сентября 2006 г.). Тверь, 2006. С. 31—47.

16. Тулупьев А. Л. Алгебраические байесовские сети: логико-вероятностный подход к моделированию баз знаний с неопределенностью. СПб.: СПИИРАН, 2000. 282 с.

Статья рекомендована к печати член-кор. РАН, проф. Г. А. Леоновым.

Статья принята к печати 25 декабря 2008 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.