Научная статья на тему 'Непротиворечивость оценок вероятностей в алгебраических байесовских сетях'

Непротиворечивость оценок вероятностей в алгебраических байесовских сетях Текст научной статьи по специальности «Математика»

CC BY
395
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕРОЯТНОСТНАЯ ГРАФИЧЕСКАЯ МОДЕЛЬ / НЕОПРЕДЕЛЕННОСТЬ ЗНАНИЙ / ФРАГМЕНТ ЗНАНИЙ / АЛГЕБРАИЧЕСКАЯ БАЙЕСОВСКАЯ СЕТЬ / ИНТЕРВАЛЬНАЯ ОЦЕНКА / СТЕПЕНЬ НЕПРОТИВОРЕЧИВОСТИ / PROBABILISTIC GRAPHICAL MODEL / KNOWLEDGE UNCERTAINTY / KNOWLEDGE PATTERN / ALGEBRAIC BAYESIAN NETWORK / INTERVAL ESTIMATE OF PROBABILITY / CONSISTENCY DEGREE

Аннотация научной статьи по математике, автор научной работы — Тулупьев Александр Львович

Алгебраические байесовские сети (АБС) являются одной из вероятностных графических моделей баз фрагментов знаний (ФЗ) с неопределенностью. Цель работы дать формальное определение алгебраическим байесовским сетям и исследовать вопросы проверки непротиворечивости тех из них, которые связны и ацикличны. В теории АБС моделью ФЗ выступает идеал конъюнктов со скалярными или интервальными оценками вероятности истинности, а сама АБС является совокупностью таких моделей ФЗ, над которой задана структура графа смежности. Частными видами структуры АБС могут быть деревья смежности в этом случае речь идет об особом классе ациклических алгебраических байесовских сетей, и цепи смежности в этом случае АБС будет не только ациклической, но и представимой в виде пути (без взаимопересечений) между двумя фрагментами знаний. В статье содержится определение трех перечисленных структур, раскрывается связь между терминами «дерево смежности» и «дерево сочленений» и, наконец, дается формальное определение АБС и ациклической АБС. В отличие от локального случая, когда проверяется и поддерживается непротиворечивость отдельно ФЗ, в случае АБС можно рассмотреть четыре степени непротиворечивости: локальную, экстернальную, интернальную и глобальную. Они перечислены в порядке возрастания вычислительной сложности проверки соответствующих им условий. Если АБС глобально непротиворечива, то над совокупностью означиваний атомов, вошедших в эту сеть, существует распределение вероятностей, которое удовлетворяет как аксиоматике вероятностной логики, так и исходным оценкам, содержащимся в сети. Такие распределения вероятностей могут даже образовать семейство. В общем случае три оставшиеся степени непротиворечивости существования такого распределения вероятностей не гарантируют; в статье приведены соответствующие контр-примеры. Однако в случае ациклической АБС из ее интернальной непротиворечивости следует ее глобальная непротиворечивость. Проверка условий интернальной непротиворечивости сводится к решению задач линейного программирования, число переменных и ограничений которых линейно зависит от числа атомов в АБС (с учетом ограничений, накладываемых на размер каждого ФЗ). Проверка условий глобальной непротиворечивости сводится к решению задач линейного программирования, число переменных и ограничений в которых растет экспоненциально от числа атомов в АБС. Таким образом, для проверки глобальной непротиворечивости ациклической АБС достаточно проверить ее интервальную непротиворечивость, что существенно сокращает вычислительную сложность алгоритмов проверки. Приведены примеры, которые демонстрируют, насколько более экономна по объему хранимых данных АБС по сравнениюс объемлющим ее ФЗ, а также насколько более вычислительно эффективна проверка интервальной непротиворечивости АБС по сравнению с ее глобальной непротиворечивостью. Библиогр. 17 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Probabilistic estimates consistency in conjuncts and disjuncts ideals

Algebraic Bayesian networks (ABN) are one of the probabilistic graphical models of knowledge pattern bases with uncertainty. The paper goal is to present a formal definition for ABN and to investigate the problems of consistency maintenance of those which are connected and acyclic. In the theory of algebraic Bayesian networks, the model for a knowledge pattern (KP) is a conjuncts ideal with either scalar or interval estimates of their probabilities. An ABN itself is a set of KP models where this set has a special structure that is referred to as an join graph. There can be considered two particular kinds of ABN structure: join tree and an join chain. If an ABN has a join tree structure, this network is an acyclic ABN. If an ABN has a join chain structure, this network is not only acyclic but it can also be represented as a path (without self-intersections) between two knowledge patterns. The paper contains definitions of the above mentioned structures, explicates the essential links between notions of a join tree and a join chain and provides a reader with the formal definition of ABNs and acyclic ABNs in this context. As opposed to the local case in which just a separate knowledge pattern can be checked for consistency or supported, in the case of an algebraic Bayesian network four different ABN consistency degrees: local consistency, external, internal and global ones can be considered. The consistency degrees are presented in the increasing order of their computational complexity. If an algebraic Bayesian network is globally consistent, it means that there exists a probabilistic distribution over all possible ABN atom assignments that satisfy probabilistic logic axioms as well as initial estimates belonging to the ABN. Such probabilistic distributions can even make a non-empty family. In a general case, none of the rest of consistency degrees can guarantee existence of such probabilistic distribution; the paper presents a set of proper counter-examples. However, in the case of an acyclic algebraic Bayesian network its internal consistency implies its global consistency. The verification of ABN internal consistency is reduced to solving a set of the linear programming problems whose number of variables and constraints is linear regarding to the number of atoms in the ABN (taking into account the limitations imposed on the upper limit for the size of knowledge patterns). The direct verification of the ABN global consistency will require solving a set of the linear programming problems whose number of variables and constraints is exponential regarding to the number of atoms in the ABN. The fact that to verify an ABN global consistency it is enough to verify the network internal consistency provides sufficient reduction in computational complexity of the verification procedure. The paper contains brief examples that demonstrate the data keeping advantages of an ABN in comparison with the corresponding ABN-embracing knowledge pattern as well as the computational complexity advantages of various degrees of consistency.

Текст научной работы на тему «Непротиворечивость оценок вероятностей в алгебраических байесовских сетях»

Сер. 10. 2009. Вып. 3

ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

УДК 004.8 А. Л. Тулупьев

НЕПРОТИВОРЕЧИВОСТЬ ОЦЕНОК ВЕРОЯТНОСТЕЙ В АЛГЕБРАИЧЕСКИХ БАЙЕСОВСКИХ СЕТЯХ *)

Введение. Настоящая работа опирается на систему терминов, обозначений и результатов из статьи [1], посвященной вопросам локального логико-вероятностного вывода в идеале конъюнктов. Идеал конъюнктов с вероятностными оценками истинности является одной из возможных логико-вероятностных моделей фрагмента знаний (ФЗ) с неопределенностью. Совокупность ФЗ образует базу фрагментов знаний (БФЗ). Одной из ее возможных математических моделей является алгебраическая байесовская сеть (АБС), сформированная из некоторым образом организованного набора идеалов конъюнктов и их оценок истинности.

Цель работы - дать формальное определение алгебраическим байесовским сетям и исследовать вопросы проверки непротиворечивости тех из них, которые состоят из одной компоненты связности и представимы в виде дерева смежности.

Графы, деревья и цепи смежности. В теории АБС узлу графа смежности приписывается в качестве веса идеал конъюнктов (без пустого конъюнкта). Заметим, что над идеалами конъюнктов определены операции пересечения и включения. До тех пор пока рассматриваются лишь вопросы структуры, можно полагать, что каждому узлу графа смежности приписан конечный набор атомов. По такому набору однозначно восстанавливается идеал конъюнктов, а по идеалу конъюнктов - набор атомов.

Граф смежности - это ненаправленный граф, в котором:

1) между каждой парой различных узлов, веса которых содержат общие элементы, существует путь;

2) в веса каждого из узлов пути, указанного в п. 1), входят все элементы, общие для начального и конечного узлов;

3) вес одного узла графа не входит полностью в вес никакого другого узла.

Следует обратить внимание на то, что путь из п. 1) может содержать одно или большее число ребер. Кроме того, узлы с весами, включающими общие элементы, не обязательно связаны ребром - достаточно, если они соединены путем.

Каждому ребру в графе смежности удобно приписать вес - множество общих элементов весов, отнесенных к тем двум узлам, которые соединяются рассматриваемым ребром. В данном случае вес на ребре называется сепаратором (или разделителем) [2].

Тулупьев Александр Львович — кандидат физико-математических наук, доцент кафедры информатики математико-механического факультета СПбГУ, ведущий научный сотрудник СПИИРАН. Количество опубликованных работ: 140. Научные направления: представление и обработка данных и знаний с неопределенностью, применение методов математики и информатики в социокультурных исследованиях, применение методов биостатистики и математического моделирования в эпидемиологии, технология разработки программных комплексов с СУБД. E-mail: [email protected], [email protected].

+ ) Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (грант № 09-01-00861-а).

© А. Л. Тулупьев, 2009

Лист - это узел графа смежности, из которого исходит (или в который входит) только одно ребро.

Поскольку мы рассматриваем ненаправленные графы, то деревом смежности называется ациклический граф смежности - такой граф, в котором нет ни одного цикла, т. е. пути, начало и конец которого бы совпали. Цепь смежности - это дерево смежности с двумя и только двумя листами (они не совпадают), между которыми существует путь, и в нем содержатся все остальные вершины дерева [2, 3].

Замечание 1. В дереве смежности с числом узлов, не меньшем двух, имеется как минимум два узла-листа. Справедливость утверждения доказывается методом математической индукции [2, 4, 5].

С деревом смежности совпадает по структуре дерево сочленений, но его отличие состоит в том, что элементам идеалов, стоящих в узлах, приписана оценка вероятности. Фактически, если в дереве смежности в каждом узле заменить идеал на отвечающий ему ФЗ, получится дерево сочленений - одно из возможных представлений соответствующей АБС.

Обычно, когда речь идет о деревьях сочленений, считается, что оценки вероятностей конъюнктов, общих для двух и более ФЗ, совпадают. Можно сказать иначе: оценки вероятностей на конъюнктах из сепараторов совпадают.

Наконец отметим, что деревья смежности и сочленений интенсивно используются в теории байесовских сетей доверия [4-9] при рассмотрении алгоритмов первичной пропагации (или априорного вывода) и пропагации свидетельств (или апостериорного вывода).

Определение АБС. Пусть С - идеал конъюнктов [1, 7, 10], р : С —> [0; 1] задает скалярные (точечные), а р : С —> {[р-;р+] : р- ^ р+; р-,р+ € [0; 1]} интервальные оценки вероятностей его элементов. В теории АБС фрагмент знаний С - это пара, состоящая из идеала конъюнктов и их оценок вероятностей. В случае скалярных оценок С = (С,р), а в случае интервальных С = (С, р) [7, 10].

Алгебраическая байесовская сеть N - это набор N° ФЗ N° = {Сг}г=П = {(Сг, Рг)}г=П в случае интервальных оценок, и N° = {Сг}гг=гП = {(Сг,рг)}г=п в случае скалярных [2, 7]. Назовем носителем N = виррN АБС N объединение идеалов конъюнктов, лежащих

г=п

в основе ФЗ, вошедших в сеть: N = и С.

г=1

В данный момент АБС N обладает только первичной структурой: нам лишь известно, какие ФЗ в нее вошли. В дальнейшем будем также использовать вторичную структуру АБС в виде графа смежности О или дерева смежности Т соответственно.

Над конъюнктами из N = виррN заданы совокупности оценок вероятностей; эти совокупности образуются при совместном рассмотрении оценок вероятностей в ФЗ, которые формируют АБС N. В случае скалярных оценок имеем набор {рг}гг=П, а в случае интервальных - {рг}\=П. Когда оценки на всех одинаковых конъюнктах, которые входят в два или более ФЗ, совпадают, тогда можно говорить о том, что оценки определены как функция на носителе N. В точечном случае эта функция будет иметь вид р : N —> [0; 1], а в интервальном - р : N —> {[р-;р+] : р- ^ р+; р-,р+ € [0; 1]} .

Степени непротиворечивости АБС. Нашей ближайшей задачей является анализ непротиворечивости совокупности оценок (т. е. совместимости их друг с другом и с аксиомами вероятностной логики).

Вопросы, связанные с определением и поддержанием различных степеней непротиворечивости АБС, как и подходы к определению непротиворечивости ФЗ с точечными

и интервальными оценками истинности, ставились и изучались в ряде публикаций (в частности, в [7, 11-15]).

Определение непротиворечивости отдельного ФЗ C и способ ее проверки в случае как скалярных, так и интервальных оценок рассмотрены в [1]. В [1, 7, 10, 14, 15]

определен предикат Consistent [C], который истинен, когда ФЗ C непротиворечив, и ло-

жен - в противоположном случае.

АБС считается локально непротиворечивой, если каждый отдельно взятый ФЗ в сети непротиворечив:

(VC е №) Consistent [C].

Эта степень непротиворечивости еще не предъявляет требований к совпадению оценок на конъюнктах, общих для двух или нескольких ФЗ.

АБС считается экстернально непротиворечивой, если каждый ФЗ в сети непротиворечив (VC е №) Consistent [C], а также оценки истинности любого конъюнкта, входящего одновременно в два или более ФЗ, совпадают:

(VC' е №) (VC'' е №) (Vf е C n C'') p'(f) = p''(f). (1)

Имеется в виду (см. (1)), что при точечных оценках совпадают значения этих оценок, а при интервальных - их нижние и верхние границы соответственно.

АБС считается интернально непротиворечивой, если каждый ФЗ в сети непротиворечив, а также для любого конъюнкта из этой сети для любого скалярного значения из интервала оценки его истинности можно выбрать согласованные (т. е. совпадающие на одинаковых формулах) скалярные значения во всех ФЗ, так, что все получившиеся ФЗ с точечными оценками будут непротиворечивы:

(Vf е N) (Vp е p(f)) (Эр' : N -^ [0; 1]) p'(f) = р& (VC е №) Consistent [<C,p'\c)].

АБС считается глобально непротиворечивой, если ее с имеющимися оценками можно погрузить в непротиворечивый объемлющий ФЗ C и при этом оценки p^(f) на конъюнктах из сети не изменятся:

(3C = <C, PC))Consistent [C] & N с C&(Vf е N) pc(f) = pw(f).

Было показано, что линейная комбинация конечного числа непротиворечивых ФЗ одинаковой структуры непротиворечива [14, 15]. Линейно комбинируются соответствующие оценки истинности. В интервальных оценках линейно комбинируются нижние и верхние границы соответственно. Из этого следует, что линейная комбинация конечного набора одинаково непротиворечивых АБС будет являться АБС, непротиворечивой в той же степени, что и исходные АБС [14, 15]. Отсюда, в свою очередь, вытекает, что любой элемент линейной оболочки конечного набора одинаково непротиворечивых АБС будет являться АБС, непротиворечивой в той же степени, что и исходные сети [14, 15].

Отметим, что в общем случае из глобальной непротиворечивости очевидно следует интернальная, из интернальной - экстернальная, а из экстернальной - локальная. Проверка требований, предъявляемых степенями непротиворечивости АБС, имеет различную вычислительную сложность: самая вычислительно сложная - глобальная непротиворечивость, затем идет интернальная, экстернальная и, наконец, локальная.

«Идеальным» случаем непротиворечивости является глобальная непротиворечивость, поскольку только она гарантирует существование хотя бы одного «всеобщего»

распределения вероятностей над квантами, построенными сразу над всеми атомарными пропозициями из АБС. Другими словами, глобальная непротиворечивость гарантирует, что мы работаем именно с оценками вероятностей, а не с какими-то иными объектами. Но проверка глобальной непротиворечивости непосредственно по ее определению экспоненциально сложна, поэтому важно рассмотреть отношения степеней непротиворечивости. Относительно системы указанных отношений установлено несколько нетривиальных фактов.

Несовпадение локальной и экстернальной непротиворечивости очевидно: достаточно рассмотреть два пересекающихся непротиворечивых ФЗ, у которых не будут совпадать оценки на общих элементах.

Пример 1. АБС, непротиворечивая лишь экстерналъно. Экстернально непротиворечивая ациклическая АБС, построенная над набором идеалов (д,т,в), (т,в,Ь), (і,и,у,иі), {ш,х,у) и (х,у,г), является интернально противоречивой [13, 16]:

р(д) = 0.52,

0.84 ^ р(т) ^ 1.0, р(дт) = 0.52, р(в) = 0.68, р(дв) = 0.2,

0.52 < р(тв) < 0.68, р(дтв) = 0.2,

0.6 < р(г) < 0.76, р(Н) = 0.6, р(вЬ) = 0.52, р(тві) = 0.52,

0.6 < р(г) < 0.74,

0.7 < р(и) < 0.9,

0.5 < р(Ы) < 0.64,

0.7 < р(у) < 0.9,

0.5 ^ р(Ьу) ^ 0.64, р(иу) = 0.6,

0.5 ^ р(Ьиу) ^ 0.6,

0.7 < р('ю) < 0.82, р(іім) = р(иж) = 0.6, р(іиж) = 0.5; р(уім) = 0.6, р(іуім) = р(иу')м) = 0.5,

0.4 ^ р(іиуім) ^ 0.5.

0.7 < р(т) < 0.82, 0.7 < р(и) < 0.92, р(-)мх) = 0.7, р(у) = 0.76, р(^лу) = 0.64,

0.64 ^ р(ху) ^ 0.74, р(-)мху) = 0.64, р(х) = 0.64, р(хг) = 0.64, р(уг) = 0.4, р(хуг) = 0.4,

Пример 2. АБС, непротиворечивая лишь интернально. АБС, построенная над набором идеалов (хі,х2), (х2,х3) и (х\,хз), с оценками

р(хі) = р(х2) = р(хз) = р(хіх2) = р(х2хз) = 0.5 и р(хіхз) = 0

является интернально непротиворечивой, но не глобально непротиворечивой [12, 14, 15]. Заметим, что из-за наличия цикла в графе смежности такая АБС не может быть представлена в виде дерева смежности.

Оказывается, что в случае ациклических АБС (в [14, 15], где представлено доказательство факта, ациклические АБС вводились без обращения к понятию «дерево смежности») из их интернальной непротиворечивости следует их глобальная непротиворечивость. Ниже оформим этот результат для ациклических АБС, определение которых состоит в том, что они представимы в виде дерева смежности.

Утверждение 1. Два построенных над пересекающимися цепочками атомов и = ХУ и V = УУ непротиворечивых ФЗ (Си,ри) и (Су,ру) с точечными оценками вероятностей, которые совпадают на общих элементах указанных ФЗ, образуют глобально непротиворечивую АБС.

Доказательство. Отметим, что согласованность распределений ри(У) = ру (У0 на квантах вида и = XУ и V = УZ равносильна согласованности распределений на соответствующих идеалах конъюнктов над цепочками и и V. Поэтому, если распределения над идеалами согласованы в общем подыдеале над цепочкой У, указанным в [7, 14, 15, 17] способом эти два распределения над и и V можно продолжить

до распределения в объемлющем идеале, построенном над атомарными пропозициями из цепочки Ш = ХУZ:

рш

0, ру (У0=0,

(2)

Таким образом, АБС из двух ФЗ над и и V удалось погрузить в непротиворечивый объемлющий ФЗ над Ш, что доказывает глобальную непротиворечивость указанной

Утверждение 2. Пусть АБС с точечными оценками истинности представлена в виде дерева смежности, каждый ФЗ в ней непротиворечив и оценки вероятностей на общих элементах различных ФЗ совпадают, тогда сама АБС глобально непротиворечива.

Доказательство. Оно выполняется на основе принципа математической индукции. База индукции доказывается для АБС из двух ФЗ. В этом случае для построения объемлющего непротиворечивого ФЗ используем утверждение 1. Индуктивный переход. Пусть утверждение справедливо для всех АБС, состоящих из не более чем п — 1 (п ^ 3) ФЗ. Докажем справедливость утверждения для АБС, состоящей из п ФЗ. Поскольку АБС представима в виде дерева смежности, у этого дерева найдется хотя бы один узел-лист (см. замечание 1), связанный ребром только с одним другим ФЗ. Исключим узел-лист из АБС. Получившаяся АБС также представима в виде дерева смежности. По условию индуктивного перехода ее можно достроить за счет композиции распределений до непротиворечивого объемлющего ФЗ. Рассмотрим сформированный объемлющий ФЗ и исключенный ранее ФЗ-лист. АБС, полученная из этих двух ФЗ, представима в виде дерева смежности, объемлющий ФЗ и ФЗ-лист имеют согласованные распределения вероятностей (так как эти распределения были согласованы у ФЗ-листа и его непосредственного соседа, вошедшего в объемлющий ФЗ). Согласно утверждению 1, можно достроить АБС, состоящую из двух ФЗ, до непротиворечивого объемлющего ФЗ.

Замечание 2.1. Поскольку композиция распределений (2) коммутативна и ассоциативна, распределение на объемлющем ФЗ над АБС из утверждения 2, построенное за счет серии указанных в доказательстве композиций, не будет зависеть от порядка поглощения ФЗ объемлющими ФЗ.

Замечание 2.2. Поскольку композиция распределений (2) влечет условную независимость [2, 7] для двух случайных бинарных последовательностей (СБП), разделенных третьей СБП, распределение вероятностей над объемлющим ФЗ из утверждения 2 будет обладать следующим свойством: если получим две или более непересекающиеся компоненты связности из дерева смежности, исключив из его узлов и других сепараторов пропозиции, в которые входит хотя бы одна атомарная пропозиция из некоторого выбранного сепаратора, то тогда СБП, построенные над любыми двумя компонентами связности, будут условно независимы при известном означивании СБП, сформированной над выбранным сепаратором.

Замечание 2.3. Композиция (2) не является единственным способом продолжить два согласованных распределения до распределения на объемлющем ФЗ. Примеры различающихся продолжений приведены в [14, 17].

Замечание 2.4. Однако требование условной независимости (или гипотеза условной независимости) двух СБП относительно СБП над общими атомарными

АБС.

пропозициями, делает композицию (2) единственным возможным способом распространения согласованных вероятностных распределений.

Утверждение 3. Пусть АБС представима в виде дерева смежности, тогда из ее интернальной непротиворечивости следует ее глобальная непротиворечивость.

Доказательство. Для АБС, представимой в виде дерева смежности, с точечными оценками истинности утверждение 3 немедленно следует из утверждения 2. Пусть теперь в рассматриваемой АБС допускаются интервальные оценки. Рассмотрим произвольный конъюнкт из АБС, выберем произвольную точку из интервальной оценки его истинности. Поскольку АБС интернально непротиворечива, то для всех оставшихся формул из этой сети можно выбрать точки из интервалов их оценок истинности, что получившаяся совокупность скалярных оценок на АБС будет интернально непротиворечива. Она, как было показано, будет и глобально непротиворечива. Следовательно, погружение исходной АБС в объемлющий ФЗ не приведет к исключению значений из исходных интервальных оценок истинности формул из АБС.

Замечание 3.1. Утверждение 3 позволяет заметно снизить вычислительную сложность и размерность задач линейного программирования, которые придется решать для проверки глобальной непротиворечивости АБС, представимой в виде дерева смежности, поскольку вместо погружения в объемлющий ФЗ достаточно будет проверить выполнение условий интернальной непротиворечивости рассматриваемой АБС.

Сложность проверки непротиворечивости. Можно сказать, что именно вопросы сложности задания и обработки сведений о вероятностных отношениях между большим числом утверждений, хранищихся в базах знаний интеллектуальных систем, обеспечили развитие теории нескольких видов вероятностных сетей в искусственном интеллекте. Это положение удобно раскрыть на примере АБС.

Пусть для описания предметной области используются оценки истинности утверждений, построенных над алфавитом А = {х1,. ..,хп}. Прямолинейный подход к формированию совокупности исходных сведений потребовал бы задания 2п оценок истинности вида р(Х1 ... Хп), где п может быть достаточно большим целым числом (более 100). Извлечь такой набор сведений, скажем, из опроса эксперта не представляется возможным; более того, специалисты в предметной области не увязывают сразу 100 или более утверждений в одном высказывании, правиле, оценке.

Как правило, удается извлечь знания о закономерностях, связывающих утверждения, построенные над небольшим подмножестовм атомов из алфавита; т. е. удается получить набор оценок вида р(Хг), р(ХгХ^), р(ХгХ^Хк) - как раз таких, для хранения и обработки которых предназначены ФЗ в теории АБС. Таким образом, всеобщее распределение р(Х1 . ..Хп) характеризуется через совокупность его маргинальных распределений, заданных над небольшим числом атомов.

В первую очередь это приводит к выигрышу в объеме данных. Скажем, при алфавите из 100 атомов и точечных оценках для цепи ФЗ, каждый из которых построен над двумя атомами, вместо 2100 « 1030 оценок вероятности всех конъюнктов в ФЗ над всем алфавитом потребуется 1 + 99 • 2 = 199 оценок конъюнктов из цепи ФЗ. Грубая верхняя граница объема данных для такой же цепи из ФЗ, каждый из которых построен над 4 атомами и имеет с каждым из соседей по три общих атома, равна 24 • 97 = 1552; на самом деле точное значение ощутимо меньше.

В случае интервальных оценок проверка локальной непротиворечивости потребовала бы последовательного решения задач линейного программирования (ЗЛП) [7, 14, 15] для каждого отдельно взятого ФЗ АБС. Сложность ЗЛП можно охарактеризовать через число переменных и ограничений, в нее входящих. С некоторым огрублением

в сторону увеличения можно считать, что для ФЗ над m атомами потребуется 2m переменных и столько же ограничений, обеспечивающих выполнение требований аксиоматики вероятностной логики, а также до 2 • 2m ограничений из предметной области на значения переменных. Для проверки непротиворечивости достаточно решить одну ЗЛП для произвольной переменной в качестве целевой функции; для уточнения оценок потребуется решить до 2 • 2m таких ЗЛП - для каждой переменной ищется максимум и минимум.

Проверка экстернальной непротиворечивости сведется к проверке локальной непротиворечивости и совпадения оценок для конъюнктов, одновременно входящих в разные ФЗ. Грубая верхняя граница числа таких проверок на совпадение равна сумме чисел конъюнктов из всех ФЗ АБС.

Проверка интернальной непротиворечивости сведется к формированию задачи линейного программирования с числом переменных, равным числу конъюнктов в АБС, грубая верхняя граница числа ограничений, вытекающих из аксиоматики вероятностей, равна сумме чисел конъюнктов из всех ФЗ сети; грубая верхняя граница числа ограничений из предметной области равна удвоенному числу конъюнктов в сети. Для проверки непротиворечивости потребуется решить одну такую ЗЛП; для уточнения оценок нужно решить такие ЗЛП на поиск максимума и минимума для каждой переменной.

Проверка глобальной непротиворечивости сведется к формированию ЗЛП с числом переменных, равным числу конъюнктов в ФЗ, построенном над всем алфавитом A; число ограничений, вытекающих из аксиоматики вероятностей, равно тому же числу конъюнктов в указанном ФЗ, а грубая верхняя граница числа ограничений из предметной области - удвоенному числу конъюнктов в сети. Для проверки непротиворечивости потребуется решить одну такую ЗЛП; для уточнения оценок необходимо решить такие ЗЛП на поиск максимума и минимума для каждой переменной.

Таким образом, в первых трех случаях размерность ЗЛП и их число ограничены сверху оценкой, величина которой пропорциональна числу ФЗ в АБС. Коэффициент пропорциональности зависит от максимального по размеру ФЗ, заданного в рассматриваемой АБС. Более того, можно заранее и с запасом считать, что такой ФЗ построен не более чем над 5-6 атомами.

Проверка глобальной непротиворечивости требует формирования ЗЛП с числом переменных и ограничений, экспоненциально зависящем от числа атомов в алфавите, над которым построена АБС; поэтому в случае ациклических АБС переход от непосредственной проверки требований глобальной непротиворечивости к проверке требований интернальной непротиворечивости дает существенный выигрыш как в объеме обрабатываемых данных, так и в числе удовлетворяемых ограничений.

Литература

1. Тулупьев А. Л. Непротиворечивость оценок вероятностей над идеалами конъюнктов и дизъюнктов // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2009. Вып. 2. С. 121-131.

2. Тулупьев А. Л. Алгебраические байесовские сети: глобальный логико-вероятностный вывод: учеб. пособие. СПб.: С.-Петерб. гос. ун-т; ООО Изд-во «Анатолия», 2007. 40 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Тулупьев А. Л., Столяров Д. М., Ментюков М. В. Представление локальной и глобальной структуры алгебраической байесовской сети в Java-приложениях // Труды СПИИРАН. 2007. Вып. 5. С. 71-99.

4. Cowell R. G., Dawid A. Ph., Lauritzen S. L., Spiegelhalter D. J. Probabilistic Networks and Expert Systems. Berlin: Springer, 2003. 321 p.

5. Jensen F. V. Bayesian Networks and Decision Graphs. New York: Springer-Verlag, 2001. 268 p.

6. Тулупьев А. Л. Алгебраические байесовские сети: логико-вероятностная модель баз фрагментов знаний с неопределенностью // Труды Всерос. науч. конференции по нечетким системам и мягким вычислениям НСМВ-2006 (20—22 сентября 2006 г.). Тверь, 2006. С. 31—47.

7. Тулупьев А. Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. СПб.: Наука, 2006. 607 с.

8. Korb K. B., Nicholson A. E. Bayesian Artificial Intelligence. New York: Chapman and Hall/CRC, 2004. 364 p.

9. Neapolitan R. E. Learning Bayesian Networks. Lebanon, IN: Pearson Prentice Hall, 2003. 674 p.

10. Тулупьев А. Л. Алгебраические байесовские сети: локальный логико-вероятностный вывод: учеб. пособие. СПб.: С.-Петерб. гос. ун-т; ООО Изд-во «Анатолия», 2007. 80 с.

11. Городецкий В. И. Алгебраические байесовские сети — новая парадигма экспертных систем // Юбил. сб. трудов институтов Отделения информатики, вычислительной техники и автоматизации РАН: в 2 т. М.: Изд-во РАН, 1993. Т. 2. С. 120-141.

12. Городецкий В. И., Тулупьев А. Л. Формирование непротиворечивых баз знаний с неопределенностью // Изв. РАН. Сер. Теория и системы управления. 1997. № 5. С. 33-42.

13. Сироткин А. В., Тулупьев А. Л. Алгебраические байесовские сети: согласованность и согласу-емость вероятностных оценок истинности // Интегрированные модели и мягкие вычисления в искусственном интеллекте: сб. трудов IV Междунар. науч.-практ. конференции. Коломна, 28-30 мая 2007 г.: в 2 т. М.: Физматлит, 2007. Т. 1. С. 296-302.

14. Тулупьев А. Л. Алгебраические байесовские сети: теоретические основы и непротиворечивость. СПб.: СПИИРАН, 1995. 76 с.

15. Тулупьев А. Л. Алгебраические байесовские сети: логико-вероятностный подход к моделированию баз знаний с неопределенностью. СПб.: СПИИРАН, 2000. 282 с.

16. Сироткин А. В. Интернальная и экстернальная степени непротиворечивости алгебраических байесовских сетей // Материалы X С.-Петерб. междунар. конференции «Региональная информатика 2006 (РИ-2006)», Санкт-Петербург, 24-26 октября 2006 г. СПб.: СПОИСУ, 2006. С. 57.

17. Тулупьев А. Л. Композиция распределений случайных бинарных последовательностей // Информационные технологии и интеллектуальные методы. 1996. Вып. 1. СПб.: СПИИРАН, 1996. С. 105-112.

Статья рекомендована к печати член-кор. РАН, проф. Г. А. Леоновым.

Статья принята к печати 5 марта 2009 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.