Научная статья на тему 'Матрично-векторные алгоритмы нормировки для локального апостериорного вывода в алгебраических байесовских сетях'

Матрично-векторные алгоритмы нормировки для локального апостериорного вывода в алгебраических байесовских сетях Текст научной статьи по специальности «Математика»

CC BY
237
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЙЕСОВСКИЕ СЕТИ / BAYESIAN NETWORKS / АПОСТЕРИОРНЫЙ ВЫВОД / POSTERIORI INFERENCE / АЛГОРИТМЫ ВЫВОДА / INFERENCE ALGORITHMS / ОТЛОЖЕННЫЕ ВЫЧИСЛЕНИЯ / ПОБИТОВЫЕ ОПЕРАЦИИ / BITWISE OPERATIONS / POSTPONED CALCULATIONS

Аннотация научной статьи по математике, автор научной работы — Золотин А.А., Тулупьев А.Л., Сироткин А.В.

Рассматривается задача описания локального апостериорного вывода в алгебраических байесовских сетях, являющихся одним из классов вероятностных графических моделей, с помощью матрично-векторных уравнений. Такие уравнения, в основном, были описаны в предыдущих работах, однако содержали нормирующие множители, вычисления которых использовали алгоритмическую компоненту, не получившую искомой интерпретации на матрично-векторном языке. Для устранения указанного недостатка нормирующие множители сначала были представлены в форме скалярного произведения. Удалось показать, что одна из компонент в каждом скалярном произведении выражается как степень Кронекера фиксированного вектора размерности два. За счет переноса транспонированной матрицы-оператора ненормированного апостериорного вывода внутри скалярного произведения было получено разложение одного из множителей в виде последовательности тензорных произведений векторов размерности два, причем такие векторы могут принимать лишь два значения в одном случае и три в другом. Выбор указанных значений определяется структурой поступившего свидетельства. Второй компонентой скалярного произведения становятся векторы с исходными данными. Вычислительные эксперименты позволили построить соответствующие векторы, примеры некоторых из них приведены в работе. Описание в виде матрично-векторных уравнений локального апостериорного вывода упрощает разработку спецификации алгоритмов локального апостериорного вывода, обоснование их корректности и последующую реализацию с применением уже существующих библиотек. Также такие уравнения позволяют применить классические математические техники для анализа полученных результатов. Полученные результаты делают возможным использование метода отложенных вычислений: не формировать для проведения вычислений векторы большой размерности, а вычислять их компоненты за счет применения побитовых операций по мере надобности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Золотин А.А., Тулупьев А.Л., Сироткин А.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MATRIX-VECTOR ALGORITHMS FOR NORMALIZING FACTORS IN ALGEBRAIC BAYESIAN NETWORKS LOCAL POSTERIORI INFERENCE

We consider a task of local posteriori inference description by means of matrix-vector equations in algebraical Bayesian networks that represent a class of probabilistic graphical models. Such equations were generally presented in previous publications, however containing normalizing factors that were provided with algorithmic descriptions of their calculations instead of the desired matrix-vector interpretation. To eliminate this gap, the normalized factors were firstly represented as scalar products. Then, it was successfully shown that one of the components in each scalar product can be expressed as a Kronecker degree of a constant two-dimensional vector. Later on, non-normalized posteriori inference matrix-operator transplantation and further transfer within each scalar product yielded a representation of one of the scalar product components as a sequence of tensor products of two-dimensional vectors. The latter vectors have only two possible values in one case and three values in the other. The choice among those values is determined by the structure of input evidence. The second component of each scalar products is the vector with original data. The calculations performed gave the possibility for constructing corresponding vectors; the paper contains a table with proper examples for some of them. Local posteriori inference representation for matrix-vector equations simplify the development of local posteriori inference algorithms, their verification and further implementation based on available libraries. These equations also give the possibility for application of classical mathematical techniques to the obtained results analysis. Finally, the results obtained make it possible to apply the method of postponed calculations. This method helps avoiding construction of big-size vectors; instead, the vectors components can be calculated just in time they are needed by means of bitwise operations.

Текст научной работы на тему «Матрично-векторные алгоритмы нормировки для локального апостериорного вывода в алгебраических байесовских сетях»

НАУЧНО-ТЕХНИЧЕСКИИ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ И ОПТИКИ январь-февраль 2015 Том 15 № 1 ISSN 2226-1494 http://ntv.ifmo.ru/

SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTICS January-February 2015 Vol. 15 No 1 ISSN 2226-1494 http://ntv.ifmo.ru/en

УДК 004.8

МАТРИЧНО-ВЕКТОРНЫЕ АЛГОРИТМЫ НОРМИРОВКИ ДЛЯ ЛОКАЛЬНОГО АПОСТЕРИОРНОГО ВЫВОДА В АЛГЕБРАИЧЕСКИХ БАЙЕСОВСКИХ СЕТЯХ

А. А. Золотин", А. Л. Тулупьев" b, А.В. Сироткинь

а Санкт-Петербургский государственный университет, Санкт-Петербург, 198504, Российская Федерация b СПИИРАН, Санкт-Петербург, 199178, Российская Федерация Адрес для переписки: Alexander.tulupyev@gmail.com Информация о статье

Поступила в редакцию 05.12.14, принята к печати 15.12.14 doi: 10.17586/2226-1494-2015-15-1-78-85 Язык статьи - русский

Ссылка для цитирования: Золотин А. А., Тулупьев А.Л., Сироткин А.В. Матрично-векторные алгоритмы нормировки для локального апостериорного выводав алгебраических байесовских сетях // Научно-технический вестник информационных технологий, механики и оптики. 2015. Том 15. № 1. С. 78-85

Аннотация. Рассматривается задача описания локального апостериорного вывода в алгебраических байесовских сетях, являющихся одним из классов вероятностных графических моделей, с помощью матрично-векторных уравнений. Такие уравнения, в основном, были описаны в предыдущих работах, однако содержали нормирующие множители, вычисления которых использовали алгоритмическую компоненту, не получившую искомой интерпретации на матрично-векторном языке. Для устранения указанного недостатка нормирующие множители сначала были представлены в форме скалярного произведения. Удалось показать, что одна из компонент в каждом скалярном произведении выражается как степень Кронекера фиксированного вектора размерности два. За счет переноса транспонированной матрицы-оператора ненормированного апостериорного вывода внутри скалярного произведения было получено разложение одного из множителей в виде последовательности тензорных произведений векторов размерности два, причем такие векторы могут принимать лишь два значения в одном случае и три - в другом. Выбор указанных значений определяется структурой поступившего свидетельства. Второй компонентой скалярного произведения становятся векторы с исходными данными. Вычислительные эксперименты позволили построить соответствующие векторы, примеры некоторых из них приведены в работе. Описание в виде матрично-векторных уравнений локального апостериорного вывода упрощает разработку спецификации алгоритмов локального апостериорного вывода, обоснование их корректности и последующую реализацию с применением уже существующих библиотек. Также такие уравнения позволяют применить классические математические техники для анализа полученных результатов. Полученные результаты делают возможным использование метода отложенных вычислений: не формировать для проведения вычислений векторы большой размерности, а вычислять их компоненты за счет применения побитовых операций по мере надобности.

Ключевые слова: байесовские сети, апостериорный вывод, алгоритмы вывода, отложенные вычисления, побитовые операции.

Благодарности. Часть результатов, представленных в статье, была получена в рамках исследовательского проекта, поддержанного грантами РФФИ №№ 12-01-00945-а, 15-01-09001-а.

MATRIX-VECTOR ALGORITHMS FOR NORMALIZING FACTORS IN ALGEBRAIC BAYESIAN NETWORKS LOCAL POSTERIORI INFERENCE

A.A. Zolotin", A.L. Tulupyeva b, A.V. Sirotkinb

а Saint Petersburg State University, Saint Petersburg, 198504, Russian Federation b SPIIRAS, Saint Petersburg, 199178, Russian Federation Corresponding author: Alexander.tulupyev@gmail.com Article info

Received 05.12.14, accepted 15.12.14 doi: 10.17586/2226-1494-2015-15-1-78-85 Article in Russian

Reference for citation: Zolotin A.A., Tulupyev A.L., Sirotkin A.V. Matrix-vector algorithms for normalizing factors in algebraic Bayesian networks local posteriori inference. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2015, vol. 15, no. 1, pp. 78-85 (in Russian)

Abstract. We consider a task of local posteriori inference description by means of matrix-vector equations in algebraical Bayesian networks that represent a class of probabilistic graphical models. Such equations were generally presented in previous publications, however containing normalizing factors that were provided with algorithmic descriptions of their

calculations instead of the desired matrix-vector interpretation. To eliminate this gap, the normalized factors were firstly represented as scalar products. Then, it was successfully shown that one of the components in each scalar product can be expressed as a Kronecker degree of a constant two-dimensional vector. Later on, non-normalized posteriori inference matrixoperator transplantation and further transfer within each scalar product yielded a representation of one of the scalar product components as a sequence of tensor products of two-dimensional vectors. The latter vectors have only two possible values in one case and three values in the other. The choice among those values is determined by the structure of input evidence. The second component of each scalar products is the vector with original data. The calculations performed gave the possibility for constructing corresponding vectors; the paper contains a table with proper examples for some of them. Local posteriori inference representation for matrix-vector equations simplify the development of local posteriori inference algorithms, their verification and further implementation based on available libraries. These equations also give the possibility for application of classical mathematical techniques to the obtained results analysis. Finally, the results obtained make it possible to apply the method of postponed calculations. This method helps avoiding construction of big-size vectors; instead, the vectors components can be calculated just in time they are needed by means of bitwise operations.

Keywords: Bayesian networks, posteriori inference, inference algorithms, postponed calculations, bitwise operations. Acknowledgements. The research was partially supported by RFBR Grants No. 12-01-00945-а, 15-01-09001-а.

Введение

Алгебраические байесовские сети (АБС) [1-3] являются одним из классов вероятностных графических моделей (ВГМ) [4], все более широко применяющихся в интеллектуальных системах поддержки принятия решений и рекомендательных системах [5-9], системах анализа безопасности, рисков и обнаружения отказов [10-13], интеллектуального анализа текстов для составления маркетинговых прогнозов [14], системах моделирования отклика экологических систем на различные изменения и воздействия [15] и др. Все классы ВГМ фактически являются представлением баз фрагментов знаний с неопределенностью, причем предполагается, что предметная область допускает декомпозицию на небольшие фрагменты знаний - совокупности локально тесно связанных объектов (например, утверждений или переменных), а фрагменты знаний на глобальном уровне имеют разреженные связи между собой [4, 16]. Такое разделение на локальный и глобальный уровни влечет потребность в обеспечении двух видов вывода над ВГМ - локального и глобального. Преимущество ВГМ состоит в том, что алгоритмы, реализующие локальный вид вывода, могут быть вычислительно сложными, что, однако, компенсируется малыми объемами данных, к которым такие алгоритмы применяются.

Одной из отличительных особенностей теории АБС [3, 4] является то, что в качестве математической модели фрагмента знаний в ней выступает идеал конъюнктов с оценками вероятности истинности его элементов, причем оценки истинности могут быть как скалярными, так и интервальными, что, в свою очередь, обеспечивается привлечением подхода Н. Нильссона [17] к введению вероятности истинности на пропозициональных формулах. Возможность систематического использования интервальных оценок вероятностей в ВГМ существенна для таких актуальных открытых вопросов их теории, как, например, обработка изначально несогласованных сведений [3, 4, 18], алгоритмизация автоматического обучения [4, 19, 20].

Хотя ряду видов локального логико-вероятностного вывода в АБС (проверки непротиворечивости, поддержания непротиворечивости, априорного вывода, вывода оценок чувствительности) было сопоставлено алгоритмическое описание, допускавшее дальнейшую реализацию [3, 4, 16, 21], сказывалось отсутствие их математического описания в рамках единого формализма, что либо затрудняло, либо делало невозможным изучение свойств получающихся результатов. В одном из опубликованных материалов [22] был предложен подход к формированию уравнений апостериорного вывода во фрагментах знаний АБС на матрично-векторном языке, однако ограничением полученного результата являлось то, что предложить соответствующие уравнения для нормирующих множителей не удалось.

В настоящей работе ставится цель устранить этот недостаток, для чего решаются задачи построения матрично-векторных уравнений для нормирующих множителей в локальном апостериорном выводе, а также указать способ использовать эти уравнения при алгоритмизации соответствующих вычислений.

Определения, обозначения и базовые результаты

Определим использующиеся далее математические объекты, более подробное описание которых доступно в [3, 4, 22].

Зафиксируем конечное множество атомарных пропозициональных формул (атомов) - упорядоченный алфавит V = {vjfr,,1. Определим над указанными атомами два набора «базовых» пропозициональных формул. Первый набор - идеал конъюнктов,

— vik\0 <i1<i2<-<ik<n-l,0 <к <п}, где vi± vi2 —vik - означает конъюнкцию соответствующих переменных; сам знак конъюнкции мы для удоб-ства опустим. С учетом заданного алфавита каждому из конъюнктов вида vi2 —vik можно сопоставить характеристический вектор, а ему, в свою очередь, двоичное число, которое рассматривается как номер конъюнкта [3, 4]. Для определения второго набора формул - множества квантов - будет полезным следующее

обозначение. Литерал уь означает, что на его месте в пропозициональной формуле может стоять либо либо его отрицание у1. Тогда множество квантов над алфавитом 7 = — Q = Иными

словами, квант - это конъюнкция, которая для любой переменной из алфавита содержит либо ее саму, либо ее отрицание.

1 \ / р(?о)

Векторы Рс = | | и Рч = ( ^^ | содержат вероятности конъюнктов и квантов соот-

\р(с2п_1у

ветственно. При анализе процессов локального логико-вероятностного вывода вектор Рс рассматривается как представление фрагмента знаний с оценками вероятности истинности его элементов, а вектор Рч оказывается необходим как в математических выкладках, так и при последующей алгоритмической реализации. Эти векторы выражаются друг через друга с помощью соотношений Рч = 1„РС, Рс = 1„РЧ, где

'.-?1, '.-(1 "11 '^'Р1, '. = (1 1>

Показатель [п] используется для обозначения степени Кронекера матриц, а ниже символ ® - для обозначения тензорного (прямого) произведения матриц [23].

В теории АБС под свидетельством понимаются новые «обусловливающие» данные, которые поступили во фрагмент знаний и с учетом которых нам требуется пересмотреть все (или некоторые) оценки. В настоящей работе мы рассмотрим только детерминированное свидетельство; другие случаи сводятся к его рассмотрению в [4]. Мы говорим, что на вход системы поступило детерминированное свидетельство, если новые сведения представимы в виде конъюнкции атомарных переменных и их отрицаний. Примерами таких свидетельств могут быть <у0>, <у2У1Уо>. Заметим, что такое свидетельство можно разбить на «положительный» и «отрицательный» конъюнкты. В первый входят все положительно означенные атомарные переменные свидетельства, а во второй - отрицательно. При этом и положительной, и отрицательной части можно сопоставить индекс, соответствующий десятичному представлению двоичного числа, являющегося характеристическим вектором положительного (или отрицательного) свидетельства, и наши свидетельства можно будет записать следующими эквивалентными обозначениями: <у2у1у0> = <у0у1,у2> = <3,4> = <0112,1002>.

Далее, мы полагаем, что нам поступило свидетельство (¿; у>. Обратим наше внимание к вектору вероятностей квантов и попробуем вычислить условные вероятности квантов и конъюнктов при условии поступившего детерминированного свидетельства. Для этого понадобятся матрицы = ® Н<У>®„.Н<'->>, где

!Н+,если ук входит в с^, Н",если ук входит в с,-, Н°,иначе;

причем Н+ = (0 0); Н" = (0 0); Н° = (1 0^;T<IJ, = T--í®T^®■ToIJ,, где

!Т+,если ук входит в с^, Т",если ук входит в с^, Т°,иначе;

причем Т+ = (0 1);Т- = (1 "1);Т° = (0 1 Заметим, что Т<^> = 1ПН<^1П.

В принятых обозначениях уравнения апостериорного вывода примут следующий вид [22]:

Р^') =_I__н<и)р ■ =_I__т<1,7) хр

ч (1,Н<У>РЧ) ч; Гс (Т<£.7>Рс)[0] с'

где в левой части равенств стоят апостериорные вероятности квантов и конъюнктов соответственно при поступившем детерминированном свидетельстве (¿; у>, а [0] указывает на верхний компонент вектора, получающегося в результате произведения Т^Р,..

Анализ структуры нормирующих множителей

Существенным недостатком этих уравнений является незавершенный анализ структуры выражений, стоящих в знаменателях и, таким образом, являющихся нормирующими множителями. Чтобы преодолеть указанный недостаток, докажем следующую теорему.

Теорема. (Т<^'>Рс)[0] = (г<и\рс), (^Н^Р^^'^Рд),

!г+,если ук входит в с1: г",если ук входит в су, г°,иначе;

причем г+ = (!°), г" = (_1),г° = ((]),

и где =®£=о 1 Як'^, ^к'^ = ^ 5 ,если ук входит в Ср

в ,если ук входит в с . внесли I 5°,иначе;

причем 5+ = (00)' 5~ = ©' =

Доказательство. Выполним ряд преобразований

(т<и>ре)[0] = ((00)[я]'Т<'^>ре) = (т<'-«г(1)[я1'Р«

Воспользуемся тем, что Т<1,7> = Т^ ® Т^2> ® ... ® Т^1'7>, причем матрица Т, в свою очередь, может принимать одно из трех возможных значений:

чо 11 Vo оГ Vo 1

Подставим полученное нами ранее разложение матрицы Т<1,7> в нормирующий множитель и перегруппируем:

(™г (0)'"' • ■-.)-((«¡г ® «т ®... ® ч'"т)(0)м •'

Матрица Т^1'^ принимает лишь три возможных значения; значит, будет существовать всего три возможных варианта вектора г^: г^ = Т/<1'у> Рассмотрим эти варианты: г+= (1 0)(О) =

Таким образом, принимая во внимание г<1'7> = 1 Г;<';>, приходим к выводу

(1)[^Т<^>Рс) = (г<ЧРс).

Теперь обратимся к скалярному произведению (1'Н<1'7>РЧ). Перенесем матрицу Н<1'7> в левую часть скалярного произведения и произведем перегруппировку:

(1'Н^ь (н^>ЧРч) = н^>г)(1)[п] ^ Р,) = (®ЙГ (й<и>г (1))'РЧ).

Воспользуемся тем, что Т<^>7 ^"^Н^7^7 = 1[[п]Н<^>Г1[[п] и выразим Н^ через Т<1'7>Г: = . Подставим полученный результат в скалярное произведение, получим:

)/с=о"1 (н ^ (1)) •Pq) = f ® №тк<1'лТ11*]Т (1))' Рч

~ <' ]>т

Заметим, что ' имеет всего 3 означивания. Рассмотрим все три:

Т*М0 1т-' = (_1 0);т" = (0 0). _

Принимая во внимание все сказанное ранее, рассмотрим вектор 8<и> (1).

Из определения вектора следует, что и вектор имеет всего 3 означивания. Распишем

каждый из случаев подробнее:

х 0)(-10)(1)=(0> ■-=е;)(.; 0)(-10)(1)=е>

■•=(1 1 ?)(-1 0)(1)-(1)°

Наконец, выстроим окончательную цепочку равенств:

(1'Н<у>рч) = (я X тк<и>г Х1[ х(1)Урч) = (о*--1 рч) = рч)..

В таблице приведено несколько примеров, иллюстрирующих объекты, которые строятся в утверждение доказанной теоремы.

Фрагмент знаний Свидетельство Вектор-селектор Вектор-редистрибьютор г*',;)

1. = <^) = <2,0) = <10; 00) 5 <2,0) = 5° 0 5 + 5<2,0)Г = (0011) г<2,0) =г° 0г+ г<2,0)г = (0 0 1 0)

2. V-1 = Ы = <0,2) = <00; 10) 5<0,2> = 5° 0 5" 5<0,2)Г = (1100) г<о,2) =г° 0г~ г<0,2)г = (1 0 1 0 )

3. VI = V2 = {^0,^} = <0; 3) = <000; 011) 5<0;3) = 5" 0 5" 0 5° 5<0;3)Г = (1000100 0) г<0;3) _г- 0 Г" 0г° Г<0;3)Г = (1 1 0 0 0 0)

4. VI = V2 ={р0,р1}; = <3; 0) = <011; 000) 5 <3,0) = 5 + 0 5 + 0 5° 5<з,0)Г = (0 001000 1) г<3,0) _г + 0 г+ 0г° г<з,о)Г = (0 0 0 1 0 0 0 0)

5. V! = {р0,Р1,Р2} Vг = Ьо,М; = <2; 1) = <010; 001) 5<2;1) = 5" 0 5 + 0 5° 5<2;1)Г = (0 0100010) ^<2;1) — 0 г+ 0г° Г<2;1)Г = (0 0 1 1 0 0 0 0)

6. V1 = {р0,Р1,Р2} Vг = Ьо,М; = <1;2) = <001; 010) 5<1,2) = 5 + 0 5" 0 5° 5<1,2)Г = (0 100010 0) г<1,2) =г + 0 Г" 0Г° Г<1,2)Г = (0 1 0 1 0 0 0 0)

7. V1 = {Р0,Р1,Р2} Vг = = <5;0) = <101; 000) 5<5;0) = 5 + 0 5° 0 5 + 5<5;0)Г = (0 000010 1) г<5;0) _г + 0 Г° 0г+ Г<5;0)Г = (0 0 0 0 0 1 0 0)

8. VI = {р0,Р1,Р2} Vг = = <1;4) = <001; 100) 5<1;4> = 5 + 0 5° 0 5" 5<1,4)Г = (0 101000 0) г<1,4) _г + 0 Г° 0Г~ Г<1,4)Г = (0 1 0 0 0 1 0 0)

Примечание. В таблице число -1 заменено символом 1

Таблица. Векторы-селекторы и векторы-редистрибьюторы Технологическое применение результата

По построению вектор-селектор состоит из 0 и 1 и может интерпретироваться как характеристический вектор, соответствующий заданному свидетельству: этот характеристический вектор позволяет отобрать те кванты, которые не противоречат поступившему детерминированному свидетельству (¿,у). С вычислительной точки зрения интересно то, что с помощью побитовых операций, которые поддерживаются значительным числом современных языков программирования, в том числе T-SQL, каждый компонент вектора-селектора может быть выражен непосредственно через индексы (¿,у), задающие свидетельство. Это позволяет не формировать сразу весь вектор-селектор размерности 2" в памяти ЭВМ, а отложить его вычисление до тех пор, пока не потребуется конкретная его компонента. Для дальнейших рассуждений нам потребуется небольшое число новых обозначений и определений.

Мы говорим, что квант цт согласован со свидетельством <с;,с/), если все атомы конъюнкта положительно означены в цт, а все атомы конъюнкта с^ означены отрицательно. Точка над знаками логических операций означает, что они выполняются побитово. Функция bitscount выдает число ненулевых бит в двоичном представлении своего целочисленного аргумента.

Рассмотрим структуру вектора-селектора в*1,7'. Заметим, что на позиции т вектора-селектора единица будет стоять тогда и только тогда, когда квант цт согласован со свидетельством <с;,с/). Это, в частности, значит, что на всех позициях, где в двоичном представлении I стоит единица в т, также должна быть единица. В частности, это значит, что (т&а = ¿). С другой стороны, на всех позициях, в которых ] содержит единичные биты, т должно содержать нули. В противном случае квант цт не будет согласован с отрицательным свидетельством. Это значит, что (ш&/= у).

Таким образом, любой элемент вектора-селектора в*1,7' можно выразить, воспользовавшись следующей формулой:

5<и> [ш] =р- если (т8а = ¿) и (ш&/= у), (.0, иначе,

где I и у - это числа, двоичное представление которых является характеристическими векторами конъюнктов, представляющих положительно и отрицательно означенные свидетельства соответственно в означенном алфавите.

Следует заметить [4, 24], что 5*',;>[ш] = Н*',;>[ш, т].

Аналогичный прием в отношении операций с битами в двоичном представлении индексов ¿, у, т может использоваться для выражения компонент вектора г*',;>:

!0, т&1Ф ¿,

0, (IV])&тф 0

(-ЦЬ^соипСО&т), иначе.

В случае вектора-редистрибъютора нам будет удобнее не рассуждать о совместности свидетельств, а напрямую обратиться к полученной выше форме представления через тензорное произведение. Рассмотрим все места, где в тензорном произведении встречается г+ = (Ц). Заметим, что позиции г+ определяются положительным свидетельством, а именно - единичными битами в индексе положительного свидетельства. Если в позиции, где I содержит единичный бит, т будет содержать нуль, то в определении значения т-го элемента вектора г*',-'> будет участвовать верхний (нулевой) элемент вектора г+, что заведомо обращает указанный элемент в нуль. Таким образом, мы получаем первую строку указанного выше равенства.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Теперь рассмотрим позиции, где встречается г° = (0). Рассуждения будут аналогичны предыдущему случаю. Вектор г° встречается там, где одновременно индексы положительного отрицательного

свидетельства имеют нулевой бит, т.е. позиции, где выражение (IVу) имеет единицу в двоичной записи. Заметим, что если в такой позиции у т в двоичной записи будет единица, то при вычислениях будет использоваться нижний (равный нулю) элемент вектора г°. Иначе говоря, если у (IV у) и т будет единица в одной и той же позиции двоичной записи, то т-й элемент вектора г*',-'> заведомо будет нулем. Эта ситуация в точности соответствует второй строке приведенного выше равенства. Следует заметить, что первое и второе условие не являются взаимоисключающими и могут выполняться одновременно, но так как в обоих случаях соответствующий элемент вектора г*',-'> равен нулю, то мы можем написать их и по отдельности.

Выше мы разобрали все ситуации, когда г*',;> [ш] равно нулю. Рассмотрим оставшиеся значения. Так как г+ и г° либо обращают значение в нуль, либо не меняют его (умножают на единицу), а ситуации с нулем мы разобрали, то они не будут оказывать влияния на оставшуюся ситуацию. Остается определиться со вкладом г" = ( 1) в итоговое значение. Если в соответствующей позиции двоичной записи т стоит нуль, то в вычислении используется верхний (равный единице) элемент вектора г", который не оказывает влияния на результат. Остается ситуация, когда в соответствующей позиции двоичной записи т стоит единица, при этом происходит умножение на минус один. Но таких мест, где единица встречается в двоичной записи т и двоичной записи у одновременно, ровно столько, сколько ненулевых бит в числе ]'&т. Это в точности приводит нас к последней строке указанного выше равенства.

Заметим, что такая возможность по вычислению коэффициентов позволяет в расчетах воспользоваться концепцией отложенных вычислений. Нам не требуется строить сразу весь вектор в *''■'> или вектор г *''-'>. Наоборот, в программной реализации мы сможем вычислить любую их компоненту по мере надобности, избегая хранения вспомогательных объектов значительной размерности.

Заключение

В настоящей работе завершена разработка описания локального логико-вероятностного вывода с помощью матрично-векторных уравнений, которые существенно опираются на использование тензорного Научно-технический вестник информационных технологий, механики и оптики, „3

2015, том 15, № 1 83

произведения матриц, степени Кронекера и свойств этих операций. Наличие такого описания, с одной стороны, упрощает разработку спецификации алгоритмов и делает возможным ее обоснование, а с другой стороны, открывает путь к применению классических математических техник для анализа полученных результатов. Особенности структуры векторов, которые участвуют в вычислении нормирующих ко -эффициентов, позволяют не строить их в процессе вычислений целиком, а генерировать их компоненты по мере их потребности в вычислениях. Наконец, воплощение алгоритмов апостериорного вывода в коде программ облегчается за счет возможности применить уже существующие библиотеки, эффективно реализующие матрично-векторные объекты и операции.

Литература

1. Городецкий В.И. Алгебраические байесовские сети - новая парадигма экспертных систем // Юбилейный сборник трудов отделения информатики, вычислительной техники и автоматизации РАН. Т. 2. М.: РАН, 1993. С. 120-141.

2. Городецкий В.И., Тулупьев А.Л. Формирование непротиворечивых баз знаний с неопределенностью // Изв. РАН. Сер. Теория и системы управления. 1997. Т. 36. № 5. C. 33-42.

3. Тулупьев А.Л., Николенко С.И., Сироткин А.В. Байесовские сети: логико-вероятностный подход. СПб.: Наука, 2006. 607 с.

4. Тулупьев А.Л., Сироткин А.В., Николенко С.И. Байесовские сети доверия: логико-вероятностный вывод в ациклических направленных графах. СПб.: СПбГУ, 2009. 400 с.

5. Bobadilla J., Ortega F., Hernando A., Gutierrez A. Recommender systems survey // Knowledge-Based Systems. 2013. V. 46. P. 109-132. doi: 10.1016/j.knosys.2013.03.012

6. Borras J., Moreno A., Valls A. Intelligent tourism recommender systems: a survey // Expert Systems with Applications. 2014. V. 41. N 16. P. 7370-7389. doi: 10.1016/j.eswa.2014.06.007

7. Constantinou A.C., Fenton N.E., Neil M. Pi-football: a Bayesian network model for forecasting Association Football match outcomes // Knowledge-Based Systems. 2012. V. 36. P. 322-339. doi: 10.1016/j.knosys.2012.07.008

8. Kim J.-S., Jun C.-H. Ranking evaluation of institutions based on a Bayesian network having a latent variable // Knowledge-Based Systems. 2013. V. 50. P. 87-99. doi: 10.1016/j.knosys.2013.05.010

9. Ngoduy D., Watling D., Timms P., Tight M. Dynamic Bayesian belief network to model the development of walking and cycling schemes // International Journal of Sustainable Transportation. 2013. V. 7. N 5. P. 366388. doi: 10.1080/15568318.2012.674627

10. Weber P., Medina-Oliva G., Simon C., Iung B. Overview on Bayesian networks applications for dependability, risk analysis and maintenance areas // Engineering Applications of Artificial Intelligence. 2012. V. 25. N 4. P. 671-682. doi: 10.1016/j.engappai.2010.06.002

11. Chen T.-T., Leu S.-S. Fall risk assessment of cantilever bridge projects using Bayesian network // Safety Science. 2014. V. 70. P. 161-171. doi: 10.1016/j.ssci.2014.05.011

12. Hu Y., Zhang X., Ngai E.W.T., Cai R., Liu M. Software project risk analysis using Bayesian networks with causality constraints // Decision Support Systems. 2013. V. 56. N 1. P. 439-449. doi: 10.1016/j.dss.2012.11.001

13. Khakzad N., Khan F., Amyotte P. Safety analysis in process facilities: comparison of fault tree and Bayesian network approaches // Reliability Engineering and System Safety. 2011. V. 96. N 8. P. 925-932. doi: 10.1016/j.ress.2011.03.012

14. Khadjeh Nassirtoussi A., Aghabozorgi S., Ying Wah T., Ngo D.C.L. Text mining for market prediction: a systematic review // Expert Systems with Applications. 2014. V. 41. N 16. P. 7653-7670. doi: 10.1016/j.eswa.2014.06.009

15. Landuyt D., Broekx S., D'hondt R., Engelen G., Aertsen J., Goethals P.L.M. A review of Bayesian belief networks in ecosystem service modelling // Environmental Modelling and Software. 2013. V. 46. P. 1-11. doi: 10.1016/j.envsoft.2013.03.011

16. Тулупьев А.Л., Сироткин А.В. Алгебраические байесовские сети: принцип декомпозиции и логико-вероятностный вывод в условиях неопределенности // Информационно-измерительные и управляющие системы. 2008. Т. 6. № 10. С. 85-87.

17. Nilsson N.J. Probabilistic logic // Artificial Intelligence. 1986. V. 28. N 1. P. 71-87. doi: 10.1016/0004-3702(86)90031-7

18. Schippers M. Probabilistic measures of coherence: from adequacy constraints towards pluralism // Synthese. 2014. V. 191. N 16. P. 3821-3845. doi: 10.1007/s11229-014-0501-7

19. Larrañaga P., Karshenas H., Bielza C., Santana R. A review on evolutionary algorithms in Bayesian network learning and inference tasks // Information Sciences. 2013. V. 233. P. 109-125. doi: 10.1016/j.ins.2012.12.051

20. de Campos L.M., Castellano J.G. Bayesian network learning algorithms using structural restrictions // International Journal of Approximate Reasoning. 2007. V. 45. N 2. P. 233-254. doi: 10.1016/j.ijar.2006.06.009

21. Тулупьев А.Л. Апостериорные оценки вероятностей в алгебраических байесовских сетях // Вестник Санкт-Петербургского университета. Серия 10: Прикладная математика. Информатика. Процессы управления. 2012. № 2. С. 51-59.

22. Тулупьев А. Л., Сироткин А.В. Матричные уравнения локального логико-вероятностного вывода оценок истинности элементов в алгебраических байесовских сетях // Вестник Санкт-Петербургского университета. Серия 1: Математика. Механика. Астрономия. 2012. № 3. С. 63-72.

23. Беллман Р. Введение в теорию матриц. М.: Наука, 1969. 375 с.

24. Сироткин А.В. Алгебраические байесовские сети: вычислительная сложность алгоритмов логико-вероятностного вывода в условиях неопределенности. Дисс. ... канд. физ.-мат. наук. СПб.: СПбГУ, 2011. 218 с.

Золотин Андрей Александрович -

Тулупьев Александр Львович -

Сироткин Александр Владимирович -

Andrei A. Zolotin -

Alexander L. Tulupyev -

Alexander V. Sirotkin -

студент, Санкт-Петербургский государственный университет, Санкт-Петербург, 198504, Российская Федерация, andrey.zolotin@gmail.com доктор физико-математических наук, доцент, заведующий лабораторией, СПИИРАН, Санкт-Петербург, 199178, Российская Федерация; профессор, Санкт-Петербургский государственный университет, Санкт-Петербург, 198504, Российская Федерация, Alexander.tulupyev@gmail.com

кандидат физико-математических наук, старший научный сотрудник, СПИИРАН, Санкт-Петербург, 199178, Российская Федерация, Alexander.sirotkin@gmail.com

student, Saint Petersburg State University, Saint Petersburg, 198504, Russian Federation, andrey.zolotin@gmail.com

D.Sc., Associate professor, Head of Laboratory, SPIIRAS, Saint Petersburg, 199178, Russian Federation; Professor, Saint Petersburg State University, Saint Petersburg, 198504, Russian Federation,

Alexander.tulupyev@gmail.com

PhD, senior scientific researcher, SPIIRAS, Saint Petersburg, 199178, Russian Federation, Alexander.sirotkin@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.