УДК 004.8 Вестник СПбГУ. Математика. Механика. Астрономия. 2018. Т. 5 (63). Вып. 1
МБС 68Т37, 60В99
Оценка чувствительности уравнений локального апостериорного вывода в алгебраических байесовских сетях над пропозициями-квантами*
А. А. Золотин, А. Л. Тулупьев
Санкт-Петербургский государственный университет,
Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7—9 Санкт-Петербургский институт информатики и автоматизации РАН, Российская Федерация, 199178, Санкт-Петербург, В. О., 14 линия, 39
Для цитирования: Золотин А. А., Тулупьев А. Л. Оценка чувствительности уравнений локального апостериорного вывода в алгебраических байесовских сетях над пропозициями-квантами // Вестник СПбГУ. Математика. Механика. Астрономия. 2018. Т. 5(63). Вып. 1. С. 60-69. https://doi.org/10.21638/11701/spbu01.2018.107
В работе предложен подход к анализу чувствительности первой задачи апостериорного вывода в алгебраических байесовских сетях. Кратко даны основные определения и формулировки, а также рассмотрено развитие матрично-векторного аппарата апостериорного вывода. Рассмотрены случаи поступления детерминированного и стохастического свидетельств во фрагмент знаний над пропозициями-квантами со скалярными оценками вероятностей истинности элементов. Для каждого из рассматриваемых случаев введены необходимые метрики и проведены преобразования, в результате которых построены 4 задачи линейного программирования. Решения этих задач дают искомые оценки. Кроме того, сформулированы 2 теоремы, постулирующие накрывающие оценки для рассматриваемых величин. Полученные в работе результаты доказывают корректность использования моделей и создают задел для исследования чувствительности уравнений локального и глобального логико-вероятностных выводов.
Ключевые слова: знания с неопределенностью, распространение свидетельств, вероятностная логика, алгебраические байесовские сети, логико-вероятностный вывод, оценки чувствительности, вероятностные графические модели, матрично-векторные уравнения.
1. Введение. Сбор и обработка информации являются неотъемлемой частью анализа данных как области искусственного интеллекта [1]. Алгебраические байесовские сети (АБС), введенные в конце прошлого столетия В.И.Городецким [2, 3], и родственные им байесовские сети доверия, находящие применение в медицине [4, 5], оценке рисков [6, 7], распознавании образов [8, 9], оценке повреждений [10, 11] и систем мониторинга состояния здоровья [12], как класс вероятностных графических моделей, предоставляют аппарат для декомпозиции на небольшие объемы, именуемые фрагментами знаний, и для дальнейшей обработки баз данных с не-факторами, включающими неполноту данных и неопределенность, вызванную различными мне-
* Часть публикуемых материалов получена в рамках проектов, выполненных по госзаданию СПИИРАН №0073-2014-0002 и при финансовой поддержке РФФИ (гранты № 15-01-09001-а, № 18-01-00626-а).
(¡5 Санкт-Петербургский государственный университет, 2018
ниями экспертов [13]. Одними из причин появления в данных ограничений, связанных с не-факторами и, как следствие, понижения качественных показателей работы модели, являются неверно выбранная стратегия сбора информации и некорректно сформулированная модель.
В зависимости от структуры базы знаний, над которой строится модель АБС, бывает удобнее работать либо с базовой моделью фрагментов знаний — идеалами конъюнктов, либо с одной из альтернативных моделей — идеалом дизъюнктов или множеством пропозиций-квантов. В данной работе уделим внимание модели фрагмента знаний, сформированной над множеством пропозиций-квантов. Одной из математических моделей, определенной над фрагментами знаний, является локальный логико-вероятностный вывод, включающий в себя проверку и поддержание непротиворечивости, локальный априорный и локальный апостериорный выводы. В данной статье внимание читателя сфокусировано на локальном апостериорном выводе, алгоритмы которого являются также основополагающими для глобального вывода. Цель работы — дать оценку чувствительности уравнений апостериорного вывода от вариации оценок вероятностей элементов фрагмента знаний. Для достижения поставленной цели решаются проблемы построения задач линейного программирования для двух случаев: детерминированного и стохастического свидетельств. В качестве дополнительной цели авторы ставят перед собой задачу вывода накрывающей оценки чувствительности.
2. Чувствительность уравнений локального апостериорного вывода.
Одним из доступных критериев оценки корректности разработанной математической модели является анализ ее чувствительности [14, 15]. В контексте данной работы речь пойдет о чувствительности результата вычисления к допустимой вариации входных данных. Одним из практических применений оценки чувствительности является характеристика степени претенциозности к точности входных данных, что сказывается на общем объеме данных, необходимых на вход соответствующему алгоритму для получения результата заданной точности.
Перед тем как перейти к анализу чувствительности, введем необходимый математический аппарат, а также приведем вкратце постановку первой задачи локального апостериорного вывода и формулировку матрично-векторных уравнений для решения указанной задачи во фрагментах знаний над множеством пропозиций-квантов. Приведенные ниже результаты, составляющие теоретическую базу, подробно изложены в работах по локальному апостериорному выводу [16, 17] и общей теории АБС [18, 19].
2.1. Матрично-векторные уравнения апостериорного вывода. Рассмотрим алфавит А и множество пропозиций-квантов, сформированных над данным алфавитом. Фрагмент знаний (ФЗ), построенный над множеством пропозиций-квантов с присвоенными им оценками вероятности истинности запишем как Рч), где Q — множество пропозиций-квантов, а Рч — вектор, содержащий оценки вероятности истинности пропозиций-квантов. Элементы в векторе Рч упорядочены согласно правилу, описанному в предшествующих работах по смежной тематике [20], и в общем виде представляются следующим образом:
Ря = (р(Чо• • -,р(я2п-1))Т • (1)
В рамках данной работы мы ограничимся рассмотрением случая скалярных (точечных) оценок вероятностей во фрагменте знаний и пропагацией детерминированного и стохастического свидетельств как базовыми и основополагающими, оставив
развитие случая с интервальными оценками в ФЗ и поступившем свидетельстве для последующих работ.
Одним из первых матрично-векторных представлений решения задачи апостериорного вывода для детерминированного свидетельства (с*,с^} было следующее уравнение [21]:
р ((с*,с,-}) = (1, Н^>РЧ), (2)
где
причем
к=п-1 ( Н+, если Хк входит в с^,
= 0 Нкк'Г!, НР = I Н-, если Хк входит в ч, к=0 I Н°, иначе,
н+ = ( 0 М, Н- = 1 М, н° ' 1 0
О 1 ) ' V о 0 ) ' V 0 1
а символ подразумевает произведение Кронекера. Недостатком данной формулировки являются избыточные вычисления всей матрицы Н, являющейся диагональной, тем более, что приведенный выше пример в итоге использует лишь диагональные элементы для вычисления результата. Одновременно с полученным результатом по апостериорному выводу была дана оценка устойчивости уравнений апостериорного и априорного выводов [22].
Тем не менее предложенный подход совершенствовался и в рамках последних работ по развитию матрично-векторного подхода в алгоритмах локального логико-вероятностного вывода было предложено описание задач апостериорного вывода, исключающее операцию «вырезки» и упрощающее дальнейшие алгебраические операции. Решение первой задачи апостериорного вывода в случае поступления детерминированного свидетельства теперь можно записать как
р ((с*,с,-}) = (8^>, Рч), (3)
где —вектор-селектор, характеристический вектор формулы, описывающей свидетельство над множеством пропозиций-квантов данного ФЗ [17].
Свидетельство со скалярными оценками вероятностей (стохастическое) Р^} рассматривается в алгоритмах апостериорного вывода как линейная комбинация детерминированных свидетельств, что дает следующую формулировку решения первой задачи:
2П-1 , р , Р^)) = ^ (8{С1па(*,т),С1па(2П -1-,т)>, рч)реУ ед. (4)
¿=0
Теперь, ознакомившись в достаточной степени с аппаратом локального апостериорного вывода, перейдем к задаче оценки чувствительности рассматриваемых моделей к допустимой вариации оценок вероятности истинности элементов свидетельства.
2.2. Оценки чувствительности. 2.2.1. Детерминированное свидетельство. Рассмотрим фрагмент знаний Ре} над множеством пропозиций-квантов, описанным выше. Предположим, что в данный ФЗ поступило детерминированное свидетельство (с*,с^}, и изучим чувствительность уравнения для решения первой задачи апостериорного вывода к вариации оценок вероятностей в ФЗ.
Пусть вариация оценок вероятностей описывается двумя векторами — Рч и Рч, при этом на каждый из них накладываются ограничения непротиворечивости, определяющие допустимые значения: Рч > 0 и Рч > 0, а также (Рч, 1) = 1 и (Рч, 1) = 1. Пара последних ограничений — ни что иное, как условие нормировки. Тогда запишем для каждого из двух векторов соответствующее уравнение апостериорного вывода:
Р
«Ci,Cj )) = (sj Pq) и p ((Ci,Cj )) = (sj Pq). (5)
Таким образом, чтобы провести анализ чувствительности данного выражения, нам потребуются две метрики — метрика v, чьей областью действия является множество оценок вероятностей элементов ФЗ, и метрика d, применимая к оценкам вероятностей элементов свидетельства. В качестве метрики для множества оценок вероятностей элементов ФЗ воспользуемся метрикой Чебышёва. Ниже приведем выбранные в рамках данной работы метрики для обоих множеств, приняв ради однозначности здесь и далее обозначение Pq [г] за г-й элемент вектора Pq:
(v(Pq, Pq))= max 1 Pq[i] - Pq [i] , (6)
i=0(1)2n 1
d (p,p) = d(p ((ci,cj)) ,p ((ci,cj ))) = |p - p\, (7)
где Pq[i] и Pq[i] —скалярные значения вероятностей пропозиций-квантов. Формальная постановка задачи оценки чувствительности сводится к исследованию значения величины d (p,p) к допустимой вариации вероятностей элементов ФЗ, а именно к величине v(Pq, Pq). Отметим, что требование допустимости в данном контексте обуславливается накладываемыми моделью ограничениями непротиворечивости оценок, а также совпадающей размерности рассматриваемых векторов. Говоря об оценке чувствительности, будем одновременно рассматривать решение двух задач для каждого вида свидетельств — задачу оценки чувствительности модели при варьировании обоих наборов оценок вероятностей (Pq и Pq) и задачу оценки чувствительности при условии фиксирования значений одного из наборов оценок (Pq = Pq).
Теперь, основываясь на постановках задач, предложенных выше, сформулируем задачи линейного программирования (ЗЛП) для каждого из случаев. В первом случае математическим языком задачу можно записать следующим образом:
£ = sup d (p,p), (8)
P q>0,Pq>0, (Pq,1) = 1,(P q,1) = 1, v(Pq,P q )<S
где £ обозначает оценку чувствительности. Во втором рассматриваемом случае к списку условий добавится условие фиксации значений одного из векторов Pq = Pq. Ниже представлена формулировка задачи для второго случая:
£(Pq)= sup d(p,p). (9)
P q>0,Pq>0, (Pq,1) = 1,(P q,1) = 1,
Pq = Pq.v(P^,P q)<
Тем не менее обе формулировки пока не являются ЗЛП из-за наличия нелинейных ограничений. Рассмотрим их по очереди и приведем все ограничения к линейному виду. Условия непротиворечивости по определению представляются системой
линейных уравнений, в то время как условие, накладываемое на метрику V, можно, в соответствии с выбранной метрикой, расписать следующим образом:
(Рф Р„)) - 6 ^
тах
= 0(1)2П-1
РяН - РяН
<6^ Ря М - Р^ < 6,
- 1 Рч [г] - Рч[г] >-6,
г = 0(1)2'
1
(10)
Равенство векторов Ря и Р^ подразумевает их покомпонентное равенство, то есть систему из п равенств, где п — мощность множества пропозиций-квантов. Кроме того, наличие модуля в целевой функции с! (р,р) подразумевает решение ЗЛП для двух противоположных целевых функций !(р,р) = р - р и !(р,р) = р - р. Тогда, учитывая все вышесказанное, представим окончательные формулировки ЗЛП для обоих случаев, описанных уравнениями (8) и (9):
£ = тах {р - р,р - р}
Р Ч>0,РЧ>0,
(РЧ,1)=1,(Р ч,1)=1,
^(РЧ,Р ч)<г, р(а,с, )=(8<^>,РЧ),
£(Р^) = тах {р - р,р - р}.
Р а>0,Р°>0,
(РЧ,1)=1,(Р ч,1)=1
ЭО Р
(11)
^(РО,Р ч)<<5,
р(с*>с3 НС
Р я)
р(а,сз )=(8<--з),РО),
Р<с
, ) = (8<-'з),р ,)
Сложность решения приведенных выше ЗЛП зависит от количества атомов, входящих во фрагменты знаний, что, с учетом принципа дефрагментации данных в АБС на небольшие, тесно связанные между собой группы, не должно превышать 5-8 атомов. Ранее было сказано, что одной из причин выполнения анализа чувствительности модели является количественный результат, характеризующий необходимый объем собранной информации для достижения заданной точности результата. Данный параметр можно получить, решив предложенные выше ЗЛП, но порой требуется получить результат с минимальными затратами времени и ресурсов. Применим алгебраические преобразования к формуле (8) и выведем теорему, представленную ниже и снабженную доказательством.
Теорема 1. Оценка чувствительности первой задачи апостериорного вывода при поступлении детерминированного свидетельства во фрагмент знаний над пропозициями-квантами со скалярными оценками истинности к допустимой вариации оценок истинности элементов фрагмента знаний меньше либо равна произведению допустимой вариации оценок истинности на сумму элементов вектора-селектора для поступившего свидетельства:
! (р,р) - 6 ^ [г].
Доказательство. Рассмотрим оценку чувствительности, предложенную выше в уравнении (8), при допустимой вариации исходных данных 6:
!(р ((сг,сз )) ,Р({С1,С^))) = ! (р,р) = - р1 =
(8^ , Рч) - (8<Ч Рч) = (8^ , Рч - Рч)
2П-1 ^ 8(^')[к]6
к=0
Е8(1'з)[к](Ря[к] - РЧ
к=0
<
6 ^ 8(^ [к].
к=0
V
и
-1
1
Отметим, что в отличие от вектора-редистрибьютора г^'^, по построению содержащего как 0 и 1, так и -1, элементы вектора-селектора в^'^ неотрицательны, что дает возможность избавиться от модуля в формуле выше. Таким образом, получим оценку чувствительности, постулируемую в теореме. □
2.2.2. Стохастическое свидетельство. Предположим, что поступившее свидетельство представлено фрагментом знаний со скалярными оценками вероятностей элементов множества пропозиций-квантов. Такое свидетельство может быть представлено фрагментом знаний , Р^}, а вероятность свидетельства может быть получена по формуле (4). В данной работе мы рассматриваем лишь вариацию вероятностей элементов фрагмента знаний, куда поступает свидетельство, поэтому зафиксируем допустимый вектор вероятностей свидетельства и аналогично случаю детерминированного свидетельства рассмотрим чувствительность модели для решения первой задачи апостериорного вывода к допустимой вариации вероятностей элементов фрагмента знаний. Сформулируем задачу оценки чувствительности на математическом языке:
а (р,р) = а (р (д- р-) р-)) = |р - р|. (12)
Воспользуемся метриками а и V, описанными в случае детерминированного свидетельства для оценки вариации оценок вероятностей и результата. Прежде чем сформулировать экстремальную задачу для поиска чувствительности, отметим, что к условиям, сформированным ранее в задачах (9) и (8), добавятся условия непротиворечивости оценок фрагмента знаний, над которым построено поступившее свидетельство: Р^ > 0, (Р^, 1) = 1. Тогда задачу можно сформулировать следующим образом:
е = вир а(р,р). (13)
Р Ч>0'(Р Ч'1) = 1'
РЧ>0'(РЧ'1) = 1' Р^>0'(Р^ '1) = 1' «(РЧ'Р ч)<5
Ниже представлена формулировка задачи поиска супремума в случае, когда только один из векторов оценок вероятностей рассматриваемого ФЗ варьируется, а второй остается неизменным:
е(Р^)= вир а (р,р). (14)
Р Ч>0'(Р Ч'1) = 1,
РЧ>0'(РЧ'1) = 1' Р^ >0'(Р^'1) = 1' РЧ = Р^(РЧ'Р ч)<<5
Применим к условиям обеих задач преобразования, описанные в выражении (10), и получим 2 задачи линейного программирования, решение которых даст точную оценку чувствительности рассматриваемой модели. Тогда задачу (13) можно переформулировать:
е = тах {р — р>,р — р}. (15)
Р Ч>0'(Р Ч'1) = 1,
РЧ>0'(РЧ'1) = 1, Р^ >0'(Р^"'1) = 1, ^(РЧ'Р ч)<<5'
В свою очередь, ЗЛП для задачи с одной фиксированной границей вектора вероятностей можно записать следующим образом:
е(Р^)
тах Р Ч>0,(Р ч,1) = 1,
РЧ>0,(РЧ,1) = 1, Р^ >0,(Р^,1) = 1; ЧР°,Р ч)<5,
_(С1па(»,т),С1па(2п -1-
{р _ р,р _ р}.
(16)
;,т)>
,Р°)РГ )М,
„ -1// Р= Е2=0 ((*
(С1па(»,т),С1па(2п
г,т))
Р Ч^Г )М
0
Руководствуясь теми же доводами, что и в первом случае, попробуем найти накрывающую оценку чувствительности для случая стохастического свидетельства.
Теорема 2. Оценка чувствительности первой задачи апостериорного вывода при поступлении стохастического свидетельства во фрагмент знаний над пропозициями-квантами со скалярными оценками истинности к допустимой вариации оценок истинности элементов фрагмента знаний меньше либо равна произведению допустимой вариации оценок истинности на линейную комбинацию элементов вектора вероятностей свидетельства с суммой элементов вектора-селектора в качестве коэффициента:
2П-1 /V-1 , \
< (р,р) < ^ I £ 8<см(й'т)'см(2П -1-к,т)>[г] | р-[к]. (17)
к=о у ¿=о у
Доказательство .
< (р,р) = Iр _ р| = \р рг)) _ р р^)) I
2П -1
у^ ((8{01па(г,т),01па(^ -1-г,ш)> рq)рqv)[г]_
=о 2П -1
¿=0
_ ^ —1—¿,т)> рq
2П-1 , ^ (^^¿.^.^О2" -1^,т)>, (рq _ рq))рqv)[г]
По теореме 1 имеем неравенство
рq _ Pq) <
л2п ;к=0
¿¿,3>
[к]. Тогда произве-
дем подстановку в формуле выше. В данном случае запись с использованием нотаций (С1пё(г, т), С1пё(2" _ 1 _ г, т)) и (г,]) идентична, так как вторая используется для трансформации локальных индексов элементов свидетельства в глобальные индексы накрывающей АБС, которой принадлежит рассматриваемый ФЗ. Также аналогично первому случаю можно опустить использование модуля в записи благодаря неотрицательности элементов вектора-селектора:
2n -1 , ^ ((s{GInd(i,m),GInd(2n -1-i,m)), (pq _ pq))pqv)[i]
¿=0
-) n -| /on— 1
s
<
2n -1 2
4 ~Tnd(fc,m
^s E IE s<Gind(fc-m)'Gind(^ -i-k,m))[i] i pqv[k].
fc=0 \ ¿=0
□
3. Заключение. В работе рассмотрена оценка чувствительности первой задачи апостериорного вывода во фрагментах знаний над пропозициями-квантами. Сформулированы четыре ЗЛП — две из них для случая детерминированного и две для случая стохастического свидетельств. Их решения дают точные оценки чувствительности рассматриваемых уравнений. Кроме того, предложена накрывающая оценка чувствительности, не требующая крупных вычислений. Полученные в работе оценки доказывают применимость и корректность предложенных уравнений. Данная статья создает задел для дальнейшего изучения чувствительности как уравнений локального вывода в случае неточного свидетельства и интервальных оценок во фрагменте знаний, так и уравнений глобального вывода.
Литература
1. Nilsson N. J. Probabilistic Logic // Artificial Intelligence. 1986. Vol.47. Issue 1. P. 71-87.
2. Городецкий В. И. Алгебраические байесовские сети — новая парадигма экспертных систем // Юбилейный сборник трудов институтов отделения информатики, вычислительной техники и автоматизации РАН. 1993. Т. 2. С. 120-141.
3. Городецкий В. И., Тулупьев А. Л. Формирование непротиворечивых баз знаний с неопределенностью // Изв. РАН. Сер. Теория и системы управления. 1997. Т. 5. C. 33-42.
4. Cosma G., Brown D., Archer M., Khan M., Pockley A. G. A survey on computational intelligence approaches for predictive modeling in prostate cancer // Expert Systems with Applications. 2017. Vol. 70. P. 1-19.
5. Moreira M. W., Rodrigues J. J., Oliveira A. M., Ramos R. F., Saleem K. A preeclampsia diagnosis approach using Bayesian networks // IEEE International Conference on Communications. 2016. P. 1-5.
6. Tang C., Yi Y., Yang Z., Sun J. Risk analysis of emergent water pollution accidents based on a Bayesian Network // Journal of environmental management. 2016. Vol. 165. P. 199-205.
7. Barua S., Gao X., Pasman H., Mannan M. S. Bayesian network based dynamic operational risk assessment // Journal of Loss Prevention in the Process Industries. 2016. Vol.41. P.399-410.
8. Molina J. L., Zazo S., Rodriguez-Gonzalvez P., Gonzalez-Aguilera D. Innovative Analysis of Runoff Temporal Behavior through Bayesian Networks // Water. 2016. Vol.8, N11. P.484.
9. Nemati H. M., Sant'Anna A., Nowaczyk S. Bayesian Network representation of meaningful patterns in electricity distribution grids // IEEE International Energy Conference. 2016. P. 1-6.
10. Gehl P., D'Ayala D. Development of Bayesian Networks for the multi-hazard fragility assessment of bridge systems // Structural Safety. 2016. Vol.60. P. 37-46.
11. Zhang L., Wu X., Qin Y., Skibniewski M. J., Liu W. Towards a Fuzzy Bayesian Network Based Approach for Safety Risk Analysis of Tunnel-Induced Pipeline Damage // Risk Analysis. 2016. Vol. 36, N2. P. 278-301.
12. Ojeme B., Mbogho A. Predictive Strength of Bayesian Networks for Diagnosis of Depressive Disorders // Intelligent Decision Technologies 2016. Conference Proceedings. 2016. P. 373-382.
13. Хованов Н. В. Анализ и синтез показателей при информационном дефиците. СПб.: Изд-во С.-Петерб. ун-та, 1996.
14. Lei S., Mao K., Li L., Xiao W., Li B. Direct method for second-order sensitivity analysis of modal assurance criterion // Mechanical Systems and Signal Processing. 2016. Vol.76. P. 441-454.
15. Pianosi F., Beven K., Freer J., Hall J. W., Rougier J., Stephenson D. B., Wagener T. Sensitivity analysis of environmental models: A systematic review with practical workflow // Environmental Modelling & Software. 2016. Vol. 79. P. 214-232.
16. Тулупьев А. Л., Сироткин А. В., Золотин А. А. Матричные уравнения нормирующих множителей в локальном апостериорном выводе оценок истинности в алгебраических байесовских сетях // Вестник Санкт-Петербургского университета. Серия 1. 2015. Т. 2(60). Вып.3. С. 379-386.
17. Золотин А. А., Тулупьев А. Л., Сироткин А. В. Матрично-векторные алгоритмы локального апостериорного вывода в алгебраических байесовских сетях над пропозициями квантами // Научно-технический вестник информационных технологий, механики и оптики. 2015. Т. 15, №4. С. 676-684.
18. Тулупьев А. Л. Байесовские сети: логико-вероятностный вывод в циклах. СПб.: Изд-во С.-Петерб. ун-та, 2008. 140 с.
19. Тулупьев А. Л., Сироткин А. В., Николенко С. И. Байесовские сети доверия: логико-вероятностный вывод в ациклических направленных графах. СПб.: Изд-во С.-Петерб. ун-та, 2009. 400 с.
20. Тулупьев А. Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. СПб.: Наука, 2006. 607 с.
21. Тулупьев А. Л., Сироткин А. В. Матричные уравнения локального логико-вероятностного вывода оценок истинности элементов в алгебраических байесовских сетях // Вестн. С.-Петерб. ун-та. Сер. 1. 2012. Вып. 3. С. 63-72.
22. Тулупьев А. Л., Сироткин А. В. Чувствительность результатов локального априорного и локального апостериорного вывода в алгебраических байесовских сетях // Научная сессия НИЯУ МИФИ-2010. Аннотации докладов: в 3 т. М.: НИЯУ МИФИ, 2010. Т.3. С. 75.
Статья поступила в редакцию 9 июля 2017 г.; рекомендована в печать 21 сентября 2017 г. Контактная информация:
Золотин Андрей Алексеевич — аспирант; [email protected]
Тулупьев Александр Львович —д-р физ.-мат. наук, доц., проф.; [email protected]
Sensitivity statistical estimates of local aposterior
inference matrix-vector equations in
algebraic Bayesian networks on quanta propositions
A. A. Zolotin, A. L. Tulupyev
St. Petersburg State University, Universitetskaya nab., 7-9, St. Petersburg, 199034, Russian Federation
St. Petersburg Institute for Informatics and Automation of RAS, V. O., 14-th linia, 39, St. Petersburg, 199178, Russian Federation
For citation: Zolotin A. A., Tulupyev A. L. Sensitivity statistical estimates of local aposterior inference matrix-vector equations in algebraic Bayesian networks on quanta propositions. Vestnik SPbSU. Mathematics. Mechanics. Astronomy, 2018, vol. 5(63), issue 1, pp. 60-69. https://doi.org/10.21638/11701/spbu01.2018.107
An approach to the sensitivity analysis of local aposterior inference equations in algebraic Bayesian networks is proposed in the paper. Basic definitions and formulations are briefly given and the development of the matrix-vector approach of a posterior inference is considered. The propagation of deterministic and stochastic evidences in a knowledge pattern with scalar estimates of probabilities of truth over quantum propositions is described. For each of the provided cases necessary metrics are introduced and transformations which result into construction of 4 linear programming problems which solution gives the required estimates are performed. In addition, 2 theorems that postulate the covering estimates for both cases are formulated. The results obtained in the paper prove the correctness of models and create a basis for investigation of local and global logic-probabilistic inference equations sensitivity.
Keywords: uncertain knowledge, evidence propagation, probabilistic logic, algebraic Bayesian networks, probabilistic-logic inference, sensitivity statistical estimate, probabilistic graphical model, matrix-vector equations.
References
1. Nilsson N., J. "Probabilistic Logic", Artificial Intelligence 47, issue 1, 71—87 (1986).
2. Gorodetskiy V. I., "Algebraic Bayesian networks — new paradigm of expert systems", Jubilee collection of works of institutes of the Department of Informatics, Computer ¡Science and Automation of RAS 2, 120-141 (1993) [in Russian].
3. Gorodetskiy V. I., Tulupyev A. L., "Construction of non-contradictory knowledge bases with uncertainty", Izv. RAS. Ser. Theory and control systems 5, 33-42 (1997) [in Russian].
4. Cosma G., Brown D., Archer M., Khan M., Pockley A. G., "A survey on computational intelligence approaches for predictive modeling in prostate cancer", Expert Systems with Applications 70, 1-19 (2017).
5. Moreira M. W., Rodrigues J. J., Oliveira A. M., Ramos R. F., Saleem K., "A preeclampsia diagnosis approach using Bayesian networks", IEEE International Conference on Communications, 1-5 (2016).
6. Tang C., Yi Y., Yang Z., Sun J., "Risk analysis of emergent water pollution accidents based on a Bayesian Network", Journal of environmental management 165, 199-205 (2016).
7. Barua S., Gao X., Pasman H., Mannan M. S., "Bayesian network based dynamic operational risk assessment", Journal of Loss Prevention in the Process Industries 41, 399-410 (2016).
8. Molina J. L., Zazo S., Rodriguez-Gonzalvez P., González-Aguilera D., "Innovative Analysis of Runoff Temporal Behavior through Bayesian Networks", Water 8(11), 484 (2016).
9. Nemati H. M., Sant'Anna A., Nowaczyk S., "Bayesian Network representation of meaningful patterns in electricity distribution grids", IEEE International Energy Conference, 1-6 (2016).
10. Gehl P., D'Ayala D., "Development of Bayesian Networks for the multi-hazard fragility assessment of bridge systems", Structural Safety 60, 37-46 (2016).
11. Zhang L., Wu X., Qin Y., Skibniewski M. J., Liu W., "Towards a Fuzzy Bayesian Network Based Approach for Safety Risk Analysis of Tunnel-Induced Pipeline Damage", Risk Analysis 36(2), 278-301 (2016).
12. Ojeme B., Mbogho A., "Predictive strength of Bayesian networks for diagnosis of depressive disorders", Intelligent Decision Technologies 2016. Conference Proceedings, 373-382 (2016).
13. Hovanov N. V., Analysis and synthesis of indicators with information shortage (St. Petersburg Univ. Press, St. Petersburg, 1996) [in Russian].
14. Lei S., Mao K., Li L., Xiao W., Li B., "Direct method for second-order sensitivity analysis of modal assurance criterion", Mechanical Systems and Signal Processing 76, 441-454 (2016).
15. Pianosi F., Beven K., Freer J., Hall J. W., Rougier J., Stephenson D. B., Wagener T., "Sensitivity analysis of environmental models: A systematic review with practical workflow", Environmental Modelling & Software 79, 214-232 (2016).
16. Tulupyev A. L., Sirotkin A. V., Zolotin A. A., "Matrix equations for normalizing factors in local a posteriori inference of truth estimates in algebraic Bayesian networks", Vestnik St. Petersburg University: Mathematics 48, Iss. 3, 168-174 (2015).
17. Zolotin A. A., Tulupyev A. L., Sirotkin A. V., "Matrix-vector algorithms of local posteriori inference in algebraic bayesian networks on quanta propositions", Scientific and Technical Journal of Information Technologies, Mechanics and Optics 15(4), 676-684 (2015) [in Russian].
18. Tulupyev A. L., Bayesian Networks: probabilistic-logic inference in cycles (St. Petersburg Univ. Press, St. Petersburg, 2008, 140 p.) [in Russian].
19. Tulupyev A. L., Sirotkin A. V., Nikolenko S. I., Bayesian belief networks: probabilistic-logic inference in acyclic directed graphs (St. Petersburg Univ. Press, St. Petersburg, 2009, 400 p.) [in Russian].
20. Tulupyev A. L., Nikolenko S. I., Sirotkin A. V., Bayesian networks: probabilistic-logic approach (Nauka, St. Petersburg, 2006, 607 p.) [in Russian].
21. Tulupyev A. L., Sirotkin A. V., "Matrix-vector equations for local probabilistic-logic inference in algebraic Bayesian networks", Vestnik St. Petersburg University: Mathematics 3, 63-72 (2012).
22. Tulupyev A. L., Sirotkin A. V., "Sensitivity of the results of local a priori and local posteriori inference in algebraic Bayesian networks", Scientific session of NRNU MEPhI-2010. Annotations of reports 3 (NRNU MEPhI, Moscow, 2010, p. 75) [in Russian].
A u t h o r's i n f o r m a t i o n:
Zolotin Andrey A. — [email protected]
Tulupyev Aleksandr L. — [email protected]