Научная статья на тему 'Связность и ацикличность первичной структуры алгебраической байесовской сети'

Связность и ацикличность первичной структуры алгебраической байесовской сети Текст научной статьи по специальности «Математика»

CC BY
225
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕРОЯТНОСТНЫЕ ГРАФИЧЕСКИЕ МОДЕЛИ / ГЛОБАЛЬНАЯ СТРУКТУРА / АЛГЕБРАИЧЕСКАЯ БАЙЕСОВСКАЯ СЕТЬ / ГРАФЫ СМЕЖНОСТИ / ТЕОРИЯ ГРАФОВ / АЦИКЛИЧНОСТЬ / PROBABILISTIC GRAPHICAL MODELS / GLOBAL STRUCTURE / ALGEBRAIC BAYESIAN NETWORK / JOINGRAPHS / GRAPH THEORY / ACYCLICITY

Аннотация научной статьи по математике, автор научной работы — Фильченков А. А., Тулупьев А. Л.

Ическую модель баз фрагментов знаний с неопределенностью, а в терминологии математических наук — комплекс сложноустроенных случайных элементов. Особенностью АБС является то, что для представления неопределенности в них используются как скалярные, так и интервальные оценки вероятности. Математической моделью фрагмента знаний (ФЗ) в теории АБС выступает идеал конъюнктов с заданными над ними оценками вероятности истинности. Набор (база) таких ФЗ, максимальных по включению, называется первичной структурой АБС, а построенный над ней особый граф (граф смежности) — вторичной структурой. Задачей глобального обучения АБС является синтез указанных структур. Выделяются две подзачади: синтез первичной структуры АБС по обучающей выборке и синтез вторичной структуры АБС по ее первичной структуры. Вторичной структурой может выступать только граф смежности, и, более того, дерево смежности (т. е. связный и ацикличный граф смежности).Доказана теорема о том, что для данной первичной структуры АБС все графы смежности, построенные над ней, являются связными или несвязными одновременно. Благодаря этому связной первичной структурой называется та, над которой возможно построение связного графа смежности. Приведен и обоснован критерий выявления связности первичной структуры АБС, не опирающийся на графы смежности.Доказана теорема о том, что множество ациклических графов смежности, которые можно построить над данной первичной структурой АБС, если оно не пусто, совпадает с множеством минимальных графов смежности. Первичные структуры АБС, длякоторых указанное множество непусто, называются ациклическими. Приведены два критерия выявления ацикличности первичной структуры, не опирающиеся на графы смежности.Благодаря полученным результатам задачу синтеза первичной структуры АБС (первуюзадачу глобального обучения АБС), над которой можно построить сеть, позволяющую осуществлять работу ее основных алгоритмов, можно решать, не прибегая к понятию графа смежности, т. е. без решения второй задачи глобального обучения АБС.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Фильченков А. А., Тулупьев А. Л.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Algebraic Bayesian network primary structure connectivity and acyclicty

Algebraic Bayesian networks (ABN) are in terms of arti?cial intelligence logic and prob-abilistic graphical model of bases of knowledge patterns with uncertainty, and in terms of the mathematical sciences — complex-structured random elements system. ABN feature using both scalar and interval probability estimation to represent uncertainty. Mathematical model of a knowledge pattern (KP) in ABN theory is conjuncts ideal with given probability estimates of its elements. Set (base) of the maximal KPs is called the ABN primary structure. Special graph (join graph) constructed on the ABN primary structure is called its secondary structure. ABN global learning problem is to synthesize the mentioned structures. Two subproblems are marked out: to synthesize the ABN primary structure on a training set, and to synthesize ABN secondary structure on its primary structure. Secondary structure can only be the join graph, and moreover, join tree (that is connected and acyclic join graph).The theorem is proved that for given ABN primary structure all the join graphs constructedover it are connected or disconnected at the same time. With this the connected primary structure is called the structure, over which one can construct a connected join graph. A criterion to identify ABN primary structure connectivity without involving join graphs is given and proved.The theorem is proved that if set of acyclic join graphs, which can be constructed over given ABN primary is not empty, then this set coincide with minimal join graph set. The ABN primary structure for which this set is nonempty, is called acyclic. Two criteria for determining given primary structure acyclicity, not based on join graphs are given.Owing to the obtained results the problem of the ABN primary structure synthesis (the ?rst subproblem of the ABN global learning), on which you can build a network maintaining its corealgorithms processing, can be solved without involving the concept of join graph, i. e. without solving the second subproblem of ABN global learning.

Текст научной работы на тему «Связность и ацикличность первичной структуры алгебраической байесовской сети»

УДК 004.8+519.17

Вестник СПбГУ. Сер. 1. 2013. Вып. 1

СВЯЗНОСТЬ И АЦИКЛИЧНОСТЬ ПЕРВИЧНОЙ СТРУКТУРЫ АЛГЕБРАИЧЕСКОЙ БАЙЕСОВСКОЙ СЕТИ*

А. А. Фильченков1, А. Л. Тулупьев2

1. С.-Петербургский государственный университет, СПИИРАН аспирант, м.н.с., [email protected], [email protected]

2. С.-Петербургский государственный университет, СПИИРАН

д-р физ.-мат. наук, профессор, зав. лабораторией, [email protected], [email protected]

Введение. Алгебраические байесовские сети (АБС) в терминах области искусственного интеллекта представляют собой логико-вероятностную графическую модель баз фрагментов знаний (БФЗ) с неопределенностью, а в терминологии математических наук — комплекс сложноустроенных случайных элементов [1—7]. АБС основываются на логико-вероятностном подходе Нильссона [8, 9] в его формализации, предложенной Фейгиным, Хальперном и Меджидо [10-12]. Особенностью АБС является то, что для представления неопределенности в них используются как скалярные, так и интервальные оценки вероятности (а также допускается использование иных формализмов для представления неопределенности) [5].

Центральным объектом теории АБС, наряду с самими сетями, является фрагмент знаний (ФЗ), математической моделью которого выступает идеал конъюнктов с заданными над ними оценками вероятности истинности [5, 6, 13-15]. ФЗ задается над некоторым алфавитом атомарных пропозициональных формул и, фактически, хранит скалярные или интервальные оценки истинности всех непустых конъюнктов. Локальные алгоритмы логико-вероятного вывода (ЛВВ) [1, 5, 16] позволяют:

1) вычислять вероятность произвольной формулы, заданной над теми же атомами, что и ФЗ (априорный вывод);

2) вычислять оценку вероятности поступивших свидетельств (первая задача апостериорного вывода);

3) вычислять апостериорную оценку вероятности конъюнктов ФЗ при условии поступившего свидетельства (вторая задача апостериорного вывода).

Синтез оценок истинности во фрагменте знаний — задача локального обучения АБС [6, 17]. Однако память, требуемая для хранения ФЗ, как и в других родственных вероятностных графических моделях [18-20], растет экспоненциально от числа атомов, входящих в ФЗ, а сложность алгоритмов локального ЛВВ растет еще быстрее (экспоненциально растет число задач линейного программирования, которые необходимо решить для осуществления ЛВВ [21, 22]), что делает практически невозможным использование фрагментов знаний, задаваемых над сравнительно большим алфавитом. В рамках теории АБС, как и во всех теориях вероятностных графических моделей [18, 20, 23, 24], это препятствие предлагается преодолевать за счет рассмотрения базы ФЗ, в которой каждый ФЗ задан над сравнительно небольшим (предположительно 2-5 атомов [13, 25, 26]) алфавитом, а связи между ФЗ достаточно редки [5, 27]. Сама АБС рассматривается в терминах задач искусственного интеллекта как

*Работа выполнена при финансовой поддержке РФФИ (гранты № 12-01-00945-а, 12-01-31202-мол_а).

© А. А. Фильченков, А. Л. Тулупьев, 2013

логико-вероятностная модель БФЗ [5, 6]. Для базы ФЗ требуется решить ряд вопросов относительно того, каким образом на ней осуществлять ЛВВ и поддерживать ее непротиворечивость.

Для описания соответствующих алгоритмов [2, 6] требуется семейство структур, называемых глобальными структурами АБС. Первичной структурой АБС выступает сама база ФЗ [3, 5, 6], вторичной структурой АБС—граф, построенный над ее первичной структурой и отображающий отношения между фрагментами знаний, который называется графом смежности [5, 6, 28, 29]. Схожие объекты исследуются также и в теории декомпозиции деревьев [30, 31], однако специфика данной работы состоит в том, что веса, приписываемые вершинам и ребрам, являются подалфави-тами некоторого алфавита. В рамках работы с построенной таким образом моделью используются методы и понятия теории графов. Дополнительно выделяется ряд других глобальных структур АБС [32], которые будут рассмотрены ниже.

Первичной структурой АБС, подходящей для корректной работы известных на данный момент алгоритмов ЛВВ в АБС, может выступать не любой набор фрагментов знаний. Прежде всего, фрагменты знаний должны быть максимальными по включению. Однако помимо этого от первичной структуры АБС требуется также два других свойства — связность и ацикличность [6, 33], которые тесно связаны со вторичной структурой АБС. Указанные свойства определяются возможностью построения над первичной структурой АБС связных и ацикличных графов смежности соответственно. Связность и ацикличность вторичной структуры АБС требуется для корректной работы алгоритмов логико-вероятностного вывода. Таким образом, оба свойства, относящиеся к первичной структуре АБС, определяются через ее вторичную структуру, что неудобно как с теоретической точки зрения, т. к. необходимо решать задачу обучения первичной структуры АБС, учитывая решение задачи обучения вторичной, так и с практической точки зрения, поскольку построение даже единственного графа смежности чрезвычайно затратно по времени.

Целью данной работы является выявление и формализация косвенных критериев связности и ацикличности первичной структуры АБС, не опирающихся на графы смежности.

1. Первичная и вторичная структуры. В рамках данной работы для краткости и простоты изложения будем говорить не «структура АБС», а просто «структура», если только не потребуется указание конкретной АБС, с которой упоминаемая структура связана. Будем следовать системе терминов и обозначений, введенной в [29, 34, 35].

С точки зрения рассмотрения глобальных структур АБС под ФЗ понимается подалфавит некоторого алфавита атомов:

КР € 2а,

где А — алфавит атомов. Этот подафлавит — множество атомарных пропозициональных формул, над которыми построен носитель соответствующего фрагмента знаний — идеал конъюнктов.

Набор (база) максимальных ФЗ (МФЗ) МКР —набор ФЗ таких, что никакой ФЗ из набора не входит ни в какой другой ФЗ из этого набора:

МКР с 2а, МКР = {КР,},=1...„, причем УКР,, КР^ € МКР, КР, Ф КР^ ^ КР^ $ МР,,

а также г Ф ] ^ КР, Ф KPj.

Первичной структурой АБС называется набор МФЗ. Максимальность фрагментов знаний обусловлена тем, что уже в экстернально непротиворечивой сети в разных ФЗ оценки на одинаковых конъюнктах совпадают [5, 36], поэтому фрагмент знаний, который включается целиком в какой-либо другой ФЗ, может быть удален без изменения вероятностной семантики, задаваемой сетью.

Граф максимальных фрагментов .знаний — ненаправленный граф О, вершины которого соответствуют МФЗ первичной структуры, а ребра возможны только между МФЗ, пересечение которых непусто:

О = (МКР, Е), причем МКР = {КР,},=1...„ и Чг,3 : 1 < г < з < п (КР,, KPj) € Е ^ КР, п KPj Ф0, а также Чк : 1 < к < п (КРк, КРк)£Е.

Вес вершины графа МФЗ — множество атомов, входящих в соответствующий максимальному фрагменту знаний идеал конъюнктов:

Ш (УКР)=КР,

где Укр —вершина, соответствующая ФЗ КР.

Пересечение весов двух вершин графа МФЗ называется сепаратором:

Ш (Ц,Ц ) = Ш (У,)пШ V).

Две вершины, сепаратор которых непуст, называются сочлененными.

Пользуясь введенными определениями, можно переформулировать определение графа МФЗ: граф МФЗ — граф, вершины которого соответствуют МФЗ первичной структуры, а ребра возможны только между сочлененными вершинами. Следует обратить ванимание, что в графе МФЗ все смежные вершины будут сочлененными, но не все сочлененные обязательно будут смежными.

Вес ребра графа МФЗ совпадает с сепаратором его концов:

ш ((Уг,у )) = Ш (У,,У),

где )€Е (О).

Магистральный путь М (Уь, Уе) между двумя сочлененными вершинами Уь и Уе графа МФЗ — такой путь, соединяющий эти вершины, что веса всех вершин данного пути содержат сепаратор его концов:

М (Уь, Уе) = (Уь,У1 ,...,Уп,Уе):ЧУ € МШ (Уь, Уе) с Ш (У)

для Уь, Уе € У (О):Ш (Уь, Уе) Ф 0.

Граф смежности — магистрально связный граф МФЗ. При этом магистрально связный граф необязательно связен (например, граф из двух вершин аЬ и её, в котором нет ребер, тем не менее, является магистрально связным).

Вторичной структурой АБС называется граф смежности, построенный над первичной структурой данной сети. Над одной первичной структурой можно построить множество минимальных графов смежности [29, 37-40].

То, что вторичной структурой может выступать только граф, удовлетворяющий двум описанным требованиям (граф МФЗ, обладающий магистральной связностью), объясняется спецификой известных в настоящее время алгоритмов глобального ЛВВ [2, 6]. Так, поступившее в какой-либо ФЗ свидетельство должно распространиться по всей сети по ребрам, причем оно может передаваться только между

сочлененными вершинами (т. к. виртуальное свидетельство — свидетельство, которое формируется в ФЗ на основе апостериорных оценок вероятности и передается в соседние ФЗ — строится над сепаратором смежных вершин, поэтому сепаратор не может быть пустым). Это требует от нас рассмотрения только графов МФЗ.

Далее, если в графе МФЗ не существует магистрального пути между какими-то двумя вершинами, то на пути, по которому будет передавать свидетельство от одной вершины до другой, существует ребро, вес которого не содержит сепаратор концов этого пути. Соответственно, при передаче свидетельства от одного конца до другого в виртуальном свидетельстве, построенном при передаче по указанному ребру, не будет каких-то конъюнктов, которые содержатся в свидетельстве, построенном над сепаратором концов пути. Из этого следует, что мы не можем гарантировать, что апостериорные вероятностные оценки, полученные при передаче свидетельства по этому пути, совпадут с апостериорными вероятностными оценками, полученными при передаче свидетельства напрямую от одного конца пути до другого. Таким образом, граф МФЗ должен также быть магистрально связным для корректной работы алгоритмов глобального логико-вероятностного вывода.

Максимальный граф смежности Gmax — наибольший по числу ребер граф смежности. Так как в графе МФЗ возможны не все ребра, а только те, которые соединяют сочлененные вершины, максимальный граф смежности вовсе необязательно является полным графом.

Минимальный граф смежности — граф смежности, число ребер в котором минимально. Известно [34, 41], что минимальный граф смежности одновременно является и нередуцируемым графом смежности — таким графом смежности, который при удалении любого ребра перестает быть магистрально связным.

2. Третичная поли структура и четвертичная структура. Кроме рассмотренных первичной и вторичной структур, в дальнейшем изложении нам потребуются также третичная полиструктура и четвертичная структура (будем следовать терминологии, введенной в [35]).

Сужение G [ U графа G на вес U — это граф, в который входят те и только те вершины и ребра исходного графа G, веса которых содержат или равны U:

G I U = ({Vi\Vi € V (G) ,U С W(V)}, {Ei\Ei € E(G),U g W(Ei)}).

Значимый вес — вес, совпадающий с каким-либо непустым сепаратором. Можно также определить значимый вес как вес какого-либо ребра в максимальном графе смежности.

Сильное сужение G { U — сужение G I U на вес U, из которого удалили все ребра веса U:

G I U = ({Vi\Vi € V (G) ,U С W(Vi)}, {Ei\Ei € E(G),U с W(Ei)}).

Сильное сужение Gmax { U разбивается на компоненты связности. Такие компоненты называются владениями.

Значимая клика веса U — Gmax I U — сужение графа Gmax на какой-либо значимый вес U. Множество значимых клик будем обозначать как Clique.

Праклика PraC — сужение Gmax на пустой вес (т.е., фактически, максимальный граф смежности). Следует отметить, что праклика в общем случае не является полным графом.

Замкнутое сверху множество .значимых клик — множество значимых клик, к которому добавлена праклика:

Clique1 = Clique и {PraC} .

Для краткости изложения будем далее под «значимой кликой» понимать элемент замкнутого сверху множества значимых клик, т. е. либо собственно значимую клику, либо праклику.

Вес значимой клики P — будем обозначать как W (P). Будем говорить, что значимая клика P содержит значимую клику Q, если W (Q) содержит W(P), или, что то же самое, множество вершин значимой клики P содержит множество вершин значимой клики Q. Следует отметить, что любой значимый вес будет являться весом какой-либо значимой клики.

Если значимая клика P содержит значимую клику Q, то значимая клика P называется предком значимой клики Q, а значимая клика Q — потомком значимой клики P.

Если значимая клика P является предком значимой клики Q, и не существует такой значимой клики R, что R является одновременно потомком P и предком Q, то значимая клика P называется родителем значимой клики Q, а значимая клика Q — сыном значимой клики P. Множество сыновей значимой клики U будем обозначать как Son (U).

Родительский граф над подмножеством A множества сужений — направленный граф, вершинами которого являются значимые клики из множества A, в котором ребро из вершины P в вершину Q проведено, если значимая клика P является родителем значимой клики Q. В частности, родительский граф над .замкнутым сверху множеством значимых клик — это родительский граф, построенный над указанным множеством. Будем считать, что сыновья значимой клики упорядочены по индексу их веса.

Третичной полиструктурой АБС называется семейство графов, построенных над подмножествами множества сужений. В частности, элементом третичной полиструктуры является и родительский граф над замкнутым сверху множеством значимых клик.

Два сына Si и Sj значимой клики U называются собратьями, если их пересечение непусто:

(Si, Sj) € Fel ^ ((Si, Sj € Son (U)) л (Si n Sj Ф0)).

Полусиблинговый граф HSGu для значимой клики U — это граф, построенный над множеством сыновей этой значимой клики, ребро между двумя вершинами которого проведено тогда и только тогда, когда соответствующие сыновья являются собратьями:

HSGu = <{Si|Si € Son (U)}, {(Si,Sj) : (Si,Sj) €Fel}).

Если два сына U входят в один и тот же компонент связности соответствующего полусиблингового графа, то они называются полусиблингами.

Четвертичная структура АБС — семейство полусиблинговых графов, задаваемых каждой значимой кликой.

Полусиблинговый цикл —цикл полусиблингового графа.

Братский цикл — полусиблинговый цикл Si, S2,..., Sn такой, что пересечение всех этих сыновей непусто. Небратский цикл — полусиблинговый цикл, не являющийся братским.

В братском цикле все сыновья, в него входящие, приходятся друг другу собратьями, тогда как в небратском цикле это условие может как выполняться, так и не выполняться [42].

Следует отметить, что компоненты связности полусиблинговых графов имеют важную связь с третичной структурой. Так, неодноэлементное множество вершин, образующее компоненту связности сильного сужения максимального графа смежности на произвольный значимый вес и (т.е. владения), совпадает с множеством вершин, принадлежащих сыновьям и, образующим компонент связности соответствующего полусиблингового графа [32]. На указанных соображениях основываются алгоритмы построения владений для значимых весов [43], которые будут играть важную роль в определении ацикличности первичной структуры.

3. Связность первичной структуры.

Теорема 1. Над произвольной первичной структурой все графы смежности связны или несвязны одновременно.

Доказательство. Рассмотрим два графа смежности, построенных над одной и той же первичной структурой, один из которых, назовем его 01, — связен, а второй, 02, — нет. Не умаляя общности, будем считать, что О2 состоит из двух компонент связности. Рассмотрим ребро в 01 , соединяющее каких-либо представителей этих компонент. Концы этого ребра являются сочленнеными вершинами, однако две эти вершины в 02 не связны, следовательно 02 не магистрально связен.

Благодаря теореме 1 связную первичную структуру можно определить как структуру, над которой можно построить связный граф смежности.

Требование связности первичной структуры возникает потому, что в обратном случае сеть разбивалась бы на несколько компонент, соответствующих компонентам связности, которые были бы независимы друг от друга, а потому их следовало бы рассматривать как отдельные сети [3, 5, 13].

Теорема 2. Первичная структура связна в том и только том случае, если соответствующий набор МФЗ нельзя разбить на два дизъюнктных поднабора таким образом, чтобы множества атомов, входящих в МФЗ поднаборов, не пересекались:

с МКР,Б Ф0-. и № (КР<)П и № (КР,) = 0.

КР^еМКР^

Доказательство. Для удобства воспользуемся тем, что связность первичной структуры эквивалентна связности максимального графа смежности, построенного над ней.

Пускай максимальный граф смежности, построенный над первичной структурой МКР несвязен. Не умаляя общности, предположим, что максимальный граф смежности разбивается на две компоненты связности, состоящие из вершин, соответствующих поднаборам МФЗ Б и Т = МКР\Б.

Поскольку МКР связна,

и № (КР4) П и № (КР,)Ф0^3КР, € Б, КРу € МКР\Б : КР, п КРу Ф0.

Последнее означает, что вершины, соответствующие КР, и КР-, сочлененные, следовательно, максимальный граф смежности содержит ребро между этими вершинами, следовательно, они не могут входить в разные компоненты связности. Полученное противоречие говорит о том, что исходное предположение неверно.

Обратно, пусть максимальный граф смежности, построенный над несвязной первичной структурой, связен. Рассмотрим такое S с МКР, S Ф0, что

и ш(кр,) п и ш(КР,) = 0.

Из этого, в частности, следует, что никакие МФЗ из Б не пересекаются ни с какими МФЗ из МКР\Б. В то же время в максимальном графе смежности между соответствующими наборами вершин существует хотя бы одно ребро. Рассмотрим пару МФЗ, соответствующих концам этого ребра. Они должны иметь общие атомы. Полученное противоречие говорит о том, что исходное предположение неверно.

Таким образом, теорема доказана.

Теорема 2 доставляет нам косвенный критерий связности первичной структуры.

4. Ацикличность первичной структуры. Первичная структура называется циклической (цикличной), если над ней нельзя построить ацикличную вторичную структуру. В обратном случае первичная структура называется ациклической (ацикличной).

Требование ацикличности первичной структуры возникает из особенностей алгоритмов глобального ЛВВ: они определены лишь для деревьев смежности, поэтому не могут быть применены к АБС, первичная структура которых циклична.

Следует отдельно остановиться на следующем моменте: рассмотрим два требования, обусловленные спецификой алгоритмов ЛВВ, а именно магистральную связность и ацикличность. Оба этих требования выдвигаются к графу смежности. Тем не менее, ацикличность, в отличие от магистральной связности, является свойством первичной структуры, поскольку над любой первичной структурой можно построить хотя бы один граф смежности, следовательно, магистральная связность не зависит от первичной структуры. С другой стороны, не над любой первичной структурой можно построить ацикличный граф смежности. Именно поэтому свойство ацикличности относится именно к первичной структуре. А благодаря следующей теореме мы можем не рассматривать ацикличность графов смежности, поскольку она оказывается обусловленной ацикличностью первичной структуры (в предположении, что мы рассматриваем только минимальные графы смежности, поскольку неминимальные графы смежности цикличны всегда).

Теорема 3. Множество минимальных графов смежности совпадает с множеством деревьев смежности тогда и только тогда, когда связная первичная структура ациклична.

Доказательство. Если связная первичная структура ациклична, то над ней можно построить дерево смежности. При этом число ребер в дереве смежности минимально (среди всех возможных графов смежности), поскольку иначе, согласно теореме 2, первичная структура не будет связна. При этом любой граф с минимальным числом ребер будет деревом, поскольку, согласно той же теореме 2, он связен.

Обратно, поскольку над любой первичной структурой можно построить граф смежности, из множества возможных графов смежности можно выделить непустое подмножество тех, число ребер которых минимально. Если это непустое подмножество совпадает с множеством деревьев смежности, множество деревьев смежности непусто, и, согласно определению, первичная структура ациклична.

Теорема 4 (1-я теорема о циклах в минимальных графах смежности) [42]. Первичная структура АБС циклична тогда и только тогда, когда в

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ее четвертичной структуре существуют небратские полусиблинговые простые циклы.

Теорема 5 [34]. Число ребер в минимальном графе смежности равно

£ Conn (Gmax ± U)-\UW\ ,

U eUW

где Conn (Gmax { U) —число компонент связности графа Gmax (т.е. число владений), а UW — множество значимых весов.

На основании теоремы 5 можно доказать теорему 6, которая доставляет нам второй критерий цикличности первичной структуры.

Теорема 6 (2-я теорема о циклах в минимальных графах смежности). Связная первичная структура циклична тогда и только тогда, когда не выполняется следующее соотношение:

\MKP\= £ Conn (Gmax { U )-\UW\+1,

U eUW

где MKP — набор МФЗ, Conn (Gmax { U) — число компонент связности графа Gmax, а UW — множество значимых весов.

Доказательство. Поскольку для ациклической первичной структуры граф смежности является деревом смежности, число его ребер должно быть на одно меньше, чем число вершин. Используя выраженное в теореме 3 число ребер минимального графа смежности, мы получаем исходное равенство.

Следует отметить, что условие теоремы становится неверно для первичных структур, не являющихся связными.

Теоремы 4 и 6 доставляют нам косвенные критерии ацикличности первичной структуры.

Заключение. В статье рассмотрены косвенные критерии связности и ацикличности первичной структуры АБС. Оба этих свойства, наряду с максимальностью фрагментов знаний, являются ключевыми для определения набора фрагментов знаний, на основе которых можно построить структуры АБС, над которыми могут корректно работать алгоритмы логико-вероятностного вывода. Доказано четыре теоремы, одна из которых утверждает, что над выбранной первичной структурой все графы смежности связны или несвязны одновременно, вторая утверждает эквивалентность связности первичной структуры с невозможностью разбить ее на непересекающиеся по атомам поднаборы МФЗ, а две другие выявляют связь между цикличностью первичной структуры и числовыми характеристиками элементов третичной полиструктуры и четвертичной структуры.

С теоретической точки зрения указанные критерии требуются для решения задачи глобального обучения АБС, которая состоит в построении первичной и вторичной структур АБС над заданной обучающей выборкой [44], причем первичная структура должна быть связной и ацикличной. Приведенные в работе критерии позволяют выявить связность и ацикличность первичной структуры без непосредственного построения и анализа графов смежности [45]. Таким образом, для того чтобы ответить на вопрос «Существует ли для данного набора фрагментов знаний дерево смежности?», можно обойтись без построения вторичной структуры. Благодаря этому задачу синтеза связной ацикличной первичной структуры можно решать непосредственно, без решения задачи синтеза вторичной структуры.

С практической точки зрения, указанные критерии являются основой для разработки алгоритмов определения того, является ли заданная первичная структура связной и ацикличной. Алгоритмы определения того, являются ли фрагменты знаний максимальными, уже получили программную реализацию [46].

Литература

1. Тулупьев А. Л. Алгебраические байесовские сети: локальный логико-вероятностный вывод: учеб. пособие. СПб.: ООО Издательство «Анатолия», 2007. 80 с. (Сер. Элементы мягких вычислений).

2. Тулупьев А. Л. Алгебраические байесовские сети: глобальный логико-вероятностный вывод в деревьях смежности: учеб. пособие. СПб.: ООО Издательство «Анатолия», 2007. 40 с. (Сер. Элементы мягких вычислений).

3. Тулупьев А. Л. Алгебраические байесовские сети. Теоретические основы и непротиворечивость. СПб.: СПИИРАН, 1995. 76 с.

4. Тулупьев А. Л. Основы теории алгебраических байесовских сетей: программа спецкурса для студентов старших курсов и аспирантов. СПб.: СПбГУ, 2007. 7 с.

5. Тулупьев А. Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. СПб.: Наука, 2006. 607 с.

6. Тулупьев А. Л., Сироткин А. В., Николенко С. И. Байесовские сети: логико-вероятностный вывод в ациклических направленных графах. СПб.: Изд-во С.-Петерб. ун-та, 2009. (Сер. Элементы мягких вычислений) 400 с.

7. Суворова А. В., Тулупьева Т. В., Тулупьев А. Л., Сироткин А. В., Пащенко А. Е. Вероятностные графические модели социально-значимого поведения индивида, учитывающие неполноту информации // Труды СПИИРАН. 2012. Вып. 22. С. 101-112.

8. Nilsson N. J. Probabilistic Logic // Artificial Intelligence. 1986. Vol. 28. P. 71-87.

9. Nilsson H. J. Probabilistic Logic Revisited // Artifitical Intelligence. 1993. Vol. 59. P. 39-42.

10. Fagin R., Halpern J. Y., Meggido N. A Logic for Reasoning about Probabilities // Information and Computation. 1990. Vol. 87. N1/2. P. 78-128.

11. Fagin R., Halpern J. Y. Uncertainty, Belief, and Probability // Computational Intelligence. 1991. Vol. 6. P. 160-173.

12. Fagin R., Halpern J. Y. Reasoning about Knowledge and Probability // Journal of the Association of Computing Machinery. 1994. Vol. 41. N2. P. 340-367.

13. Тулупьев А. Л. Алгебраические байесовские сети. Логико-вероятностный подход к моделированию баз знаний с неопределенностью. СПб.: СПИИРАН, 2000. 292 с.

14. Тулупьев А. Л. Непротиворечивость оценок вероятностей в идеалах конъюнктов и дизъюнктов // Вестн. С.-Петерб. ун-т. Сер. 10. 2009. Вып. 2. С. 121-131.

15. Тулупьев А. Л., Фильченков А. А., Азаров А. А., Мусина В.Ф., Пащенко А. Е., Сироткин А. В., Суворова А. В., Тулупьева Т. В. Отчет о научно-исследовательской работе «Фрагменты знаний алгебраической байесовской сети и локальный логико-вероятностный вывод» (промежуточный), инвентарный №02201257683 от 2012.05.05, по теме «Логико-вероятностный подход и его обобщения в моделировании, обработке и обучении баз фрагментов знаний с неопределенностью в интеллектуальных системах», шифр BNet-2008, регистрационный №01200852455. СПб.: СПИИРАН, 2012. 95 с. (Депонировано в ЦИТиС.)

16. Тулупьев А. Л. Апостериорные оценки вероятностей в идеале конъюнктов // Вестн. С.-Петерб. ун-т. Сер. 10. 2010. Вып. 1. С. 95-104.

17. Тулупьев А. Л. Задача локального автоматического обучения в алгебраических байесовских сетях: логико-вероятностный подход // Труды СПИИРАН. 2008. Вып. 7. С. 10-25.

18. Alpaydin E. Introduction to Machine Learning / 2nd Ed. Cambridge, MS: The MIT Press. 2010. 537 p.

19. Cowell R. G., Dawid A. P., Lauritzen S. L., Spiegelhalter D. J. Networks and Expert Systems. New York: Springer-Verlag. 1997. 370 p.

20. Koller D., Friedman N. Probabilistic Graphical Models: Principles and Techniques. Cambridge, MS: The MIT Press. 2009. 1280 p.

21. Сироткин А. В. Алгебраические байесовские сети: вычислительная сложность алгоритмов логико-вероятностного вывода в условиях неопределенности: дис. ... канд. физ.-мат. наук. СПб., 2011. 216 с. (СПбГУ).

22. Сироткин А. В. Вычислительная сложность алгоритмов локального апостериорного вывода в алгебраических байесовских сетях // Труды СПИИРАН. 2011. Вып. 18. С. 188-214.

23. Halpern J. Y. Reasoning about uncertainty. Cambridge, MS: The MIT Press, 2003. 483 p.

24. Korb K., Nicholson A. Bayesian Artificial Intelligence. New York: Chapman and Hall/CRC. 2004. 364 p.

25. Pearl J. Fusion, propagation, and structuring in belief networks // Artificial Intelligence. Vol. 29. 1986. P. 241-288.

26. Pearl J. Probabilistic Reasoning in Intelligent Systems. New York: Morgan Kaufman Publ. 1988. 552 p.

27. Тулупьев А. Л., Сироткин А. В. Алгебраические байесовские сети: принцип декомпозиции и логико-вероятностный вывод в условиях неопределенности // Информационно-измерительные и управляющие системы. 2008. № 10. Т. 6. С. 85-87.

28. Тулупьев А. Л., Столяров Д. М., Ментюков М. В. Представление локальной и глобальной структуры алгебраической байесовской сети в Java-приложениях // Труды СПИИРАН. 2007. Вып. 5. СПб.: Наука, 2007. С. 71-99.

29. Фильченков А. А., Тулупьев А. Л. Структурный анализ систем минимальных графов смежности // Труды СПИИРАН. 2009. Вып. 11. СПб.: Наука, 2009. С. 104-127.

30. Halin R. S-functions for graphs // Journal of Geometry. 1976. N8. P. 171-186.

31. Robertson N., Seymour P. Graph minors III: Planar tree-width // Journal of Combinatorial Theory. 1984. Series B 36 (1). P. 49-64.

32. Фильченков А. А., Тулупьев А. Л., Сироткин А. В. Структурный анализ клик максимальных графов смежности алгебраических байесовских сетей // Вестн. Тверск. гос. ун-та. Сер.: Прикладная математика. 2011. №20. С. 139-151.

33. Тулупьев А. Л., Николенко С. И., Сироткин А. В. Циклы в байесовских сетях: вероятностная семантика и отношения с соседними узлами // Труды СПИИРАН. 2006. Т. 1. Вып. 3. С. 240-263.

34. Фильченков А. А., Тулупьев А. Л. Совпадение множеств минимальных и нередуцируемых графов смежности над первичной структурой алгебраической байесовской сети // Вестн. С.-Петерб. ун-та. Сер. 1. Математика. Механика. Астрономия. 2012. Вып. 2. С. 65-74.

35. Фильченков А. А., Тулупьев А. Л. Третичная структура алгебраической байесовской сети // Труды СПИИРАН. 2011. Вып. 3 (18). С. 164-187.

36. Тулупьев А. Л. Непротиворечивость оценок вероятностей в алгебраических байесовских сетях // Вестн. С.-Петерб. ун-та. Сер. 10. 2009. Вып. 3. С. 144-151.

37. Фильченков А. А. Алгоритм построения множества минимальных графов смежности при помощи самоуправляемых клик // Труды СПИИРАН. 2010. Вып. 1 (12). С. 119-133.

38. Фильченков А. А. Алгоритм построения множества минимальных графов смежности при помощи самоуправляемых клик-собственников // Труды СПИИРАН. 2010. Вып. 3 (14) С. 150-169.

39. Фильченков А. А. Алгоритм построения множества минимальных графов смежности при помощи клик владений // Труды СПИИРАН. 2010. Вып. 1 (13). С. 119-133.

40. Фильченков А. А. Алгоритм построения множества минимальных графов смежности при помощи клик-собственников владений // Труды СПИИРАН. 2010. Вып.4 (15). С. 193-212.

41. Опарин В. В., Фильченков А. А., Тулупьев А. Л., Сироткин А. В. Матроидное представление семейства графов смежности над набором фрагментов знаний // Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики. 2010. Вып. 4. C. 73-76.

42. Фильченков А. А., Тулупьев А. Л. Анализ циклов в минимальных графах смежности алгебраических байесовских сетей // Труды СПИИРАН. 2011. Вып. 2 (17). С. 151-173.

43. Фильченков А. А. Алгоритмы построения элементов третичной полиструктуры алгебраической байесовской сети // Труды СПИИРАН. 2011. Вып. 18. С. 237-266.

44. Тулупьев А. Л., Фильченков А. А., Вальтман Н. А. Алгебраические байесовские сети: задачи автоматического обучения // Информационно-измерительные и управляющие системы. 2011. №11. Т. 9. С. 57-61.

45. Фильченков А.А., Тулупьев А. Л. Алгоритм выявления ацикличности первичной структуры алгебраической байесовской сети по ее четвертичной структуре // Труды СПИИРАН. 2011. Вып. 4 (19). С. 128-145.

46. Тулупьев А. Л., Фильченков А. А., Сироткин А.В. Программа для поддержки синтеза наборов бинарных последовательностей без поглощающих элементов при формировании алгебраической байесовской сети Algebraic Bayesian Networks Primary Structure Refiner, Version 01 for Java (AlgBN PSR j.v.01). Свид. о гос. рег. пр. для ЭВМ. Рег. №2010614270 (30.06.2010). Роспатент // Бюлл. «Прогр. для ЭВМ, БД, топол. инт. микросх.». 2010. №3. С. 456.

Статья поступила в редакцию 20 сентября 2012 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.