Научная статья на тему 'Метод решения задачи различения орграфов на основе сложности'

Метод решения задачи различения орграфов на основе сложности Текст научной статьи по специальности «Математика»

CC BY-NC-ND
765
65
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Бизнес-информатика
ВАК
RSCI
Область наук
Ключевые слова
ОРГРАФ / СЛОЖНОСТЬ ОРГРАФА / ПРОБЛЕМА РАЗЛИЧЕНИЯ ОРГРАФОВ / МОДЕЛЬ СЛОЖНОСТИ / СХОДСТВО ОРГРАФОВ / РАСПОЛОЖЕНИЕ ФРАГМЕНТОВ / DIGRAPH / COMPLEXITY OF DIGRAPHS / DISTINCTION OF DIGRAPHS PROBLEM / MODEL OF COMPLEXITY / SIMILARITY OF DIGRAPHS / ARRANGEMENT OF PATHS

Аннотация научной статьи по математике, автор научной работы — Кохов В. А., Кохов В. В.

Предложен метод решения задачи различения орграфов. Основу метода определяет матричная модель сложности, которая учитывает количественные и качественные характеристики фрагментов орграфа. Модель впервые позволяет оценивать значимость каждого фрагмента орграфа в его общей сложности. Приведены результаты решения задач различения и определения сходства для орграфов

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHOD OF THE DECISION OF DISTINCTION OF DIGRAPHS PROBLEM ON THE BASE OF COMPLEXITY

The method of the decision of distinction of digraphs problem is offered. The basis of this method is defined on matrix model of complexity, which takes into account the quantitative and qualitative characteristics of digraph fragments. The model for the first time allows to calculate the importance of each digraph fragment of digraph in its total complexity. The results of the decision of problems of distinction and definition of similarity for digraphs are given.

Текст научной работы на тему «Метод решения задачи различения орграфов на основе сложности»

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

МЕТОД РЕШЕНИЯ ЗАДАЧИ РАЗЛИЧЕНИЯ ОРГРАФОВ НА ОСНОВЕ СЛОЖНОСТИ

В.А. Кохов,

кандидат технических наук, доцент кафедры Высшей математики на факультете экономики Национального исследовательского университета «Высшая школа экономики».

В.В. Кохов,

студент кафедры «Прикладная математика» Московского энергетического института, e-mail: viktorkokhov@rambler.ru.

Адрес: г. Москва, ул. Красноказарменная, д. 14.

Ключевые слова: орграф, сложность орграфа, проблема различения орграфов, модель сложности, сходство орграфов, расположение фрагментов.

1. Введение

Сложность системы, будучи ключевым понятием системологии, требует глубоких и интенсивных исследований и ориентирована на развитие подходов к анализу сходства систем.

Сложность и сходство структурированных объектов (корпоративных социальных сетей; семантических сетей, абстрактных графов, графов синтаксической структуры предложений и др.) наиболее востребована в таких областях, как системы искусственного интеллекта, информационно-поисковые системы структурной информации (семантического web-поиска текстовых документов) и др. [1-3].

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г.=

Приведем краткий обзор по построению моделей сложности графов. Одна из первых моделей была связана с построением теоретикоинформационных индексов [4,5]. Пусть имеется граф G=( V, E), где \V\=p, \E\=q и множество его вершин V, разбивается на к классов эквивалентности V, i=1..k. В качестве отношения эквивалентности может выступать принадлежность вершин к одной орбите группы автоморфизмов графа. Тогда информационное содержание (количество информации), приходящееся на одну вершину, будет определяться следующей формулой:

IIC(G/V) = -XCbg2 Ci,

i=1

11

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

где C=\V./\V\. Полное информационное содержание графа, рассчитанное на основе V, будет TIIC(G/V) = =\V\IIC(G/V). TIIC(G/V) рассматривается как интегральная количественная мера его структурной сложности (неоднородности). На основе информационного содержания графа может быть построено множество различных индексов сложности, если вместо множества вершин анализировать другие множества однотипных фрагментов, например цепей с длиной два (Р). Из [6] известен орбитальный информационный индекс графа в базисе связок Ti (Р)

к

ОН(G/P2 2 = 2П l°g2 - - X — 1 -i,

i=1

где к - число орбит группы расположения Т| в G, Т|. — количество связок в i-ой орбите. По сути, это полное информационное содержание графа, рассчитанное на основе связок, плюс « г| log2 р » — информация о размере графа (число связок).

В [7] для определения сложности графа G введена функция

CM (G) = -pL Xm.Vj =

p+qy ;

где y(v.,v. ) — число простых цепей из вершины v. в вершину v.. Указано, что эта функция соответствует интуитивному понятию сложности графа. В [8] предложена функция, значение которой, равно числу остовных деревьев (каркасов) графа. В качестве функции сложности в [9] используется число деревьев, изоморфно вкладываемых произвольным образом в граф G.

В [10] рассматривается топологическая сложность графовых моделей систем (ГМС), причем в наиболее общем и системном виде. Выделены девять требований, предъявляемых к моделям (функциям) сложности систем. В [11] приведен обзор подходов к определению структурной сложности графов и выделены три этапа в построении моделей: (1) построение индексов сложности, то есть числовых инвариантов графов, отражающих одну из сторон сложности, например сложность в терминах цепных, циклических, древесных и др. характеристик; (2) построение моделей сложности, основанных на мультииндексах, отражающих несколько сторон комплексного понятия «сложность»; (3) построение концептуальных и математических моделей, включающих многоуровневое отражение сложности, с привлечением достижений теории систем, теории графов, теории информации, топологии и

др. Показано, что к перспективным направлениям построения моделей сложности ГМС четвертого поколения следует отнести такие матричные модели, которые учитывают три уровня характеризации в единой модели: (1) сложность ГМС как единого целого; (2) сложность фрагментов ГМС; (3) сложность расположения фрагментов ГМС в ее топологии с характеризацией вкладов в общую сложность.

Ниже предлагается матричная модель сложности орграфов, позволяющая:

♦ учитывать как количественные, так и качественные характеристики систем, представленных орграфами;

♦ обобщить индексы симметрии расположения «связок» до индексов симметрии расположения любых фрагментов орграфа и вычислять их значения все с большей и большей точностью;

♦ проводить иерархический анализ сложности орграфов с уточнением результатов на каждом следующем уровне иерархии;

♦ определять вклад любого фрагмента в общую сложность;

♦ все более и более точно решать задачи различения орграфов;

♦ все более и более точно решать задачи различения расположения фрагментов в орграфах;

♦ формировать и исследовать новые виды отношений эквивалентности орграфов.

2. Основные определения

Пусть G=( V,E) орграф. Два орграфа G=( V,E) и G*=(V*,E*) изоморфны (G»G*), если

3(p:F<-> V* и Уи, veVt(M,v)eE <-» (ф(н),ф(^) е.E*\ где <p(u), $v) e V*.

Орграф G*=(V*,E*) изоморфно вкладывается в орграф G=(V,E) как порожденный подграф (G*сSG), (подграф (G* cG)), если в G есть порожденный подграф (подграф) G*=(V*,E*), для которого справедливо отношение G%G.

Изоморфизм орграфа на себя называется автоморфизмом и обозначается через !;. Множество всех автоморфизмов орграфа образует группу по умножению автоморфизмов и обозначается через Aut(G). Порядок группы обозначим через Aut(G)|. Под числом канонических изоморфных вложений G* в G будем понимать величину, определяемую следующим образом w(G*,G)=W(G*,G)/Aut(G)\, где W(G*,G) — число всех изоморфных вложений G*

12

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

в G. Орбитой вершины veVназывается подмножество Q(Aut(G),v) вершин орграфа G, которые могут быть отображены на вершину v:

Q(Aut(G),v) ={v*:[3 £ е Aut(G): £(v*)=v]}.

Орбиты вершин орграфа определяют классы их эквивалентного расположения.

Абстрактный тип t — произвольный орграф, определённый с точностью до изоморфизма. Группу его вершинных автоморфизмов обозначим через Aut(t). Обозначим множество всех канонических изоморфных вложений абстрактного типа t в G через Ft(G) = {f1t,ft, ... fj}, а через |_F'(G)| обозначим количество фрагментов типа t в G. Если на множестве вершин типа фрагмента t и G задана нумерация, то фрагмент ft орграфа G может быть представлен помеченными фрагментами f,t, когда каждой вершине типа фрагмента t сопоставляется номер вершины орграфа G, которой она соответствует при вложении. Число помеченных фрагментов, представляющих один и тот же фрагмент G, равно порядку группы вершинных автоморфизмов абстрактного типа.

Пусть Autt(G) является индуцированным представлением группы Aut(G) и определяет симметрию расположения фрагментов типа t в G. Под t-автоморфизмом G будем понимать подстановку ^ на множестве помеченных фрагментов типа t орграфа G (или канонических изоморфных вложений) Flt (G), индуцированную некоторым вершинным автоморфизмом £ орграфа G. В процессе индуцирования помеченный фрагмент f eF‘ (G), представленный каноническим изоморфным вложением (vp v2,..., уи) орграфа G, переходит в помеченный фрагмент f.,t(G) eF,t(G), каноническое представление которого получено канонизацией вложения (и и2,..., uj, где u = /=1 ..п, п — число вершин фрагмен-

та типа t. Группой t-автоморфизмов G (Aut t( G) или t-группа) будет группа подстановок, носителем которой является всё множество t-автоморфизмов для данного t, а групповой операцией — операция произведения подстановок. Тот факт, что множество t -автоморфизмов образует группу, непосредственно следует из свойств Aut(G). Степень t-группы равна числу канонических изоморфных вложений абстрактного типа t в орграф G (\F\G^ ), а порядок меньше или равен порядку Aut(G), так как два различных нетождественных вершинных автоморфизма могут индуцировать один и тот же t-автоморфизм. Все понятия, связанные с анализом Autt(G), определяются аналогично понятиям, связан-

ным с анализом Aut(G) (например, орбиты t-группы). t-группа точно характеризует симметрию расположения фрагментов типа t в орграфе G. Все неопределяемые ниже понятия можно найти в [12, 13].

3. Задачи различения орграфов и различения расположения

их фрагментов

Пусть 91й обозначает множество всех связных орграфов, на котором задано отношение R — «быть изоморфными». Тогда задача различения (установления факта изоморфизма) двух орграфов G. , Gje 9? определяется следующими параметрами:

DG =< Ъ; G,GS;R > .

Решением задачи DG является ответ на вопрос, являются ли Gt и G. изоморфными?

Задача различения расположения двух фрагментов

типа t в орграфе G определяется следующими параметрами:

где — отношение принадлежности фрагмента к одной орбите t-группы. Решением задачи является ответ на вопрос, принадлежат ли f. uJsu одной и той же орбите t-группы?

4. Инварианты и их применение

для решения задач различения орграфов

Основным инструментом при решении задач различения орграфов является понятие инварианта орграфа. Пусть Qz — непустое множество с отношением эквивалентности т (множество чисел, векторов, матриц, графов и т.д.). Функция IN, заданная на множестве ^(G) и принимающая значения в Q^, называется инвариантом орграфа G, если справедливо условие:

VG,,Gj £ (R)Gj ^ ING)(t)IN(G.)].

Графы G,GJ. IN-эквивалентные (Gt(IN(G., если IN (G(( t) NN (Gj.

Инвариант IN называется полным инвариантом орграфа, если выполняется условие:

V Gt, Gj £ 9t[IN(Gt)(t)IN(Gj) ^ Gt (R)Gj ] .

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г

13

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

Под чувствительностью инварианта орграфа G в множестве 7с5К будем понимать отношение вида: a(IN,R)=\T(IN)\/\T(R)|, где |Д/Л)| обозначает число классов /N-эквивалентности орграфов, а \ш — число неизоморфных орграфов в множестве T. Чувствительность инварианта определяет точность решения задачи различения орграфов в множестве T. Границей вырождаемости инварианта IN в множестве 7c9t называется наименьшее число вершин feT, при котором инвариант IN становится неполным.

5. Матрица достроек фрагментов как инвариант характеризации орграфа и характеризации расположения его фрагментов

Пусть

Ft(G)={F1, F2, ... F, ...F7} (Fl(G)={Fl1, FE, F", ... FlT}) обозначает множество всех собственных фрагментов (помеченных фрагментов) орграфа G, а F“(G)={fl“, f®, ... flt, ...frlt‘} множество помеченных фрагментов типа t, j — номер фрагмента, rt — число фрагментов типа t, T — число типов фрагментов. Пусть В =<bpb2,...,b.,...,bk1> обозначает базис структурных дескрипторов (СД), определяющий точность характеризации орграфа, и пусть т, —

число достроек фрагмента flt орграфа G до фрагмента орграфа, изоморфного b.eB. Построим матрицу EM(G/B)=llm, .||, где i = 1..|Fl (G)|, j=1..k1. Выберем базис путей, как первоочередной для исследования, что обосновано следующими причинами: (1) любые орграфы включают пути; (2) пути отражают

Вершина концевая достраивается до путей

V Po Рг p2 P3 irc (ft(C.n)) irc (AQ)

5 1 3 3 2 0,3846 0,3846

1 1 1 3 2 0,3616 0,3616

2 1 4 2 0 0,1231 0,1231

3 1 2 1 0 0,0654 0,1308

4 1 2 1 0 0,0654

Slw 5 12 10 4 31 1

Sw 1 2 2 2 7

WF 5 6 5 2 18

ISC 5 18 45 62 ISC(G/P)=130

как локальные (пути малой длины), так и глобальные (пути большой длины) свойства орграфов; (3) пути — наиболее легко конструктивно перечислимые фрагменты в сравнении с другими фрагментами орграфов; (4) пути относятся к классу монотонно наращиваемых по сложности базисов СД для характеризации орграфов.

Для орграфа G (рис. 1) приведены примеры двух видов матриц EM(G/VсP) (табл. 1, выделены серым цветом), в которых в качестве строк выступают вершины G, а в качестве базиса СД — базис путей P = <P0, P .., P j)>. Матрица, упорядоченная лексикографически по убыванию значений строк (например, справа налево) является инвариантом, если не сохраняется нумерация вершин G. В первом виде матриц достройка выполняется от вершин как концевых в пути, а во втором — достраиваемый путь включает вершину в любом месте пути. Учитывая, что пути можно достраивать до путей-подграфов (P) или путей порожденных подграфов (Is), получаем четыре вида основных матриц достроек путей до путей:

Таблица 1.

Вершина достраивается до путей

V Po Рг A A irc (ft(C.n)) irc (AQ)

2 1 4 5 2 0,2885 0,2885

5 1 3 3 2 0,2308 0,2308

1 1 1 3 2 0,2077 0,2077

3 1 2 2 1 0,1365 0,2731

4 1 2 2 1 0,1365

Slw 5 12 15 8 40 1

Sw 1 2 3 4 10

WF 5 6 5 2 18

ISC 5 18 45 62 ISC(G/P)=130

14

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

EM(G / Pl ce P); EM(G / Pl c P);

EM(G / Pl cSe P); EM(G / Pl cS P).

В наиболее общем виде матрица EM(G / Fl c F) в качестве строк включает все подграфы из множества Fl(G), а в качестве столбцов — все подграфы из множества F(G). Таким образом, получаем стратифицированную систему матриц от EM(G / V c P) до EM(G / Fl c F), расширяемую по трем направлениям: (1) от V до Fl; (2) от P0 до F; (3) одновременно по (1) и (2). Это приводит к формированию и исследованию новых систем уточняемых отношений эквивалентности орграфов.

Чтобы упорядочить фрагменты из F(G) по возрастанию сложности, определим индекс сложности орграфа. Под структурным спектром G в базисе СД В=<Ь1, b2, ..., b,..., bk1> будем понимать запись следующего вида SS(G/B) = рД, P2b2, ..., p.b., pk1bk1), где Р=1, если фрагмент b. еВ изоморфно вкладывается в G и р.=0 в противном случае [14].

Пусть для G построен его полный структурный спектр (ПСС) в базисе СД

B=<b, b2, ..., b,..., bk1>: FS(G/B)=

=<w1b1, ..., ^4^..^ Wk1 bkl>,

где b. — фрагмент базиса; w. — число канонических изоморфных вложений фрагмента b . в G. Очевидно, что w(Kj)=p, а w(K2)=q. Примем ISC(Ki)=1, ISC(K2)=3. Так как для любого фрагмента f орграфа G можно определить его ПСС, а для каждого фрагмента от фрагмента G, можно построить его ПСС и т.д., то рекурсивным методом всегда можно вычислить индекс спектральной сложности (ISC) (ниже сложности) и вектор-индекс сложности (VISC) орграфа G в базисе СД B:

6. Расширенная матрица достроек фрагментов и матрица вкладов фрагментов в общую сложность орграфа

Эта матрица определяет основу иерархического метода анализа сложности орграфа с вычислением вкладов фрагментов, вкладов каждого класса эквивалентно расположенных фрагментов для каждого типа t и вкладов фрагментов в сложность орграфа.

Добавим к матрице EM(G / Fl c B) пять новых строк:

1. Строки с номером нуль для вектор-индекса сложности элементов byeB:

V_ISC(G/B) =< ISC(bj),..., ISC(bj),..., ISC(bk0 >.

2. Строки с номером (k+1) со значениями элементов

rt

Slw (Fl / bj) = £ £ mj.

flt eFl 1=1

3. Строки с номером (k+2), значения элементов которой Sw(bj), равны суммарному числу канонических изоморфных вложений фрагмента типа t в beBпо всем типам t= 1,2, ...,7, т.е.

j

Sw(Fl /B) =< Sw(Fl /b;),..., Sw(Fl /bj),..., Sw(Fl /bk > ,

ft (bj-)

где Sw(Fl / bj) = £ ---J— = £ w(f / bj j.

t=1

Aut(f )

t=1

4. Строки с номером (k+3) со значениями элементов

wj {bj) = Slw(Fl / bj) / Sw(Fl / bj).

ISC (G / B) = w1ISC (b1) +

+ w2ISC(b2),..., wjISC(bj),..., wk1 ISC(bk1);

V_ISC(G/B) =< w1ISC(b1); w2ISC(b2); ... ; wjISC (bj); ... ; wk 1ISC (bk 1) >.

5. Строки с номером (k+4) со значениями элементов

V_ISC (G / bj) = wj (bj) ISC (bj).

В результате построим расширенную матрицу достроек фрагментов

Для G (рис. I) при использовании базиса путей-подграфов P=<P0, Pj, P2, P3> получим:

♦ ISC(G/P)=5 • 1+6 • 3+5 • 9+2 ■ 31=130;

♦ V_ISC(G/P)=<5; 18; 45; 62>;

♦ SS(G/P)=<1, 1, 1, 1 >;

♦ FS(G/P)=<5, 6, 5, 2>.

EM*{G / Fl c B).

На основе EM*(G / Fl c B) построим матрицу

MIRC(Fl c Б(G))

i = 0..k + 4; j = 1.k1 + 3

относительных вкладов фрагментов в сложность G.

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г

15

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

Значения элементов матрицы вычисляются по формуле

7. Метод иерархического анализа сложности орграфов

t Щ/ ISC (bj)

irc (f! / Ь,) =----j------------------—

- Sw (Fl / bj) ISC (G / B) .

Тогда величина irc( f- / B), вычисляемая по формуле

irc (fl / B)

1 £ щ ISC (b-)

ISC(G/B) Sw(Fl /bj),

определяет относительный вклад f. в общую сложность при использовании базиса B.

Фрагменты ft, имеющие одинаковые значения вкладов irc(fl /B), образуют класс f‘(C) эквивалентных по расположению фрагментов типа t с общим вкладом irc(fl (C) / B). Сумма относительных вкладов по всем фрагментам одного типа t образует вклад irc (f! / B). Расширенную матрицу достроек фрагментов, дополненную тремя столбцами:

♦ (k1 + 1) со значениями irc f (C.n)/ B) для каждого типа t;

♦ (k1+2) со значениями irc(f! (C) / B) для каждого типа t;

♦ (k1+3) со значениями irc f / B) для каждого типа t,

обозначим MIRC(Fl c B(G)) .

Пример матрицы MIRC(V c P(G)) без значений irc(ft(C.n)/bj) для орграфа G (рис. 1) приведен в табл. 1. На основе MIRC(Fl c F(G)) легко построить матрицу абсолютных вкладов фрагментов в сложность G, т.е. матрицу MIAC(Fl c F(G)).

Вычисление матриц MIRC(Fl c B(G)) позволяет проводить иерархический анализ сложности, включающий пять основных уровней, с последовательным уточнением результатов на основе:

1. Индексов сложности — ISC(G/B);

2. Вектор-индексов сложности — V_ISC(G/B);

3. Вектор-индексов относительных вкладов каждого типа фрагментов t (вершины, дуги, пути с длиной 2 и т.д.) — V_irc(G, Ft), где t = 1..T;

4. Вектор-индексов относительных вкладов классов фрагментов в каждом типе фрагментов

V_irc(G, F!(C)),

где C — номер класса фрагментов типа t и t = 1..T;

5. Вектор-индексов относительных вкладов каждого фрагмента с номером n в классе C типа t —

V_irc(Ft(C.n)/B), где t = 1..T.

Дополнительные уровни анализа сложности определяются на основе вектор-индексов относительных вкладов каждого фрагмента с номером n в классе C типа t по каждому элементу bpB —

V_irc(Ft(C.n)/b) , где t=1..T, j=k1, (k1—1),..., 1.

Для трех орграфов (рис. 2) в табл. 2 приведены матрицы MZ4C(P'c ДО), упорядоченные по убыванию значений вкладов всех путей по каждому типу t, где t=P0 — P2.

Приведем результаты сравнительного анализа трех орграфов по иерархической схеме:

♦ на первом уровне

ISC( Gj /P)=ISC( G2 /P)=ISC( G3 /P);

16

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

Таблица 2.

М1АС(Р' с Д G^)) = М1АС(Р1 с Д(?2)) М1АС(Р'с ДС3))

Pl(Gj) Pl(G2) 1 3 9 irc (P(C.n)) irc (Pt(C)) irc (p) Pl( G3) 1 3 9 irc (Pt(C.n)) irc (Pt(C)) irc (Pt)

3 2 1 3 3 7 14 23 4 1 3 3 7 14 23

4 1 1 3 3 7 1 1 3 3 7

1 4 1 2 1,5 4,5 9 3 1 2 1,5 4,5 9

2 3 1 2 1,5 4,5 2 1 2 1,5 4,5

34 12 0 1 3 4 4 11 13 0 1 1,5 2,5 10 11

13 23 0 1 1,5 2,5 5 34 0 1 1,5 2,5

23 24 0 1 1,5 2,5 12 0 1 1,5 2,5

14 13 0 1 0 1 2 24 0 1 1,5 2,5

24 14 0 1 0 1 14 0 1 0 1 1

134 124 0 0 1,5 1,5 3 3 124 0 0 1,5 1,5 3 3

234 123 0 0 1,5 1,5 134 0 0 1,5 1,5

Slw(b) 4 15 18 37 37 37 Slw(b) 4 15 18 37 37 37

Sw(b) 1 3 9 10 ISC(G/P)=37 Sw(b) 1 3 9 10 ISC(G/P)=37

WF(b) 4 5 2 11 WF(b) 4 5 2 11

V_ISC(b) 4 15 18 37 VISC(bj) 4 15 18 37

4- на втором уровне

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V_ISC( Gj /P)=V_ISC( G2/P)=V_ISC( G3 /P);

4 на третьем уровне

V_irc( Gj ,P t( C))= V_irc(G2 ,P '(C))= V_irc(G3 ,P t(C));

4 на четвертом уровне

V_irc(Gl ,Pt(C.n)/B)=

= V_irc(Gj ,P>(C.n)/B)*V_irc(Gj ,P‘(C.n)/B).

Таким образом, на четвертом уровне выявлено различие по сложности орграфов Gj и G2 с G3. Для Gj и G2 значения матриц MIAC{Pl<z P(G)) одинаковые, следовательно, Gj и G2 /^-эквивалентные орграфы по М1АС(Р‘с P(G)). Заметим, что полученные классы эквивалентно расположенных путей в Gj—G3, являются орбитами групп

AutP (G), AutP (GAutP(p-v (G),

то нетрудно доказать, что справедливы следующие утверждения.

Утверждение 1. Индекс TIIC(G/V) и индексы TIIC(G/P1),...,TIIC(G/P(p j)) являются восстанавливаемыми характеристиками из MIRC(P‘ с P(G)) для орграфа G.

Действительно, например, для орграфа Gj (рис. 2) имеем

TIIC (G1/ V) = WF (b1) , |P°(C2)

|P (Cl)|log2(|P0(C1)|) +

WF (b1)

WF (b1)

Llog2(| P (C2 )|)

AutP (G), AutP (G), AutP (G).

Если базис путей является достаточным для того, чтобы классы эквивалентно расположенных путей стали орбитами групп

Утверждение 2. Индекс OIIC(G/P2) и индексы OIIC(G/P3),.,OIIC(G/P(p j)) являются восстанавливаемыми характеристиками из MIAC{Pl<zP{G)) для орграфа G.

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г

17

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

Действительно, например, для орграфа Gx (рис. 2) имеем

OII(G/Рг) = 2WF(b2)( | P2(C1) | log2(| P2(Cj) |) +

+ | P2 C ) | l0g2 ( | P2 (C2 ) | )+ | P2 (C3 ) | l0g2 ( | P2 (C3 ) | )) .

Утверждение 3. Индекс CM(G) являются восстанавливаемой характеристикой из MIRC(Pl<zP(G)) для орграфа G.

Действительно, например, для орграфа Gj (рис. 2) имеем

MIRC(P'с P(G)) , получим: 10 классов:

(G1)>(G2)>(G3)>(G4)>(G5)>(G6,G7)>(G8,G9)>(G10)>(G11)>(G12,G13).

Следовательно, точность решения задачи различения орграфов

a(MIRC (P1 с P (G)), R) = 0,769.

Заметим, что все пары орграфов, образующие классы эквивалентности, имеют инверсную ориентацию дуг. Такие орграфы будем называть инверсными. Для них справедливо

OII (G1 / P2)

WF (b1)WF (b2) WF (bj) + WF (b2)

(WF (b2) + WF (b3)).

Если классы расположения путей не являются орбитами, то мы имеем метод приближенного вычисления рассмотренных индексов. Для точного вычисления индексов необходимо базис путей наращивать элементами типа полупути, контура, ордеревья и т.д. Выделим, что добавляя к базису путей, например, один полупуть вида K12, мы построим MlRC(Plc(Pu К12)(0) и определим не изоморфизм Gi и G2 (рис. 2).

8. Результаты определения точности решения задач различения орграфов

На рис. 3 приведены диаграммы всех орграфов с p=3.

Сравнивая орграфы по значениям относительных вкладов путей в сложность (irc(P1 (C.n))) из матриц

Утверждение 4. Неизоморфные инверсные пары орграфов являются /^-эквивалентными по значениям матрицы MIRC(P‘^P(G)).

Следовательно, справедливо

Утверждение 5. Матрица MIRC(P1 с P(G)) не является полным инвариантом орграфов и граница ее вырождаемости равна трем.

В табл. 3 приведены результаты определения точности решения задач различения для орграфов, сетей, графов по ISC(G/P) и MIRC(P'с P(G)).

Использованы следующие обозначения: ND, NS, NG — число соответственно орграфов, сетей, графов; a(D,ISC), a(S,ISC), a(G,ISC) — чувствительность по ISC соответственно для орграфов, сетей, графов; a(D,MIRC), a(S,MIRC), а( G,MIRC) - чувствительность по MIRC соответственно для орграфов, сетей, графов.

Анализ результатов приводит к следующим выводам: (1) граница вырождаемости ISC(G/P) для

©

и

(•И----►©

©<——►© ©◄——►0 ©К

©

п

® ©*-----®

п п

0 G »® 0^7—0 © G

G11 g12 G13

10

Рис. 3.

18

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

Таблица 3.

p ND a (D,ISC) a (D,MIRC) NS a (S,ISC) a (S,MIRC) NG a(G,ISC) a(G,MIRC)

3 13 0,615 0,769 4 0,750 0,75 2 1 1

4 199 0,407 0,638 24 0,542 0,64 6 1 1

5 9364 0,183 0,533 267 0,269 0,51 21 0,947 1

6 1530843 0,064 0,596 5647 0,094 0,47 112 0,938 1

7 237317 0,019 0,47 852 0,977 1

8 11117 0,983 1

9 261080 0,989 1

орграфов (сетей, графов) равна 3 (3, 5); (2) граница вырождаемости MIRC(P1 с P(G)) для орграфов (сетей, графов) равна 3 (3, больше 9); (3) каждый класс эквивалентности орграфов включает инверсные пары орграфов; (4) для более точного решения задач различения орграфов (сетей) необходимо базис путей расширять полупутями.

9. Новые методы анализа сходства орграфов

Задача вычисления сходства орграфов включает следующие параметры:

1. M={Gp G2,..., G,.., G} — множество орграфов, анализируемых на сходство.

2. B=<b 1, b2,..., b,..., bk> — базис СД или правила его определения.

5. ISC(B)=<ISC(b1); ISC(b2); ...; ISC(b.); ISC(bk1)> -набор весов СД для учета их качественных характеристик.

4. D(G,G) — метрика (псевдометрика) или функция для вычисления коэффициентов сходства (несходства) (SC).

Необходимо построить матрицу (граф) попарных расстояний или коэффициентов сходства (несходства).

Выделим два метода решения задачи на основе матричных моделей:

1. Метод иерархического уточняющего анализа, использующий в качестве метрик:

♦ на первом уровне — \ISC(G. / B) — ISC(G. / B)\;

♦ на 2-5 уровнях — метрику Евклида для соответствующих вектор-индексов вкладов из MIRC(F' с B( G)), для каждого класса, полученного на предыдущем уровне.

2. Метод анализа на основе подструктурного подхода (ПП), использующего вычисление попарных расстояний

D G ,Gj) =

V(F е B G))

E (F1 е B G))

+

-2

V(F е B (G.))

E(Fl е B(G:))

V(mcf (F1 е B(G),F1 е B(G.)))

где F1 c B(G) — двудольная граф-модель с весами на дугах, соответствующая EM( G/F1 с F), mcf(F1 с B(G), F1 с B( G)) — максимальный общий подграф по числу дуг для двух граф-моделей F1 с: B( G), Flс B(G) или коэффициент сходства

MSIG,Gj) = (V(mcf (Fl е B(G,),Fl е B(G.)))

E(mmcf (Fl е B(G ), Fl е B(G.)))

/ (V (F е B (G;))

E(F е B(G,))).

E(F е B(G;)))• (V(F е B(G.))

Приведем результаты анализа сходства на основе EM( G/Pl c SF) по второму подходу для 13 орграфов (рис. 3) и результаты их кластеризации. В графе попарных расстояний получено 19 разных значений расстояний (весов ребер) в диапазоне от 0 до 48. При кластеризации из графа попарных расстояний последовательно удалялись ребра, значения веса которых, превышали соответственно следующие границы 9; 8; 6; 3; 2; 0. В результате выделено 7 одноэлементных кластеров и 3 двухэлементных, состоящих из неизоморфных инверсных орграфов (рис. 4). Такие же кластеры выделены на этапе 4 по методу подхода 1.

Заметим, что использование ПП, основанного на определении mcf для всех пар орграфов при одинаковом числе вершин, не позволяет проводить кластеризацию, из-за недостаточного диапазона значений весов ребер в графах попарного сходства.

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г

19

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

Выделим, что, используя метрику Евклида для вычисления попарных расстояний между строками ма-

трицы MIRC(Fl с F( G)), мы решаем задачу определения попарного сходства расположения фрагментов орграфа.

10. Экспериментальные оценки вычислительной сложности задачи построения матрицы относительных вкладов фрагментов в сложность орграфов

Экспериментальные оценки вычислительной сложности (ЭОВС) решения задачи построения матрицы MIRC(Pl с P(G)) получены на основе использования новых программных подсистем, включенных в АСНИ «Мастерская граф-моделей» [16, 17]. Эксперименты проводились на ноутбуке (SONY, Intel Core i5, 2.67 GHz, память 4 Gb, Windows 7).

Учитывая особенность ордеревьев, связанную с существованием для каждой пары вершин только одного пути, нетрудно получить теоретическую

полиномиальную оценку P=0(p3) вычислительной сложности алгоритма построения MIRC(Pl с P(G)) для ордеревьев. Основу алгоритма составляет метод достройки вершины ордерева до пути, заданной длины. На рис. 5 приведены графики ЭОВС алгоритма построения MIRC(Pl с ^^^ля ордере-вьев со средними значениями индексов сложности (ISC(G/P)) и числами вершин от 108 до 508.

В общем случае задача построения MIRC(Pl с P(G)) для орграфов (сетей) является AP-полной проблемой, так как число путей всех длин в орграфах (сетях) растет экспоненциально и частным случаем для нее является класическая AP-полная проблема определения гамильтонова пути в орграфе (сети)

20

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

Рис. 5.

[15]. Сокращение перебора при построении матрицы MIRC(P1 с P(G)) методом достройки вершин до путей, заданной длины, осуществляется за счет учета симметрии (орбит стабилизаторов Aut(G)) и инвариантов вершин орграфов [13].

На рис. 6-9 приведены ЭОВС алгоритма построения восьми видов матриц:

MIRC(P'„-„ е SP0-n(G)); MIRC(P^ е SP0_n(G)); MIRC(P'0-4 е SP0-i2(G)); MIRC(P>0_6 е ^(G));

MIRC(P lo-o е sPo-2o(G)); MIRC(P '0_2 е ^(G));

MIRC(Pl0-4 е SPo-2o(G)); MIRC(P>0_6 е ^(G));

Анализировались случайные орграфы с числами вершин от loo до 6oo и средней степенью (суммой полустепеней исхода и захода) равной четы-

рем. Были построены матрицы MIRC следующих размеров (число строк х число столбцов): 1) у1 от ioox13 до 52ox 13; 2) у2 от 622x13 до 3395x13; 3) у3 от 1962x13 до 12369x13; 4) у4 от 4945x13 до 39675x13; 5) х1 от 1oox21 до 52ox21; 6) х2 от 622x21 до 3395x21; 7) х3 от 1962x21 до 12369x21; 8) х4 от 4945x21 до 39675x21.

Необходимо выделить, что задача вычисления сходства пары орграфов на основе поиска МОФ их матриц MIRC(P1 с P(G)) имеет полиномиальную вычислительную сложность при условии, что используется один и тот же базис P. Это обосновано возможностью сведения задачи поиска МОФ двух матриц MIRC(P' с P(G)) к задаче поиска максимального паросочетания в двудольном орграфе с весами на дугах.

Рис. 6.

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г

21

ВРЕМЯ, (мс) ВРЕМЯ, (мс) ВРЕМЯ, (мс)

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

ЧИСЛО ВЕРШИН

Рис. 7.

Рис. 8.

800000

700000

600000

500000

400000

300000

200000

100000

0

Рис. 9.

22

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧ БИЗНЕС-ИНФОРМАТИКИ

Заключение

Предложены матричные модели, позволяющие проводить иерархический уточняющий анализ сложности и сходства с учетом количественных и качественных характеристик фрагментов орграфов. Эти модели позволили расширить и дополнить теоретико-информационный подход к определению сложности орграфов качественными характеристиками его фрагментов. Рассмотрено применение моделей для решения теоретических

задач, связанных с определением границ вырождаемости матричных моделей в базисе путей для орграфов, сетей и графов. Модели полезны для решения прикладных задач различения и определения сходства ГМС, например, логико-вычислительных сетей, представляющих знания, сетей коммуникаций, компьютерных сетей и др. Предложенные методы анализа сложности и сходства программно реализованы и используются в учебном процессе НИУ ВШЭ, МЭИ (ТУ). ■

Литература

1. Финн В.К. Индуктивный метод соединенного сходства-различия и процедурная семантика ДСМ-метода.//НТИ, сер. 2, №4, 2010.

2. Кузнецов С.О. Финн В.К. Распространение процедур ЭС типа ДСМ на графы. //Техн.кибернетика, 1988, №5, С.4-11.

3. Игнатов Д.И., Кузнецов С.О. О поиске сходства интернет-документов с помощью частых замкнутых множеств признаков. Десятая национальная конференция по искусственному интеллекту с международным участием. КИИ-2006: Труды конференции. В 3-х т. М.: Физматлит, 2006. С. 245-249.

4. Шеннон К. Работы по теории информации и кибернетике. — М.: Изд. ин. лит., 1963.

5. Бончев Д.Г. Характеризация химических структур с помощью теории информации и теории графов. Автореферат дисс. докт. хим. наук. — Бургас, 1983. — 48 с.

6. Бертц С. Математическая модель молекулярной сложности. Химические приложения топологии и теории графов /Под ред. Р. Кинга, М.: Мир, 1987. — С. 236-258.

7. Minoly D. Combinatorial graph complexity. // Atti. Acad. Waz. Li. Rend. A. Sci. fis. mat. l'natur, vol. 59, no. 6. рр. 154-171, 1975.

8. Grone R., Herris R. A Bound for the Complexity of a Simple Graph. //Discrete Math., vol. 69, no. 1, рр. 97-99, 1988.

9. Загорянская А.А., Кохов В.А. Структурная сложность информационных систем и ее характеризация в базисе деревьев. Труды НТК студентов и аспирантов вузов России, Т1, Москва, 1998. — С.180-182.

10. Bonchev D., Polansky O.E. On the Topological Complexity on Chemical Systems // Studies in Physical and Theoretical Chemistry, 1987.V.51. P. 126-158.

11. Кохов В.А. Концептуальные и математические модели сложности графов. М.: Издательство МЭИ, 2002. - 160 с.

12. Касьянов В.Н., Евстигнеев В.А. Графы в программировании: обработка, визуализация и применение. — Спб.: БХВ-Петербург, 2003. — 1104 с.

13. Алгоритмы и программы решения задач на графах и сетях //Нечепуренко М.И., Попков В.К., Кохов В.А. и др. Новосибирск: Наука. 1990. — 515 с.

14. Кохов В.А. Метод количественного определения сходства графов на основе структурных спектров. Известия АН СССР, сер. Техническая кибернетика. N5, 1994. — С.143-160.

15. Гэри М, Джонсон Д. Вычислительные машины и труднорешаемые задачи. М.: Мир. 1982. — 416 с.

16. Кохов В.А., Ткаченко С.В. Программная система для исследования вычислительной сложности решения задач на графовых моделях. // Программные продукты и системы. N4, 2009. С. 137-140.

17. Незнанов А.А., Кохов В.А. Программный комплекс анализа структурного сходства систем с учетом расположения фрагментов. // Программные продукты и системы. N4, 2009. С. 147-150.

БИЗНЕС-ИНФОРМАТИКА №1(15)-2011 г

23

i Надоели баннеры? Вы всегда можете отключить рекламу.