УДК 51-74
ПРИМЕНЕНИЕ ТЕОРИИ ГРАФОВ В СТРУКТУРНО-ТОПОЛОГИЧЕСКОМ АНАЛИЗЕ
ИНФОРМАЦИОННЫХ СИСТЕМ
APPLICATION OF THE THEORY OF GRAPHS IN THE STRUCTURAL AND TOPOLOGICAL ANALYSIS OF INFORMATION SYSTEMS
О.Ю. Лавлинская, Т.В. Курченкова O.Yu. Lavlinskaya, T.V. Kurchenkova
Воронежский институт высоких технологий, Россия, 394043, г. Воронеж, ул. Ленина, 73 а Voronezh Institute of High Technologies, 73 а Lenin St, Voronezh, 394043, Russia
E-mail: [email protected], [email protected]
Аннотация
В статье рассматриваются вопросы применения теории графов и теории марковских цепей в задачах структурно-топологического анализа информационных систем. Используется аппарат теории графов, формулируется математическая задача топологического анализа на основе параметров, характеризующих структуру системы. Расчет количественных значений структурно-топологических характеристик системы дает информацию, необходимую для принятия решения, по оценке эффективности ее функционирования. Вводится понятие меры значимости элемента в топологии системы, как интегрального показателя. Для определения меры значимости предлагается использовать аппарат цепей Маркова. Расчет меры значимости позволяет получить информацию, необходимую для оценки качества топологии системы. Мера значимости сравнивается с показателем структурной близости, на основе метода определения расстояния между элементами. На примере показан расчет двух показателей. Проводится сравнительный анализ и делаются выводы по поводу их применимости в структурно-топологическом анализе информационных систем.
Abstract
he article discusses the use of graph theory and the theory of Markov chains in problems of structural-topological analysis of information systems. We use the technique of graph theory, we formulate a mathematical problem of topological analysis based on the parameters characterizing the structure of the system. The calculation of quantitative values of structural-topological characteristics of the system provides the information necessary for decision-making, to assess the effectiveness of its functioning. Introduces the concept of a measure of importance of an element in the topology of the system as an integral indicator. To measure significance, it is proposed to use the apparatus of Markov chains. Calculating the measure of importance allows you to obtain the information necessary to assess the quality of the system topology. The measure of significance is compared with the index of structural proximity, based on the method of determining the distance between the elements. The example shows the calculation of the two indicators. A comparative analysis and conclusions about their applicability in the structural-topological analysis of information systems.
Ключевые слова: структурно-топологический анализ, информационная система. Keywords: structural and topological analysis, information system.
Введение
Структурно-топологический анализ системы необходим для получения информации о характере функционирования сложной системы в задачах оптимизации, планирования или синтеза системы.
Зная топологию системы и характер информационных потоков, исследователь получает информацию, необходимую для принятия решения по оптимизации процесса функционирования, получения, передачи, распределения информации, синтезу сложных иерархических, многоуровневых систем [Курченкова и др., 2010; Сербулов и др., 2010]. Теоретический аппарат и математические формулировки
Рассмотрим основные структурно-топологические характеристики, методы их расчета и их роль в интерпретации полученных результатов [Ланкастер, 1978; Вылиток, 1995; Корсунов и др., 2014].
Для изучения взаимодействий элементов системы, в первую очередь, необходимо выделить из общего представления атомарные единицы, которые и будут являться элементами, и составить морфологический портрет рассматриваемой системы в виде графа G порядка пхп, где п-число взаимодействующих элементов. Причем, в соответствии с целью анализа морфологические портреты могут существенно различаться. В математическом смысле для морфологического описания системы необходимо использовать бинарные отношения и матрицы смежности для графа G.
к
Обозначим значения компонентов матрицы смежности ч - это величины, которые характеризуют количество и/или качество передаваемой информации от 1-ого элемента к _]-ому элементу системы.
Для обобщенной количественной характеристики топологии информационной системы необходимо рассчитать следующие параметры: п 0
0 - полустепень исходов, параметр, характеризующий количество элементов, которым объект информационной системы передает информацию.
Для ^ = 1,п и вершины с С определим суммы вида
п ^
п 0(8,) = 1 ку п бЫ = 1 Юу
1=1 , ^ . (1)
п Ь - полустепень заходов, параметр, характеризующий количество элементов, от которых объект получает информацию.
п
п БЫ = Е ку
Н , (2) В виду того, что суммы п б(я,) и п б(я,) дают представления лишь о месте в структуре
С , целесообразно ввести величины, характеризующие степень влияния на формирования отношения «.
Параметр « - отношение, характеризующее мощность информационных связей. Для отношения «, определим сумму
Р« = Е ЕЖ, Ку е К«
(3)
3. Х 0 - степень воздействия элемента системы на другие элементы.
4. х Ь- степень воздействия других элементов на элемент системы.
X (Я) Я
Сумма 0 ^ ^ показывает (в процентах от суммарного « по Я), степень воздействия 1 на
другие системы в смысле отношений «. Сумма Хб(Я,), наоборот, степень воздействия других систем на в смысле отношений «. При таком подходе пары (пХ0(Я,)) и
(пB(SiX XB(Si)) довольно полно характеризуют важность (вес) элементов в Si в формировании отношений * между элементами множества S .
Xо (Si) = Zkij/ £ Zkij -100 % XB(Si) = £ky/ £ Zkij -100 %
j=1 / j=1=1 , i=1 / j=1=1 , (4)
Z Id(si,sj)
j=1i=1
n - (n -1) . (5)
-j—< ri
5. Проверка на «петлю». Петлей называется дуга eii G , для которой вершина Si - ее
о K * kij
начало и конец. В матрице K , наличие петель характеризуется заполнением ячеек 1J, где
Ь * 0
i=j, то есть элементы главной диагонали 4 .
6. Расстояние между элементами d. Расстоянием между двумя вершинами графа называется наименьшая длина пути, соединяющего эти вершины [Кристофидес, 1978]
Определим матрицу расстояний D {dij}, где dij d(Si'Sj) . Изначально D = Q ( Q - ноль
- единичная матрица смежности, указывающая на наличие eij G E ), Vdij kij. Перемножив
^ к = D х D djj * 0 d(Si,Sj) < 2
D саму на себя, получим матрицу D = D х D, такую, что если 1J , то J .
rr ^ D2 D3 = D2 хD dj- * 0 d(Si,Sj) < 3
Перемножив D на D , получим D = D х D, такую, что если 4 , то J и так
Dn
далее, до D .
Имея заполненную матрицу расстояний D, можно рассчитать структурную компактность.
7. Структурная компактность. Это свойство предлагается оценивать рядом показателей:
d(G) = mf d(Si'Sj) d(Si,Sj)
- диаметром структуры - ,J , где J - расстояние между вершинами
Si,Sj с S (длина кратчайшего пути, равная числу дуг, составляющих этот путь);
S
- центром и радиусом структуры - вершина 00 является центром, если
VSi с S* : (max d(Si,Sj) > max d(S00,Sj)) (S
j j , а 00' j - радиусом;
- относительным показателем, характеризующим структурную близость элементов между собой
(/ ) 1 8 = Т 2d(Si,Sj) ( ,
8от =(8/8 min )- 1, i=1j=1 , 8 min = n - (n - 1). (6)
8. Структурная избыточность. Характеризует относительную разность числа связей E, имеющихся в структурном представлении бинарного отношения, и числа связей Emin, минимально необходимого для связности графа. Вводится показатель
Ф = (E -Emin)/Er
(7)
Показатель ф оценивает меру избыточности структуры по связям. Если ф > 0, то структура имеет максимальную избыточность (типа полный граф), если ф = 0, то наблюдается случай с минимальной избыточностью; ф < 0 - структура отношения не связна.
Изучая каждый из элементов Б в морфологическом плане с той или иной позиции и применяя к анализу системы изложенную выше структурную формализацию, можно построить механизм информационного взаимодействия, как между элементами Б, с точки
зрения структуры и ее качества, так и с точки зрения характера информационного обмена во времени [Гантмахер, 1988].
Пример расчета структурно-топологических характеристик информационной системы Рассмотрим информационную систему со следующими функциональными характеристиками. Пусть объект Х посылает сообщение объекту У. В то же время необязательно, что объект У посылает сообщение объекту X. (однонаправленная связь или двунаправленная связь). Предположим, что субъект не посылает сообщение самому себе (отсутствие «петли» на графе). Для примера сформулируем следующую задачу. Провести структурно-топологический анализ с использованием теоретико-графового и вероятностного подхода информационной системы [Лавлинская, Курченкова, 2010], состоящей из шести информационных объектов, которые обмениваются информацией по следующему алгоритму.
Пусть объект { - подсистема оповещения; 1 - администратор сети, б - маршрутизатор в сети, с1, с2 - пользователи системы. Пользователи могут передать информацию системе (БД). Информация из БД поступает администратору и в систему оповещения напрямую. Администратор может сгенерировать дополнительные оповещения и передать их в подсистему Г Подсистема оповещений также отправляет информацию в базу данных б и оператору сотовой связи (для выбранного примера примем, что оператор сотовой связи один - г). Оператор доставляет сообщение пользователям. В примере рассмотрим ситуацию, когда в системе только два пользователя.
Построим граф информационных отношений, представленный на рисунке 1. Двунаправленные связи изображаются линиями, а однонаправленные связи стрелками.
Рис. 1. Граф информационных связей Fig. 1. Graph of information communications
Построим матрицу смежности элементов сети, рисунок 2.
Is f cl c2 r
l 0 110 0 0
s 10 10 0 0
f l l 0 0 l 0
cl 0 l 0 0 0 0
c2 0 l 0 0 0 0
r 0 0 110 1
Рис. 2. Матрица смежности Fig. 2. Connectivity matrix
Рассчитаем структурно-топологические характеристики в соответствии с математической моделью и запишем результаты в таблицу 1. Таблица 1 Table 1
Структурно-топологические характеристики объектов информационной системы Structural and topological characteristics of objects of an information system
l s f cl c2 r
Параметр « 12
0 - полустепень исходов 2 2 3 l l 3
Ь - полустепень заходов 2 4 3 l l l
Л 0 „ 0 - степень воздействия элемента системы на другие элементы. 0,16 0,l6 0,25 0,08 0,08 0,25
Л Ь „ Ь - степень воздействия других элементов на элемент системы. 0,16 0,3 0,25 0,08 0,08 0,08
Структурная компактность вот 1,36
Полученные значения дают возможность оценить значимость информационных объектов в структурно-топологическом контексте [Котов, 1984]. Таким образом, самым значимым элементом с точки зрения влияния на другие элементы является подсистема { (подсистема оповещений), а подсистема б (БД в рассматриваемом примере) является самым поглощающим информацию элементом в ИС [Харари, 1973]. Значение структурной компактности 1,36 говорит о том, что наличие двунаправленных связей требует организации механизмов разделения отправки и получения информации во времени, иначе возможна ситуация, когда информация, необходимая для оповещения не сформирована в нужной инстанции, а отправка уже осуществилась. Чем выше показатель структурной компактности, тем больше расстояния (информационные маршруты) в системе. Далее рассмотрим меру значимости объектов на основе аппарата цепей Маркова [Кемени, Снелл 1972].
В самом общем случае представим ситуацию, что каждый объект посылает информацию другому с равной степенью вероятности. В этом случае, теоретико-графовая модель превращается в цепь Маркова. Ответим на вопрос, какая доля сообщений пройдет через каждый элемент за длительное время? Матрица переходных вероятностей представим в виде:
l s f cl c2 r
l 0 l/2 l/2 0 0 0
s 1/2 0 l/2 0 0 0
f l/3 l/3 0 0 l/3 0
cl 0 l 0 0 0 0
r 0 0 l/3 l/3 l/3 0
c2 0 l 0 0 0 0
Напомним, что эргодическая цепь - это цепь, в которой возможен обмен информацией между двумя любыми объектами (не обязательно за один шаг) [Нагагу, 1965]. Одним из вариантов эргодической цепи является регулярная цепь. Регулярной цепью называется цепь, где существует вероятность перехода из любого состояния в любое состояние, т.е., цепь регулярна тогда и только тогда, когда существует такое число
элементов цепи, что в матрице переходных состояний все элементы будут отличны от нуля [Sharp, 1966].
Анализ топологии сети, проведенный выше, дает основание считать данную сеть регулярной и эргодической.
Поскольку у регулярных цепей есть свойство, что через определенное число ходов будет иметься постоянная вероятность нахождения цепи в состоянии s, и эта вероятность не зависит от начального распределения, а зависит только от матрицы переходов, то с помощью предела можно вычислить меру, которая будет характеризовать значимость элемента в цепи.
В рассматриваемом примере количество сообщений, направленных в произвольное состояние, равно пределу, который не зависит от начального состояния, предел равен вектору матрицы переходных вероятностей.
Для нахождения единственно возможного решения составим систему уравнений.
0 1/2 1/2 0 0 0
1/2 0 1/2 0 0 0
1/3 1/3 0 0 0 1/3
0 1 0 0 0 0
0 0 1/3 1/3 1/3 0
0 1 0 0 0 0
(8)
(а1, а 2, а 3, а 4, а 5, а 6 )* = (аь а 2, а3, а 4, аз, а6)
а1 + а 2 + а 3 + а 4 + а 5 + а 6 = 1
т» " а = (а1, а 2, а3, а 4, а5, а 6)
Решение данной задачи выражается единственным вектором 1 2 3 4 5 6
, представляющим предельные вероятности поставки информации от одного объекта
другим объектам. С помощью этого вектора также можно определить меру значимости
каждого объекта в информационной системе.
Решим данную систему уравнений и получим следующее значение:
а = — (22,26,27,3,3,9) 90 7
Данный вектор показывает, что самым значимым объектом в информационной системе является объект f, т.е., система оповещения, вторым объектом по значимости является объект s, а объекты с1 и c2 обладают равнозначностью в информационной системе. Интуитивная интерпретация данного простого примера дает схожие результаты. Количественная оценка меры значимости позволяет определить, можно ли изменять топологию системы без потери качества [Мельников, 2002]. Например, в нашем случае, видно, что для вершин c1 и c2 перестановка не изменит морфологию системы, а вот изменение связей между остальными элементами может привести к изменению характера функционирования системы. Если требуется принятие решения по оптимизации структуры, то необходимо решить задачу синтеза системы: подобрать такую структуру системы, которая имеет заданную меру значимости. Задача синтеза является гораздо более сложной задачей и методы синтеза требуют применения алгоритмов перебора. Интерпретация полученных результатов
Представленный анализ меры значимости, и оценка структурной близости информационных объектов на основе определения расстояния между объектами дают схожие результаты с точки зрения топологии сети. Но для оценки характера информационного обмена во времени, оценка меры значимости с помощью аппарата цепей Маркова является более информативной, поскольку дает содержательную оценку в случае, если известны вероятностные характеристики информационного обмена. Если при топологическом анализе с помощью аппарата цепей Маркова мы видим совпадающие вектор-строки, то возможно структурное укрупнение [Беллман, 1969; Gavin, 2017] за счет объединения схожих объектов в одну подсистему, где все элементы выполняют одинаковые
роли и наделены одинаковыми функциями [Янковская, 20l4], следовательно, информационный обмен данными между структурными элементами является эквивалентным.
Представленный алгоритм структурно-топологического анализа интересен с точки зрения структурного анализа определения основных характеристик, отражающих меру значимости объекта в общей структуре системы, что играет определяющую роль в задачах оценки надежности [Сербулов и др., 20l3], работоспособности систем [Liu, 2009; Черноморец и др., 20l7], моделировании систем [Лавлинская, Курченкова, 20l0; Сумин, Смоленцева, 20l5] и структурной и функциональной оптимизации для сложных систем [Чеботарев, l989], где интуитивная интерпретация невозможна или дает ошибочные результаты.
Список литературы References
1. Беллман Р. l969. Введение в теорию матриц. Пер. с англ. М., Наука, 368. Bellman R. l969. Introduction to matrix analysis. TRANS. from English. M., Nauka, 368.
2. Вылиток А. А. l996. О построении графа магазинного автомата. Вестн. Моск. ун-та. Сер. l5. Вычисл. матем. и киберн. № 3: 68-73.
Vylitok A. A. l996. On the construction of the graph automaton store. Vestn. Mosk. Univ. Ser. l5. Comp. mod. and cybern. No. 3: 68-73. (in Russian)
3. Гантмахер Ф.Р. l988. Теория матриц. М., Наука, 552. Gantmakher F. R. l988 Theory of matrices. M., Nauka, 552. (in Russian)
4. Кемени Дж., Снелл Дж. l972. Кибернетическое моделирование. Некоторые приложения. М., Советское радио, l9l.
Kemeni Dzh., Snell Dzh. l972. Kiberneticheskoe modelirovanie. Nekotorye prilozheniya. M., Sovetskoe radio, l9l. (in Russian)
5. Корсунов Н.И., Чуев Е.В., Чуева А.И. Метод построения контролируемых цифровых автоматов. Научные ведомости БелГУ. Серия: Экономика. Информатика. l5(l86): 90-95. Korsunov N.I., Chuev E.V., Chueva A.I. Metod postroeniya kontroliruemyx cifrovyx avtomatov. Nauchnye vedomosti BelGU. Seriya: E'konomika. Informatika. l5(l86): 90-95. (in Russian)
6. Котов В.Е. l984. Сети Петри. М., Наука, l58. Kotov V. E. l984. Petri Nets. M., Nauka, l58. (in Russian)
7. Кристофидес Н. l978. Теория графов. Алгоритмический подход. М., Мир, 432. Kristofides N. l978. Teoriya grafov. Algoritmicheskij podhod. M., Mir, 432. (in Russian)
8. Курченкова Т.В., Курченков О.А., Никулина Е.Ю. 20l0. Информационная технология взаимодействия технологических систем. Инженерная физика. М., Научтехлитиздат, 3: 3033.
Kurchenkova T.V., Kurchenkov O.A., Nikulina E.YU. 20l0. Informacionnaya tekhnologiya vzaimodejstviya tekhnologicheskih system. Inzhenernaya fizika. M., Nauchtekhlitizdat, 3: 30-33. (in Russian)
9. Лавлинская О.Ю. 20l0. К вопросу о мере измерения информации в задачах выбора и распределения информационных ресурсов. Вестник Воронежского института высоких технологий, 6. Воронеж, Научная книга: l7-22.
Lavlinskaya O.YU. 20l0. K voprosu o mere izmereniya informacii v zadachah vybora i raspredeleniya informacionnyh resursov. Vestnik Voronezhskogo instituta vysokih tekhnologij, 6. Voronezh, Nauchnaya kniga: l7-22. (in Russian)
10. Лавлинская О.Ю., Курченкова Т.В. 20l0. Моделирование структурных связей между объектами сложных систем с использованием методов аналитической экспертизы. Вестник Воронежского института МВД России, 4. Воронеж: l05-ll0.
Lavlinskaya O.YU. Kurchenkova T.V. 20l0. Modelirovanie strukturnyh svyazej mezhdu ob"ektami slozhnyh sistem s ispol'zovaniem metodov analiticheskoj ehkspertizy. Vestnik Voronezhskogo instituta MVD Rossii, 4. Voronezh: l05-ll0. (in Russian)
11. Ланкастер П. l978. Теория матриц. М., Наука, 280. Lancaster P. l978. Theory of matrices. M., Nauka, 280. (in Russian)
12. Мельников Б. Ф. 2002. Однозначные конечные автоматы. Известия высших учебных заведений. Поволжский регион. Технические науки, 1: 45- 58.
Melnikov, B. F. 2002. Unambiguous finite automata. News of higher educational institutions. Povolzhskiy region. Technical Sciences, 1: 45- 58. (in Russian)
13. Сербулов Ю. С. Лавлинская О.Ю., Лавлинский В.В. 2010. Мера информации в задачах выбора и распределения информационных ресурсов. Инженерная физика, 4: 7-8. Serbulov Yu. S. Lavlinskaya O.Yu., Lavlinskij V.V. 2010. Mera informacii v zadachah vybora i raspredeleniya informacionnyh resursov. Inzhenernaya fizika, 4: 7-8. (in Russian)
14. Сербулов Ю.С. Десятирикова Е.Н., Лавлинская О.Ю., Рудакова М.Н. 2013. Оценка компетентности участников инновационного проекта на основе правил нечеткого вывода. Вестник Воронежского государственного технического университета, Т. 9., 1: 106. Serbulov Y. S., Desyatnikov E. N., Lublinskaya O. Yu., Rudakov M. N. 2013. Assessment of the competence of the participants in the innovation project on the basis of rules of fuzzy conclusion. Bulletin of Voronezh state technical University, V. 9., 1: 106. (in Russian)
15. Сумин В.И., Смоленцева Т.Е. 2015. Методика группирования базовой информации для информационных процессов сложных систем. Научные ведомости БелГУ. Серия: Экономика. Информатика. 13 (210): 104-108.
Sumin V.I., Smolenceva T.E. 2015. Metodika gruppirovaniya bazovoj informacii dlya informacionnyx processov slozhnyx sistem. Nauchnye vedomosti BelGU. Seriya: E'konomika. Informatika. 13 (210), Vypusk 35/1: 104-108. (in Russian)
16. Харари Ф. 1073. Теория графов. М., Мир: 300. Harari F. graph Theory 1973. M., Mir: 300. (in Russian)
17. Чеботарев П. 1989. Агрегирование неполных предпочтений. Автоматика и телемеханика, 8: 125-137.
Chebotarev P. 1989. Aggregation of incomplete preferences. Automatics and telemechanics, 8: 125-137. (in Russian)
18. Черноморец А.А., Петина М.А., Коваленко А.Н., Зайцева Н.О. 2017. Графоаналитическая модель динамики распространения подземных вод. Научные ведомости БелГУ. Серия: Экономика. Информатика. 2 (251): 75-80.
Chernomorec A.A., Petina M.A., Kovalenko A.N., Zajceva N.O. 2017. Grafoanaliticheskaya model' dinamiki rasprostraneniya podzemnyx vod. Nauchnye vedomosti BelGU. Seriya: E'konomika. Informatika. 2 (251): 75-80. (in Russian)
19. Янковская Т.А. 2014. О задачах структурно-параметрического синтеза при проектировании сложных технических систем. Образовательные ресурсы и технологии, 1: 170-175.
Jankovska T. 2014. On the problems of structural-parametric synthesis in the design of complex technical systems. Educational resources and technology, 1: 170-175. (in Russian)
20. Gavin H. P. 2017. The Levenberg-Marquardt method for nonlinear least squares curve-fitting problems. Department of Civil and Environmental Engineering Duke University. Available at: http://people.duke.edu/~hpgavin/lm.pdf. (accessed 20 May 2017).
21. Harary F., Norman R.Z., Cartwright D. 1965. Structurial Models: An Introduction to the Theory of the Directed Graphs. Wiley, New York, 415.
22. Liu B. 2009. Theory and Practice of Uncertain Programming. 2nd ed., Springer-Verlag, Berlin, 201.
23. Sharp H.Jr. 1966. Quasi-orderings and topologies on finite sets. Proc., Amer. Math. Soc., 17: 1344-1349.