Научная статья на тему 'Метод сепарабельной реконфигурации графав задачах структурной идентификации больших сетей'

Метод сепарабельной реконфигурации графав задачах структурной идентификации больших сетей Текст научной статьи по специальности «Математика»

CC BY
36
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Метод сепарабельной реконфигурации графав задачах структурной идентификации больших сетей»

УДК 681.3.06 Е.Б. Юдин

Омский государственный технический университет, г. Омск

МЕТОД СЕПАРАБЕЛЬНОЙ РЕКОНФИГУРАЦИИ ГРАФА

В ЗАДАЧАХ СТРУКТУРНОЙ ИДЕНТИФИКАЦИИ БОЛЬШИХ СЕТЕЙ

Введение

Структурная идентификация больших сетей, таких как сеть социальных контактов, Интернет, сеть ссылок веб-страниц, в последние годы базируется на теории так называемых графов Барабаши-Альберт (графов БА). В основу генерации графа БА заложен принцип

299

«предпочтительного связывания», или принцип «богатый становится богаче». Граф БА выращивается из небольшого графа затравки путем последовательного добавления вершин с заданным числом ребер, ребра присоединяются к существующим вершинам графа пропорционально их степени связности.

Как показано в многочисленных публикациях, в частности в [1], графы БА достаточно точно описывают распределение степени связности (РСС) узлов этих сетей. Однако соответствие по РСС не обеспечивает соответствия по ряду других структурных характеристик: среднее кратчайшее расстояние, диаметр, статистика клик и.т.д. В данной статье рассматривается соответствие графов БА сетям по такой характеристике как коэффициент кластеризации.

Коэффициент кластеризации является такой структурной характеристикой, которая оценивает долю фрагментированности графа. Например, в сети друзей это вероятность того, что 2 моих друга являются друзьями между собой. При высокой кластеризации можно ожидать, что вирус будет распространяться лишь в определенной подгруппе (кластере). При низкой кластеризации высока вероятность быстрого распространения вируса по всей сети.

Коэффициент кластеризации С определяется [1] как утроенное отношение среднего числа пА «треугольников» в графе к среднему числу пу «вилок» (число путей длины 2):

С = Пд/ Пу .

Для графа БА в работе [2] устанавливается, что коэффициент кластеризации рассчитывается по формуле:

С

(т -1)

(1п N )2

1) с 1п N

графБА_ теор

8

N

+

' т N

(1)

где N - число вершин, т - параметр графа БА, ст - константа, зависимая от т.

Получаемые теоретические (по формуле 1) значения коэффициента кластеризации графа БА, при одинаковом числе узлов N и ребер Е, значительно меньше, чем коэффициенты кластеризации в реальных сетях (табл.1).

Таблица 1

Коэффициент кластеризации в реальных сетях - Среал и в графе БА - СрграфБл_тео

Название сети Харак N теристики E сетей C реал Т m оретические величины C [21 графБА теор L J C / C реал графБА теор

Сеть маршрутизаторов 124651 207217 0,03863 2 0,00185 20,86609994

Сеть пользователей программы PGP 10680 24340 0,37802 3 0,00232 163,0688118

Сеть автономных систем Интернет 22963 48436 0,01146 2 0,00076 14,93567203

Сеть адресов электронной почты 36692 367662 0,08531 10 0,00342 24,9348154

Сеть ссылок вебстраниц (GOOGLE) 875713 5105039 0,05523 5 0,00011 503,4293618

Сеть товаров интернет-магазина Amazon 262111 1234877 0,23608 4 0,00024 1001,232022

300

Таким образом, стоит задача настройки коэффициента кластеризации, причем при этом необходимо обеспечить сохранение РСС графа.

Сепарабельная реконфигурация по коэффициенту кластеризации

Предложим метод реконфигурации настройки графа по коэффициенту кластеризации, назовем его методом сепарабельной реконфигурации. Заметим, для выполнения условия постоянства РСС число вилок не может быть изменено, единственный способ изменения коэффициента кластеризации - это изменение числа треугольников (тогда не нарушается РСС).

Для увеличения числа «треугольников» в графе циклически необходимое число раз используется следующая процедура, иллюстрируемая рис. 1 (процедура уменьшения числа треугольников аналогична приведенной).

Процедура увеличения коэффициента кластеризации

1. Случайно выбираем ребро Я, не входящее в треугольник. Определяем степени связности I и т вершин, инцидентных Я.

2. Случайно выбираем вершину а и среди смежных ей вершин отыскиваем две несвязные вершины Ь и с. Если таких нет, возвращаемся к 2.

3. Определяем степени связности г и7 вершин Ь и с соответственно. Ребро Я переносим - ставим его между найденными вершинами Ь и с. В результате этой операции количество вершин со степенями связности I, т, г, ] уменьшается, а количество вершин со степенями I -

1, т - 1, г + 1,7 + 1 увеличивается (вследствие чего изменяется РСС).

4. Компенсируем изменение РСС:

- выбираем случайное ребро (отличное от Я) со степенями связности г + 17 + 1;

- находим случайные вершины со степенями связности I - 1, т - 1;

- перенося выбранное ребро, соединяем им найденные вершины.

Конец процедуры

т

Я

Рис. 1. К методу реконфигурации графа; А1, Ат, А/, Л1,- множества вершин

301

Заключение

Предложенный метод реконфигурации графа позволяет на порядки изменять его коэффициент кластеризации, сохраняя РСС (рис. 2). Для эффективной программной реализации предложенного метода необходимо хранить ссылки на множества вершин с одинаковой степенью связности в специальной структуре данных.

с

Ь

а

а) б)

Рис. 2. а) граф БА б) граф БА после сепарабельной реконфигурации

На рис. 3 иллюстрируются затраты времени по изменению числа треугольников от времени запуска процедуры сепарабельной реконфигурации графа БА, содержащего 100000 вершин, и средней степенью связности 2-т = 6.

треугольников

2500000

2000000

1500000

1000000

500000

0

2000

4000

6000

8000

10000

12000

Время реконфигурации

Рис. 3. Динамика числа треугольников в процессе сепарабельной реконфигурации графа БА

302

Представленный метод калибровки, позволяет изменять коэффициент кластеризации без изменения РСС графа и реализован в системе агентного моделирования с использованием больших сетей 8ішЬі§гарЬ [4]. Этот метод отличается от известного метода сепарабельной

0

калибровки графов БА при m = 2 [21 тем, что выполняется не в процессе выращивания графа, а после его построения, и может применяться к графам БА при любых m > 2, а также к любым другим.

Библиографический список

1. Albert, R. Statistical mechanics of complex networks / R. Albert, A. Barabasi // Rev. Mod. Phys. - 2002.- V. 74. - P. 42-97.

2. Задорожный, В. Н. Структурные свойства безмасштабного графа Барабаши-Альберт / В. Н. Задорожный, Е. Б. Юдин // Автоматика и телемеханика. - 2012. - N° 4. - С. 131-150.

3. Олемской, А. И. Статистика сложных сетей (обзор) / А. И. Олемской, И. А. Олем-ской // Вісник СумДУ. - 2006. - № 6 (90). - С. 21-47.

4. Юдин, Е. Б. Система агентного моделирования SIMBIGRAPH / Е. Б. Юдин // Россия молодая: передовые технологии - в промышленность: матер. III Всерос. науч.-техн. конф. / ОмГТУ. - Омск, 2010. - Кн. 1. - С. 312-316.

i Надоели баннеры? Вы всегда можете отключить рекламу.