Научная статья на тему 'Ранжирование академического веб-пространства'

Ранжирование академического веб-пространства Текст научной статьи по специальности «Математика»

CC BY
215
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЛЕКТРИЧЕСКАЯ ЦЕНТРАЛЬНОСТЬ / ВЕКТОР МАЙЕРСОНА / ВЕБ-ГРАФ / ELECTRIC CENTRALITY / MYERSON VALUE / WEBGRAPH

Аннотация научной статьи по математике, автор научной работы — Мазалов Владимир Викторович, Печников Андрей Анатольевич, Трухина Людмила Ивановна, Цынгуев Булат Тимурович

Предлагается для анализа научно-образовательного вебпространства использовать методы теории графов и кооперативной теории игр. Основной характеристикой анализа является центральность вершин во взвешенном графе. Взвешенный граф представлен как электрическая цепь, и в качестве меры центральности вершины рассматривается суммарный ток, протекающий через данную вершину. Вычисление центральности вершин использует обратную матрицу Лапласа. Рассматриваемый метод имеет относительно невысокую вычислительную сложность. Метод иллюстрируется результатами расчетов электрической центральности для ранжирования вершин графа, представляющего фрагмент взаимосвязанных сайтов академических организаций РФ. Сделано сравнение с широко используемым методом PageRank.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Мазалов Владимир Викторович, Печников Андрей Анатольевич, Трухина Людмила Ивановна, Цынгуев Булат Тимурович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Ranking of russian academic web

We propose to apply the methods of the graph theory and the cooperative game theory for determining nodes centrality in weighted graphs. In this method a graph considers like electric circuit, where the centrality measure is the total sum of electric current flow through this node. The computing of betweeness centrality is based on the inverse Kirchhoff's matrix. This method has low computational complexity. The results of numerical experiments of electric centrality are presented for graph of web sites of Russian academic organizations. We compare our results with the popular Page Rank method.

Текст научной работы на тему «Ранжирование академического веб-пространства»

УДК 021.8 + 025.1 ББК 78.34

РАНЖИРОВАНИЕ АКАДЕМИЧЕСКОГО ВЕБ-ПРОСТРАНСТВА

Мазалов В. В.1, Печников А. А.2

(Институт прикладных математических исследований КарНЦ РАН, Петрозаводск) Трухина Л. И.3

(Читинский институт (филиал) Байкальского государственного университета экономики и права, Чита) Цынгуев Б. Т.4 (Забайкальский государственный университет, Чита)

Предлагается для анализа научно-образовательного веб-пространства использовать методы теории графов и кооперативной теории игр. Основной характеристикой анализа является центральность вершин во взвешенном графе. Взвешенный граф представлен как электрическая цепь, и в качестве меры центральности вершины рассматривается суммарный ток, протекающий через данную вершину. Вычисление центральности вершин использует обратную матрицу Лапласа. Рассматриваемый метод имеет относительно невысокую вычислительную сложность. Метод иллюстрируется результатами расчетов электрической центральности для ранжирования вершин графа, представляющего фрагмент взаимосвязанных

1 Владимир Викторович Мазалов, доктор физико-математических наук, профессор (Петрозаводск, ул. Пушкина, д. 65, тел. (8142) 78-11-08, [email protected])

2 Андрей Анатольевич Печников, доктор технических наук, доцент (Петрозаводск, ул. Пушкинская, д. 11, тел. (8142) 76-63-12 (доп. 39), [email protected])

3 Людмила Ивановна Трухина, кандидат физико-математических наук ([email protected]).

4Булат Тимурович Цынгуев, аспирант ([email protected]).

сайтов академических организаций РФ. Сделано сравнение с широко используемым методом PageRank.

Ключевые слова: электрическая центральность, вектор Май-ерсона, веб-граф

Введение

Анализ веб-пространства стремительно набирает всемирную популярность благодаря возникновению всемирной паутины Интернет, а также появлению в 1990-х годах онлайновых сервисов социальных сетей (SixDegrees, LiveJournal, Facebook, Twitter, YouTube и другие). Методы анализа социальных сетей чрезвычайно важны для анализа развития современных тенденций в различных областях науки, а также и для улучшения обмена научной информацией среди научных организаций.

Основной целью статьи является анализ академического веб-пространства России с использованием методов ранжирования вершин графов, основанных на обратной матрице Лапласа и на векторе Майерсона.

Одним из базовых понятий в анализе сетевых структур является betweenness centrality. Центральность вершины — это важная мера, отражающая то, насколько вершина участвует в процессе распространения информации между остальными вершинами в графе.

1. Электрическая центральность

В отличие от традиционных моделей вычисления центральности вершин в графе на основе геодезических путей или вычисления предельных вероятностей для некоторого случайного блуждания на данном графе (метод PageRank [6]) в работах [3,5,9-11,13-15] было предложено при расчете меры центральности использовать аналогию с электрическими сетями. В данном подходе граф рассматривается как электрическая цепь с идеальными элементами, где каждое ребро имеет некую пропускную способность (значение обратное сопротивлению), а верши-

ны графа являются её узлами. Для поиска меры центральности в модели электрической цепи используются правила Кирхгофа. Одну модель отличает от другой то, что напряжение подается в цепь различными способами и в качестве меры центральности вершины выбирается либо ее электрический потенциал, либо ток, проходящий через данную вершину, либо другие характеристики.

В [4] рассматривается модель электрической цепи, где каждая вершина цепи соединена с искусственно вводимой вершиной уп+1 ребром с пропускной способностью 5. Единичный электрический ток подается в некоторую вершину в, цепь заземляется в вершине г>га+1. Таким образом, электрический ток течет по цепи из вершины в в вершину г>га+ь Подобный прием использовался в работах [7,8].

Мерой центральности вершины V служит средняя величина тока, проходящего через вершину V по всем возможным в. Отметим, что ток на ребрах, инцидентных вершине vra+l, не учитывается при расчете центральности.

Обозначим взвешенный граф как С = (У,Е,Ш), где V — множество вершин, Е — множество ребер, Ш — матрица весов:

W (С) =

( 0 -Ш1,2 . . . -Ш1,п\ ■Ш2,1 0 ... W2,1

\Шп, 1 Wn, 2 ... 0 J

где wij ^ 0 — вес ребра между вершинами VI и V, п = IV | — число вершин. Если вершины ^ и Vj несмежные, то Wi,j = 0. Если С — неориентированный граф, то wi,j = Wj,i.

Пусть ^ обозначает абсолютный потенциал в вершине V € V при условии, что источник электрического тока подключен к вершине в. Примем абсолютный потенциал в вершине vra+l равным нулю: <£>1п+1 = 0, тогда вектор абсолютных потенциалов <р3(С) = ,..., ]Т в вершинах графа С можно определить следующим выражением (правила Кирхгофа) [4]: (1) <р8(С) = [0(С) - Ш(С)+ 51]-%,

где 0(0) — диагональная матрица суммы весов ребер, инцидентных соответствующим вершинам, I — единичная матрица размерности п, Ь3 — вектор-столбец, состоящий из п элементов, значения которых равны:

ш = (1' " = в'

I 0 иначе.

Ток, протекающий через ребро е = (VI, V]), согласно закону Ома, равен х3е = \<р*щ - | ■ К].

Величину тока, протекающего через вершину V можно найти, определив сумму токов на ребрах, инцидентных ей, и поделив полученную сумму на 2. Отметим, что необходимость в делении на 2 возникла в связи с тем, что при суммировании всех токов на ребрах, инцидентных вершине, учитывается электрический ток как входящий в вершину, так и выходящий из нее.

Соответственно величину тока, протекающего через вершину V, при условии, что источник тока находится в вершине в, можно вычислить следующим образом:

(2) х*^) = 1(Ъ3^)+ £ х|).

Таким образом, меру центральности в вершине V для взвешенных графов С^ (V) можно определить по формуле:

(3) съ (V) = П Е х» = 2- (1 + ЕЕ хе).

вЕУ вЕУ е-/и£е

Вычислительная сложность алгоритма поиска электрической центральности вершин взвешенных графов предлагаемым способом относительно невысока и равна сложности вычисления обратной матрицы 0(п3).

2. Вектор Майерсона

Для определения центральности вершин в графе можно использовать теоретико-игровой подход.

Пусть множество вершин графа G является множеством игроков кооперативной игры, в которой характеристическая функция задаётся следующим образом [12]: каждая прямая связь — путь длиной 1 — приносит игрокам доход r, где 0 ^ r ^ 1. Кроме того, игроки также извлекают выгоду из косвенных (непрямых) связей, но уже меньшую. За каждый путь длиной 2 коалиция получает r2, за путь длиной 3 получает r3 и т.д. Так как любые две вершины могут быть связаны несколькими путями разной длины, то при построении характеристической функции учитываются только кратчайшие. А если две вершины связаны несколькими путями одинаковой длины, то учитываются все такие пути, при условии, что между этими вершинами нет другого меньшего пути.

Таким образом, для любой коалиции S можно записать

L

(4) §(S) = air + a2r2 +-----+ aLrL = £ akrk,

k= 1

где L — максимальное расстояние между двумя вершинами в данной коалиции;

ak — число геодезических путей длины k в данной коалиции,

0(г) = 0, Vi е N. Делёж в данной игре определяется по формуле

Ai Ai Ai Ai

(5) Yi (^,G) = A r + A r2 + ■■■ + L+TrL = E kA+Trk,

k=1

где Ak — число путей длины k, содержащих игрока i.

В [2] доказано, что предложенный делёж для невзвешенных графов является вектором Майерсона.

В рассматриваемой игре значение вектора Майерсона зависит от числа путей. Следовательно, большее значение выигрыша для игрока означает большее количество путей, проходящих через него, а значит, и больший вес игрока в сети. Поэтому можно использовать вектор Майерсона как меру центральности вершин графа. Модифицируем этот подход для взвешенных сетей. 122

Пусть дан взвешенный граф с целыми весами на ребрах. Заменим каждое ребро веса п на п параллельных ребер единицы веса. Самый короткий путь между любыми двумя вершинами будет определяться так же, как и в невзвешенном графе, так как все ребра имеют единичную длину. Но теперь в целом геодезических путей больше, чем было ранее, из-за мультиребер. Если вершины А и В соединены т ребрами, а В и С - п рёбрами, то из вершины А в вершину С ведёт т ■ п путей. Применяя формулу (5) к вершинам мультиграфа, получим меру центральности вершины во взвешенном графе.

В [2] предложен алгоритм нахождения числа кратчайших путей в невзвешенном графе с помощью производящих функций. Этот алгоритм несложно перенести на случай взвешенных графов.

Рассмотрим дерево Ср с корнем в вершине р. Введём в рассмотрение производящую функцию

рр(х) = ак

хк,

к= 1

где ак — число путей, состоящих из к игроков (длины к — 1), содержащих вершину р.

Вычислим производящую функцию рекуррентно. Вначале определим в финальных вершинах д дерева Ср

Рд (X) = X.

Для остальных вершин дерева, не являющихся корнем, положим

(6) Рд(х) = х ^1 + ^ Рд;(х) ^ ,

где сумма берётся по всем потомкам = 1,... ,й, вершины д. Для корня дерева — вершины р — положим

(7) Рр(х) = х I 1 + ^ Рд;(х) + ^ Рд; (х)Рд; (х)

\ г=1 г=]

где сумма берётся по всем потомкам = 1,... вершины р.

123

Во взвешенном графе число путей через производящую функцию вычисляется точно так же, с той лишь разницей, что когда поднимаемся вверх к корню, то в вершине, где есть параллельные ребра, мы как бы копируем поддерево внизу такое же число раз. То есть вычисляем во всех вершинах фд(х) = х(1 + ад(д, (ж)), где, qi - потомки д и -ш(д, — вес ребра (д, д^. А в корне функция вычисляется по формуле

3. Примеры

Рассмотрим частный случай, когда С — полный двудольный граф c п вершинами, вершины которого разделены на два множества У1 и У2 таким образом, что ни одна вершина в У1 не соединена с вершинами VI, и ни одна вершина в У2 не соединена с вершинами У2. Обозначим данный полный двудольный граф как К|у1|,|у2|. Все ребра имеют вес равный единице. Для случая К 1,п-1, т.е. для звезды, аналитическое решение электрической центральности было представлено в [4].

3.1. ДВУДОЛЬНЫЙ ГРАФ К2,м

Пусть VI = у' Е У2. Тогда матрица Лапласа имеет

вид:

(8)

(рр(х) =а

Б(С) - W(С) + 51 =

/п - 2 + 5 0 -1 -1

0 п - 2 + 5 -1 -1

-1 -1 2 + 5 0

-1 -1 0 2 + 5

-1 0 0

1

-1

1

00

2+5

Обратная матрица имеет вид:

(Я(С) — W (С) + 5/)-1 =

5(п + 5)

I п-2+пё+ё2 п+&-2

п-2 п+й-2

1 1

V

1

п-2 п+&-2

п-2+пг+г2

п+й-2 1

1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1

1 1 .. 1

1 1 .. 1

2+пй+г2 2 2

2+г 2+г .. 2+г

2 2+пй+г2 2

2+г 2+г .. 2+г

2 2+й

2 2+й

2+пг+г2 2+й )

Здесь и далее, тот факт что это обратная матрица, проверяется непосредственно умножением на матрицу ^(С) — Ш(С) + 51. После несложных вычислений приходим к единичной матрице. При в = VI ток распределяется следующим образом:

х*ы = 1 (1 + (5 + п — 1)(п — 2)

х = 2 (п + 5)(п + 5 — 2)

х^(^2) =

(п — 2)

х>') =

2(п + 5 — 2)(5 + п)' 1

2(п + 5 — 2)'

Так как вершины г1 и г>2 расположены симметрично, то при г2 получаем

х5(г1) =

(п — 2)

2(п + 5 — 2)(5 + п)'

х>2) = 1 (1 + (5 + п — 1)(п — 2) х (г2) 2 \ + (п + 5)(п + 5 — 2)

хв(г') =

1

2(п + 5 — 2)'

1

х

х

в

При в = у' :

х5(у1) = х5(«2) =

1

5 + 2п - 4 2(2 + 5)(5 + п),

2(5 + п - 1)

Х^(в) 2 \1 + (2 + 5)(5 + п)У

х>') =

1

(2 + 5)(5 + п)' Получаем следующий результат для К2,п-2:

пт^, ^ Л 1 Л п - 2 (п - 2)(5 + 2п - 4)

СГ,(«,) = СГ,(«2) = - (1 + + 1 (2+Л,)(, + п) '

с« («') = ^ (1 +

2

+

2(5 + 2п - 4)

п + 5 - 2 (2 + 5)(5 + п)) '

3.2. ДВУДОЛЬНЫЙ ГРАФ К3,м-3. Пусть У1 = {уь«2,у3}, у' е У2. Тогда матрица Лапласа:

ДС) - W(С) + 5/ =

/п - 3 + 5 0 0 -1 -1 . . -1 \

0 п - 3 + 5 0 -1 -1 . . -1

0 0 п - 3 + 5 -1 -1 . . . -1

-1 -1 -1 3+5 0 . .0

-1 -1 -1 0 3 + 5 .. .0

-1 -1 -1 0 0 .. . 3 + 5/

Обратная матрица имеет вид:

(Я(С) - W(С) + 5/)-1 =

1

5(п + 5)

х

/ п—3+пё+ё2 п+ё—3

п—3 п+ё—3

п—3 п+ё—3

1

V

1

п—3 п+ё—3 п—3+пё+ё2 п+ё—3

п—3 п+ё—3

1

1

п—3 п+ё—3

п—3 п+ё—3 п—3+пё+ё2 п+ё—3

1 1

1

1 1 1

3+пё+ё2 3+ё

3 3+ё

3 3+ё

1 1

1

3 3+ё 3+пё+ё2 3+ё

3 3+ё

Рассуждая аналогично К2,п—2, получим следующий результат для К'3 п-3:

1 1

1

3 3+ё

3 3+ё

3+пё+ё2 3+ё /

С¥ё, (VI) = С¥ё Ы = С¥ё Ы =

_ ( (п - 3)(5 + п + 1) (п - 3)(5 + 2п - 5) _ 2п V + (п + 5 - 3)(5 + п) + (3 + 5)(5 + п)

Срё ^ _ 2п С+

3(5 + п + 1) 3(5 + 2п - 5) (п + 5 - 3)(5 + п) + (3 + 5)(5 + п)

3.3. ДВУДОЛЬНЫЙ ГРАФ КК}М—п.

Пусть V € VI, V' € У2 и г _ |У1|, п - г _ |У"2|. Подобно рассуждениям рассмотренных случаев К1,п—1, К2,п—2 и К3,п—3, можно определить значения центральностей для вершин полного двудольного графа Кг,п—г:

СР М_ 1 Л . (п - г)(5 + п - 2 + г) + С^ё 1+ (п + 5 - г)(5 + п) +

+

(v') _ 2п +

(п - г)(5 + 2п - 2 - г) \ (г + 5)(5 + п) )'

г(5 + п - 2 + г) + г(5 + 2п - 2 - г)

(п + 5 - г)(5 + п) (г + 5)(5 + п)

х

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1

1

3.4. ЦЕНТРАЛЬНОСТЬ НА ОСНОВЕ ВЕКТОРА МАИЕРСОНА ДЛЯ ЗВЕЗДЫ К},м-1.

Найдём меру центральности на основе вектора Майерсона для звезды из п вершин. Пусть вес ребра между вершинами 1 и 2 равен ш},2, а остальные рёбра имеют вес равный единице. По формуле (5) для центра звезды получим

А} А} 2 п - 2+ -1,2 (СП-2 + Ш1,2(п - 2) ^ 2 = -Г г + —2 г2 = ---— г + --- г2

n - 2 + r /(та - 2)(n - 3) + wi,2(n - 2)\ ^

2

Для вершины 2:

A2 2 wi,2 wi,2(n - 1) 2

Y2 — -1 rr +--2 r2 — -!_ r +-->-r2_

2 2 3 2 3

Для всех остальных вершин:

A1 A2 2 1 n - 2 + wi,2 2 Yv = — r +-3- r =2 r + -3-r.

4. Эксперименты

В качестве примера был рассмотрен фрагмент реального веб-графа научных учреждений Российской академии наук (далее - веб-граф РАН) в их дореформенной версии, построенного с использованием базы данных внешних гиперссылок [1]. База данных расположена в интернете по адресу http://grid.krc.karelia.ru/webometrics2. Для гостевого входа в качестве имени пользователя и пароля достаточно ввести слово «guest».

Веб-граф РАН представляет собой ориентированный граф с кратными дугами без петель. По данным на март 2014 года он содержал 956 вершин, соответствующих сайтам научных отделений, центров, институтов, библиотек и др., связанных почти 39000 дугами, соответствующими гиперссылкам, связывающим эти сайты. 128

Поскольку в статье рассматривается неориентированный граф, для проведения вычислительных экспериментов над веб-графом РАН были выполнены следующие действия:

1) оставлены только те вершины веб-графа, любая пара которых связана «встречными» дугами любой кратности;

2) все кратные встречные дуги заменены на ребра, вес которых равен меньшей из двух кратностей встречных дуг;

3) в полученном после первых двух шагов графе удалены все вершины (и соответствующие им ребра), не вошедшие в максимальную компоненту связности.

Далее из построенного графа была удалена вершина, соответствующая сайту РАН с доменным именем www.ras.ru. Дело в том, что сайт РАН занимает доминирующее положение в системе веб-сайтов учреждений РАН, имея около 500 исходящих гиперссылок и 1300 входящих. Вследствие этого при любом методе ранжирования вершин веб-графа, вершина, соответствующая данному сайту, занимает первое место в рейтингах. Поскольку наша цель - показать, что новые предлагаемые методы ранжирования вершин обладают более высокой чувствительностью по отношению к вершинам с определенными особенностями, доминирующую вершину мы исключили из дальнейшего рассмотрения.

Полученный таким образом граф содержит 169 вершин, связанных 279 ребрами. Вес ребер варьируется от 1 до 38, средний вес ребра равен 2,04. Его изображение приведено на рис. 1.

На рисунке некоторые вершины графа помечены названиями научных учреждений. Пронумерованными эллипсами выделены четко различимые группы веб-сайтов, таких как:

1-3. Сайты научных учреждений, входящих в состав Дальневосточного, Сибирского и Уральского региональных отделений РАН (ДВО РАН, СО РАН и УрО РАН).

4. Сайты научных учреждений, входящих в состав КарНЦ РАН.

5-6. Сайты институтов (Институт социально-экономического развития территорий РАН, Институт теоретической физики РАН).

Рис. 1. Неориентированный граф учреждений РАН

Достаточно очевидно, что сайты, являющиеся «головными» в этих группах, должны иметь высокие значения такой известной характеристики ссылочного ранжирования как PageRank (РЯ), введенной в работе [6]. И действительно, это подтверждается таблицей 1, в которую попали все сайты учреждений, указанных в пп. 1-5.

Таблица 1. Десять первых сайтов с наибольшим значением PR

Название ияь РЯ

Сибирское отделение РАН www.sbras.nsc.ru 0,088

Карельский научный центр РАН www.krc.karelia.ru 0,048

Институт вычислительных www.ict.nsc.ru 0,038

технологий СО РАН

Уральское отделение РАН www.uran.ru 0,037

Институт теоретической физики itp.ac.ru 0,022

им. Л.Д. Ландау РАН

Дальневосточный геологический www.fegi.ru 0,017

институт ДВО РАН

Дальневосточное отделение РАН www.febras.ru 0,013

Институт социально-экономического www.vscc.ac.ru 0,013

развития территорий РАН

Институт проблем химической физики РАН www.icp.ac.ru 0,012

Институт прикладных математических mathem.krc.karelia.ru 0,012

исследований КарНЦ РАН

Для этих же сайтов были сделаны расчеты значений электрической центральности и центральности по вектору Майерсона. Сравнивая значения PR с ранжированием по значениям электрической центральности для 5 = 0,3, можно отметить, что 5 из 6 указанных головных сайтов попадают в первую десятку и в этом случае, а сайт www.vscc.ac.ru находится на 15-м месте.

Несколько иные результаты мы имеем для вектора Майерсона при г = 0,9: только 3 головных сайта попадают в первую десятку.

Таблица 2. Сравнение рангов 5 учреждений РАН

Название Ранг по PR Ранг по Ранг по

(URL) электрической центральности вектору Майерсона

Институт археологии РАН 76 41 3

(www.archaeolog.ru)

Институт истории и 133 38 5

археологии УрО РАН

(www.ihist.uran.ru)

Институт экономики 80 17 7

КарНЦ РАН

(economy.krc.karelia.ru)

Библиотека РАН 151 19 35

(www.rasl.ru)

Институт физики 137 23 22

твердого тела РАН

(www.issp.ac.ru)

На рис. 1 несложно выявить сайты, удаление которых ведет к образованию достаточно крупных несвязных компонент. В первую очередь, к ним относятся сайты Института археологии РАН, Института истории и археологии УрО РАН, Института экономики КарНЦ РАН, Библиотеки РАН и Института физики твердого тела РАН. Значения рангов сайтов этих учреждений по PR, электрической центральности (5 = 0,3) и вектору Майерсона (г = 0,9) приводятся в таблице 2. Здесь в колонке «Ранг по PR» даются порядковые номера указанных сайтов в общем списке сайтов, упорядоченных по убыванию значений PR. Такой же смысл имеют значения, указанные в колонках «Ранг по электри-

131

ческой центральности» и «Ранг по вектору Майерсона».

Очевидно, что обнаружение указанных сайтов, имеющих важное значение в анализируемом графе РАН, более точно проводится с помощью методов, основанных на использовании понятий электрической центральности и вектора Майерсона, нежели с помощью РЯ. Например, сайт Института физики твердого тела РАН по сравнению с рангом по РЯ (137 место) поднялся на 115 позиций в ранге по вектору Майерсона (22 место). На рис. 1 видно, что удаление этого сайта ведет к образованию двух несвязных компонент, к одной из которых относится группа, состоящая из 12 сайтов, входящих в веб-пространство Института теоретической физики РАН, включающего официальный сайт, сайты лабораторий, проектов, библиотеки и др.

5. Заключение

В работе предложен подход к анализу академического веб-пространства на основе разработанных авторами методов вычисления центральности вершин во взвешенном графе. Граф моделируется как некоторая электрическая цепь с новой заземленной вершиной, затем с одинаковой вероятностью в каждую из вершин подводится единичный ток. Средняя величина тока, проходящего через вершину, и берется в качестве центральности данной вершины. В физическом смысле это соответствует второму началу термодинамики: система находится в термодинамическом равновесии, и энтропия такой равновесной системы является мерой центральности в сети. Информационная энтропия тесно связана с термодинамической энтропией. В этом смысле распространение информации в академической сети подобно распространению тока в электрической цепи. Для вычисления центральности предлагается использовать правила Кирхгофа, которые представляют собой систему линейных уравнений. Для некоторых видов графов центральность можно найти в аналитическом виде. В работе это сделано для двудольных графов. В общем случае задача сводится к вычислению обратной матрицы, для этого можно использовать численные методы. Предложенный метод был исполь-132

зован для моделирования академического веб-пространства, сделано сравнение с традиционным методом PageRank и вектором Майерсона, адаптированным для взвешенных графов. Показаны преимущества метода электрической центральности на примере вычисления этой характеристики для вершин, которые являются коммуникаторами связных компонент.

Работа частично поддержана Отделением математических наук РАН, грантом РГНФ (проект 15-02-00352) и грантами РФФИ (проекты 15-01-06105, 16-51-55006).

Литература

1. ГОЛОВИН А.С., ПЕЧНИКОВ А.А. База данных внешних гиперссылок для исследования фрагментов Веба // Информационная среда вуза XXI века: материалы VII Всероссийской научно-практической конференции, Петрозаводск, 23-27 сентября 2013 г. - С. 55-57.

2. МАЗАЛОВ В.В., ТРУХИНА Л.И. Производящие функции и вектор Майерсона в коммуникационных сетях // Дискретная математика. - 2014. - Том 26, Вып. 3. - C. 65-75.

3. ЧЕБОТАРЕВ П.Ю., ШАМИС Е.В. Матричная теорема о лесах и измерение связей в малых социальных группах // Автоматика и телемеханика. - 1997. - №9. - С. 125-137.

4. AVRACHENKOV K.E., MAZALOV V.V., TSYNGUEV B.T. Beta Current Flow Centrality for Weighted Networks // Lecture Notes in Computer Science. Computational Social Networks. - 2015. - Vol. 9197. - P. 216-227. (DOI: 10.1007/978-3-319-21786-4_19).

5. BRANDES U., FLEISCHER D. Centrality measures based on current flow // STACS-2005. Lecture Notes in Computer Science. - 2005. - Vol. 3404. - P. 533--544. (D0I:10.1007/978-3-540-31856-9_44).

6. BRIN S., PAGE L. The anatomy of a large-scale hypertextual Web search engine // Computer Networks and ISDN Systems. - 1998. - Vol. 30(17). - P. 107-117. (DOI: 10.1016/j.comnet.2012.10.007).

7. CHEBOTAREV P., SHAMIS E. The Forest Metrics for Graph Vertices // Electronic Notes in Discrete Mathematics. -2002. - Vol. 11. - P. 98-107.

8. CHEBOTAREV P. , AGAEV R. Forest matrices around the Laplacian matrix // Linear Algebra and its Applications. -2002. - Vol. 356, Issues 1-3. - P. 253-274.

9. ESTRADA E., HATANO N. Resistance Distance, Information Centrality, Node Vulnerability and Vibrations in Complex Networks // Network Science. Complexity in Nature and Technology, Springer, 2010. - P. 13-29. (D0I:10.1007/978-1-84996-396-1_2).

10. FREEMAN L.C., BORGATTI S.P., WHITE D.R. Centrality in valued graphs: A measure of betweenness based on network flow // Social Networks 13. - 1991. - P. 141-154. (D0I:10.1016/0378-8733(91)90017-N).

11. HINES P., BLUMSACK S. A centrality measure for electrical networks // Proc. 41st Hawaii International Conference on System Sciences. - 2008. - P. 185. (DOI: 10.1109/HICSS.2008.5).

12. JACKSON M.O. Social and economic networks. - Princeton University Press, 2008.

13. NEWMAN M.E.J. A measure of betweenness centrality based on random walks // Social networks. - 2005. - Vol. 27. -P. 39-54. (DOI:10.1016/j.socnet.2004.11.009).

14. WANG H., HUA H., WANG D. Cacti with minimum, second-minimum, and third-minimum Kirchhoff indices // Mathematical Communications. - Vol. 15. - 2010. -

P. 347-358.

15. WANG Z., SCAGLIONE A., THOMAS R. Electrical centrality measures for electric power grid vulnerability analysis // Proc. 49th IEEE Conference on Decision and Control (CDC). - 2010. - P. 5792-5797. (DOI: 10.1109/CDC.2010.5717964).

RANKING OF RUSSIAN ACADEMIC WEB

Vladimir Mazalov, Institute of Applied Mathematical Research Karelian Research Centre RAS, Petrozavodsk, Doctor of Science, professor ([email protected]).

Andrey Pechnikov, Institute of Applied Mathematical Research

Karelian Research Centre RAS, Petrozavodsk, Doctor of Science,

associate professor ([email protected]).

Liudmila Trukhina, Chita Branch of Baikal State University of

Economics and Law, Chita, ([email protected]).

Bulat Tsynguev, Transbaikal State University, Chita,

([email protected]).

Abstract: We propose to apply the methods of the graph theory and the cooperative game theory for determining nodes centrality in weighted graphs. In this method a graph considers like electric circuit, where the centrality measure is the total sum of electric current flow through this node. The computing of betweeness centrality is based on the inverse Kirchhoff's matrix. This method has low computational complexity. The results of numerical experiments of electric centrality are presented for graph of web sites of Russian academic organizations. We compare our results with the popular Page Rank method.

Keywords: Electric centrality, Myerson value, webgraph.

Статья представлена к публикации членом редакционной коллегии П.Ю. Чеботарёвым.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Поступила в редакцию 25.08.2015. Дата опубликования 31.05.2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.