Научная статья на тему 'О сценариях присоединения новых сайтов к веб-пространству со РАН'

О сценариях присоединения новых сайтов к веб-пространству со РАН Текст научной статьи по специальности «Математика»

CC BY
3517
112
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕБ-ГРАФ / ВЕБ-ПРОСТРАНСТВО / РАНГ ВЕРШИНЫ / САЙТ / PAGERANK / WEB-GRAPH / WEB-SPACE / VERTEX RANK / SITE

Аннотация научной статьи по математике, автор научной работы — Веснин Андрей Юрьевич, Константинова Елена Валентиновна, Савин Михаил Юрьевич

Рассматриваются преобразования веб-графа Сибирского отделения Российской академии наук. Вершины графа соответствуют сайтам научных организаций; две вершины соединяются ориентированным ребром, если с одного сайта на другой имеется ссылка. В работе моделируются сценарии присоединения к этому графу новых вершин и исследуются происходящие в результате этого изменения рангов вершин, вычисляемых алгоритмом PageRank. Находятся значения структурных параметров графов, гарантирующие выход новых вершин в лидеры.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Веснин Андрей Юрьевич, Константинова Елена Валентиновна, Савин Михаил Юрьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON SCENARIOS OF JOINING NEW SITES TO THE SB RAS WEB-SPACE

We consider transformations of the Web-graph of the Siberian Branch of Russian Academy of Sciences (SB RAS). The vertices in this graph correspond to the web-pages of scientific institutes, and there is a directed edge between two vertices if one of the web-pages is linking to another web-page. Different scenarios for joining new vertices to this Web-graph are considered and changes in ranging of vertices by PageRank are investigated. Structural parameters of graphs making a new vertex to be the leader are shown.

Текст научной работы на тему «О сценариях присоединения новых сайтов к веб-пространству со РАН»

УДК 004.7

А. Ю. Веснин 1 2, Е. В. Константинова 1 2, М. Ю. Савин 2

1 Институт математики им. С. Л. Соболева СО РАН пр. Акад. Коптюга, 4, Новосибирск, 630090, Россия

2 Новосибирский государственный университет ул. Пирогова, 2, Новосибирск, 630090, Россия

E-mail: vesnin@math.nsc.ru; e_konsta@math.nsc.ru savinmike.u@gmail.com

О СЦЕНАРИЯХ ПРИСОЕДИНЕНИЯ НОВЫХ САЙТОВ К ВЕБ-ПРОСТРАНСТВУ СО РАН *

Рассматриваются преобразования веб-графа Сибирского отделения Российской академии наук. Вершины графа соответствуют сайтам научных организаций; две вершины соединяются ориентированным ребром, если с одного сайта на другой имеется ссылка. В работе моделируются сценарии присоединения к этому графу новых вершин и исследуются происходящие в результате этого изменения рангов вершин, вычисляемых алгоритмом PageRank. Находятся значения структурных параметров графов, гарантирующие выход новых вершин в лидеры.

Ключевые слова: веб-граф, веб-пространство, PageRank, ранг вершины, сайт.

Введение

Предметом изучения в данной работе является веб-граф научного пространства Сибирского отделения Российской академии наук. Под веб-графом научного пространства мы понимаем ориентированный граф, вершины которого соответствуют сайтам научных учреждений, а дуги - их ссылкам друг на друга. Веб-граф научного пространства СО РАН был впервые построен в [1]. Очевидно, что с течением времени веб-граф может меняться. В данной работе рассматривается веб-граф научного пространства СО РАН по состоянию на 2 ноября 2012 г., представленный на сайте объединенного ученого совета СО РАН по на-нотехнологиям и информационным технологиям 1. Вебометрический анализ и граф-теоретический анализ веб-пространства СО РАН представлен в [2].

Популярным и хорошо зарекомендовавшим себя средством ранжирования сайтов веб-пространства является алгоритм PageRank [3]. Он также активно используется при изучении связей графов научного сотрудничества и структуры веб-графов (см. [4; 5]). Основанный на алгоритме PageRank анализ научного веб-пространства СО РАН реализован в [6]. Поскольку веб-пространство развивается и меняется с течением времени, его мониторинг представляет несомненный интерес. Изменения веб-пространства обусловлены появлением новых сайтов, установлением новых информационных связей, утратой существовавших связей. В [7] с помощью алгоритма PageRank были проведены ранжирования сайтов веб-пространства СО

* Работа выполнена при финансовой поддержке Президиума СО РАН (междисциплинарный интеграционный проект № 21, 2012-2014) и РФФИ (проект № 12-01-00448).

1 См.: http://ousnano.sbras.ru/sitepage.php?PageID=2128

Веснин Ю. А., Константинова Е. В., Савин М. Ю. О сценариях присоединения новых сайтов к веб-пространству СО РАН // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2013. Т. 11, вып. 4. С. 28-37.

ISSN 1818-7900. Вестник НГУ. Серия: Информационные технологии. 2013. Том 11, выпуск 4 © А. Ю. Веснин, Е. В. Константинова, М. Ю. Савин, 2013

РАН по состоянию на 2 ноября 2012 г. Соответствующий веб-граф Glo6 имеет 106 вершин и 1 084 дуги. Распределение рангов вершин в данном графе приведено на рис. 1. Наибольший ранг, равный 0,079553, имеет вершина, соответствующая сайту Портал СО РАН. Информация о рангах первых 80 вершин графа Gl06 приведена в [7].

Рис. 1. Ранги вершин графа 0106

В настоящей работе моделируются несколько сценариев изменения исходного графа Gl06 и для каждого из них приводится сравнение рангов вершин в новых графах (в зависимости от типа новых ссылок). Кроме этого, находятся значения структурных параметров графов, при которых ранг новых вершин становится выше, чем ранг лидеров исходного графа. Приводятся базовые сведения о методе вычисления рангов вершин и рассматриваются сценарии, основанные на соглашениях с лидерами и аутсайдерами.

Алгоритм PageRank

Пусть G = (V, Е) - ориентированный граф с множеством вершин V, V = п, и множеством дуг Е. Для 7 = 1, 2, ..., п обозначим через д7 число дуг, выходящих из вершины 7. Определим (п х п)-матрицу Н = (к^) следующим образом. Если д Ф 0, то положим для у = 1,...,п

|1/ дi ,если имеется дуга из вершины 7 в вершину у; ь [0, иначе.

Если д = 0, то для у = 1,...,п положим Ну = 1/п. По определению матрицы Н сумма элементов в каждой ее строке равна единице, т. е. Н является стохастической матрицей. Рассмотрим (п х п)-матрицу Е, каждый элемент которой равен 1/п, и определим матрицу

5 = аН + (1 -аЕ),

где параметр а называется коэффициентом затухания. Обычно его значение принимают равным 0,85. Очевидно, все элементы матрицы 8 положительны и она является стохастиче-

ской. Матрица S = (Sj ) известна в литературе как Google matrix. Рангом вершины i назовем величину л;, удовлетворяющую соотношению

п

ж j=T%s,

i=1

которое можно записать в виде tc = tc-S. Вектор л = (л1,...,жп) назовем вектором рангов

вершин графа. Обычно вектор п нормализуется так, что ^ П=1 ж, = 1. В этом случае получаем уравнение

ж = arcS + (1 - a)и, ж = ar;zS + (1 - а)и, где n-вектор и имеет вид (1/n,...,1/п).

Соглашение с лидерами

Графы [G106+n J и [G*06+п J . Рассмотрим сценарии присоединения новых вершин к графу

G106, вершинами которого являются v1,...,v106, исходя из предположения, что лидеры графа G106 устанавливают ссылки на новые вершины.

Пусть число присоединяемых вершин равно п, п > 1. Будем предполагать, что новые вершины занумерованы и1,...,ип. Обозначим через Кп ориентированный граф на п вершинах и1,...,ип, в котором каждая вершина соединена ориентированной дугой с каждой другой вершиной. Таким образом, Кп имеет п (п -1) дуг. Обозначим через G^^ граф с множеством вершин {v1,...,v106}U{и1,...,ип}, множество дуг которого состоит из дуг графа G106 и дуг графа Кп.

Проведем ранжирование вершин графа G106+n методом PageRank. Это ранжирование индуцирует ранжирование вершин на его подграфе G106. Перенумеруем вершины подграфа G106 в соответствии с этим ранжированием в порядке невозрастания рангов: v1,..., v106. Ранг вершины vi будем здесь и далее обозначать ni, i = 1,..., 106.

Пусть k - целый параметр, принимающий значения от 0 до 106. Обозначим через ^106+п J граф, полученный из графа G1()6+n добавлением дуг из вершин v1,...,vk в каждую

из вершин и1,...,ип. В частности, ^106+п J совпадает с GW6+n.

Через [G106+п J обозначим граф, полученный из ^106+п J добавлением дуг из вершин

ul,...,ип в каждую из вершин vl,...,vl06, при этом [^0в+пJ0 = Ськ+п.

Отметим, что каждый из графов Кп, ^106+п J , [G^^ J обладает автоморфизмом порядка п, переводящим ui ^им, i = 1,...,п, где индексы берутся по модулю п, и оставляющим вершины vj, j = 1,...,106, на месте. Следовательно, в фиксированном графе вершины и1,...,ип имеют один и тот же ранг, который мы будем обозначать ж,.

Добавление одной вершины. Пусть к графу G106 присоединяется одна вершина, т. е. п = 1. Получаемый граф G107 есть несвязное объединение графа G106 и изолированной вершины и1. Проведем ранжирование вершин графа G107 (который совпадает с графом [G107 ]°) с помощью алгоритма PageRank и перенумеруем вершины подграфа G106 в соответствии с невозрастанием рангов. Наибольший ранг ж1 = 0,079367825 имеет вершина v1, соответствующая сайту Портала СО РАН, а ранг новой вершины и1 в графе G107 равен ж, = 0,002341948 (табл. 1).

Таблица 1

Сценарии соглашений с лидерами

№ Граф л1 л,

1 [^107 ] к = 0 0,079367825 0,002341948

к = 14 0,076850950 0,015046168 л, вошел в Т0Р10 рангов

к = 56 0,070007676 0,070268180 и1 стала лидером

к = 106 0,052438192 0,179566009

2 [^107 ] к = 0 0,079369311 0,002323365

к = 14 0,075984516 0,017483016 л, вошел в Т0Р10 рангов

к = 56 0,067356153 0,072655435 и1 стала лидером

к = 106 0,052512834 0,178390171

3 [^108 ] к = 0 0,077139781 0,015174368

к = 1 0,076473629 0,019415946 л, вошел в Т0Р10 рангов

к = 11 0,068414878 0,068819123 и1 и и2 стали лидерами

к = 106 0,018439751 0,332701182

4 [^108 ] к = 0 0,079185308 0,002318151

к = 19 0,076473629 0,019415946 л, вошел в Т0Р10 рангов

к = 62 0,058551613 0,060915392 и1 и и2 стали лидерами

к = 106 0,042524987 0,114182289

5 [^11 ] к = 0 0,073780996 0,014513776

к = 1 0,072277316 0,019415946 л, вошел в Т0Р10 рангов

к = 13 0,055078863 0,056041798 и1,..., и5 стали лидерами

к = 106 0,010322062 0,149987794

6 [С*11 ] к = 0 0,078638226 0,002302630

к = 19 0,067449214 0,015512883 л, вошел в Т0Р10 рангов

к п 9 0,044663227 0,045460593 и1,..., и5 стали лидерами

к = 106 0,028538459 0,061726068

7 [^131 ]к к = 0 0,057182244 0,011248646

к = 1 0,052941540 0,013411782 л, вошел в Т0Р10 рангов

к = 16 0,026390432 0,025116797 и1,...,и25 стали лидерами

к = 106 0,003111032 0,034032701

8 [^ ]к к = 0 0,075171288 0,002203713

к = 38 0,011272822 0,015512883 л, вошел в Т0Р10 рангов

к п 7 0,015871734 0,016937550 и1,...,и25 стали лидерами

к = 106 0,011272822 0,018377486

Сценарий 1. Естественно предположить, что ранг вершины и1 будет увеличиваться по мере того, как на нее будет ссылаться все большее число лидеров. Предположим, что на и1 сделали ссылки первые к лидеров подграфа О106, а именно вершины у1,...,Ук. Этот сценарий моделируется графом ^107 ]к. Проведя вычисления рангов вершин графов ^107 ]к для к = 1,...,106, заключаем, что ранг вершины и1 войдет в десятку наибольших рангов при

г пк

к = 14 и и1 станет лидером графа [С107 ] при к = 54 (см. табл. 1, где для каждого фиксированного к ранг вершины у1 обозначен через л1, а ранг вершины и1 - через л,).

Сценарий 2. Предположим, что мы не ограничиваемся соглашениями с к лидерами, а, управляя сайтом, соответствующим вершине и1, устанавливаем ссылки из вершины и1 на все вершины подграфа Ц06, т. е. проводим из вершины и1 дуги во все остальные вершины. Этот сценарий моделируется графами [Ц*07] , к = 1, ..., 106. Вычисляя ранги вершин этих графов, получаем, что ранг вершины и1 войдет в десятку наибольших рангов при к = 14, и и1 станет лидером графа [С107 ] при к = 56 (см. табл. 1).

Коалиция двух вершин. Как видно из моделирования сценариев 1 и 2, для достижения лидерских позиций вершиной и1 требуется добиться соглашений о ссылках со всеми сайтами из первой половины списка, составленного по рангам. Покажем, что применение других сценариев может привести к нужному результату с меньшими затратами, а именно: рассмотрим сценарии создания коалиции с еще одной вершиной, стремящейся к попаданию в лидеры. Предположим, что к графу G106 добавлены две новые вершины и1 и и2, имеющие ссылки друг на друга. Полученный граф G108 соответствует описанной выше конструкции при п = 2. Ранжирование его вершин с помощью алгоритма PageRank показывает, что наибольший ранг ж1 = 0,077139781 имеет вершина, соответствующая сайту Портала СО РАН, а ранги новых вершин и1 и и2 совпадают и равны ж, = 0,015174368 (см. табл. 1).

Сценарий 3. Предположим, что на вершины и1 и и2 сделали ссылки первые к лидеров подграфа G106 графа G108 (обозначенные после ранжирования вершин графа G108 как

у1,...,Ук). Этот сценарий моделируется графом |^108J . Вычисляя ранги вершин графов |^108J , где к = 1, ..., 106, получаем, что ранг ж, вершин и1 и и2 войдет в десятку самых высоких рангов при к = 1 и вершины и1, и2 станут лидерами графа |^108 J при к = 11 (см.

табл. 1). Таким образом, согласованность действий двух новых вершин существенно повышает ранг каждой из них.

Сценарий 4. Предположим, что мы не ограничиваемся соглашениями с к лидерами, а, управляя сайтами, соответствующими вершинам и1 и и2 , устанавливаем с них ссылки на все вершины веб-графа G106, т. е. из вершин и1 и и2 проводим дуги во все остальные вершины. Этот сценарий моделируется графами ^108] , к = 1, ..., 106. Вычисляя ранги вершин этих графов, получаем, что ранг ж, вершин и1 и и2 войдет в первую десятку рангов при к = 19 и эти вершины станут лидерами графа ^108 ] при к = 62 (см. табл. 1).

Коалиция большой группы вершин. Рассмотрим сценарии создания коалиций с большим числом новых вершин, ставящими перед собой задачу выйти в лидеры, исходя из предположения, что стратегии всех новых вершин одинаковы.

Сценарий 5. Предположим, что к графу G106 присоединяются пять новых вершин и1,...,и5,

имеющие ссылки друг на друга. Результатом такого присоединения является граф G111, соответствующий описанной выше конструкции при т = 5. Проведем ранжирование его вершин с помощью алгоритма PageRank. Наибольший ранг ж1 = 0,073780996 имеет вершина , соответствующая сайту Портала СО РАН, а ранги новых вершин и1,...,и5 совпадают и равны ж, = 0,014513776 (см. табл. 1). Предположим, что на вершины и1,...,и5 сделали ссылки первые к лидеров подграфа G106 графа G111 . Этот сценарий моделируется графом ^ш]к . Вычисляя ранги для вершин графов ^ш]к, где к = 1, ..., 106, получаем, что ранг ж, вершин и1,...,и5 войдет в десятку самых высоких рангов при к = 1 и вершины и1,...,и5 станут лидера-

ми графа [С111 ]к при к = 13 (см. табл. 1). Таким образом, согласованность действий пяти новых вершин существенно повышает ранг каждой из них.

Проиллюстрируем сценарий 5 сравнением графиков рангов вершин графов 0111 и

[^ш]20. На рис. 2 приведены графики ранжирования вершин графа G111 и графа [С111]20, соответствующего случаю, когда на каждую из вершин м1з...,и5 ссылаются 20 лидеров графа 0111 . Упорядочивание вершин соответствует их рангам в графе G111 . Как видно, вершины

и1,...,и5 оказались в нем на местах с 11 по 15. В графе [Сш] имеем п1 = 0,045291 и ранг вершин и1,...,и5 равен п* = 0,074831. Новые вершины стали лидерами с большим отрывом.

Сценарий 6. Рассмотрим сценарий присоединения пяти новых вершин, который отличается от предыдущего сценария тем, что из каждой новой вершины устанавливаются ссылки на старые вершины графа. Этот сценарий моделируется графами [С1*11]к, к = 1, ..., 106. Вычисляя ранги вершин этих графов, получаем, что ранги вершин и1,..., и5 войдут в первую десятку рангов при к = 19 и эти вершины станут лидерами графа [С1*11]к при к = 94 (см. табл. 1).

Проиллюстрируем сценарий 6 сравнением графиков рангов вершин графов. На рис. 3 приведены графики рангов вершин графов G111 и G1*11. Вершины упорядочены в соответствии с их рангами в графе 0111. На рис. 4 приведены графики рангов вершин графов [С111]20 и [^Ц ]20. Здесь вершины упорядочены в соответствии с их рангами в графе [С111 ]20.

Сценарий 7. Предположим, что к графу G106 присоединяется достаточно большое число вершин. Приведем результаты вычислений в случае присоединения двадцати пяти вершин (почти четверть от числа старых вершин). Положим, что действия новых вершин и1 ,... , и25 согласованы и каждая из них ссылается на другую. Результатом такого присоединения является граф , соответствующий описанной выше конструкции при п = 25. Проведем ранжирование его вершин с помощью алгоритма PageRank. Наибольший ранг п1 = 0,057182244 имеет вершина У1, соответствующая сайту Портала СО РАН, а ранги новых вершин и1,..., и25 совпадают и равны п* = 0,011248646 (см. табл. 1). Предположим, что на вершины

Рис. 2. Ранги вершин графа (1) и графа ]2° (2)

Рис. 3. Ранги вершин графа (1) и графа (2)

1 2

\ / /

ч-ч го |_Г| г-н. сп т-н со 1лг^сл»чт1лг^т »нт1лг^сл»чт тг^сп^чтшг^т гнттг^ст1*нгп1л г^сП'Нттг^сП'гН тшгнт^тшг*» т и н и нннппппм тттгпт^г^г ■з-гг-з-ттттт юшшшшг^г^г^ г^ г^ 00 00 00 СО 00 т спспсптоооо о и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ИНИН *ч

г -.20 г * ~|20

Рис. 4. Ранги вершин графа |С?Ш ] (1) и графа I С111 I (2)

иг,...,и25 сделали ссылки первые к лидеров подграфа G106 графа G131 . Этот сценарий моделируется графом [С131]к . Вычисляя ранги вершин графов [С131]к, где к = 1, ..., 106, получаем, что ранг п* вершин и1,..., и25 войдет в десятку самых высоких рангов при к = 1, а вершины и1,..., и25 станут лидерами графа [С131]к при к = 16 (см. табл. 1).

Сценарий 8. Рассмотрим сценарий присоединения двадцати пяти новых вершин, который отличается от предыдущего сценария тем, что из каждой новой вершины устанавливаются

ссылки на старые вершины графа. Этот сценарий моделируется графами [С131]к,

к = 1, ..., 106. Вычисляя ранги вершин этих графов, получаем, что ранг ж, вершин и1,...,и25 войдет в первую десятку рангов при к = 38 и эти вершины станут лидерами графа [б^ ]к при к = 79 (см. табл. 1).

Соглашение с аутсайдерами

Рассмотрим сценарии присоединения новых вершин к графу б106 исходя из предположения, что ссылки на новые вершины графа б106 устанавливают аутсайдеры. Такие сценарии

связаны, например, с ситуациями, когда лидеров трудно убедить в необходимости установления ссылок на новые вершины или когда решение вопроса об установлении ссылок от лидеров требует слишком больших затрат. Естественно предполагать, что с аутсайдерами рейтинга решить вопрос об установлении ссылок на новые вершины может оказаться проще и / или дешевле.

Как и ранее, будем присоединять п > 1 вершин и1,...,ип , образующих ориентированный граф Кп, в котором каждая вершина соединена ориентированной дугой с каждой другой вершиной. Обозначим через б106+п граф, вершинами которого являются У1,...,У106 вместе с и1,...,ип , а множество дуг состоит из дуг графа б106 и дуг графа Кп .

Проведем ранжирование вершин графа б106+п методом PageRank. Это ранжирование индуцирует ранжирование вершин на его подграфе б106. Перенумеруем вершины подграфа б106 в соответствии с этим ранжированием в порядке невозрастания рангов: У1,...,У106, т. е. вершина У1 имеет наибольший ранг (является лидером), а вершина У106 - наименьший (является аутсайдером). Пусть £ - целый параметр, принимающий значения от 0 до 106, и пусть граф б106+п]£ получен из графа С106+п добавлением дуг из £ вершин ^06_{£_1:1,..., У106 в каждую из вершин и1,...,ип. В частности, [С106+п]0 совпадает с С106+п. Через [С1*06+п]£ обозначим граф, полученный из [б106+п]£ добавлением дуг из вершин и1,...,ип в каждую из вершин

V1,..., У106. В частности, граф [б1*06+п ]0 совпадает с графом б1*06+п £ .

Сценарии 9-16. Рассмотрим сценарии 9-16, которые отличаются от описанных выше сценариев 1-8 лишь тем, что дуги в новые вершины проводятся не из к лидеров, а из £ аутсайдеров. Следовательно, эти сценарии моделируются не графами [б106+п ] и б106+п ] , а графами [б106+п ]£ и [б1*06+п ]£. Результаты вычислений рангов вершин этих графов приведены в табл. 2, где ж1 - ранг лидера подграфа б106, а ж, - ранг новых вершин и1,...,ип в графах

[б 106+п ]£ и [б106+п ]£ .

Таблица 2

Сценарии соглашений с аутсайдерами

№ Граф ж1 ж,

9 [б107 ]£ £ = 0 0,079367825 0,002341948

£ = 8 0,077964999 0,018282575 ж, вошел в Т0Р10 рангов

£= 32 0,069065081 0,069436005 и1 стала лидером

£ = 106 0,052438192 0,179566009

10 [б107 ]£ £= 0 0,079369311 0,002323365

£= 8 0,077976340 0,018139774 ж, вошел в Т0Р10 рангов

£= 32 0,068832481 0,072569971 и1 стала лидером

£ = 106 0,052512834 0,178390171

Окончание табл. 2

№ Граф л1 л,

11 [^108 1 1 = 0 0,077139781 0,015174368

1 = 1 0,076521508 0,017727548 л, вошел в Т0Р10 рангов

1 = 10 0,068414878 0,068819123 и1 и и2 стали лидерами

1 = 106 0,018439751 0,332701182

12 [^108 1 1 = 0 0,079185308 0,002318151

1 = 15 0,075870437 0,018248326 л, вошел в Т0Р10 рангов

II 4 0,060898092 0,061400769 и1 и и2 стали лидерами

1 = 106 0,042524987 0,114182289

13 [^111 ], 1 = 0 0,073780996 0,014513776

1 = 1 0,072865177 0,016020083 л, вошел в Т0Р10 рангов

1 = 18 0,054662124 0,055686559 и1,..., и5 стали лидерами

1 = 106 0,010322062 0,149987794

14 [^11 ], 1 = 0 0,078638226 0,00230263

1 = 26 0,064710110 0,015532979 л, вошел в Т0Р10 рангов

1 = 68 0,043012516 0,043275725 и1,..., и5 стали лидерами

1 = 106 0,028538459 0,061726068

15 [^131 ], 1 = 0 0,057182244 0,011248646

1 = 2 0,055678455 0,011830183 л, вошел в Т0Р10 рангов

1 = 40 0,024277944 0,024334259 и1,..., и25 стали лидерами

1 = 106 0,003111032 0,034032701

16 [^ ], 1 = 0 0,075171288 0,002203713

1 = 62 0,033145778 0,011273166 л, вошел в Т0Р10 рангов

1 = 91 0,016934049 0,016938960 и1,..., и25 стали лидерами

1 = 106 0,011272822 0,018377486

Выводы

В работе рассмотрены сценарии присоединения новых вершин к веб-графу научных организаций Сибирского отделения Российской академии наук. Сценарии подразумевали как присоединение одной вершины, так и присоединение коалиции вершин, действующих согласованно. Первая группа сценариев была связана с установлением ссылок на новые вершины от лидеров исходного графа, а вторая - с установлением ссылок от аутсайдеров исходного графа. В результате построения моделей для рассматриваемых сценариев и ранжирования вершин графов методом PageRank установлено, что сценарий согласованного действия двух вершин при соглашениях с аутсайдерами является оптимальным: новые вершины становятся лидерами графа после установления на них всего лишь десяти ссылок от аутсайдеров исходного графа.

Список литературы

1. Шокин Ю. И., Клименко О. А., Петров И. С. Анализ связей между институтами Сибирского отделения РАН // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2011. Т. 9, вып. 4. С. 12-17.

2. Шокин Ю. И., Веснин А. Ю., Добрынин А. А., Клименко О. А., Рычкова Е. В., Петров И. С. Исследование научного веб-пространства Сибирского отделения Российской академии наук // Журнал вычислительных технологий. 2012. Т. 17, №. 6. С. 85-98.

3. Brin S., Page L. The Anatomy of a Large-Scale Hypertextual Web Search Engine // Comput. Netw. ISDN Syst. 1998. Vol. 30. No. 1-7. P. 107-117.

4. Ding Y. Topic-Based PageRank on Author Co-citation Networks // Journal of the American Society for Information Science and Technology. 2011. Vol. 62 (3). P. 449-466.

5. Pandurangan G., Raghavan P., Upfal E. Using PageRank to Characterize Web Structure // Internet Mathematics. 2006. Vol. 3. No. 1. P. 1-20.

6. Константинова Е. В., Савин М. Ю., Клименко О. А. Анализ научного веб-пространства СО РАН методом PageRank // Распределенные информационные и вычислительные ресурсы: Материалы XIV Рос. конф. с участием иностр. ученых. Новосибирск, 2012. URL: http:// conf.nsc.ru/dicr2012/ru/reportview/141956

7. Константинова Е. В., Савин М. Ю., Клименко О. А. Анализ динамики развития Веб-пространства Сибирского отделения РАН методом PageRank // Информационные и математические технологии в науке и управлении // Информационные и математические технологии в науке и управлении: Тр. XVIII Байкальской Всерос. конф. Иркутск, 2013. Т. 3. С.142-148.

Материал поступил в редколлегию 07.10.2013

A. Yu. Vesnin, E. V. Konstantinova, M. Yu. Savin ON SCENARIOS OF JOINING NEW SITES TO THE SB RAS WEB-SPACE

We consider transformations of the Web-graph of the Siberian Branch of Russian Academy of Sciences (SB RAS). The vertices in this graph correspond to the web-pages of scientific institutes, and there is a directed edge between two vertices if one of the web-pages is linking to another web-page. Different scenarios for joining new vertices to this Webgraph are considered and changes in ranging of vertices by PageRank are investigated. Structural parameters of graphs making a new vertex to be the leader are shown.

Keywords: Web-graph, Web-Space, PageRank, vertex rank, site.

i Надоели баннеры? Вы всегда можете отключить рекламу.