Научная статья на тему 'ВЛИЯНИЕ КОЛЛАБОРАЦИЙ НА ХАРАКТЕРИСТИКИ ГРАФА СОАВТОРСТВА В ОБЛАСТИ ФИЗИКИ В РОССИИ'

ВЛИЯНИЕ КОЛЛАБОРАЦИЙ НА ХАРАКТЕРИСТИКИ ГРАФА СОАВТОРСТВА В ОБЛАСТИ ФИЗИКИ В РОССИИ Текст научной статьи по специальности «Математика»

CC BY
31
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГРАФ СОАВТОРСТВА / ФИЗИЧЕСКИЕ НАУКИ / ТОПОЛОГИЯ / РАСПРЕДЕЛЕНИЕ СТЕПЕНЕЙ ВЕРШИН

Аннотация научной статьи по математике, автор научной работы — Васильева Е.Е., Иванов О.В., Коваленко А.М., Колобов А.В., Королева В.В.

В представленной работе рассматриваются топологические свойства графа соавторства применительно к исследованиям по физическим наукам в России за 2012-2018 годы. Показано, что ключевые глобальные свойства графа соавторства формируются публикациями с относительно небольшим количеством авторов. На основе анализа характеристик распределений степеней и взвешенных степеней вершин показано, что взвешенный граф с весами ребер, равными фракционному баллу, наиболее точно описывает основные особенности взаимодействия исследователей в данной области.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Васильева Е.Е., Иванов О.В., Коваленко А.М., Колобов А.В., Королева В.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ВЛИЯНИЕ КОЛЛАБОРАЦИЙ НА ХАРАКТЕРИСТИКИ ГРАФА СОАВТОРСТВА В ОБЛАСТИ ФИЗИКИ В РОССИИ»

УДК 501

ВЛИЯНИЕ КОЛЛАБОРАЦИЙ НА ХАРАКТЕРИСТИКИ ГРАФА СОАВТОРСТВА В ОБЛАСТИ ФИЗИКИ В РОССИИ

Е. Е. Васильева1, О. В. Иванов1, А. М. Коваленко1, А. В. Колобов1, В. В. Королева1, А. В. Леонидов1'2

В представленной работе рассматриваются топологические свойства графа соавторства применительно к исследованиям по физическим наукам в России за 2012 — 2018 годы. Показано, что ключевые глобальные свойства графа соавторства формируются публикациями с относительно небольшим количеством авторов. На основе анализа характеристик распределений степеней и взвешенных степеней вершин показано, что взвешенный граф с весами ребер, равными фракционному баллу, наиболее точно описывает основные особенности взаимодействия исследователей в данной области.

Ключевые слова: граф соавторства, физические науки, топология, распределение степеней вершин.

В текущей работе рассматриваются топологические свойства графа соавторства применительно к исследованиям по физическим наукам в России за 2012-2018 годы, построенного на основе информации о публикационной активности российских исследователей из базы данных WebOfScience. Глобальные характеристики данного графа изучены в работе [1], в настоящей работе более подробно изучаются ключевые локальные характеристики данного графа, а также оценивается роль коллаборационных статей в формировании глобальных свойств графа. Подробный обзор области, связанной с исследованием процесса генерации знаний посредством анализа сложных сетей, представлен в работе [2]. Для описания этого процесса используются сложные сети разного рода. Так, например, в работе [3] изучаются сети цитирования авторов, в работе [4] двудольные графы соавторства, а в работе [5] сеть цитирования между журналами. В настоящей работе рассматривается сеть, узлами которой являются авторы статей, а

1 ФИАН, 119991 Россия, Москва, Ленинский пр-т, 53; e-mail: leonidovav@lebedev.ru.

2 МФТИ, 141701 Россия, Московская обл., Долгопрудный, Институтский пер., 9.

ребра между данными узлами проводятся в том случае, если авторы написали хотя бы одну статью в соавторстве. Отличие работы [1] и данной работы от исследований, представленных в литературе, состоит, во-первых, в том, что впервые изучается российская сеть соавторства, построенная на данных о публикациях ШеЬОГБаепсе, а во-вторых, в том, что предложен принципиально новый способ определения весов ребер в данном графе.

Сетью соавторства называется граф, вершинами которого являются индивидуальные исследователи1, а ребра между вершинами возникают при наличии хотя бы одной статьи, написанной данными исследователями в соавторстве за некоторый рассматриваемый период времени (£), например, год. Интенсивность и/или качество взаимодействия авторов могут быть учтены посредством добавления весов на ребра графа

Методика модификаций такого рода описана ниже.

Далее будут использованы следующие обозначения:

1. £ - год, за который рассматривается граф (в данных £ = 2012,... , 2018);

2. Яг - количество вершин графа , т. е. количество исследователей, являющихся соавторами хотя бы одной статьи за год

3. ^ = ,..., } - множество вершин графа

4. - невзвешенный граф соавторства, ребро в котором демонстрирует наличие хотя бы одной совместной публикации у исследователей в году

5. = Е), где Ег - множество ребер графа

6. матрица Ог = {д\*}, г,] = 1,... ,Яг, - матрица смежности графа соавторства

в ней = 1, если исследователи И* и имели хотя бы одну общую публикацию в году и = 0, если это не так;

7. N - взешенный граф соавторства, в котором вес ребра равен количеству совместных статей соединяемых им узлов в году

8. матрица N = {п**}, г,] = 1,..., Яг, - матрица весов графа М, для которой п** равно количеству совместных публикаций в году £ у исследователей Ы* и И*;

9. - взешенный граф соавторства, в котором вес ребра равен сумме фракционных баллов совместных статей в году

10. матрица Wt = {и»**}, г,] = 1,..., Яг, - матрица весов графа для которой и**

ХВ граф входят только те исследователи, у которых были работы в соавторстве с другими исследователями. Если исследователь публиковал статьи только в одиночку, то он не появится в графе и эти статьи никак не будут учтены.

расчитывается по следующей формуле:

t _ ST^ 2Qk

_ / y

Vk

k=i

где Qk - это вес статьи к (зависящий от качества журнала, в котором опубликована данная статья, см. табл. 1), а ^ - это количество авторов у статьи к.

Таблица 1

Таблица весов статей в формуле (1)

Q1 Q2 Q3 Q4 Q S R V B

19.7 7.3 2.7 1 1 1 0.75 0.5 1

В таблице использованы следующие обозначения для изданий: Q1—Q4 - индексируемые Web of Science (WoS), Q - без квартиля из Web of Science Core Collection (WoSCC), S - индексируемые в Scopus, но не в WoS и WoSCC, R - индексируемые в RSCI WoS, но не в WoSCC, V - входящие в список ВАК, B - зарегистрированные в Российской книжной палате.

Ключевой локальной характеристикой графа является распределение степеней вершин. Степень dt узла i в графе периода t определяется следующим соотношением

d _ £ 4. (2)

j=i

В ходе анализа было установлено, что распределение степеней вершин практически не меняется во времени. А именно, в каждом периоде это распределение характеризуется наличием тяжелого хвоста, который хорошо описывается степенным распределением. Ввиду относительной статичности распределения, оценка параметра наклона степенного закона, приближающего хвост эмпирического распределения, производилась на объединенной за весь период анализа (с 2012 по 2018 г.г.) выборке. На рис. 1 изображено дополнение к кумулятивной функции распределения2 (CCDF) степеней вершин.

2Дополнение кумулятивной функции распределения (Complimentary cumulative distribution function, CCDF) определяется следующим соотношением CCDF(x) = 1 — F(x), где F(x) - это кумулятивная функция распределения. Если хвосты распределения степенные, то CCDF(x) ~ xa, x > xm, а < 0, где xm - параметр распределения. В связи с этим, в log-log масштабе lnCCDF(x) = intercept + а ln x для x > xm. Таким образом, а может быть оценено как параметр наклона линейной регрессии.

1е+00

Рч

@ 1е-02

О

1е-04

у = 24.2- 10.4 х Я2 = 0.97 •

1 10 100 Степень вершины

Рис. 1: Дополнение к кумулятивной функции распределения степеней вершин. Серая линия демонстрирует приближение степенным законом, параметры которого приведены на рисунке.

Для взвешенных графов N и можно также определить взвешенные степени узлов, и в^Р'1, г = 1,... , соответственно, следующим образом:

Яг

М

,

3=1

Яг

^ Ч-.

(3)

(4)

3 = 1

Аналогично распределению степеней вершин, распределения взвешенных степеней и относительно стабильны во времени, что позволяет оценивать параметры данных распределений по объединенной за период с 2012 по 2018 г.г. выборке наблюдений. ССБЕ данных распределений приведены на рис. 2.

Анализ диаграмм, представленных на рис. 1 и 2, показывает, что распределения степеней вершин и взвешенных степеней в графах N характеризуются двумя близкими к линейным участками с существенно разным наклоном. При этом коэффициенты наклона степенного распределения для хвостов распределений оказываются достаточно большими по абсолютной величине (-10.4 и -18.3), что нехарактерно для большинства социальных сетей. Однако в графе хвост распределения описывается степенным законом с существенно меньшим по абсолютной величине угловым коэффициентом, равным -3.8.

1 10 100 10 100 1000 10000

Взвешенная степень вершины Взвешенная степень вершины

(фракционный балл) (количество статей)

Рис. 2: Дополнения к кумулятивным функциям распределения взвешенных степеней вершин графов Ь = 2012,..., 2018 (слева); А, Ь = 2012,..., 2018 (справа). Серые линии демонстрируют приближение степенным законом, параметры которого приведены на рисунках.

Описанная особенность распределения степеней и взвешенных степеней в графе А является следствием наличия в области физики больших коллабораций исследователей. Статьи с большим количеством авторов вносят существенный вклад в распределения степеней и взвешенных степеней в графе N4, однако имеют малый вклад в веса ребер графа

Т а б л и ц а 2

Соотношение между глобальными характеристиками графов & и &г(20), Ь = 2012,..., 2018

Год Яг Я« (20) Я« \LCCt | | ЬОСь (20) | |ЬСС«|

2012 18638 90% 9208 72%

2013 19093 92% 9294 70%

2014 21698 93% 11959 80%

2015 27440 94% 16733 87%

2016 31971 94% 20214 88%

2017 36097 94% 20975 88%

2018 34364 95% 20353 87%

Отметим, что коллаборационные публикации не вносят значительного изменения в глобальные характеристики графов. А именно, пусть Gt(20), t = 2012,..., 2018 -невзвешенный граф соавторства, построенный на основе информации о публикациях с не более чем 20 авторами, Rt(20) - количество вершин в графе Gt(20). Обозначим также LCCt множество вершин, входящих в наибольшую связную компоненту графа Gt, и LCCt(20) - множество вершин, входящих в наибольшую связную компоненту графа Gt(20). В табл. 2 приведено соотношение между количеством вершин и размерами наибольших компонент графов Gt и Gt(20). Из данной таблицы следует, что для каждого из рассматриваемых периодов почти все вершины графа Gt (более 90%) присутствуют в графе Gt(20). И, кроме того, наибольшая компонента графа Gt(20) практически совпадает с наибольшей компонентой графа Gt. Отсюда можно сделать вывод, что "каркас" графа соавторства формируется статьями с относительно небольшим количеством авторов. Иными словами, вероятно, большие коллаборации преимущественно формируются на основе уже существующих связей между научными сотрудниками, возникшими при работе в малых группах. Это же утверждение подтверждают результаты оценки параметров хвостов распределений размеров малых компонент, приведенные в первой строке табл. 3. Из данных результатов следует, что распределение размеров малых компонент практически не меняется при добавлении/исключении статей с большим количеством авторов.

Таблица 3

Параметры, определяющие форму функций распределения характеристик в их хвостах. xm - минимальное значение, относимое к хвосту распределения, а - угловой коэффициент CCDF соответствующих величин на графике в log-log масштабе. Под размером малых компонент понимается количество вершин в каждой из связных компонент графа, кроме наибольшей компоненты соответствующего графа (LCCt или LCCt(20))

Грае b Gt Граф Ь Gt(20)

xm а xm а

Размер малых компонент 17 -2.8 13 -2.4

dj 500 -10.4 40 -5.5

(n),t 10000 -18.3 100 -6.0

s (f ),t 40 -3.8 50 -5.0

Сравнение оценок параметров распределений степеней ) и взвешенных степеней (в(п ),г, в/^) графа & ( Аг и Щ и графа £¿(20) ( Аг(20) и Щ(20)) показывает, что распределение $ и в(п)'г, действительно, крайне чувствительно к добавлению коллабора-ционных статей, тогда как на распределение в^ такие статьи существенного влияния не оказывают. Исходя из этого можно сделать вывод, что свойства графа с весами, равными фракционным баллам, более корректно характеризуют взаимодействие исследователей в области физики в России, чем его невзвешенный аналог и взвешенная модификация А*.

В заключение перечислим основные результаты, описанные в настоящей работе. При рассмотрении графа соавторства работ в области физики в России за 2012-2018 г.г. показано, что:

• глобальные свойства графа соавторства, такие как количество вершин и компонентная структура, формируются публикациями с относительно небольшим количеством авторов;

• хвосты распределений степеней вершин графа соавторства и взвешенных степеней двух его взвешенных модификаций могут быть приближены степенным законом;

• распределение степеней в графе соавторства и взвешенных степеней вершин в его модификации с весами, равными количеству совместных статей у авторов, значительно меняется при исключении коллаборационных статей;

• распределение взвешенных степеней вершин в графе с весами, равными фракционному баллу, устойчиво к добавлению/исключению коллаборационных статей и, тем самым, данный граф наиболее точно описывает основные особенности взаимодействия исследователей.

Статья опубликована в рамках проекта "Посткризисное мироустройство: вызовы и технологии, конкуренция и сотрудничество" по гранту Министерства науки и высшего образования РФ на проведение крупных научных проектов по приоритетным направлениям научно-технологического развития (соглашение № 075-15-2020-783).

ЛИТЕРАТУРА

[1] О. В. Иванов, А. М. Коваленко, А. В. Колобов и др., Краткие сообщения по физике ФИАН 47(8), 9 (2020). Б01: 10.3103/81068335620080060.

[2] A. Zeng, Z. Shen, J. Zhou, et al., Physics Reports, No. 714, 1 (2017). DOI: 10.1016/j.physrep.2017.10.001.

[3] S. Lehmann, B. Lautrup, A. D. Jackson, Phys. Rev. E 68(2), 026113 (2003). DOI: 10.1103/PhysRevE.68.026113.

[4] Michel L. Goldstein, Steven A. Morris, Gary G. Yen, Phys. Rev. E 71(2), 026108 (2005). DOI: 10.1103/PhysRevE.71.026108.

[5] Vicente P. Guerrero-Bote, Félix Moya-Anegon, Journal of Informetrics 6(4), 674 (2012). DOI: 10.1016/j.joi.2012.07.001.

Поступила в редакцию 27 октября 2020 г.

После доработки 30 октября 2020 г. Принята к публикации 30 октября 2020 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.