Научная статья на тему 'КОЛЛЕКТИВНОЕ АВТОРСТВО НАУЧНЫХ ПУБЛИКАЦИЙ'

КОЛЛЕКТИВНОЕ АВТОРСТВО НАУЧНЫХ ПУБЛИКАЦИЙ Текст научной статьи по специальности «Математика»

CC BY
84
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
библиометрия / научная публикация

Аннотация научной статьи по математике, автор научной работы — Сергей Всеволодович Бредихин, Наталья Григорьевна Щербакова

Предметом изучения является сеть соавторства, которая может быть построена на основе научных публикаций, размещенных в библиографической базе данных (БД). Обсуждаются полный и частичный методы определения вкладов авторов в совместную научную работу.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Сергей Всеволодович Бредихин, Наталья Григорьевна Щербакова

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «КОЛЛЕКТИВНОЕ АВТОРСТВО НАУЧНЫХ ПУБЛИКАЦИЙ»

6

"Проблемы оптимизации сложных систем - 2020"

КОЛЛЕКТИВНОЕ АВТОРСТВО НАУЧНЫХ ПУБЛИКАЦИИ

С. В. Бредихин, Н. Г. Щербакова

Институт вычислительной математики и математической геофизики СО РАН

УДК 519.177

Б01: 10.24411/9999-018А-2020-10009

Предметом изучения является сеть соавторства, которая может быть построена на основе научных публикаций, размещенных в библиографической базе данных (БД). Обсуждаются полный и частичный методы определения вкладов авторов в совместную научную работу. Ключевые слова: библиометрия, научная публикация.

Введение

Соавторство является хорошо документированной формой научного сотрудничества. Если более одного автора разделяют ответственность за научную публикацию (НП), содержащую результаты исследований, то предполагается, что эти ученые (соавторы) в процессе исследований должны были сотрудничать на протяжении некоторого времени, общая ответственность за публикацию статьи в известном журнале вряд ли возможна иначе. Соавторы, по крайней мере, знают друг друга, и это реалистичное предположение делает анализ сетей соавторства целесообразным (случаи включения в соавторы произвольных лиц не отрицаются, но и не рассматриваются). В докладе рассматривается сеть соавторства, узлами которой являются авторы НП, а в качестве ребер выступают связи между парами авторов, являющихся соавторами, по крайней мере одной НП. Содержание доклада опирается на работы [1,2].

1. Постановка задачи

Пусть Р - множество НП, проиндексированных в БД; \Р\ =/; I] = п - множество авторов этих НП. Сетью публикаций (авторства) №иЪ = (V, Р, Е) называется двудольная сеть, такая что е = (/,/) Е /',', если автор / е V является автором/соавтором НП / е 1\ Матрица смежности А = (а,,) (матрица авторства) соответствующего графа является (////) матрицей, строки соответствуют авторам, столбцы - НП:

_ Г1, если ученый I является автором НП ] , ч ( 0 в противном случае.

Обозначим щ - число авторов публикации к, т. е.

пк =Т£=1аш. (2)

Будем считать, что любая упоминаемая далее НП имеет как минимум двух авторов, т. е. пк> 1 для каждой НП к.

Для авторов /, / £ ^"определим отношение соавторства^3:

I Яса] = (3 р Е Р), I является одним из авторов р и ] является одним из авторов р.

Сетью соавторства будем называть взвешенную неориентированную сеть = (1\ Е, м>), в которой V- множество авторов, Е с у / у множество взвешенных ребер, е = (/, /) ЕЕ, если выполняется / В простейшем случае \\'(е = (/, у)) = 1 независимо от того, насколько часто эти авторы являются соавторами и какой вклад внес каждый, т. е. сеть можно считать невзве-шенной. Тогда граф, соответствующий невзвешенной сети, представляется (0, 1)-матрицей смежности и= (//,,):

Работа выполнена в рамках бюджетного проекта ИВМиМГ СО РАН № 0315-2019-0006.

С. В. Бредихин, Н. Г. Щербакова 7

( 1, если Шса],

и„ = 1 п (4)

1 (. 0 в противном случае.

Матрицу U = (м,) можно получить из матрицы Л1 = ЛЛТ заменой всех ненулевых элементов

на единицу.

Примером использования невзвешенной сети является вычисление "числа Эрдёша", определяющего "дистанцию сотрудничества". Первоначально это - расстояние по цепочке соавторов от какого-либо ученого, публикующего статьи в области математики, до венгерского математика П. Эрдёша, автора как минимум 1525 статей. Непосредственным соавторам Эрдёша, их 511, присваивается число Эрдёша, равное единице. Этот принцип можно распространить на любую область науки. Исследование невзвешенных сетей показало, что типичное среднее расстояние между соавторами сети равно шести, что соответствует среднему расстоянию в сети социальных знакомств и характерно для сетей "малого мира".

Однако невзвешенная сеть отражает только наличие сотрудничества, но не его степень. В контексте конструирования взвешенной сети соавторства необходимо соотнести совместные публикации с индивидуальными авторами. Здесь мы рассматриваем подходы к вычислению весов ребер в сети соавторства.

2. Измерение вкладов авторов

Обсудим полный и частичный методы определения вкладов авторов в НП, которые обозначим Т-метод и F-метод соответственно. При использовании Т-метода предполагается, что вес НП, выполненной в соавторстве, равен сумме вкладов всех соавторов из расчета по единице для каждого соавтора, т. е. вес НП равен числу соавторов. В свою очередь, при использовании F-метода предполагается, что вес выполненной в соавторстве НП равен сумме дробей 1/п, где п - число соавторов. Таким образом, при расчете веса научной публикации F-методом все НП имеют одинаковые веса, равные единице.

Рассмотрим применение Т-метода для расчета значения параметра "вес ребра" в сети соавторства. Матрицу соавторства обозначим и = (и,). Это симметричная матрица размерности п*п, элемент и, которой равен числу соавторских связей между учеными / и/, т. е. числу НП, авторами которых являются / и/

Щ] = Т,к = 1 а1к а]к. (5)

В матричной нотации:

и = ЛЛТ. (6)

Таким образом, матрицу и можно получить путем умножения матрицы авторства А на транспонированную матрицу. Диагональный элемент Мц матрицы и равен числу НП, в которых участвовал автор /. Ввиду того, что единственный автор НП не считается своим соавтором, диагональные элементы матрицы и устанавливаются равными нулю.

При использовании Т-метода можно применять нормирование значения щ, например согласно схеме Солтона, тогда вес ребра (/, /) равен

Жц =

(7)

11 71р;11р;1'

где Р/, Р, - множество публикаций, авторами которых являются /,/ соответственно.

Перейдем к F-методу, предложенному в работе [1]. Матрицу соавторства обозначим и* = (и^-). Значение и, указывающее на соавторство между учеными / и/, определяется так:

а-гк^к

к=1Пк - 1"

Ч = > Г^Г" (8)

8 "Проблемы оптимизации сложных систем - 2020 "

В знаменателе единица вычитается из щ потому, что автор не является своим соавтором. В матричной нотации:

и* = Л йа§(ЛТ1 - 1)-1ЛТ, (9)

где - диагональная матрица с элементами вектора V, размещенными на главной диаго-

нали; 1 - вектор-столбец длины п, все элементы которого равны 1. Элементы на главной диа-

*

гонали матрицы соавторства и устанавливаются равными нулю.

Заметим, что при определении частичного метода вид формулы (8) может меняться, так, в работе [3] приведено альтернативное определение веса:

(10)

к=1 п2к

Существуют другие определения сети соавторства, основанные на представлении сети в виде орграфа. Так, в работе [4] орграф определяется следующим образом. Предполагается, что первый в списке авторов является лидирующим. Если авторы / и/ являются соавторами в точности н публикаций, причем / всегда первый в списке авторов, то в сети строится дуга, ведущая из / в/ В работе [5] в случае соавторства / и/ в графе появляются две разнонаправленные дуги. Способы определения весов дуг описаны в работах [4, 5]. Представление связей ориентированными дугами позволяет применить к узлам сети меры центральности, свойственные орграфам.

Еще одним подходом, представленным в работе [6], является моделирование сети сотрудничества гиперграфом. На его основе определяется мера "поддержки", позволяющая установить, насколько соавторство двух исследователей важно для каждого из них, и ранжировать авторов согласно этой мере.

3. Пример

Приведем пример вычисления весов элементов сети с помощью Т- и F-методов [2]. На рис. 1 представлена сеть ^риЪ, образованная тремя НП (обозначены р1, р2, р3) и четырьмя их авторами (обозначены г1, г2, г3, г4). Табл. 1 содержит матрицу авторства сети №иЪ. На рис. 2, 3 представлены сети соавторства, веса ребер подсчитаны согласно Т- и F-методам соответственно. Матрицы соавторства для Т- и F-методов представлены в табл. 2, 3.

Рис. 1. Сеть N

1иЪ

Рис. 2. Сеть №а, Т-метод

Рис. 3. Сеть №а, F-метод

Таблица 1: Матрица авторства

Таблица 2: Матрица соавторства, Т-метод

Автор\ НП Р1 Р2 Р3 Сумма Автор Г1 Г2 Г3 Г4 Сумма

Г1 1 1 0 2 Г1 1 2 0 3

Г 2 1 0 1 2 Г2 1 1 1 3

Г3 1 1 0 2 Г3 2 1 0 3

Г4 0 0 1 1 Г4 0 1 0 1

Сумма: 3 2 2 Сумма: 3 3 3 1

С. В. Бредихин, Н. Г. Щербакова 9

Таблица 3: Матрица соавторства, F-метод

Автор r1 r2 r3 r4 Сумма:

r1 0,5 1,5 0,0 2

r2 0,5 0,5 1,0 2

r3 1,5 0,5 0,0 2

r4 0,0 1,0 0,0 1

Сумма: 2,0 2,0 2,0 1,0

Заметим, что общий вес ребер, связывающих автора с соавторами и рассчитанных по F-методу, равен числу НП автора, написанных в соавторстве.

4. Заключение

Разница между T- и F-методами подсчета весов ребер может оказаться несущественной при исследовании сети соавторства небольшого размера, в которой шаблоны соавторства сходны. Однако в любом случае можно предположить, что авторы статьи с большим числом соавторов менее тесно сотрудничают друг с другом, чем в случае их небольшого числа. С другой стороны, можно предположить тесное сотрудничество между авторами, подготовившими совместно достаточное число публикаций. Оба этих фактора учитываются при определении F-метода. Для больших объемов данных используемые подходы могут представить различные картины сотрудничества, в частности, зависимость от метода определения весов может проявиться при вычислении мер центральности авторов.

Список литературы

1. Newman, M.E.J. Scientific collaboration networks. II. Shortest paths, weighted networks, and centrality // Physical Review E. V. 64, 016132.

2. Perianes-Rodriguez A., Waltman L., van Eck J. Constructing bibliometric networks: A comparison between full and fractional counting // J. of Informetrics. 2016. V. 10, iss. 4. P. 1178-1195.

3. Batagelj V., Cerinsek M. On bibliographic networks // Scientometrics. 2013. V. 96, iss. 3. P. 845-864.

4. Yoshikane F., Nozawa T., Tsuji K. Comparative analysis of co-authorship networks considering authors' roles in collaboration: Differences between the theoretical and application areas // Scien-tometrics. 2006. V. 68, iss. 3. P. 643-655.

5. Liu X., Bollen J., Nelson M.L., Van de Sompel H. Co-authorship networks in the digital library research community // Inform. Proc. and Manag. 2005. V. 41, iss. 6. P. 1462-1480.

6. Han Y., Zhou B., Pei J., Jia Y. Understanding importance of collaborations in coauthorship networks: A supportiveness analysis approach // Proc. of the 2009 SIAM Intern. Conference on Data Mining, Sparks, Nevada (USA), April 30 - May 2, 2009. P. 1112-1123.

Сергей Всеволодович Бредихин - канд. техн. наук, ведущ. науч. сотр. Института вычислительной математики и математической геофизики СО РАН;

630090, Новосибирск; Email: Bredikhin@sscc.ru;

Наталья Григорьевна Щербакова - ст. науч. сотр. Института вычислительной математики и математической геофизики СО РАН;

630090, Новосибирск; Email: Scherbakova@sscc.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.