Временная динамика индекса Хирша

Тарасевич Юрий Юрьевич; Шиняева Таисия Сергеевна

УДК 519.8

DOI: 10.14529/ mmp 160103

временная динамика индекса хирша

Ю.Ю. Тарасевич, Т. С. Шиняева

Проведен анализ информации из базы данных Scopus о временной зависимости индекса Хирша (^-индекса) и его модификации hs(2015)-индекса группы продолжительно и стабильно работающих ученых. Обнаружено, что характер изменения со временем hs (2015)-индекса близок к сигмоидальному. Предложена модель, описывающая динамику индекса Хирша. Модель учитывает: 1) изменение публикационной активности ученого - предполагается сигмоидальный рост числа публикаций на начальной стадии научной карьеры; 2) распределение статей по числу цитирований; 3) динамику цитирования каждой конкретной статьи (принято во внимание, что в типичном случае число цитирований сначала возрастает, а затем плавно убывает). Исследована динамика индекса Хирша в зависимости от средней продуктивности (числа публикуемых в течение года статей). Использованы два вида распределения числа статей по числу цитирований: распределение Лотки и геометрическое распределение. Оба модельных распределения приводят к качественно верной временной динамике индекса Хирша.

Ключевые слова: моделирование; индекс Хирша.

Введение

Индекс Хирша или h-индекс - количественная характеристика публикационной активности ученого [1]. h-индекс ученого равен N, если N его публикаций имеют по N и более цитирований, а остальные публикации имеют не более N цитирований. h-индекс и его различные модификации, например, учитывающие нескольких соавторов у публикации [2, 3] или время научной активности ученого [1], широко используются в наукометрии (см. обзор и сравнение многочисленных модификаций ^-индексов и родственных показателей [4]).

Индекс Хирша ученого меняется со временем. Хирш предположил, что h-индекс с годами растет приблизительно линейно [1]. Это предположение было подтверждено в рамках стохастической модели [5]. Однако, исследования наукометрических данных свидетельствуют, что линейный рост h-индекса - только одна из возможностей его временной динамики [6,7]. Линейный рост может замедляться вплоть до выхода h-индекса на постоянное значение; возможно и более сложное поведение [6]. В рамках концепции процесса производства информации было показано, что h = T1/а, где T - полное число источников (публикаций), а - показатель Лотки [8]. В [9,10]

h

распределения цитирований. В большинстве случаев модель продемонстрировала ли-

h

h звставляет зэ/~

думаться о двух возможных альтернативах.

• Универсальное поведение h h

• Динамика ^-индекса является универсальной. В случае конкретного ученого эта динамика может не проявляться из-за низкой публикационной активности или ее незначительной продолжительности или быть замаскирована разнообразными факторами (например, радикальное изменение области научных исследований) .

Целью Н дьС Т 051111,6 И работы является построение модели, которая позволила понять основные закономерности динамики ^-индекса. В разделе «Экспериментальные данные» мы представляем результаты обработки данных о динамике ^-индекса группы активно публикующихся ученых^ представленных в базе ДсШНЫХ Scopus. В разделе «Модель» описана математическая модель временной динамики ^-индекса.

1. Экспериментальные данные

Для <ВЬНШ1ИЗ<ВЬ ÚblJIdb использована база ДсШ н ых Scopus. Были проанализированы наукометрические данные 25 ученых. Среди них лауреаты Нобелевской премии по физике Ж. Алферов (2000). В. Гинзбург (2003), А. Гейм (2010). К. Новоселов (2010) и лауреат Филдсовской премии С. Смирнов (2010). Для анализа отбирались те уче-ные5 про которых было достоверно известно, что они активно и стабильно публикуют результаты своих исследований в течение продолжительного времени. Кривые зависимости ^-индекса от времени не демонстрируют общих закономерностей (рис. 1), что согласуется с проведенными ранее исследованиями [6,7].

1,00,90,80,70,61 0,5: 0,40,30,20,1 -0,0-

■ Koonin, 139 ■ Ramirez-Pastor, 20

■ Barabasi, 86 A Yuzyuk, 20

• Novoselov, 76 A Ginzburg, 16

■ Laison, 60 ★ Brutin, 14

• Doi, 51 ♦ Pauchard, 14

▲ ferov 45 4 Kabov, 14

* Witten, 47 ▼ Topolov, 14

т Ziff, 43 • Tarafdar, 13

< Zakharov, 36 ★ Smimov, 13

► Mandelbrot, 29 mold, 10

• Lebovka, 26 • Tarasevich, 9 ^ ^

★ Prosandeev, 22 A Dutta, 7 ► ► A A

A-i«**

-MV

►

—1- .his ¡'Í4 ▼ ^"-T W

tlA / Ш-

▼ 4 a A.tí.*

r1"

^"ГГ* * ★ ***

■ ▲ • ■

f»f» * ф

1975 1980 1985 1990

1995 year

2000 2005 2010 2015

Рис. 1. Зависимость величины нормированного ^-индекса от времени. После фамилии ученого через запятую указано значение его ^-индекса по состоянию на 30 апреля 2015 года

Литтть некоторые кривые имеют почти линейные участки, соответствующие гипотезе Хирттта [1]. в оольтпинстве случаев кривые вогнутые или выгнутые.

Кроме того, для каждого ученого была исследована динамика Л,5(Ь)-индекса. Н3(Ь)~ индекс - значение ^-индекса в году Ь, который определяется работами, опубликованными до года в включительно [12]. Например, Л,2000 ( 20 1 5) - значение ^-индекса данного автора в 2015 году, определенное на основании цитирований его работ, опубликованных до 2000 года включительно. Естественно, что Н^Ь) совпадает с обычным ^-индексом. В отличие от обычного ^-индекса, зависимость Н3 (Ь)-индекса для группы рассмотренных нами ученых близка к сигмоидальной. Зависимость величины к3-индекса от времени аппроксимировалась функцией

К(1)

' 'max exp ( ~КГ

1 + exp (—

At

В качестве примера см. рис. 2.

year

Рис. 2. Зависимость от времени Л^-индекса и общего числа публикаций и результаты аппроксимации исходных данных. В случае аппроксимации Л^-индексa R2 = 0.99797, в случае аппроксимации числа публикаций R2 = 0.99622. По данным проекта «Корпус экспертов по естественным наукам» (http://expertcorps.ru/) Е. Кунин имеет наибольший Л-индекс среди российских ученых

В единственном случае (А. Гейм) была обнаружена зависимость Л^-индекса от времени, резко отличающаяся от остальных наборов данных (рис. 3). Мы связываем такое поведение Л^-индекса с началом работ по тематике графена. Для сравнения на том же рисунке представлены данные по К. Новоселову соавтору А. Гейма, который к моменту начала «графенового бума» имел меньший период активной научной работы и меньшие значения наукометрических показателей.

Поскольку продолжительность активной работы ученых и максимальные значения Л^-индекса в выборке сильно отличались (Л^-индекс изменяется от 7 до 137), данные для последующего анализа были отмасттттабированы: для каждого набора данных Л^-индекс поделил и на Лтах, время - на At, кроме того, начало отсчета времени смещалось к значению t0. Данные представлены на рис. 4.

80- ■ Geim ■ ■ ■

70- • Novoselov ■ ■ . • • • ■ •

60- ■ •

50- ■ •

40- ■ •

3020- ■ " # era of graphene

100- ■ ■ ■ i ■ • ■ ■ • • f * * Г I I I I I I I I I I • • 1 i i i i I i i i i I

J -| т I I I I I I I I I I I I I I I I I I I I I I I I

1990 1995 2000 2005 2010 2015

year

Рис. 3. Зависимость от времени Л^-индексов Нобелевских лауреатов А. Гейма и К. Новоселова

Ramirez-Pastor h =19

max

Yuzyuk h =17

J max

Brutin h =14

max

Pauchard h = 14

max

Kabov h =14

max

Topolov/? = 14

~ max

Tarafdar/7 =13

max

Ginzburg /?mgx = 13 Smirnov/? =13

max

rnoldh =10

max

Tarasevich h =9

max

Dutta h =7

max

(t~t)At

Рис. 4. Зависимость величины нормированного Лз-индекса от безразмерного времени по состоянию на 7 февраля 2015 года

Естественно, чем меньше значение тем заметнее дискретность Если

для ученых с большими значениями Лтах графики гладкие, то для ученых с малыми значениями Лтах графики ступенчатые. Во всех рассмотренных случаях имеется временной участок с почти линейным ростом Лз-индекса. Снижением скорости роста Лз-индекса и его выход на постоянное значение отражает тот факт, что недавно опубликованные работы не оказывают влияния на величину Л-индекса. Начальные участки зависимостей Л^-индекса демонстрируют в некоторых случаях заметное от-

клонение от сигмоидальной кривой. Эффект может быть объяснен, во-первых, существенным влиянием дискретности при малых значениях hs, во-вторых, возможной неполнотой данных, поскольку относительно полная информация о цитированиях накоплена только после 1995 года (например, начало публикационной активности Ж. Алферова относится к 1973 году).

2. Модель

h

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

h

публикует в течение годя. Для активно работающего ученого эта величина не является постоянной: в начале научной карьеры ежегодное число публикаций растет, затем выходит на насыщение, в конце научной карьеры плавно (в случае постепенного отхода от дел) или резко (в случае смерти ученого) сокращается до нуля.

h

лу цитирований. Количество цитирований косвенно связано с импакт-фактором журналов, в которых публикует свои работы ученый. Для активно работающего ученого разумно ожидать, что средняя величина импакт-фактора журналов, в которых публикуется ученый, растет в течение научной карьеры ученого. Можно ожидать, что распределение статей ученого по цитированиям при t ^ ж зависит от среднего импакт-фактора журналов, в которых опубликованы статьи. Так, для статей по биологии, химии и биохимии была найдена линейная связь между числом ссылок на статью и импакт-фактором журнала, в котором она была опубликована; для статей по математике и физике эта связь почти линейная [13]. Таким образом, ученый, который публикует свои результаты в журналах с высоким импакт-фактором, будет иметь большую долю высоко цитируемых статей.

h

кретной статьи.

4. Количество цитирований статьи линейно зависит от числа соавторов и числа ссылок [13]. Поскольку ученые обычно отслеживают публикации известных им коллег, увеличение числа соавторов приводит к увеличению вероятности того, что публикация будет замечена и использована. Кроме того, обычно ученые отслеживают ссылки на некоторые важные для них публикации. Увеличение списка цитированных источников, таким образом, увеличивает вероятность того, что

h

В нашей модели мы постарались учесть первые три из перечисленных эффектов. Исследованию последнего эффекта посвящены, например, работы [14,15].

Для проведения моделирования необходимо знать, как меняется число цитирований конкретной статьи от времени. Число цитирований статьи в единицу времени меняется с годами и зависит от типа статьи [16]. В [16] предложена кривая, описывающая динамику числа ссылок на статью. Эта кривая имеет максимум, положение

и высота которого зависит от типа статьи (обычная исследовательская статья, письмо редактору, обзор). Типичные кривые для различных типов статей приведены на рис. 5. По форме кривая, описывающая динамику цитирований, близка к логнор-мальному распределению [17]

f (x) =

xa

exp

f (ln x — /i)2\

I ¿a-)

(i)

Заметим, что xc

является медианои и соответствует широко используемои в

наукометрии величине cited half-life. Для статей по физике эта величина приблизительно равна 7 годам, по химии и техническим наукам около 8 лет [18]. Поскольку

оо

f f (x) dx = 1, то f (x) следует умножать на полное число цитирований i-й публикации

за бесконечно большое время с"1^. В [11] использован для моделирования упрощенный закон изменения цитирований с плотностью распределения в виде разностороннего треугольника. Для описания динамики затухания цитирований статьи (стадия после максимума цитирования) предложена иная математическая формула [19], однако мы будем опираться на формулу (1). поскольку нас интересуют все стадии цитирования статьи.

годы

Рис. 5. Слева: типичные зависимости от времени числа цитирований различных типов научных публикаций [16]. Справа: типичная зависимость числа цитирований от времени (кривая) и ее приближенное представление (ломанная) [11]

Понятно, что конкретная статья цитируется лишь приближенно в соответствии с теоретической кривой. При моделировании для генерации числа цитирований статьи в момент времени Ь используем распределение Пуассона

Pk

k!

—А

(2)

с параметром А = c^xf (t) (рис. 6).

Для конкретной статьи cited half-life может сколь угодно сильно отличаться от среднего значения. Например, в течение почти 40 лет число ежегодных цитирований статьи (Scopus eid 2-s2.0-0001155449) продолжает расти, таким образом cited half-life

Динамика числа цитирований

t

Рис. 6. Число цитирований некоторой публикации c как функция времени, прошедшего с момента публикации: теоретическая кривая (1). моделирование с использованием распределения (2) и сравнение с реальной динамикой цитирования статьи по данным Scopus (eid 2-s2.0-0030732736)

для этой статьи заведомо превышает 40 лет, отличаясь от типичного значения в 6 или более раз (см. рис. 7); данные о цитированиях статьи (Scopus eid 2-s2.0-0030732736, рис. 6) также демонстрируют, что cited half-life существенно превосходит типичное значение.

Распределению публикаций по числу цитирований посвящены многочисленные работы. Обзор подходов, применяющихся при моделировании распределения публикаций по числу цитирований, с соответствующими ссылками можно найти в [20]. Экспериментальное установление реального закона распределения или проверка некой теоретической гипотезы невозможно, поскольку такая проверка предполагает наличие полных данных за весьма длительный (теоретически бесконечный) промежуток времени после публикации, когда цитирования статей полностью прекращаются. Однако, относительно полные данные накоплены только о цитированиях статей после 1995 года, т.е. за 20 последних лет, а научные работы нередко цитируются многие десятилетия (рис. 7).

Зачастую считается, что при t ^ ж распределение публикаций по числу цитирований соответствует модели Лотки [21]

= а-1 > (з)

где ф(х) - функция вероятности.

На основании данных Web of Science о цитированиях более 200000 статей по математике, физике, химии, биохимии и биологии было показано [13], что реальное распределение публикаций по числу цитирований хорошо аппроксимируется геомет-

70-,

60

50-

Я л п

ш 40

О

CL

о

5

30

20-

10

0--Г

Т■+ + ТТ..............................

1975 1980 1985 1990 1995 2000 2005 2010 2015

ГОД

Рис. 7. Число цитирований статьи по данным Scopus (eid s2.0-0001155449)

рическим распределением

1 / Е \к

Рк = ЕТПЁ+) ' (4)

где рк - вероятность того, что статья будет процитирована к раз, к - ожидаемое число цитирований статьи, Е - параметр. Для статей по физике, например, Е = 9, 72. Точность аппроксимации существенно улучшается, если использовать сумму двух геометрических распределений с разными параметрами. Следует иметь в виду, что проведенный анализ основан на данных о цитированиях за ограниченный промежуток времени, в пределе Ь ^ ж результаты могут быть иными. Кроме того, при рассмотрении распределения статей конкретного ученого по цитированиям можно ожидать, что

ЕЕ мало. Соответственно, у сильного ученого доля статей с малым числом цитирований меньше, зато имеются статьи с очень большим числом цитирований; у слабого ученого, напротив, доминируют статьи с нулевым или малым числом цитирований, высоко цитируемые статьи не встречаются. Тот факт, что данные по большому массиву статей хорошо аппроксимируются комбинацией двух геометрических распределений, может свидетельствовать о том, что в обрабатываемой совокупности представлены статьи, написанные авторами разного уровня.

Алгоритм

1. Задаем время активной деятельности ученого. В приведенных в дальнейшем результатах этот параметр всюду равен 50. Задаем среднее число статей (и), которые ученый публикует за год. Считаем, что публикационная активность с годами меняется предполагается сигмоидальньтй рост числа публикаций на начальной стадии научной карьеры. Принимая в качестве нулевого приближения.

что на протяжении всей своей научной деятельности ученый работает с одинаковой активностью, то есть в среднем публикует ежегодно одно и то же число статей, оцениваем полное число статей, опубликованных за все время научной деятельности, как N = {n)tmax.

2. Число статей n(t), опубликованных в год t, генерируем случайным образом по закону Пуассона с Л = {n). Таким образом, в среднем за год будут появляться {n) статей, но в конкретном году число статей может быть больше пли меньше.

3. В зависимости от выбранной модели распределения публикаций по числу цитирований с помощью распределения Лотки (3) или геометрического распределения (4) создаем последовательность N случайных чисел cf1ах - полное число цитирований г-й статьи за все время. Первые n(1) чисел из этой последовательности относятся к статьям, опубликованным в 1 год, следующие n(2) чисел относятся к статьям, опубликованным во второй год, и т.д.

4. С помощью формулы (1) получаем распределение ожидаемого числа цитирований г-й статьи по годам. Параметры логнормального распределения для каждой статьи меняются в зависимости от максимального ожидаемого числа ссылок на статью * Логично предположить, что чем больше ссылок на статью, тем дольше продолжаются цитирования, и тем больше время, когда цитирования достигают максимума. Мы положили, что моде M соответствует время a cited

half-life в полтора раза больше T\/2 = 1, 5M. Тогда, ß = ln Ti/2, а2 = ln ^ что обеспечивает близость ожидаемой динамики цитирований к наблюдаемой. Таким образом, для г-й статьи ожидается число цитирований в год t > ti7 где ti - год, в который была опубликована статья,

f.(t) =_СС_exp (- (ln(t - ti) - ßi)2 )

fi( )=(t - ti)aiV2n еХЧ 2а2 )'

5. Для года t генерируем случайное число ci (t) - число цитирований г-й статьи

t

Математическое ожидание числа цитирований г-й статьи в год t равно Л = fi(t). 3. Результаты моделирования

Моделирование проводилось для двух распределений публикаций по числу цитирований. Использовалось распределение Лотки (3) с различными показателями а, геометрическое распределение (4), а также сумма двух геометрических распределений, параметры которых были определены по методу наименьших квадратов для данных по физическим журналам, представленным в [13]. Динамика ^-индекса даже при одинаковых параметрах демонстрирует заметный разброс, поэтому представленные в настоящей работе результаты были получены путем усреднения серии из 10 экспериментов при каждом наборе параметров.

Результаты моделирования с использованием распределения Лотки для распределения статей по числу цитирований представлены на рис. 8. Уменьшение показателя в распределении Лотки приводит к увеличению максимального значения ^-индекса при любой продуктивности.

ч ►

1 article year 3 article year 6 article year 12 article year 24 article year

(Ъ)

Рис. 8. Результаты моделирования динамики ^-индекса при различном числе публикаций в год с использованием распределения статей по числу цитирований в соответствии с распределением Лотки, (а) а = 1.8, (Ь) а = 2.0. Каждая кривая получена путем усреднения результатов по 10 реализациям

Результаты моделирования с использованием геометрического распределения представлены на рис. 9.

X

о -о с

100

(а)

year

(Ъ)

110-, ▲ = 0.01

100 ★ = 0.05

90 • = 0.1

80 ▼ = 0.2

70

60

50

40

30

20

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10-

0

80 90 100

Рис. 9. Результаты моделирования динамики ^-индекса: а) при различной продуктивности ученого (среднем числе публикаций в год) с использованием распределения статей по числу цитирований в соответствии с данными [13]; Ь) при средней продуктивности ученого 6 публикаций в год с использованием распределения статей по числу цитирований в соответствии с геометрическим распределением при разных значениях параметра распределения, р = (1 + Е)_1. Каждая кривая получена путем усреднения результатов по 10 реализациям

Для обеих гипотез о характере распределения публикаций по числу цитирований кривые зависимости ^-индекса от времени качественно согласуются с данными о динамике изменения ^-индекса реальных ученых. Имеется согласие результатов моделирования с реальными данными и в случае ^-индекса (рис. 10).

(а) Уеаг (Ь) Уеаг

Рис. 10. Результаты моделирования изменения Л^-индекса при продуктивности 12 статей в год!,» Распределение статей по числу цитирований соответствует (а) распределению Лотки, а = 1, 8; (b) геометрическому распределению, p = 0,1

В нынешнем виде модель использует два упрощающих предположения. Отказ от этих предположений может обеспечить лучшее согласие результатов моделирования с реальными данными.

1. Предположение о том, что распределение статей по числу цитирований одинаково для всех ученых. Разумно предположить, что высокая продуктивность коррелирует с качеством публикаций. Вероятно, большое число публикаций типично для руководителей крупных лабораторий. Стать руководителем научной группы может ученый, имеющий вес в научном сообществе. Логично предположить, что у более продуктивного ученого по сравнению со средним ученым больше доля статей с большим числом цитирований и меньше доля статей с малым и нулевым числом цитирований.

2. Предположение о том, что качество публикаций ученого с годами не меняется. Можно ожидать, что с годами средний уровень публикаций растет.

Заключение

Нужно очень отчетливо осознавать, что наукометрические показатели в принципе не могут оценивать научный уровень получаемых ученым результатов. Наукометрические показатели характеризуют степень интеграции ученого в процесс обмена информацией внутри международного научного сообщества. Удостоенный Филдсов-ской премии Г. Перельман в базе дан н ых Scopus вообще не представлен.

Следует учитывать, что число цитирований и динамика изменения числа цитирований зависят от числа соавторов публикации, а также от их известности в научных кругах [22]. Интуитивно понятно, что шансов привлечь к себе внимание при прочих равных условиях больше у той статьи, среди соавторов которой имеется известный ученый.

Можно было бы ожидать, что, имея данные о динамике ^-индекса на среднем этапе научной карьеры ученого, можно прогнозировать динамику дальнейшего роста ^-индекса. Такой прогноз можно было бы рассматривать как надежный, поскольку

^-индекс является весьма инерционным показателем и зависит от всей предыдущей публикационной активности ученого [23].

^-индекс - интегральная величина, что одновременно является его достоинством и недостатком. Простота вычисления и интерпретации ^-индекса делают его удобной количественной характеристикой. Интегральный характер ^-индекса делает его непригодным для детального исследования публикационной активности ученого.

Индекс Хирттта не является в чистом виде индивидуальным показателем ученого, т.к. большинство работ в настоящее время публикуется в соавторстве, а количество цитирований определяется не только научным уровнем публикации, но и известностью в научных кругах авторов, количеством ученых, работающих по тематике публикации, а также рядом других факторов, которые вообще трудно учесть.

В наттти дни наука все более становится публичной деятельностью, и для нее ока-зьтваются справедливыми те же самые закономерности, что и для тттоу-бизнеса. Если оценивать по количеству упоминаний в СМИ оперных певцов и певцов других жанров; то первые ока^кутся в проигрыше 5 что отнюдь не свидетельствует о незначительности вклада оперного искусства в мировую культуру.

При использовании любого формального критерия для оценки научной деятельности следует проявлять максимальную осторожность. Даже внутри весьма компактной и авторитетной группы ученых действительных членов РАН имеется весьма большой (десятикратный) разброс наукометрических показателей (рис. 11).

rank

Рис. 11. Значения ^-индекса академиков РАН, имеющих не менее 100 цитирований работ, опубликованных за последние 7 лет. По данным проекта «Корпус экспертов по естественным наукам» (http://expertcorps.ru/)

Юрий Юрьевич Тарасевич, доктор физико-математических наук, профессор, заведующий лабораторией «Математическое моделирование и информационные технологии в науке и образовании:», Астраханский государственный университет ^г. Астрахань ? Российская Федерация), tarasevich@asu.edu.ru.

Таисия Сергеевна Шиняева, аспирант. Астраханский государственный университет, (г. Астрахань, Российская Федерация), dauilova.taisyaiQgmail.com.

Поступила в редакцию 1 июня 2015 г.

Литература / References

1. Hirsch J.E. An Index to Quantify an Individual's Scientific Research Output. Proceedings of the National Academy of Sciences of the United States of America, 2005, vol. 102, no. 46, pp. 16569-16572. DOI: 10.1073/pnas.0507655102

2. Schreiber M. A Modification of The h-index: The hm-index Accounts for Multi-Authored Manuscripts. Journal of Informetrics, 2008, vol. 2, no. 3, pp. 211-216. DOI: 10.1016/j .joi.2008.05.001

3. Hirsch J.E. An Index to Quantify an Individual's Scientific Research Output That Takes Into Account the Effect of Multiple Coauthorship. Scientometrics, 2010, vol. 85, no. 3, pp. 741-754. DOI: 10.1007/sl 1192-010-0193-9

4. Schreiber M. Twenty Hirsch Index Variants and Other Indicators Giving More or Less Preference to Highly Cited Papers. Annalen der Physik, 2010, vol. 522, no. 8, pp. 536-554. DOI: 10.1002/andp.201000046

h

pp. 16-25. DOI: 10.1016/j.joi.2006.07.001

6. Burreil Q.L. Hirsch Index or Hirsch Rate? Some Thoughts Arising From Liang's Data. Scientometrics, 2007, vol. 73, no. 1, pp. 19-28. DOI: 10.1007/slll92-006-1774-5

h

of Informetrics, 2011, vol. 5, no. 4. pp. 489-497. DOI: 10.1016/j.joi.2011.02.003

8. Egghe L., Rousseau R. An Informetric Model for the Hirsch-Index. Scientometrics, 2006, vol. 69, no. 1, pp. 121-129. DOI: 10.1007/slll92-006-0143-8

h

American Society for Information Science and Technology, 2007, vol. 58, no. 3, pp. 452-454. DOI: 10.1002/asi.20473

10. Egghe L. Item-time-dependent Lotkaian Informetrics and Applications to the Calculation of the Time-Dependent h-index and g-index. Mathematical and Computer Modelling, 2007, vol. 45, no. 7-8, pp. 864-872. DOI: 10.1016/j.mcm.2006.08.006

h

Information Science and Technology, 2009, vol. 60, no. 2, pp. 410-417. DOI: 10.1002/asi.20973

h

Time-Dependent Hirsch Index. Journal of Informetrics, 2013, vol. 7, no. 2, pp. 325-329. DOI: 10.1016/j .joi.2013.01.001

13. Vieira E.S, Gomes J. A. N. F. Citations to Scientific Articles: Its Distribution and Dependence on the Article Features. Journal of Informetrics, 2010, vol. 4, no. 1, pp. 1-13. DOI: 10.1016/j .joi.2009.06.002

14. Sangwal K. Growth Dynamics of Citations of Cumulative Papers of Individual Authors According to Progressive Nucleation Mechanism: Concept of Citation Acceleration. Information Processing & Management, 2013, vol. 49, no. 4, pp. 757-772. DOI: 10.1016/j.ipm.2013.01.003

15. Amancio D.R., Oliveira Jr. O.N., L. da Fontoura Costa. Three-Feature Model to Reproduce

h

Journal of Informetrics, 2012, vol. 6, no. 3, pp. 427-434. DOI: 10.1016/j.joi.2012.02.005

16. Amin M., Mabe M.A. Impact Factors: Use and Abuse. Medicina, 2003, vol. 63, no. 4, pp. 347-354.

17. Egghe L., Ravichandra Rao I.K. Theory of First-Citation Distributions and Applications. Mathematical and Computer Modelling, 2001, vol. 34, no. 1-2, pp. 81-90. DOI: 10.1016/S0895-7177(01)00050-4

18. Tsay M.-Y. An Analysis and Comparison of Scientometric Data Between Journals of Physics, Chemistry and Engineering. Scientometrics, 2009, vol. 78, no. 2, pp. 279-293. DOI: 10.1007/sl 1192-007-1996-1

19. Bouabid H. Revisiting Citation Aging: a Model for Citation Distribution and Life-Cycle Prediction. Scientometrics, 2011, vol. 88, no. 1, pp. 199-211. DOI: 10.1007/sl 1192-011-0370-5

20. Sangwal K. Distributions of Citations of Papers of Individual Authors Publishing in Different Scientific Disciplines: Application of Langmuir-Type Function. Journal of Informetrics, 2014, vol. 8, no. 4, pp. 972-984. DOI: 10.1016/j.joi.2014.09.009

21. Egghe L. Mathematical Study of h-index Sequences. Information Processing & Management, 2009, vol. 45, no. 2, pp. 288-297. DOI: 10.1016/j.ipm.2008.12.002

22. McCarty C., Jawitz J.W., Hopkins A., Goldman A. Predicting Author h-index Using Characteristics of the Co-author Network. Scientometrics, 2013, vol. 96, no. 2, pp. 467-483. DOI: 10.1007/sl 1192-012-0933-0

23. Schreiber M. The Predictability of the Hirsch Index Evolution. Translational Twists and Turns: Science as a Socio-Economic Endeavor. Proceedings of 18th International Conference on Science and Technology Indicators. Berlin, Germany, September 2013. Berlin, Institute for Research Information and Quality Assurance, 2013, pp. 366-372.

MSC 62P25 DOI: 10.14529/mmpl60103

TEMPORAL DYNAMICS OF HIRSCH INDEX

Yu. Yu. Tarasevich, Astrakhan State University, Astrakhan, Russian Federation, tarasevich@asu.edu.ru,

T.S. Shinyaeva, Astrakhan State University, Astrakhan, Russian Federation, danilova.taisiya@gmail.com

We performed the analysis of the data from the Scopus database regarding temporal dynamics of h-index and hs (2015)-index of a group of the continuously and consistently working scientists. We propose a model describing the temporal dynamics of h-index. Temporal dynamics of hs (2015)-index demonstrates sigmoidal behaviour. The model takes into account: 1) changing the publication activity of the scientist (sigmoidal growth of number of publications at the early stages of scientific career is assumed); 2) the distribution of articles by the number of citations; 3) the dynamics of each specific article citation (typically, the number of citations at first increases and then gradually decreases). The h

per year) is investigated. We used two types of citations distributions, i.e. Lotka distribution and geometric distribution. Both distributions lead to a qualitatively correct temporal dynamics of Hirsch index. h

Received June 1, 2015

Временная динамика индекса Хирша Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Тарасевич Юрий Юрьевич, Шиняева Таисия Сергеевна

Похожие темы научных работ по математике , автор научной работы — Тарасевич Юрий Юрьевич, Шиняева Таисия Сергеевна

Temporal Dynamics of Hirsch Index

Текст научной работы на тему «Временная динамика индекса Хирша»