ПОКАЗАТЕЛИ ЦИТИРУЕМОСТИ УЧЕНЫХ С УЧЕТОМ ПОВТОРЯЕМОСТИ ЦИТИРУЮЩИХ АВТОРОВ

Марвин Сергей Владимирович

ЭКСПЕРТНОЕ МНЕНИЕ

Научная статья УДК 001.893+519.248

ГРНТИ: 12.41: Организация науки. Политика в области науки doi:10.51608/26867818_2023_1_167

ПОКАЗАТЕЛИ ЦИТИРУЕМОСТИ УЧЕНЫХ С УЧЕТОМ ПОВТОРЯЕМОСТИ ЦИТИРУЮЩИХ АВТОРОВ

МАРВИН Сергей Владимирович

кандидат физико-математических наук, доцент департамента информационных технологий и автоматики Уральский федеральный университет имени первого Президента России Б.Н. Ельцина

ORCID: 0000-0002-6091-2760 (Россия, Екатеринбург, e-mail:s.v.marvin@yandex.ru)

Аннотация. Утверждение, являющееся основополагающим для статьи, заключается в том, что показатели цитируемости каждого конкретного ученого должны определяться не только ссылками, поступившими на его публикации, но и широтой авторского круга, от которого эти ссылки получены. Статья дополняет серию других работ, основанных на том же базовом утверждении, выполненных в рамках той же проблематики (которая, таким образом, признается актуальной для наукометрии). В статье предложен конкретный алгоритм для корректирования показателей цитируемости, основанный на учете повторяемости цитирующих авторов. Алгоритм заключается в частичном вычитании из наукометрических показателей ученого тех ссылок, которые исходят от наиболее часто повторяющихся авторов. Определение кластера (ядра) авторов, которые особенно часто ссылаются на работы ученого, происходит в рамках той же математической модели, на которой основано построение ядра Хирша. Разбираются различные нюансы метода, связанные с многократными ссылками, исходящими из одной и той же цитирующей публикации, либо со ссылками, выполненными в соавторстве. Разобран конкретный пример применения метода. Проведено сравнение предложенного метода с другими алгоритмами, разработанными, использованными и обсужденными ранее.

Ключевые слова: наукометрия; библиометрические базы; цитируемость; ядро Хирша; индекс Хирша; ко-цитирование; индекс Херфиндаля; соавторство

Для цитирования: Марвин С.В. Показатели цитируемости ученых с учетом повторяемости цитирующих авторов // Эксперт: теория и практика. 2023. № 1 (20). С. 167-171. Сок10.51608/26867818_2022_4_167.

Original article

INDICATORS OF CITATION OF SCIENTISTS TAKING INTO ACCOUNT A SAMENESS OF CITING AUTHORS

candidate of physical and mathematical sciences, associate professor of the department of information technologies and automation Ural federal university named after the first President of Russia B.N. Yeltsin (Russia, Yekaterinburg, e-mail: s.v.marvin@yandex.ru)

Annotation. The statement, which is fundamental for this article, is that, the indicators of citation of each individual scientist should be determined not only by the references, received to his publications, but also by the breadth of author's circle, from which these references are obtained. The article extends a series of other works, based on the same basic statement, completed within the same problem (which, thus, is recognized as topical for the scientometrics). In the article, aspecific method of correction of calculation of the number of citations of a scientist, based on considering a sameness of citing authors, is proposed. The algorithm based on partial subtracting from scientometrics indicators of the scientist those citations, that come from most frequent authors. The definition of a cluster (core) of authors, who especially often are cited the scientist, based on a same mathematical model, on which based a building of the Hirsch core. Various nuances of the proposed method, associated with multiple citations, coming from a same citing publication, or coming from a publication, made in co-authorship, are analyzed. A specific example of application of the method is analyzed. A comparison of the proposed method with other algorithms, which were developed, used and discussed earlier, is carried out.

Keywords: scientometrics; bibliometric bases; citation; Hirsch core; Hirsch index; co-citation; Herfindahl index; co-authorship

For citation: Marvin S.V. Indicators of citation of scientists taking into account a sameness of citing authors // Expert: theory and practice. 2023. № 1 (20). Pp. 167-171. (In Russ.). doi:10.51608/26867818_2022_4_167.

Введение

Ранее в работах по наукометрии неоднократно отмечалось, что цитирования любого конкретного ученого, исходящие от наиболее часто повторяющихся авторов, требуют повышенного внимания и отдельного подхода. Предлагались некоторые модификации индекса Хирша [1-2]; разрабатывались методы выявления кластеров ко-цитирования по персональному, административному и территориальному признаку [3-4]; использовался индекс Херфиндаля [3; 5].

Бесспорно, научное знание не должно концентрироваться в каком-либо неоправданно узком научном кластере, должно быть интересным как можно более широкому кругу исследователей (разумеется, в рамках данной конкретной предметной области). Кроме того, выявление кластеров ко-цитиро-вания является эффективным методом противодействия имитационному цитированию.

Добросовестное цитирование отражает ценность научных трудов [6-8] и ожидаемо коррелирует с их качеством [9]. Имитационное цитирование искажает представление о ценности опубликованных работ и уменьшает (иногда очень заметно) корреляцию между наукометрическими показателями и качеством публикаций [10-11]. Вычитание ссылок, исходящих от чрезмерно повторяющихся авторов, должно уменьшить искажения, вносимые имитационным цитированием - в данной работе предлагается один из возможных подходов.

Методология

Предлагаемый метод основан на той же модели, на которой был построен индекс Хирша: некоторая выборка ранжируется (перегруппировывается) по определенному количественному признаку в порядке его невозрастания. Если на Л-м месте в выборке количественный признак больше или равен Л, а на (^+1)-м месте - меньше или равен Л, то вычисляемый индекс принимает значение Л. Этот индекс определяет разбиение выборки на две части, принципиально важные для метода: первые Л позиций в выборке образуют «ядро», а остальные позиции -«хвост».

Модель разбиения на ядро и хвост может быть использована не только для распределения количества цитирований по публикациям ученого (как это происходит при вычислении обычного индекса Хирша). Она может быть применена, например, к распределению научных трудов ученого, выполненных им не единолично, по его соавторам [12-13]: так возникает понятие ядра соавторства. В данной работе предлагается применить аналогичный подход к

распределению цитирований ученого по авторам, когда-либо его процитировавшим. Идея проиллюстрирована на рисунке.

Рис. Распределение количества цитирований по цитирующим авторам

Авторы, процитировавшие ученого, ранжируются (в порядке невозрастания) по количеству цитирований, поступивших от них рассматриваемому ученому. Каждому автору соответствует столбец на рисунке, высота которого равна указанному количеству цитирований; номер столбца - номер автора в ранжированном списке. Заметим, что подобные диаграммы составляются автоматически в профилях ученых базы elibrary.ru; однако, без каких-либо существенных их применений.

Наклонная прямая, изображенная мелким пунктиром, задается уравнением у=х, где х - горизонтальная координата, у - вертикальная. Последний (слева направо) столбец диаграммы, пересекающийся с этой прямой, определяет границу между ядром и хвостом; координата Л характеризует его расположение по горизонтали (указана стрелкой). Этот столбец и все столбцы левее относятся к ядру; столбцы правее образуют хвост.

Авторы, попавшие в ядро, наиболее часто ссылаются на работы ученого. Предлагаемый метод заключается в том, что ссылки, поступившие от этих авторов, должны иметь некоторый порог отсечения: ученому должны засчитываться только ^цитирований от каждого из них. Высота «потолка» для ссылок из ядра задается на диаграмме прямой, изображенной длинным пунктиром. Ссылки, поступившие от авторов, находящихся в хвосте диаграммы, засчитываются ученому без каких-либо ограничений. Верхний порог для всех ссылок, принимаемых в расчет, изображен на диаграмме сплошной ломаной.

Заметим: данная модель не предполагает, что ссылки, которые оказываются над «потолком» ядра

ЭКСПЕРТ: ■ ТЕОРИЯ И ПРАКТИКА

2023. № 1 (20)

EXPERT: THEORY AND PRACTICE

цитирования, заблокированы насовсем. Они, в любом случае, должны оставаться в памяти программного обеспечения библиометрической базы. И ядро цитирования может расшириться, когда, как минимум, h+1 автор сошлется на данного ученого, как минимум, h+1 раз - тогда еще некоторая часть ссылок из прежнего ядра цитирования окажется «оправданной» и разблокированной. В этом заключается основной замысел метода: научное знание должно распространяться.

Высота конкретного столбца на рисунке накоплена всеми ссылками, полученными от конкретного автора на весь массив публикаций ученого. Приведем несколько примеров. Допустим, автор № 2 цитирует какую-либо работу рассматриваемого ученого - высота 2-го столбца диаграммы вырастает на единицу. Если же, предположим, в своей (или отчасти своей) публикации автор № 2 процитировал две публикации ученого (два пункта в списке литературы), высота второго столбца увеличивается на два (что может привести к перестановке столбцов: ведь авторы ранжируются в порядке невозрастания цитирования). Если цитирование произошло из публикации, которую, например, авторы № 3 и № 4 написали совместно, то на единицу вырастают одновременно 3-й и 4-й столбцы. И возможна ситуация, когда 3-й столбец окажется выше порога отсечения, а 4-й -ниже его. Однако, речь идет об одной и той же ссылке на публикацию ученого (просто выполненную в соавторстве) - в таком случае, предлагается это цитирование засчитывать.

Для ссылок из ядра цитирования чрезвычайно актуален вопрос, какие из них следует считать под «потолком» ядра, а какие - над ним (то есть, заблокированными). От того, на какие именно публикации засчитаны цитирования, может зависеть, например, значение индекса Хирша. Кроме того, в идеале, описанный метод следует применять совместно с использованием средних показателей цитируемости, характеризующих конкретную либо собирательную тематику, а также вид публикации: чтобы вычислять нормированные показатели [14]. Тогда еще большую важность приобретает вопрос, какие именно ссылки из ядра цитирования следует засчитывать ученому.

Очевидно, что от каждого конкретного цитирующего автора в первую очередь должны идти в зачет те цитирования, которые поступили хронологически раньше. Однако, возможна ситуация, когда нельзя определить, какие из ссылок более ранние, а какие - более поздние: например, если цитирующий автор в рамках одной публикации сослался сразу на несколько работ ученого - такие ссылки, разумеется, следует считать одновременными. И одновременные ссылки от одного и того же автора могут находиться отчасти под пороговым количеством h, а от-

части - над ним. Тогда следует засчитывать те из них, которые соответствуют наилучшим нормированным показателям цитируемости автора. Конечно, все это требует использования некоторых алгоритмов перебора, соответствующего программного обеспечения и немалых вычислительных мощностей. Однако, и ранее отмечалось, что любой достаточно обстоятельный наукометрический подход сопряжен с очень высокими требованиями к количеству и качеству вычислительной техники [14].

Эксперимент: конкретное применение метода

Для того, чтобы продемонстрировать применение предложенного метода, разберем показатели цитируемости одного реального молодого ученого, имя которого не разглашается. Для разбора примера ученый осознанно выбран начинающим, чтобы был возможен «ручной подсчет» его показателей. Распределение ссылок от различных авторов представлено в таблице 1.

Таблица 1. Распределение цитирований по авторам

Автор 1 2 3 4

Ссылки 1, 2, 3.1, 1, 2, 3.1, 5, 6 7

3.2, 4.1, 3.2, 4.1,

4.2, 5, 6, 7 4.2, 6

Авторы ранжированы (пронумерованы) по количеству поступивших от них ссылок (в порядке невозрастания). Сами ссылки пронумерованы в хронологическом порядке их поступления. Ссылки с двойным номером - одновременные, поступившие сразу на две работы ученого из одной и той же публикации (как такие ссылки вписываются в общую хронологию -определяется первой цифрой). Одни и те же ссылки встречаются в столбцах различных авторов, если цитирующая работа была выполнена в соавторстве. В сумме различных ссылок у рассматриваемого ученого - 9.

В таблице 1 данный ученый тоже представлен: как автор № 2 (то есть, имеет место самоцитирование). Автор № 1 - его научный руководитель. Пока молодой ученый, завершив обучение в аспирантуре, временно отвлекся на интенсивную преподавательскую работу, его научный руководитель продолжил публикационную активность (со ссылками на ранее выполненные публикации, совместные с бывшим аспирантом).

Как видно из приведенной таблицы, пороговое значение для неблокируемых ссылок равно 2: от автора № 2 поступило больше 2 ссылок, а от автора № 3 - ровно 2. Таким образом, авторы № 1 и № 2 образуют ядро цитирования, и от них оказываются засчитанными ссылки 1 и 2, выполненные в соавторстве. Заметим также, что ссылки 5 и 6, тоже выполненные в соавторстве, для авторов №1 и №2 оказались выше порога отсечения, но для автора № 3 -

ниже порога (этот автор вообще не попал в ядро). Как было сказано выше, такие ссылки предлагается засчитывать. Следовательно, незаблокированными оказываются ссылки 1, 2, 5, 6 и 7; общее количество - 5.

В таблице 2 показано, как распределены ссылки по публикациям ученого, в том числе, с учетом блокирования некоторых из них (разумеется, в расчет приняты только публикации с ненулевым цитированием). Публикации пронумерованы в порядке невозрастания незаблокированных ссылок.

Таблица 2. Распределение цитирований по публикациям

Публикация 1 2 3 4

Ссылки 1, 2, 3.1, 3.2, 4.2, 5 7

(полностью) 4.1 6

Ссылки (после 1, 2 6 5 7

блокирования)

Из таблицы 2, в частности, видно, что обычный индекс Хирша ученого равен 2, а если не брать в расчет заблокированные ссылки - 1.

Заключение

Предложенный в данной работе метод блокирования ссылок, исходящих от наиболее часто повторяющихся авторов, представляется более эффективным, чем предлагавшееся ранее использование ch-индекса [1]. При вычислении ch-индекса (альтернативы индекса Хирша) предполагалось, что данному конкретному ученому следует засчитывать только одну ссылку на любую его конкретную публикацию, исходящую от конкретного автора. Но тот же автор мог сослаться по одному разу и на все другие работы ученого - все такие ссылки предлагалось засчитывать без каких-либо исключений. Кроме того, предложенный подход содержит в себе конкретный способ корректирования показателей цитируемости ученого, а также всех известных индексов, на цитируемости основанных. Представляется, что это более перспективно, чем просто ограничиваться выявлением кластеров ко-цитирования либо предлагать алгоритмы, которые трудно сочетать с вычислениями общепринятых наукометрических показателей [3-4].

Также, предложенный метод в полной мере применим не только к ученым, но и к журналам. Это может стать альтернативой подходу, основанному на вычислении индекса Херфиндаля [15].

Библиографический список

1. Franceschini, F. Analysis of the ch-index: an indicator to evaluate the diffusion of scientific research output by citers / F. Franceschini, D. Maisano, A. Perotti, A. Proto // Sci-entometrics. - 2010. - Vol. 85. - Iss. 1. - PP. 203-217.

2. Штовба, С. Д. Обзор наукометрических показателей для оценки публи-кационной деятельности ученого / С. Д. Штовба, Е. В. Штовба // Управление большими систе-

мами: сборник трудов. - 2013. - № 44. - С. 262-278. - EDN RDQBOD.

3. Еременко, Т. В. Качество цитируемости трудов ученых региона: библиометрический анализ на примере Рязанской области / Т. В. Еременко // Социология науки и технологий. - 2019. - Т. 10, № 2. - С. 129-149. - DOI 10.24411/2079-0910-2019-12008. - EDN TMOSAS.

4. Новые наукометрические показатели, устойчивые к искусственному "улучшению" / В. И. Лойко, Д. А. Романов, В. Л. Шапошников [и др.] // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. - 2017. - № 127. - С. 557-583. - DOI 10.21515/1990-4665-127-038. - EDN YLZTQT.

5. Еременко, Т. В. Локальность цитирований как наукометрический показатель для ученых региона: к постановке проблемы / Т. В. Еременко // Книга. Культура. Образование. Инновации : сборник докладов Пятого Международного профессионального форума «Крым-2019», Судак, 08-16 июня 2019 года / Государственная публичная научно-техническая библиотека России. - Судак: Государственная публичная научно-техническая библиотека России, 2020. - С. 94-96. - DOI 10.33186/978-5-85638-223-42020-94-96. - EDN CKRPSL.

6. Лазарев, В. С. Неудовлетворительные определения или смутно понимаемое понятие? Об определениях термина "impact" / В. С. Лазарев // Наука и научная информация. - 2019. - Т. 2, № 1. - С. 63-78. - DOI 10.24108/26583143-2019-2-1-63-78. - EDN ZAHADB.

7. Лазарев, В. С. Свойство, которое на самом деле оценивают, когда говорят, что оценивают "impact" /

B. С. Лазарев // Наука и научная информация. - 2019. -Т. 2, № 2. - С. 129-138. - DOI 10.24108/2658-3143-2019-2-2129-138. - EDN LKSIWM.

8. Лазарев, В. С. Цитируемость как средство отражения ценности и качества научных документов, результативности учёных, нобелевского уровня исследований / В.

C. Лазарев ; Под редакцией В.М. Тютюнника . - Тамбов-Москва-С-Петербург-Баку-Вена-Гамбург-Стокгольм-Буаке-Варна-Ташкент : Общество с ограниченной ответственностью "Международный Информационный Нобелевский Центр" (МИНЦ), 2020. - 64 с. - ISBN 978-5-86609-237-6. -EDN GYQEEO.

9. Лазарев, В. С. Можно ли считать уровень цитируемости научных документов показателем их качества? / В. С. Лазарев // Наукометрия: методология, инструменты, практическое применение : Сборник научных статей / Под редакцией А.И. Груши. - Минск : Республиканское унитарное предприятие "Издательский дом "Белорусская наука", 2018. - С. 88-103. - EDN XWSTVR.

10. Arnold, D. Nefarious Numbers / D. Arnold, K. Fowler // Notices of the American Mathematical Society. -2011. - Vol. 58. - No. 3. - PP. 434-437.

11. Марвин, С. В. О статистической взаимосвязи между экспертными оценками научных журналов и их им-пакт-факторами / С. В. Марвин // Научные ведомости Белгородского государственного университета. Серия: Философия. Социология. Право. - 2019. - Т. 44, № 4. - С. 583592. - DOI 10.18413/2075-4566-2019-44-4-583-592. - EDN JCBYTO.

12. Ausloos, M. A scientometrics law about co-authors and their ranking: the co-author core / M. Ausloos // Scientometrics. - 2013. — Vol. 95. - Iss. 3. - PP. 895-909.

ЭКСПЕРТ: ■ ТЕОРИЯ И ПРАКТИКА

2023. № 1 (20)

EXPERT: THEORY AND PRACTICE

13. Романов, Д. А. Современные методы оценки продуктивности исследовательской деятельности / Д. А. Романов, О. Б. Попова, Ю. С. Носова // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. - 2015. - № 108. -С. 725-739. - ЕЭЫ ТКО^.

14. Марвин, С. В. Нормированный показатель публикационной активности, учитывающий количество соав-

торов научных публикаций / С. В. Марвин // Социология науки и технологий. - 2016. - Т. 7, № 4. - С. 116-133. - ЕЭЫ ХКОРУУ.

15. Демидов, Д. Д. Библиометрическая оценка отечественных библиотечно-информационных журналов / Д. Д. Демидов // Научные и технические библиотеки. -2017. - № 8. - С. 3-17. - ЕЭЫ 7ЕСУОТ.

Автор заявляет об отсутствии конфликта интересов.

Статья поступила в редакцию 09.01.2023; одобрена после рецензирования 07.02.2023; принята к публикации 15.02.2023. The authors declare no conflicts of interests.

The article was submitted 09.01.2023; approved after reviewing 07.02.2023; accepted for publication 15.02.2023.

ПОКАЗАТЕЛИ ЦИТИРУЕМОСТИ УЧЕНЫХ С УЧЕТОМ ПОВТОРЯЕМОСТИ ЦИТИРУЮЩИХ АВТОРОВ Текст научной статьи по специальности «Экономика и бизнес»

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Марвин Сергей Владимирович

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Марвин Сергей Владимирович

INDICATORS OF CITATION OF SCIENTISTS TAKING INTO ACCOUNT A SAMENESS OF CITING AUTHORS

Текст научной работы на тему «ПОКАЗАТЕЛИ ЦИТИРУЕМОСТИ УЧЕНЫХ С УЧЕТОМ ПОВТОРЯЕМОСТИ ЦИТИРУЮЩИХ АВТОРОВ»