Лев Арменович Григорян
кандидат технических наук, научный сотрудник Всероссийского института научной и технической информации Российской академии наук,
Москва, Россия; e-mail: Levgr2@yandex.ru
Неполнота отражения публикаций российских научных вестников в ведущих реферативно-библиографических
базах данных: обзор
УДК: 001.8:(051.6)
Б01: 10.24412/2079-0910-2022-2-128-134
Проанализировано наблюдающееся в последние годы ограничение научно-информационного пространства рамками рейтинговых журналов, реферируемых крупнейшими базами данных "Web of Science", "Scopus", "ScienceDirect" и др. Перечислены недостатки проводимого согласно этим ограничениям отсева научных публикаций. Приведены статистические данные о степени неполноты отражения в международных научных базах публикаций российских научных вестников и сборников. Предложено скорректировать концепцию обработки научной информации, поставив в приоритет максимально полный охват научных публикаций, и восполнить имеющиеся в международных базах лакуны при помощи ресурсов базы данных Всероссийского института научной и технической информации (ВИНИТИ РАН).
Ключевые слова: статистика, наукометрия, научные публикации, вестники, сборники, полнота отражения, научные базы данных.
В наших предыдущих работах [Бондарь и др., 2013, 2016] показано, что ограничения, вводимые крупнейшими базами данных (БД) на научно-информационное поле, приводят к серьезному искажению как самого поля, так и выводов, которые формируются при его анализе. В результате недооцененными становятся не только авторы, журналы, научные направления, но и целые страны.
Ограничение актуального научно-информационного пространства рамками рейтинговых журналов, реферируемых крупнейшими БД "Web of Science", "Scopus", "ScienceDirect" и др., представляется не вполне оправданным.
Работы, отражаемые в этих изданиях, проходят жесткий фильтр, посредством которого осуществляется отсев целых пластов научно-технической информации, не всегда коррелирующий со значимостью отсеиваемых публикаций. Например, будущая нобелевская работа А. Гейма и К. Новоселова по графену дважды отклонялась редакцией журнала "Nature", входящего в пятерку наиболее рейтинговых изданий по версии "Scopus".
Невостребованными в крупнейших реферативно-библиографических БД нередко остаются работы, опубликованные на национальных языках различных стран (даже снабженные английским рефератом). Массовому отсеву подвергаются раз-
© Григорян Л.А., 2022
личные издания университетов и научных центров, в том числе вестники, сборники, труды, ученые записки, известия вузов и т. д.
Также по сложившейся традиции далеко не всегда принято относить к научно-информационному пространству документы таких форматов, как тезисы научных докладов, патентные документы, отчеты о ведущихся инновационных исследованиях, сообщения о прошедших научных семинарах, материалы коллоквиумов и задокументированные научные дискуссии в электронном формате, слайдовые презентации, стенограммы устных сообщений и т. д.
Для отражения вышеперечисленных типов научных документов нет препятствий технического характера; возможности современной техники по хранению и обработке больших объемов информации практически безграничны. Однако на данный момент в мире не существует баз данных, ни международных, ни национальных, приоритетом для которых являлась бы полнота отражения информационного потока.
При формировании современных БД до сих пор используется выборочный подход к отражению научных публикаций, сформировавшийся еще в середине XX в., в эпоху расцвета таких информационных гигантов, как "Chemical Abstracts" и «РЖ ВИНИТИ», когда вынужденно приходилось делить публикации на приоритетные/ неприоритетные, включаемые/невключаемые и т. д.
К сожалению, архаичность такого подхода не принимается во внимание составителями современных зарубежных баз данных. Видимо, такая логика развития информационных систем сочтена оптимальной, поскольку совпадает с представлением об успешности реализуемых бизнес-проектов. Несмотря на растущую критику со стороны научного сообщества [Игра в цыфирь..., 2011; Hauer et al., 2020; Гуськов, Косяков, 2020; Pech, Delgado, 2020; Митрохин, Данилин, 2019], главного потребителя информационных продуктов, ограничения в доступе к информации становятся все серьезнее и глубже, при том, что информационный поток (число публикаций) во многих отраслях науки и техники стремительно растет, в том числе и в России.
В нашей работе мы предполагали проанализировать статистику степени отражения в крупнейших БД работ, опубликованных в российских журналах. В качестве объекта были выбраны такие традиционные для отечественной науки издания, как вестники российских вузов и научных институтов. На 10 ноября 2021 г. в системе eLibrary зарегистрировано 2 478 российских вестников (из них 960 индексируется в РИНЦ).
По числу и регулярности публикаций вестники формально сопоставимы с рейтинговыми журналами, в том числе выпускаемыми известными университетами США и Великобритании. Для примера приведены данные по ряду крупных университетских центров России (табл. 1) и, как частный случай, по университетам Казани (табл. 2). Полученные данные об отсутствии отражения их публикаций в ведущих зарубежных базах подтвердили наше заключение.
Вниманию читателей предлагается также статистика отражения в российских научных вестниках и сборниках работ по ряду актуальных направлений современной науки (табл. 3). Понятно, что исключение российских вестников и сборников из информационного поля, охватываемого престижными зарубежными БД, ведет к обеднению научных фондов этих баз и ограничивает заинтересованных пользователей в получении требуемой информации.
Табл. 1. Вестники ряда российских университетов (по городам), 2020 г.
Город Количество статей на сайтах журналов Отражено в Беорш Отражено в ШБ
Самара 911 44 44
Казань 721 0 0
Ростов-на-Дону 285 0 0
Иркутск 305 0 0
Итого: 2 222 44 44
Табл. 2. Вестники университетов Казани, 2020 г.
Вестник Количество статей на сайтах журналов Отражено в Беорш Отражено в шб
КГТУ им. Туполева — КАИ 100 0 0
КГТехнолУ (КНИТУ) 263 0 0
КазГАУ 91 0 0
КГЭУ 47 0 0
Прочие 220 0 0
Итого: 721 0 0
Табл. 3. Тематические запросы по вестникам и сборникам (данные БД ВИНИТИ за 2020 г.; символ $ обозначает усечение запроса в поисковой системе БД ВИНИТИ)
Запрос Вестники и сборники
компьют$ моделир$ 167
нано$ 457
секвенир$ 34
энергосбере$ 67
логисти$ 156
нефт$ 401
полимер$ 395
спектроскоп$ 141
математ$ 1 058
титан$ 175
корроз$ 129
сварк$ 101
геном$ 47
коронавир$ OR covid$ 26
Ссылки на недостаточный уровень и несоответствие российских работ стандартам БД не выдерживают критики. Несомненно, разброс качества публикаций в вестниках значителен, о чем свидетельствует Перечень изданий ВАК, в который входит только 596 вестников из 3 045, имеющих индекс РИНЦ. Но вестники ведущих университетов страны и крупных исследовательских институтов и центров до сих пор сохраняют высокий научный уровень публикаций, в редакционные коллегии и список авторов входят ведущие ученые с мировым именем. А по качеству,
оперативности публикации и их доступности (многие из них предоставляют открытый доступ к материалам) они не уступают профильным научным журналам.
Например, «Вестник Московского университета» (серия «Химия») издается с 1946 г., в его редакции ученые с высокими научными рейтингами, а в авторских коллективах студенты, аспиранты, профессора и академики. При этом срок публикаций составляет от 3 до 6 месяцев с даты подачи материала, что никак не связано с недостатком желающих публиковаться. Журнал выходит регулярно со стопроцентным наполнением номера. Такие примеры можно привести и для региональных вузов.
Анализ публикаций в вестниках и рейтинговых журналах показал, что главное отличие заключается в отсутствии у редакций вестников жестких требований к библиографии. Как правило, она не превышает 5—15 ссылок, что значительно меньше, чем в журналах "Scopus"; кроме того, процент ссылок на эти журналы очень низкий. По этим признакам вестники не могут бороться даже за временное пребывание в ведущих БД, что подтверждается данными таблицы 4.
Табл. 4. Общее число российских вестников и публикаций в них за 2020 г.
БД, 2020 г. Вестники Публикации
ВИНИТИ 331 11 900
WоS 30 2 123
SCOPUS 37 2 254
Еще одной причиной отсева вестников крупнейшими зарубежными базами данных является преимущественно мультидисциплинарный характер этих изданий. Малое количество ссылок и «распыление» научно-информационного содержания вестников по различным тематическим областям не позволяют этому виду изданий обеспечить себе высокие рейтинги согласно действующим на сегодняшний день формальным методам оценки научной значимости. Таким образом, статья, опубликованная в научном вестнике, вне зависимости от своего содержания, сколь бы важная и полезная информация в ней ни содержалась, имеет существенно меньше шансов на отражение в крупнейших БД, чем статья, опубликованная в тематическом зарубежном рейтинговом журнале.
Справедливости ради следует отметить, что в отраслевых базах данных ситуация с отражением российских вестников не настолько критична, о чем свидетельствуют, например, данные базы "AGRIS"1, охватывающей публикации по аграрной тематике: за 2020 г. в БД "AGRIS" представлено 170 работ из российских вестников, что сопоставимо с показателями их отражения в БД ВИНИТИ, где представлено 165 работ. Однако интеграция таких отраслевых баз в крупнейшие мировые агрега-торы научной информации, такие как "Web of Science", "Scopus", "ScienceDirect" и т. д., представляется пока делом будущего.
Нам кажется более разумным сосредоточиться на разработке иного подхода к использованию информационного поля, краеугольным камнем которого должна стать максимальная полнота отражения всей доступной научной информации. Моделью этой системы может быть каталог журналов открытого доступа — "Directory
1 AGRIS (International System for Agricultural Science and Technology). Available at: https:// agris.fao.org/ (date accessed: 14.05.2022).
of Open Access Journals" (DOAJ)2. Его формирование и поиск в этой системе осуществляются по единым правилам для всех включенных изданий, без отсева вестников, низкорейтинговых и/или малотиражных источников. Любой пользователь может осуществлять поиск по любому включенному в каталог источнику, издателями которых являются научные организации, университеты и институты, научные и исследовательские центры, компании и др. Если перенести эту схему на национальные базы данных, то количество доступной информации увеличится в разы и отпадет необходимость дублирования «чужой» информации в национальных базах. Реализовать эту систему в мировом масштабе непросто, хотя опыт открытых архивов, объединяющих разные страны, свидетельствует о принципиальной возможности такого подхода.
Нам представляется, что ВИНИТИ РАН мог бы взять на себя труд по максимально полному отражению научных работ, публикуемых в вестниках, сборниках трудов федеральных и региональных научных центров и вузов (в том числе под эгидой территориальных отделений РАН), материалов конференций, ученых записок и т. д., что позволит увеличить контроль за полнотой отражения информации. Разработанные для этих целей правила и поисковая система могут стать основой для интеграции национальных БД различных стран (прежде всего, стран СНГ) в единый научно-информационный комплекс. Возможно, тогда исчезнет повод сетовать на неполноту отражения российских источников информации и вынужденное «бегство» авторов к далеким от науки организациям, устанавливающим свои правила и стандарты.
Из данных анализа можно сделать несколько выводов.
1. Значительный объем актуальной научной информации содержится в ведомственных малотиражных изданиях, в том числе вестниках, сборниках, ученых записках и др.
2. При формировании баз данных научных публикаций особое внимание должно уделяться полноте отражения информации. Качество и актуальность результатов должен оценивать пользователь.
3. В БД "Web of Science" и "Scopus" отсутствует значительная часть опубликованной в России научной информации, в том числе материалы вестников и сборников, что делает использование оценок и рейтингов, принятых в этих базах, для российских авторов некорректным.
4. Степень полноты представления материалов по вестникам и сборникам в ВИНИТИ существенно превышает аналогичные показатели в зарубежных базах данных. Поэтому БД ВИНИТИ может рассматриваться зарубежными базами как перспективный ресурс для восполнения этих лакун.
5. Сложившаяся в современной науке концепция научно-информационного поля требует существенных корректив в сторону расширения этого понятия.
2 Directory of Open Access Journals (DOAJ). Available at: https://doaj.org/ (date accessed: 14.05.2022).
Литература
Бондарь В.В., Григорян Л.А., Королева Л.М., Фарафонов В.В. Степень полноты отражения публикаций авторов в крупнейших научно-технических базах данных. М.: ВИНИТИ РАН, 2016. 11 с.
Бондарь В.В., Григорян Л.А., Эннан А.А. Наукометрические рейтинги: путеводная нить или компас со сломанной стрелкой? // Проблемы наукометрии: состояние и перспективы развития. Международная конференция, Москва, 10—12 окт., 2013, тез. докл. М.: Ин-т проблем развития науки РАН, 2013. С. 53—55.
ГуськовА.Е., КосяковД.В. Национальный фракционный счет и оценка научной результативности организаций // Научные и технические библиотеки. 2020. № 9. С. 15—42.
Игра в цыфирь, или как теперь оценивают труд ученого (сборник статей о библиометри-ке). М.: МЦНМО, 2011. 72 с.
Митрохин М.А., Данилин Д.А. Разработка инструментов аналитики данных международных наукометрических сервисов // Модели, системы, сети в экономике, технике, природе и обществе. 2019. № 4. С. 85-94.
Hauer M.P., Hofmann X.C.R., Krafft T.D., Zweig K.A. Quantitative Analysis of Automatic Performance Evaluation Systems Based on the h-index // Scientometrics. 2020. Vol. 123. No. 2. P. 735-751.
Pech G., Delgado C. Assessing the Publication Impact Using Citation Data from Both Scopus and WoS Databases: an Approach Validated in 15 Research Fields // Scientometrics. 2020. Vol. 125. No. 2. P. 909-924.
Incomplete Representation of Russian Scientific Heralds' Materials in the Leading Worldwide Abstract and Bibliographic Databases: a Review
Lev A. Gsigosyan
All-Russian Institute of Scientific and Technical Information of the Russian Academy of Sciences, Moscow, Russia; e-mail: Levgr2@yandex.ru
The article analyzes the limitations of the scientific information space during the recent years that have been exemplified by the rating journals reviewed by the largest international scientific databases Web of Science, Scopus, ScienceDirect, etc. The disadvantages of the dropout of scientific publications according to these restrictions are listed. Statistics on the incomplete representation of Russian scientific heralds and collections in international scientific databases are given. It is proposed to adjust the concept of scientific information processing, prioritizing the fullest possible coverage of scientific publications, and to fill the gaps in international databases with the help of the database resources of the All-Russian Institute of Scientific and Technical Information (VINITI RAS).
Keywords: statistics, scientometrics, scientific publications, scientific heralds, collections, representation completeness, scientific databases.
References
Bondar', V.V., Grigoryan, L.A., Ennan, A.A. (2013). Naukometricheskiye reytingi: putevodnaya nit' ili kompas so slomannoy strelkoy? [Scientometric ratings: a guiding thread or a compass with a broken arrow?], in Problemy naukometrii: sostoyaniye i perspektivy razvitiya. Mezhdunarodnaya konferentsiya. Moskva, 10—12 oktyabrya, 2013, tezisy dokladov [Problems of scientometry: current state and future perspectives: International conference, Moscow, October 10-12, 2013. Tezisy dokladov], Moskva: Institut problem razvitiya nauki RAN, pp. 53-55 (in Russian).
Bondar', V.V., Grigoryan, L.A., Koroleva, L.M., Farafonov, V.V. (2016). Stepen' polnoty otrazheniya publikatsiy avtorov v krupneyshikh nauchno-tekhnicheskikh bazakh dannykh [The degree of the authors' publications representation completeness in the largest scientific and technical databases], Moskva: VINITI RAS (in Russian).
Gus'kov, A.E., Kosiakov, D.V. (2020). Natsional'nyy fraktsionnyy schet i otsenka nauchnoy rezul'tativnosti organizatsiy [National fractional account and evaluation of organizations' scientific efficiency], Nauchnyye i tekhnicheskiye biblioteki, no. 9, 15-42 (in Russian).
Hauer, M.P., Hofmann, X.C.R., Kraffi, T.D., Zweig, K.A. (2020). Quantitative Analysis of Automatic Performance Evaluation Systems Based on the h-index, Scientometrics, 123 (2), 735-751.
Igra v tsyfir', ili kak teper' otsenivayut trud uchenogo (sbornik statey o bibliometrike). (2011) [The cipher game, or how the contribution of a scientist is now evaluated (collection of articles on bibliometrics)], Moskva: MTsNMO (in Russian).
Mitrokhin, M.A., Danilin, D.A. (2019). Razrabotka instrumentov analitiki dannykh mezhdunarodnykh naukometricheskikh servisov [Development of data analytics tools for international scientometric services], Modeli, sistemy, setiv ekonomike, tekhnike,prirode iobshchestve, no. 4, 85-94 (in Russian).
Pech, G., Delgado, C. (2020). Assessing the Publication Impact Using Citation Data from Both Scopus and WoS Databases: an Approach Validated in 15 Research Fields, Scientometrics, 125 (2), 909-924.