НАУКОМЕТРИЧЕСКИЙ АНАЛИЗ
в информационном обеспечении инновационной деятельности
Резюме. Кратко описаны некоторые наукометрические показатели и возможности их применения при оценке научных результатов. Приведены примеры использования данных и инструментов платформы Web of Science с целью анализа публикационной активности и цитируемости, расширения международного научно-технического сотрудничества.
Ключевые слова: индексы цитирования, базы данных цитирования, наукометрические показатели, публикационная активность, наукометрический анализ, научно-техническое сотрудничество, Web of Science.
Вячеслав Бричковский,
заведующий сектором
информационного
обеспечения
инновационной
деятельности
Национальной
библиотеки Беларуси,
кандидат
технических наук
Опыт стран - лидеров мирового инновационного развития свидетельствует о том, что задача выработки взвешенной и эффективной политики в этом направлении не может быть решена без соответствующей организации информобеспечения процесса нововведений. Следует учитывать и такие основные тенденции информационного рынка, как рост объемов данных; увеличение количества журналов и публикаций; жесткие временные рамки реализации инновационных проектов; сокращение длительности исследовательского цикла; глобализация и расширение корпоративного взаимодействия; иллюзия легкости получения ценной информации и ограниченные когнитивные способности ее восприятия.
По сообщениям многих информагентств, во всем мире насчитывается более 9 млн исследователей. При этом в среднем ежегодный их прирост составляет около 4%, а для некоторых стран - более 14%. В 2013 г. произведено и сохранено более 3,8 трлн гигабайтов данных, а к 2020 г. объем только научных материалов достигнет 35 трлн гигабайтов [1]. Количество научных материалов выросло уже настолько, что ученый просто не в состоянии прочитать все даже по своей узкой специальности, не говоря об отслеживании смежных областей знаний, что крайне важно при неизменно повышающейся междисциплинарности изысканий.
Ускорение инновационных процессов устанавливает жесткие правила мониторинга, проведения бенчмаркинга, требует сокращения жизненных циклов создания новой продукции.
Диффузия инноваций связана с их распространением по смежным научным областям и технологическим цепочкам и нуждается в постоянном мониторинге по различным дисциплинам.
Осознание указанных проблем, а также количественные и качественные изменения в области развития современных технологий стимулируют поиск новых подходов и решений в информационном обеспечении инновационной деятельности, разработку новых инструментов для поиска и более строгого отбора и анализа необходимой информации. В этих условиях перспективно более активное применение наукометрических методов, которые известны давно [2, 3], но получили второе рождение с развитием компьютерных технологий и Интернета.
Источниками данных в наукометрии являются так называемые индексы цитирования научных работ - реферативные базы данных (БД), содержащие дополнительно количественные сведения об упоминании статей, извлеченные из пристатейных списков литературы. Методологический фундамент наукометрии -показатели, рассчитываемые на основе информации, входящей в базы данных цитирования.
Цитирование можно считать одним из важнейших элементов научной деятельности. Имея богатую историческую традицию и обеспечивая преемственность и непрерывность знаний, оно включает количественную коллективную оценку научных достижений с учетом компетентности экспертов. Взаимные ссылки связывают публикации друг с другом, гарантируя семантическое структурирование информационного потока [4].
Чаще всего наукометрические сервисы реализуются в виде так называемых информационно-технологических платформ, обеспечивающих основные функции поиска и анализа. Наиболее известные и авторитетные - Web of Science (Web of Knowledge) и Scopus. Для анализа русскоязычного документного потока используется также ресурс Science Index.
Функциональные характеристики, наукометрические показатели и информационное наполнение различных платформ, несомненно, различаются [5]. Рассмотрим лишь некоторые возможности наукометрических методов в информационном обеспечении инновационной деятельности на примере платформы Web of Science (WoS) компании Clarivate Analytics (ранее - IP & Science business of Thomson Reuters). Отметим несколько аргументов в пользу такого выбора.
WoS включает источники с наиболее значимым научным контентом. Они представляют его эффективнее всего и влияют на развитие научного направления. Методики и технологии, положенные в основу платформы, были предложены Юджином Гарфилдом - одним из пионеров в области наукометрического анализа.
WoS значительно выигрывает по объему и глубине своего архива. Процедура отбора источников здесь более жесткая, что препятствует появлению недобросовестных публикаций. На этой платформе доступны различные базы данных цитирования (включая национальные и региональные), не принадлежащие Clarivate Analytics.
C 2015 г. в WoS включена БД Russian Science Citation Index (RSCI), сформированная из коллекции лучших российских журналов Научной электронной библиотеки eLIBRARY.
Clarivate Analytics - лидер в области оценки и прогноза перспективных инновационных технологий и разработок. WoS Core Collection -один из самых популярных его продуктов - реализован на платформе WoS и имеет русскоязычный интерфейс. С 2016 г. в нашей стране есть возможность подключиться к платформе через виртуальный читальный зал Национальной библиотеки Беларуси.
В WoS Core Collection входят около 13 тыс. журналов с импакт-фактором (ИФ) и еще 5 тыс. без него в БД Emerging Sources Citation Index (ESCI), более 12,8 тыс. материалов конференций, 66 тыс. монографий, свыше 62 млн записей научных публикаций и 1 млрд цитирований. Все публикации проходят жесткую процедуру рецензирования, отбор источников ведут независимые эксперты.
Все публикации распределяются по следующим группам: искусство и гуманитарные науки, биологические науки и биомедицина, естественные науки, общественные науки, технологии. Глубина архива данных, доступного пользователям, зависит от условий подписки организации.
■ Science Citation Index Expanded - БД цитирования журналов по естественным и техническим наукам. Охватывает 8,3 тыс. главных изданий по 150 дисциплинам. Максимальная глубина архива: 1900 г. - настоящее время.
■ Social Sciences Citation Index - база по общественным наукам. Охватывает более 2,9 тыс. журналов по 50 дисциплинам. В ней также индексируются индивидуально отобранные публикации, имеющие отношение к этой тематике, из более чем 3,5 тыс. лучших естественно-научных и технических журналов мира. Архив: с 1900 г.
■ Arts & Humanities Citation Index - база по искусству и гуманитарным наукам. Охватывает более 1,6 тыс. лучших в мире журналов этого профиля, включает индивидуально выбранные документы, имеющие отношение к данной тематике, из более 6 тыс. главных научных журналов, в том числе по социологии. В связи с особенностями цитирования публикаций в области гуманитарных наук и искусства показатели ИФ изданиям, входящим в этот указатель, не присваиваются. Архив: с 1975 г.
■ Emerging Sources Citation Index - политематическая БД научных журналов, удовлетворяющих базовым критериям включения в WoS Core Collection,
но пока еще не имеющих достаточно высокого уровня международной цитируемости. Импакт-фактор им не присваивается. Периодически издания проходят повторную оценку и, в случае положительного решения, «зачисляются» в один из трех основных указателей: SCI-EXPANDED, SSCI или A&HCI (с присвоением ИФ - для первых двух баз), для чего журнал сначала должен быть включен в Emerging Sources Citation Index. Архив: с 2015 г.
■ Conference Proceedings Citation Index - БД цитирования материалов конференций по естественным, техническим, общественным и гуманитарным наукам.
Ведется с 2005 г. 2017
■ Book Citation Index - БД цитирования монографий t по естественным, техническим, общественным и гума- ^ нитарным наукам. Архив: с 2005 г. 5
со
■ Index Chemicus содержит данные о структурах £ и новых органических соединениях, описанных в веду- | щих международных журналах. Это важный источник и новой информации о биологически активных соедине- | ниях и натуральных продуктах. Архив: с 1993 г. S
■ Current Chemical Reactions включает новые одно- | ступенчатые и многоступенчатые методы синтеза, взятые из ведущих научных журналов и патентов из 36 65
патентных ведомств разных стран. Для каждого метода приведено описание полного цикла протекания реакции и подробное и точное графическое представление каждой ее ступени. Архив: с 1985 г.
WoS применима для решения широкого круга задач информационного обеспечения, таких как тематическое информирование, справочно-библиографическое обслуживание, реализация поисковых сервисов, подготовка обзоров, формирование библиотечного фонда, проведение наукометрических исследований и т.д. Использование WoS дает возможность оценивать вклад исследователей как производителей информации в мировой информационный поток, изучать взаимосвязи между отдельными сообществами, выявлять быстро развивающиеся области, зарождающиеся и перспективные направления и принимать решения для их поддержки. Самая известная форма использования наукометрии - в оптимизации подписки на научные журналы [6]. Наукометрический подход наиболее прогрессивен и позволяет более объективно и точно, в отличие от подходов, основанных на экспертном мнении, выявлять уровень удовлетворенности ученых текущей подпиской и способствует более строгому отбору журналов в фонд научной библиотеки.
WoS учитывает такие показатели, как количество публикаций, суммарная цитируемость, суммарная цитируемость без учета самоцитирования, средняя цитируемость одной статьи, индекс Хирша и другие.
Количество публикаций характеризует научную производительность. Проанализировать данный индикатор возможно в разрезе автора, группы авторов, организации, научной области, предметной рубрики, журнала, страны и т.д.
Суммарная цитируемость - индикатор влиятельности (или авторитетности) публикаций. Показывает, насколько сильно они воздействовали на контекст последующих научных исследований. Анализируя публикационную активность Белгосуниверситета за 2006-2016 гг., можно отметить: наиболее цитируемым документом является статья «The ATLAS Experiment at the CERN Large Hadron Collider», подготовленная коллективом авторов в рамках проекта ATLAS на Большом адронном коллайдере (БАК). По состоянию на июль - август 2016 г. статья получила достаточно цитирований, чтобы попасть в 1% лучших представителей этой отрасли на основе порога высокоцитируемости для данного сегмента и года публикации.
Средняя цитируемость показывает, насколько сильно на ход последующих исследований влияет одна работа. Как и суммарная цитируемость, этот индикатор ощутимо зависит от предметной области. Наиболее высокие его значения характерны для биологии и биохимии, а низкие - для общественных наук.
С помощью данных ШоБ можно провести бенчмаркинг по различным показателям для страны, организации, предметной области и т.д. Сравнить в динамике, к примеру, публикационную активность белорусских исследователей относительно зарубежных.
Индекс Хирша, как и суммарная цитируе-мость, является показателем научной авторитетности. Он демонстрирует число действительно важных публикаций.
Для устранения проблем, связанных с неоднородностью цитирования по различным предметным областям, годам и типам документов, целесообразно использовать нормализацию.
Нормализованная средняя цитируемость -показатель, помогающий в анализе цитируе-мости документов, опубликованных в разных предметных областях, в разные годы [7]. В отличие от традиционного показателя суммарной цитируемости способствует отслеживанию цитируемости статей в динамике, что позволяет ответить на вопрос, растет или падает эффективность исследований. Рассчитывается как отношение реального числа полученных статьей ссылок к их ожидаемому числу, то есть среднему количеству цитирований всех документов того же типа, опубликованных в том же году и в той же предметной области. Таким образом, если рассчитать этот показатель для страны/организации, то можно проанализировать, насколько эффективно, по сравнению со среднемировым уровнем, проводятся исследования.
Наибольшее количество белорусских публикаций приходится на физику. Если сопоставить нормализованную цитируемость по предметным областям, то данный показатель также имеет высокое значение (больше 1), поскольку свыше 10% отечественных статей в области физики -совместные, относящиеся к БАК. Цитируемость таких трудов превышает среднемировой уровень у других публикаций по физике элементарных частиц. Бесспорно, это положительно сказывается на рейтинге наших физиков, однако если активность исследований на БАК пойдет на спад, то цитируемость также снизится. С другой стороны, несмотря на небольшое количество
отечественных публикаций в области молекулярной биологии и генетики (483), нормализованная их цитируемость сравнительно высока (0,58), что может свидетельствовать о значительном потенциале Беларуси в этой сфере.
Импакт-фактор - показатель авторитетности и влиятельности журнала. Его целесообразно применять при выборе издания, где планируется публикация, и не совсем правомерны попытки использовать его как критерий оценки качества научной деятельности. Так, высок и стабилен ИФ авторитетного журнала «Physics Letters В», где размещают свои статьи белорусские ученые-физики. Возможно также проанализировать импакт-факторы изданий открытого доступа [8]. Поскольку в WoS для каждой публикации указаны автор и его аффи-лиация (место работы), то имеется возможность проанализировать перспективы сотрудничества с той или иной страной, организацией, автором.
Существует множество других показателей, на основе которых возможен наукометрический анализ: нормализованная цитируемость по журналу, соотношение процитированных и непро-цитированных работ, процент работ в международном соавторстве, процент работ, попавших в 1% и в 10% наиболее цитируемых, процентиль работы (в какой процент наиболее цитируемых в своей области она попала), дробная цитируе-мость и т.д. Выбор тех или иных показателей зависит еще и от целей и задач наукометрического исследования, источников информации, авторитетности и качества имеющихся исходных данных. Также необходимо учитывать факторы, характерные для инновационных процессов: источник генерации научных результатов, недоступность в общем случае измерения их влияния на практику, задержка между моментом появления идеи и ее реализацией.
Многие возражения против использования данных о цитировании порождены некорректным применением инструментов WoS как простого счетчика публикаций и цитирований. На самом деле это уникальная система, процедуры в которой требуют внимания и осведомленности о некоторых ограничениях, а интерпретация извлекаемых сведений - знания тонкостей наукометрического подхода. Опыт других стран, в том числе СНГ, показывает: WoS способствует росту международного авторитета организации, ее рейтинга, расширению и повышению эффективности научного сотрудничества государств, коммерциализации
фундаментальной и прикладной науки, поиску и получению финансирования (гранты и контракты для совместных исследований), повышению публикационной активности. В странах с высоким научным потенциалом существуют целые команды аналитиков, которые готовят отчеты, позволяющие обоснованно подойти к выбору оптимальной стратегии инновационной деятельности на уровне государства, региона, организации, научного коллектива.
Грамотное применение наукометрического анализа открывает перспективы для выбора самой авторитетной научной литературы при проведении исследований, поиска партнеров на основе четких и прозрачных критериев, повышения публикационной активности и цитируемости, принятия оптимальных тактических и стратегических решений, расширения международных научно-технических связей, получения доступа к зарубежным грантам на исследования и инновации. Анализировать научную деятельность необходимо постоянно, на уровне как отдельных ученых и коллективов (лабораторий, отделов), организаций, так и целых отраслей, ведомств. В этой связи целесообразно создание центров наукометрической аналитики в стране, что, несомненно, будет способствовать количественному и качественному росту и эффективности инновационной деятельности за счет использования передовых мировых практик, повышению уровня информационно-аналитического обеспечения инноваций и увеличению объема их внебюджетного финансирования. ЕИ
http://innosfera.by/2017/08/analysis
ЛИТЕРАТУРА
1. Murphy F. Data and scholarly publishing: the transforming landscape // Learned Publishing. 2014. Vol. 27, N5. Р. 3-7.
2. Garfield E. Citation indexes to science: a new dimension in documentation through association of ideas // Science. 1955. Vol. 122. P. 108-111.
3. Наукометрия. Изучение науки как информационного процесса / В.В. Налимов, З.М. Муль-ченко.- М., 1969.
4. Маршакова И.В.Система цитирования научной литературы как средство слежения за развитием науки.- М., 1988.
5. Наукометрический минимум для ученого. Возможности и ограничения идентификационных баз // https://okna.hse.ru/news/160270181.html.
6. Gureyev V.N., Mazov N. A. Detection of information requirements of researchers using Bibliometric analyses to identify target journals // Information Technology and Libraries. 2013. Vol. 32, №4. P. 5-7.
7. Руководство по наукометрии: индикаторы развития науки и технологии: [монография] / под ред. А.М. Акоева.- Екатеринбург, 2014.
8. Перспективы интеграции научно-образовательных информационных ресурсов открытого доступа / В.И. Бричковский, В.И. Комик и др. // Информатика. 2013, №2. С. 86-89.