Современное образование
УДК 004.032 DOI dx.doi.org/10.24866/VVSU/2073-3984/2018-1/93-101
Е.В. Мельникова
Всероссийский институт научной и технической информации (ВИНИТИ РАН) Москва. Россия
Современное состояние системы индексации и цитирования Web of Science: базы данных, индексы
Рассматривается современное состояние одной из двух ведущих в мире информационно-поисковых систем и баз данных по научным публикациям и ссылкам - Web of Science, индексирующей информацию о публикациях по самому широкому спектру научных областей и направлений. Отмечена роль системы Web of Science в определении публикационной активности ученых, востребованности результатов их профессиональной деятельности в рамках научного сообщества, а также возможность использования системы для выявления перспективных научных идей и изысканий. Дана развернутая характеристика структуры Web of Science, ее основных указателей библиографических ссылок. Систематизирована информация по текущему состоянию баз данных и индексов Web of Science; выделены три основные группы баз данных; определены их различия. Отражено недавнее размещение на платформе Web of Science Индекса российских научных ссылок - Russian Science Citation Index; охарактеризован порядок формирования индекса; отмечено его значение для популяризации российской науки на основе расширения доступа к информации о российских научных публикациях. Приведены актуальные данные по основной коллекции системы Web of Science - Web of Science Core Collection. Значительное внимание уделено самому новому указателю ссылок в составе коллекции - Emerging Sources Citation Index; рассмотрены отличия этого указателя от остальных указателей коллекции; определена роль указателя в составе основной коллекции. Представлены аналитические инструменты, работающие на платформе Web of Science; дана характеристика их основных функций, реализуемых в рамках специальных библио-метрических процедур. Отмечается значение системы Web of Science как действенного инструмента для проведения наукометрического анализа. Одновременно указывается на необходимость привлечения экспертных групп в целях обеспечения полноты оценки научной деятельности.
Ключевые слова и словосочетания: информационно-поисковая система, Web of Science, Гарфилд, система индексации и цитирования, индекс цитирования, указатель библиографических ссылок, RSCI, российский индекс научного цитирования РИНЦ, оценка научной деятельности, наукометрический анализ.
E.V. Melnikova
AllRussian Institute of Scientific and Technical Information of the Russian Academy of Sciences Moscow. Russia
Current Situation within Citation-Indexing System Web of Science: Data Bases, Indexes
Current situation within one of the two world-leading search information systems and data bases on scientific publications Web of Science is discussed. Web of Science indexes information on publications, devoting to the widest spectrum of scientific spheres and directions. The article outlines the role of the system in estimating the researchers' publication activity as well as the response of scientific community to the results
Елена Владимировна Мельникова - канд. техн. наук, старший научный сотрудник отдела теоретических и прикладных проблем информатики Всероссийского института научной и технической информации (ВИНИТИ РАН); e-mail: [email protected]
Melnikova Elena Vladimirovna - PhD (Tech.), AllRussian Institute of Scientific and Technical Information of the Russian Academy of Sciences, Moscow.
of reseachers' professional work. The article also marks that it is possible to use the system for detecting advanced, promising scientific ideas and research areas. The author presents detailed characteristic of the system structure, its main indeces of bibliographic references. Information on the current state of the Web of Science data bases and indeces is systematized. All data bases are united into three groups; differences of the groups are defined. Recent deployment of the Russian Science Citation Index on Web of Science platform is reflected. The author characterizes the way and principles of the index' shaping and outlines its significance for popularzation of Russian science through broadening access to the information on Russian scientific publications. The article represents recent data on Web of Science Core Collection - the main data collection of the Web of Science system. The author pays much attention to the newest citation index within Core Collection - Emerging Sources Citation Index. Its distinction from other indeces of the Core Collection and its role within the Collection are outlined. The article discusses analytic tools functioning on Web of Science platform. The author characterizes their main functions which peep out within special bibliometric procedures. Web of Science' significance as an efficient tool in scientometric analysis is highlighted. At the same time the necessity of attracting expert groups to provide the all-round estimation of researchers' work is pointed out. Keywords: search information system, Web of Science, Garfield, Citation-Indexing System, citation index, index of bibliographic references, RSCI, Russian index of scientific citations (RISC), estimation of scientific activity, scientometric analysis.
Web of Science™1 (WoS) представляет собой информационно-поисковую систему, которая обрабатывает (индексирует) наиболее авторитетные источники научной информации, относящиеся к различным областям знания, включая естественные, прикладные науки, общественные, гуманитарные науки, искусство. Наибольшее внимание в WoS уделяется индексации библиографических ссылок (в английском варианте - citations (цитирований). Поэтому информационную систему WoS часто называют системой индексации и цитирования. на основе обработанных данных в рамках Web of Science создаются различные информационно-аналитические продукты, позволяющие определять количественные и качественные параметры профессиональной деятельности научных коллективов или отдельных авторов через оценку их публикационной активности (количественная характеристика), а также цитируемости их статей, характеризующей востребованность идей в научном сообществе (качественная характеристика). Характеристика баз данных Web of Science
Платформа Web of Science поддерживает несколько видов баз данных (БД). Условно их можно разделить на три группы:
1) указатели библиографических ссылок2 в научных публикациях (индексы цитирования) - Citation Indeces;
2) указатели (индексы) источников научной информации - Indeces;
3) базы данных по информационным продуктам (реферативные БД, БД по аннотациям к научным статьям; научным обзорам) - Product Databases.
1. Citation Indeces
• Web of Science™ Core Collection - Основная коллекция системы Web of Science (включает несколько индексов цитирования);
• BIOSIS Citation IndexSM - Индекс цитирования в биологической литературе;
1 Система Web of Science™ создавалась на базе американского Института научной информации (ISI), который в 1992 г. вошел в состав корпорации Thomson (Канада-США) - TM, преобразовавшейся в 2008 г. в ThomsonReuters.
2 Далее по тексту - указатели ссылок.
• Data Citation IndexSM - Индекс цитирования для источников с числовыми данными [1];
• Chinese Science Citation DatabaseSM (получил размещение на платформе Web of Science c 2009 г.) - БД по китайским научным публикациям с указателем ссылок (1,6 тыс. журналов; выпуски с 1989 г.);
• SciELO Citation Index (с 2013 г.) - Индекс цитирования для научных изданий латиноамериканских стран, стран Карибского бассейна, Испании и Португалии (880 журналов открытого доступа);
• Korean Journal Database (KCI) (с 2014 г.) - БД по корейским научным журналам с указателем ссылок (более 2,3 тыс. журналов; выпуски с 1980 г.);
• Russian Science Citation Index (RSCI) (с 2015 г.) - Индекс цитирования для российских научных изданий.
Что касается Индекса российских научных ссылок RSCI, то он получил возможность размещаться на платформе Web of Science с конца 2015 года. Поиск в рамках указателя может осуществляться на русском или английском языках. Первоначально в БД RSCI вошли чуть более 500 наиболее влиятельных российских научных журналов (выпуски с 2005 года). Эти журналы составляют ядро коллекции Российского индекса научного цитирования (РИНЦ), интегрированного с российской Научной электронной библиотекой eLIBRARY.RU. Компания eLIBRARY. RU является разработчиком и оператором проекта RSCI. К концу 2017 г. число журналов, включенных в RSCI, превысило 650.
RSCI размещен на платформе Web of Science в виде отдельной, но интегрированной базы данных. Интеграция с WoS обеспечивает: международным пользователям системы WoS - прямой доступ к российской базе RSCI; российским ученым - отображение их исследований в системе WoS наравне с исследованиями ученых других стран.
2. Derwent Innovations Indeсes (Указатели компании Derwent по инновациям)
• Derwent World Patents Index® (DWPI) - Указатель описаний изобретений в области химии, генной инженерии, электротехники и в других областях (30,5 млн с 1970 г.) [1];
• Derwent Patents Citation Index® (Derwent PCI) - Указатель ссылок на описания изобретений, патенты и патенты-аналоги, а также литературу, указанную экспертами.
Указатель Derwent PCI включен в группу 2 по формальному признаку - его принадлежности компании Derwent. Указатели DWPI и Derwent PCI интегрированы с системой Web of Science, но не являются ее собственностью. В базе данных Derwent Innovations Indeсes поиск и отбор данных производит собственный поисковик компании Derwent. При этом результаты его поиска доступны и для пользователей, работающих в БД и индексах Web of Science, через пользовательский интерфейс, обеспечиваемый основной поисковой машиной WoS.
Записи указателя DWPI включают библиографические описания патентов; расширенные заглавия, приписываемые патентам предметными специалиста-
ми Dement; рефераты; описание новизны изобретения; описание изобретения с акцентом на его основную технологию (Technology focus); термины предметного индексирования. Главная задача второго указателя - Dement PCI, в отличие от DWPI, заключается в том, чтобы индексировать ссылки в области специализации компании Dement.
3. Product Databases
• Biological Abstracts® - БД по рефератам в области биологии (из журналов);
• BIOSIS Previews® - БД по обзорам в области наук о жизни с указателем ссылок;
• Current Contents ConnectSM - БД с указателем оглавлений текущих номеров ведущих научных журналов и актуального содержания 7 тыс. наиболее авторитетных научных сайтов (БД по сути является электронным бюллетенем сигнальной информации)3;
• CABI: CAB Abstracts and Global Health® - БД по рефератам в области сельского хозяйства и здоровья человека;
• FSTA® - Food Science and Technology Abstracts) - БД по рефератам в области пищевых технологий;
• Inspec®: INSPEC-Physics (Physics Abstracts) - БД по рефератам в области физики и INSPEC-Electronics&Computing - БД по рефератам в области электроники и вычислительной техники;
• MEDLINE® - БД по рефератам в области медицины; БД также содержит полные тексты части источников;
• Zoological Records® - БД по рефератам в области зоологии.
Базы данных системы Web of Science содержат информацию на английском языке. Формируются за счет библиографических данных по источникам информации, а также рефератов или аннотаций источников, в некоторых случаях - полных текстов источников (например, в MEDLINE). Библиографическая информация включает: название источника, автора (авторов), название издания, в котором опубликована работа, год публикации, в большинстве случаев - ISSN. Особо важное место в Web of Science отводится библиографическим ссылкам.
В базах данных WoS накапливаются специальные данные, получаемые в результате поисковой индексации информационного материала. Ежегодно WoS индексирует около 1 млрд ссылок из более чем 200 млн рецензированных источников научной информации. По этим показателям система WoS не имеет равных в мире [2]. Роботы-индексировщики проходят по первичным источникам научной информации, отбирают и индексируют необходимые данные. На этой основе формируются специальные указатели (индексы) с соответствующим расположением проиндексированных позиций. Большинство индексов в системе Web of Science представляют собой указатели библиографических ссылок (индексы цитирования).
3 Указатель Current Contents Connect создан директором американского Института научной информации ISI Ю. Гарфилдом. Впервые был опубликован в 1988 г.
Указатели библиографических ссылок
Указатели библиографических ссылок позволяют формировать по запросам пользователей списки ссылок на задаваемые научные журналы, книги, материалы конференций, конкретные научные статьи, авторов, научные темы/идеи. С учетом количества ссылок и некоторых производных показателей определяются научная востребованность авторов, рейтинг научных журналов, актуальность научных идей или направлений исследований, для ученых появляется возможность расширить свои знания за счет работ по интересующей их проблематике, которые указатель ссылок позволяет выявлять и по которым в информационной системе формируется соответствующий перечень [3]. Указатели ссылок также позволяют определять публикационную активность конкретных авторов или научных коллективов. Повышенная концентрация ссылок может свидетельствовать о появлении новых перспективных научных направлений.
Состав основной коллекция Web of Science Core Collection: виды указателей
Основная коллекция системы Web of Science - Web of Science Core Collection (WoS CC) - по состоянию на конец 2017 года включает 8 различных по тематике указателей библиографических ссылок (индексов цитирования) и 2 указателя источников научной информации (по химии) (см. табл.). Из 8-ми указателей ссылок - 7 базовых и один вспомогательный. Поиск данных для большинства указателей производится по ведущим рецензируемым научным журналам мира, отобранным экспертами WoS CC, а также привлеченными научными экспертами. Источники информации, которые отбираются в коллекцию WoS CC, должны быть представлены в электронном виде на английском языке.
Таблица
Указатели основной коллекции системы Web of Science
Web of Science Core Collection
Базовые указатели Science Citation Index - Expanded (SCI-E)
Social Sciences Citation Index (SSCI)
Arts and Humanities Citation Index (AHCI)
Book Citation Index -Science® (BKCI-S)
Book Citation Index Social Sciences & Humanities® (BKCI-SSH)
Conference Proceedings Citation Index - Science (CPCI-S)
Conference Proceedings Citation Index - Social Sciences & Humanities (CPCI-SSH)
Указатель по развивающимся источникам Emerging Sources Citation Index
Указатели по химии Index Chemicus
Current Chemical Reactions
Данные для первых трех указателей сгруппированы по основным научным областям и направлениям деятельности: по естественным и прикладным наукам -Science Citation Index-Expanded (SCI-E) [4], общественным наукам - Social Sciences Citation Index (SSCI), гуманитарным наукам и искусству - Arts and Humanities Citation Index (AHCI). Что касается указателя SCI-E (Expanded - «Расширенный»), то следует отметить, что в 1961 году первоначально был сформирован Указатель по естественным наукам - SCI, а затем тематический охват этого указателя был расширен за счет прикладных наук.
Указатели ссылок в коллекции WoS CC формируются не только по журналам, но и по научным книгам и материалам научных конференций. По книгам формируются два указателя ссылок: Указатель для книг по естественным и прикладным наукам - Book Citation Index-Science® (BKCI-S) и Указатель для книг по общественным и гуманитарным наукам - Book Citation Index Social Sciences & Humanities® (BKCI-SSH).
По материалам научных конференций также формируются два указателя ссылок: Указатель по конференциям в области естественных и прикладных наук -Conference Proceedings Citation Index-Science (CPCI-S) и Указатель по конференциям в области общественных и гуманитарных наук - Conference Proceedings Citation Index - Social Sciences & Humanities (CPCI-SSH).
Еще для одного указателя в коллекции WoS CC - Index Chemicus (Указатель по химическим соединениям, включающий библиографическую информацию) -поиск производится по более чем 100 ведущим научным журналам по органической химии. Пополнение другого указателя - по химическим реакциям Current Chemical Reactions (одно- и многоступенчатые методы синтезирования химических соединений) - осуществляется по вышеназванным журналам, а также по патентам.
Emerging Sources Citation Index
Указатель ссылок по развивающимся источникам Emerging Sources Citation Index (ESCI), в отличие от семи базовых указателей ссылок, формируется на основе данных из потенциально наиболее перспективных появляющихся (emerging) или развивающихся научных журналов, которые пока не достигли позиций признанных лидеров в своих областях, но являются региональными лидерами. Этот указатель функционирует с 2015 года. По состоянию на конец 2016 года в нем было проиндексировано более 3 тыс. журналов (64 из них российские) [5]. Содержание указателя ESCI доступно для пользователей семи базовых указателей коллекции Web of Science Core Collection. Индексация журналов в ESCI производится на основе тех же принципов, что и в базовых указателях, включая полный охват статей (cover-to-cover indexing), индексацию ссылок, содержательных категорий исследований (subject category assignment), данных по авторам. Для журналов, проиндексированных в ESCI, импакт-фактор не определяется.
Включение в индекс ESCI обеспечивает более высокую узнаваемость развивающегося издания в научном мире, дает возможность этому изданию получить достаточные цитирования, повышает его шансы на включение в базовые указате-
ли Web of Science Core Collection и обеспечивает больше прозрачности процессу отбора изданий в базовые указатели.
Указатель ESCI исполняет роль своеобразной шлюзовой камеры для базовых указателей WoS CC. Если журнал, находясь в ESCI, получает достаточное, по мнению экспертов WoS CC, количество ссылок, то через определенное время он переводится в соответствующий по тематике базовый указатель. Если в базовом указателе журнал опускается по количеству ссылок ниже принятого уровня, то его переводят в ESCI. Если количество ссылок на журнал продолжает снижаться, то его убирают из коллекции WoS CC.
Аналитические инструменты в системе Web of Science
Для каждой публикации в WoS CC можно узнать, на какие источники ссылается публикация и, наоборот, какие источники ссылаются на нее. При решении комплексных задач с большим объемом данных это сделать достаточно сложно, поэтому в рамках WoS разработаны специальные аналитические инструменты, которые работают на ее платформе. Эти инструменты отбирают из WoS CC данные по различным информационным источникам, включая журналы, организации, ученых, страны и т. д. К основным среди этих инструментов относятся [6]:
• Journal Citation Reports (JCR);
• Essential Science Indicators (ESI);
• InCites.
JCR представляет собой инструмент для определения библиометрических показателей журналов как целого: позволяет получить данные о количестве выходящих в журнале статей, числе полученных журналом ссылок, хронологическом распределении сделанных и полученных ссылок, импакт-факторе журнала и др.
ESI - инструмент для определения библиометрических показателей по авторам, организациям, журналам, странам: готовит данные о количестве вышедших у автора/организации/страны/журнала статей и количестве ссылок на них. По журналам информация в ESI менее подробная, чем в JCR [7]. Следует отметить, что ESI оценивает только те организации и авторов, которые попали в 1% наиболее цитируемых хотя бы в одной научной дисциплине, и только те журналы и страны, которые попали в 50% наиболее цитируемых хотя бы в одной научной дисциплине.
Помимо этого в ESI есть специальный раздел с подгруппами:
- по мировым высокоцитируемым статьям (вошедшим в 1% самых цитируемых из тех, которые вышли в заданном году в заданной научной области);
- по среднемировым библиометрическим показателям («baselines»);
- по перспективным научным изысканиям («фронтам»), которые определяются в рамках специальной библиометрической процедуры.
InCites - инструмент, позволяющий производить детальную оценку целого ряда наукометрических показателей организаций, отдельных ученых, стран: дает возможность отслеживать показатель цитируемости в динамике и относительно среднемирового уровня.
В целом, информационно-поисковая система Web of Science является достаточно действенным инструментом, обеспечивающим возможность проведения
наукометрического анализа в виде комплекса процедур библиометрической оценки научной деятельности, которые включают определение результативности научной деятельности конкретных авторов, научных коллективов, институтов, стран. Для достижения полноты в оценке результатов, по твердому убеждению автора, наукометрический анализ, основанный на результирующих данных системы Web of Science или других систем индексации и цитирования научной информации, необходимо проводить параллельно с оценкой научной деятельности группами экспертов с использованием естественного интеллекта и опыта авторитетных представителей научных сообществ.
1. Гиляревский Р.С., Мельникова Е.В. Институт научной информации США: идеология, преобразования, продукты // Научно-техническая информация. 2017. Сер. 1. № 10.
2. Официальный сайт CBC News - Business. Thomson Reuters sells intellectual property. The Canadian Press Posted: Jul 11, 2016. URL: http://www.cbc.ca/news/business/thom-son-reuters-onex-1.3673546.
3. Гиляревский Р.С. Использование «индексов цитирования» для оценки результативности научной деятельности // Информационные технологии в профессиональном образовании, научной и библиотечно-библиографической деятельности: сб. науч. статей. СПб.: СПбГУКИ, 2008. С. 116-121.
4. Fingerman S. Web of Science and Scopus: Current Features and Capabilities // Gibson Library & Information Center. Johns Hopkins University. Electronic Resources Reviews. Laurel (Maryland), USA, 2006.
5. Маркусова В.А. Библиометрические характеристики российской науки в новом указателе Emerging Sources Citation Index // Научно-техническая информация. Сер. 2. 2016. № 11. С. 24-29.
6. Мельникова Е.В. Юджин Гарфилд и система индексации и цитирования Web of Science // Библиосфера. Новосибирск: ГПНТБ СО РАН. 2017. № 3, раздел Мастер-класс.
7. Писляков В.В. Библиометрические индикаторы в ресурсах Thompson Reuters // Руководство по наукометрии: индикаторы развития науки и технологии: монография / под ред. М.А. Акоева. Екатеринбург: Изд-во Урал. ун-та, 2014. C. 75-109.
Транслитерация
1. Gilyarevskii R.S., Mel'nikova E.V. Institut nauchnoi informatsii SShA: ideologiya, preobrazovaniya, produkty, Nauchno-tekhnicheskaya informatsiya, 2017, ser. 1, No 10.
2. Ofitsial'nyi sait CBC News - Business. Thomson Reuters sells intellectual property. The Canadian Press Posted: Jul 11, 2016. URL: http://www.cbc.ca/news/business/thomson-reuters-onex-1.3673546.
3. Gilyarevskii R.S. Ispol'zovanie «indeksov tsitirovaniya» dlya otsenki rezul'tativnosti nauchnoi deyatel'nosti, Informatsionnye tekhnologii v professional'nom obrazovanii, nauchnoi i bibliotechno-bibliograficheskoi deyatel'nosti: sb. nauchnykh statei, SPb: SPbGUKI, 2008, pp. 116-121.
4. Fingerman S. Web of Science and Scopus: Current Features and Capabilities, Gibson Library & Information Center. Johns Hopkins University, Electronic Resources Reviews, Laurel (Maryland), USA, 2006.
5. Markusova V.A. Bibliometricheskie kharakteristiki rossiiskoi nauki v novom ukazatele Emerging Sources Citation Index, Nauchno-tekhnicheskaya informatsiya, 2016, ser. 2, No 11, pp. 24-29.
6. Mel'nikova E.V. Yudzhin Garfild i sistema indeksatsii i tsitirovaniya Web of Science, Bibliosfera, Novosibirsk: GPNTB SO RAN, 2017, No 3, razdel Master-klass.
7. Pislyakov V.V. Bibliometricheskie indikatory v resursakh Thompson Reuters, Rukovodstvo po naukometrii: indikatory razvitiya nauki i tekhnologii: monografiya pod red. M. A. Akoeva, Ekaterinburg: Izd-vo Ural. un-ta. 2014, pp. 75-109.
© Е.В. Мельникова, 2018
для цитирования: Мельникова Е.В. Современное состояние системы индексации и цитирования Web of Science: базы данных, индексы // Территория новых возможностей. Вестник Владивостокского государственного университета экономики и сервиса. 2018. Т. 10. N° 1. С. 93-101. For citation: Melnikova E.V. Current Situation within Citation-Indexing System Web of Science: Data Bases, Indexes, Тhe Territory of New Opportunities. The Herald of Vladivostok State University of Economics and Service, 2018, Vol. 10, No 1, pp. 93-101. DOI dx.doi.org/10.24866/VVSU/2073-3984/2018-1/93-101 Дата поступления: 3.11.2017.