УДК 061.6:025.4.036
Н. С. Редькина 1, И. В. Зибарева 2
1 Государственная публичная научно-техническая библиотека СО РАН ул. Восход, 15, Новосибирск, 630200, Россия
2 Новосибирский институт органической химии им. Н. Н. Ворожцова СО РАН пр. Акад. Лаврентьева, 9, Новосибирск, 630090, Россия
БИБЛИОМЕТРИЧЕСКОЕ ИЗУЧЕНИЕ РОССИЙСКИХ ХИМИЧЕСКИХ ИССЛЕДОВАНИЙ: МОДЕЛИ И МЕТОДЫ *
На представительных примерах, включающих отдельных ученых, исследовательские институты и научные журналы, рассмотрено использование библиометрических моделей и методов в изучении российских химических исследований, в том числе в оценке научной результативности. Разработанная методология применена в предварительном изучении российских химических исследований начала XXI в. (2001-2005 гг.).
Ключевые слова: библиометрические модели и методы, базы данных, международная научно-техническая сеть STN International, российские химические исследования.
Одна из актуальных задач отечественной науки - существенное повышение эффективности выполняемых исследований и их воздействия на мировой научный прогресс. Ее решение невозможно без системного анализа современного состояния, тенденций и перспектив развития - как тех или иных научных дисциплин, так и национального научного потенциала в целом. Предметная база такого анализа - систематизированная библиометрическая информация [Wormell, 2000, P. 77-92]. Она основывается на научных документах (публикациях) и обычно представляется в виде т. н. библиометрических индикаторов. К ним относятся число научных продуктов (статей, книг, патентов, отчетов); число ссылок на них; и некоторые другие количественные показатели за определенный период времени в абсолютном и (или) удельном выражении [Хайтун, 1989; 2005]. С помощью библиометрических индикаторов может быть количественно охарактеризована, в том числе в динамике, научная продуктивность на уровне отдельных ученых, исследовательских организаций, городов, регионов или стран, и ее воздействие на прогресс науки. Возможны различные оценочные процедуры, позволяющие определить области развития или упадка исследований. Таким образом, библиометрическая информация крайне важна для выработки и реализации успешной научной политики.
В настоящее время получение достоверной библиометрической информации требует проведения специальных исследований, что связано с быстрым развитием науки, ежегодно приводящим к появлению огромного количества новых научных документов (см., например, CAS Statistical Summary 1907-2007 в случае химии). Такие исследования, как правило, выполняются с использованием библиографических баз данных (БД) научно-технической информации, обеспечивающих оперативный многопараметровый анализ больших информационных массивов. В контексте российской науки необходимо отметить, что использование библиографической информации, содержащейся в глобальных научно-технических БД, как правило, англоязычных, связано как с общими, так и с частными проблемами. Общие проблемы состоят в том, что большинство БД создавалось преимущественно для упорядоченного хранения и поиска научно-технической информации, но отнюдь не для использования в библиометрических исследованиях, в контексте которых их стандартизация не всегда достаточна. Специальные проблемы заключаются в том, что российская наука представлена в ряде таких БД далеко не полностью и, как можно ожидать с учетом языковых различий, с заведомыми ошибками. Оценка пригодности той или иной международной БД для корректной оценки российских научных исследований - новая и нетривиальная библиометрическая за-
Работа выполнена при финансовой поддержке РФФИ (проект № 08-06-00337).
ISSN 1818-7900. Вестник НГ". Серия: Информационные технологии. 2008. Том 6, выпуск 3 © Н. С. Редькина, И. В. Зибарева, 2008
дача. При ее решении следует учитывать многочисленные и качественно разнородные факторы - ретроспективу БД, своевременность обновления информации, полноту охвата российских источников, учет цитирования публикаций, наличие встроенных программ для анализа больших объемов данных и т. д. [Зибарева, Бузник, 2007].
В случае отечественных естественных наук основным источником библиометрической информации служат библиографические БД ведущих российских и зарубежных провайдеров: ВИНИТИ («Химия», «Информатика», «Физика» и др.), Thomson Reuters (Science Citation Index, Journal Citation Reports, Current Contents, Web of Science, Essential Science Indicators), Chemical Abstracts Service (Chemical Abstracts), Elsevier (Scopus), и некоторые другие - т. е. национальные и международные БД.
После получения достоверной библиометрической информации ее дальнейший всесторонний анализ возможен только на основе широкой системы индикаторов, учитывающих специфику изучаемых научных направлений. Целесообразность применения того или иного набора индикаторов определяется целью библиометрического исследования, характером изучаемой проблемы, степенью ее разработанности в литературе. Набор индикаторов также зависит от информационных ресурсов, которыми располагает проводящий библиометрическое исследование коллектив.
Помимо быстрого роста документопотока, другой важной проблемой в библиометрическом изучении современной науки является ее сложная структура. Можно отметить множественность иерархических уровней (отдельный ученый, исследовательская организация и т. д.); множественность существующих (продолжающих дифференцироваться и интегрироваться) и появление новых научных дисциплин; различную региональную и национальную принадлежность и т. д.
В этих условиях для изучения результативности науки в общем случае может быть использована информационная модель (см. рисунок ниже), базирующаяся на различных документопотоках с их специфических характеристиках [Редькина, 2004].
Модель является многоуровневой и обеспечивает получение количественных данных о состоянии и тенденциях развития фундаментальных научных направлений. Она допускает как разовые библиометрические исследования, так и непрерывный библиометрический мониторинг развития науки. В ходе исследования в модель могут быть внесены частные коррективы - поскольку система изучения результатов научной деятельности содержит множество элементов, то и модель должна воспроизводить все подлежащие исследованию отношения и связи внутри объекта, касающиеся взаимоотношений всех элементов или выделяемых групп элементов. Важно, что модель приспособлена для решения задач различного уровня. Соответственно с уровнями (макро, мезо, микро) с помощью классифицированных методов выбираются оптимальные инструменты проведения анализа, определяется необходимое количество БД, изучаются их поисковые возможности и параметры.
В настоящей работе данная модель была использована при изучении представительных примеров, относящихся к отечественной химической науке: отдельных ученых, исследовательские институты и научные журналы. В соответствии с информационной моделью были установлены последовательные этапы изучения результативности: выбран объект (вторичный и цитируемый потоки), определены уровни (микро-, мезо-, макро) и база исследования, произведена ее оценка, выбраны методы анализа (библиометрические методы анализа вторичных источников информации и цитирования), осуществлен поиск и обработаны результаты, представленные в наглядном виде. На основании рассмотренного материала были сформулированы в обобщенном виде выводы о развитии научного направления; изучен вклад конкретного научного учреждения и ученых на локальном, региональном и международном уровне. Рассмотрим более детально некоторые аспекты исследования.
При библиометрическом анализе российской химической науки естественно, казалось бы, применять в первую очередь национальную БД «Химия» производства ВИНИТИ. Однако отсутствие встроенных компьютерных программ статистической обработки данных существенно затрудняет использование этой БД при работе с большими информационными массивами. Кроме того, БД «Химия» (во всяком случае, вариант, доступный авторам через ГПНТБ СО РАН) обновляется не столь быстро, как некоторые международные химические БД - так, БД CAPlus (вариант БД Chemical Abstracts) обновляется ежедневно. Поэтому в качестве ис-
точников библиометрической информации использованы как международные, так и локальные БД. Эта методология может быть легко применена к библиометрическим исследованиям любой естественнонаучной направленности.
Химия является одной из движущих сил современного научно-технического прогресса, особенно в таких областях как биомедицина (науки о жизни) и функциональные материалы (в том числе наноматериалы). Основные международные БД различных провайдеров по химии и родственным дисциплинам входят в состав глобальной информационной сети Scientific and Technical Network (STN) International.
Рис. 1. Информационная модель изучения результативности науки
Научно-техническая сеть STN International предоставляет онлайновый доступ более чем к 200 профессиональным БД, включающим Chemical Abstracts (CA; химические науки), Science Citation Index (SCISearch, далее SCI; естественные науки), Inspec (физические науки), Biosis (биологические науки), Georef (геологические науки) и многие другие. Важно, что многие новые возможности этих БД, появляющиеся в последнее время, доступны только через сеть. Например, БД CA и ее вариант CAPlus с 1996 г. учитывают цитирование публикаций, что позволяет использовать их для получения соответствующих библиометрических индикаторов наряду с БД SCI - традиционным источником данных по цитированию в большинстве библиометрических исследований. Командный язык сети STN Messenger позволяет проводить поиск информации одновременно в нескольких БД, создавая возможность всестороннего изучения объектов. Он также обеспечивает многопараметровый онлайновый анализ больших объемов статистических данных, позволяя, в частности, оперативно получать достоверные значения библиометрических индикаторов для отдельных ученых, исследовательских институтов и научных журналов, в том числе на больших периодах времени. Все эти возможности делают БД сети STN чрезвычайно эффективными для библиометрического изучения различных аспектов научной деятельности.
С использованием международных БД STN International, национальной БД «Химия» и некоторых локальных БД, в соответствии с представленной выше моделью (см. рис. 1), проведен библиометрический анализ некоторых аспектов российских химических исследований, связанных с отдельными учеными [Зибарева, 2007; Бузник, Зибарева, 2006а; Бузник и др., 2007. С. 40-51; Зибарева, 2005. С. 12-19], институтами [Бузник и др., 2005; Бузник, Зубарева, 2006б] и журналами [Зибарева, Дерендяев, 2004; Бузник и др., 2004; Зубарева, 2006б; Зибарева и др., 2008].
Методологическая новизна анализа связана как с совместным использованием БД CA и БД SCI в библиометрических исследованиях российской химической науки, так и с применением БД CA для изучения цитирования российских химических публикаций.
Изученные ученые включали академиков РАН Н. Н. Ворожцова, В. А. Коптюга (оба - СО РАН, Новосибирск) и Ю. А. Золотова (РАН и МГУ, Москва), и проф. А. Г. Стромберга (ТПУ, Томск) - создателей признанных научных школ. Хронологические рамки библиометрического анализа 1920-2006 гг. Исследование созданных этими химиками научных школ, в том числе соответствующих публикаций и цитирования, без использования онлайновых БД, в первую очередь БД SCI, были бы, скорее всего, невозможны. При отборе публикаций очень полезной оказалась БД CA с ретроспективой, доходящей до 1907 г. - Ворожцов и Стромберг начали свою научную деятельность в 20-х и 30-х гг., а Золотов и Коптюг - в 50-х гг. прошлого века. Для контроля полноты отбора использовались локальные БД - официальные списки трудов этих ученых. Анализ авторов цитируемых и цитирующих публикаций позволил охарактеризовать масштаб и влияние соответствующих научных школ. Совместное применение БД СА и БД SCI при изучении цитирования показало, что, начиная с 1974 г. (ретроспектива БД SCI в сети STN), каждая работа Н. Н. Ворожцова, В. А. Коптюга, Ю. А. Золотова и А. Г. Стромберга процитирована в среднем 3,4, 4,0, 6,0 и 2,2 раза, соответственно (самоцитирование исключено). Для отечественных химиков это весьма достойные показатели (ср., например, с данными, представленными в [Грановский, 1980. С. 101-116]). При этом необходимо иметь в виду, что использованные БД позволили изучить цитирование публикаций Н. Н. Ворожцова лишь со времени фактического завершения его почти 50-летней научной карьеры. Тем более важно, что согласно БД СА и БД SCI в 1974-2006 гг. цитирование публикаций Н. Н. Ворожцова продолжало монотонно возрастать. Такая тенденция - лучшее свидетельство научной значимости ученого.
Изученные исследовательские организации включали химические институты (ХИ) Новосибирского научного центра (ННЦ) СО РАН: Институт катализа, Институт неорганической химии, Институт химической кинетики и катализа, Институт химии твердого тела, Международный томографический центр, Новосибирский институт органической химии. Хронологические рамки исследования 1995-2004 гг. При отборе публикаций институтов из БД CA и БД SCI для контроля на полноту использовалась локальная БД - сведения Объединенного ученого совета по химическим наукам СО РАН, основанные на ежегодных отчетах институтов. При совместном использовании БД CA и БД SCI для институтов впервые вычислены
величины ряда библиометрических индикаторов, характеризующих результативность, выполненных в них исследований, в частности, индексы цитирования публикаций в этот период времени, число публикаций на одного научного сотрудника в год, и некоторые другие. Показано, что показатели ХИ ННЦ СО РАН выше соответствующих общероссийских показателей, представленных в справочнике Essential Science Indicators (ESI) и основанных на сведениях только из БД SCI. На примере изученных институтов также показано, что там, где возможны корректные сравнения, количественные данные БД SCI и БД CA по цитированию согласуются. Вместе с тем, из-за различной номенклатуры цитирующих источников, предпочтительно совместное применение этих БД, позволяющее получить более полную и объективную картину цитирования.
Изученные химические журналы включали Журнал структурной химии (ЖСХ), Химия в интересах устойчивого развития (ХИУР) (оба - СО РАН, Новосибирск), Химическая технология (ХТ) и Успехи химии (УХ) (оба - РАН, Москва). Хронологические рамки исследования 1932 - 2006 гг. При отборе публикаций журналов из БД CA и БД SCI для контроля на полноту использовались локальные БД - сведения их редакций, и, в ряде случаев, национальная БД «РЖ Химия». С использованием БД CA и БД SCI для журналов независимо от БД Journal Citation Reports (JCR) оценены импакт-факторы (ИФ), причем для ХИУР и ХТ впервые, так как БД JCR они не учитываются. Полученные с использованием БД СА и БД SCI величины имеют близкие величины, причем для ЖСХ и УХ они несколько превышают стандартный ИФ из БД JCR за соответствующий год. В частности, истинный рейтинг УХ среди химических журналов выше, чем приведенный в справочнике ESI, так как в ESI учтено цитирование только оригинальной (русской) версии журнала, и не учтено цитирование переводной (английской) версии. По результатам анализа был сделан ряд рекомендаций, способствующих повышению ИФ журналов и их влияния на профессиональное сообщество.
В целом, из изученных примеров отдельных ученых, институтов РАН и научных журналов показано, что в международной БД CA адекватно представлены российские химические публикации и, начиная с 1996 г., их цитирование. Это позволяет использовать БД СА для библиометрического изучения российской химической науки с ретроспективой вплоть до начала XX в. [Зибарева, Круковская, 2007]. Совместное использование БД CA и БД SCI, имеющих различную номенклатуру первичных и цитирующих источников, позволяет провести практически исчерпывающий отбор российских химических публикаций в рецензирующих журналах для последующего библиометрического анализа и получить объективную картину их цитирования.
В настоящее время выработанная методология, основанная на совместном применении БД SCI и БД СА, используется в более масштабных целях - в библиометрическом изучении состояния, тенденций и динамики развития российских химических исследований начала XXI в. (2001-2005 гг.), поддержанном РФФИ. Наряду с экспертными оценками, достоверные значения библиометрических индикаторов необходимы здесь для объективной количественной оценки значимости исследований, в первую очередь фундаментальных, тенденций и динамики их развития, идентификации ведущих исследовательских групп и институтов. Результаты библиометрического анализа могут быть использованы для выработки конкретных рекомендаций, направленных на повышение эффективности химических исследований, рост их вклада в инновационное развитие страны. В целом изучение охватывает научноисследовательскую активность в области химических наук российских академических и отраслевых институтов, химических и химико-технологических факультетов высших учебных заведений (университетов), оцениваемую по величинам таких библиометрических индикаторов как количество публикаций и ссылок на них, с использованием, где необходимо (целесообразно), ИФ соответствующих журналов. В современной научной литературе достоверные данные такого рода отсутствуют.
В качестве примера приведем справочник ESI, где в области химии в 2001-2005 гг. зарегистрировано 28 167 российских публикаций, получивших 39770 цитирований, что приводит к индексу цитирования 1,41. Справочник ESI основан на БД SCI. Между тем наш поиск в БД SCI обнаружил для того же периода 46 853 российских публикации, получивших 76 565 ссылок (см. таблицу ниже), приводящих к индексу цитирования 1,63. В БД CA за тот же период для России зарегистрировано ~ 132 900 статей и ~ 33 000 патентов в области химии и смеж-
ных наук. Расхождения между БД SCI и БД СА связаны с тем, что первая реферирует лишь так называемые ведущие научные журналы (core journals), в число которых входит мало российских изданий, и не учитывает патенты, столь значимые для химии. Расхождение результата нашего поиска в БД SCI с показателями, представленными в справочнике ESI, требует детального анализа. Сейчас отметим лишь, что это не первый пример обнаруженных нами неточностей в справочнике ESI [Зибарева и др., 2008].
Российские не патентные химические публикации 2001-2005 гг. и их цитирование в тот же период. БД CA и БД SCI
Год Публикации Их цитирование Публикации Их цитирование
БД CA БД CA БД SCI БД SCI БД CA БД SCI
2001 27 520 42 231 37 436 9 717 28 824 28 361
2002 27 659 34 568 31 597 9 452 23 026 22 604
2003 26 479 23 117 20 903 9 231 15 783 15 866
2004 25 750 12 249 10 349 9 380 8 092 8 174
2005 25 499 2 337 1 819 9 071 1 575 1 550
Среднее Всего 26 581 132 909 114 507 102 114 9 370 46 853 77 305 76565
Наряду с интегральными показателями полезны и дифференциальные. Интересно отметить, что, по предварительным данным, в 5 тематических разделах БД СА российские публикации 2001-2005 гг. составляют: прикладная химия (APP) - 5,56 %; биохимия (BIO) - 2,04; высокомолекулярная химия (MAC) - 3.24; органическая химия (ORG) - 4,53; физическая, неорганическая и аналитическая химия (PHY) - 5,06 % от мирового документопотока по химии. При разделении документопотока на не патентную и патентную (в скобках) литературу эти показатели составляют 5,60 (5,48), 1,57(6,66), 4,28 (2,09), 5,11 (2,07) и 6,14 (1,21) % соответственно. Обращает на себя внимание относительно высокая патентная активность (обычно отражающая инновационный потенциал исследований) российских ученых в области высокомолекулярной и органической химии и, особенно, биохимии: число патентов по биохимии - самый высокий удельный показатель отечественных исследований в области химических наук в начале XXI в.
Следует отметить, что полученный при совместном использовании международных, национальных и локальных БД эмпирический материал (величины ряда библиометрических индикаторов) может служить информационной базой не только для уже отмечавшейся оценки научного потенциала и принятия соответствующих административных и финансовых решений. Он также полезен для изучения истории российской химической науки, пропаганды ее достижений, сохранения для последующих поколений образов выдающихся российских ученых-химиков.
Данная методология, основанная на возможностях сети STN, может быть легко применена к библиометрическим исследованиям любой естественно-научной направленности. Так, в библиометрическом анализе физических наук можно использовать БД Inspec (охватывающую Physics Abstracts, Electrical and Electronics Abstracts, Computer and Control Abstracts, Business Automation); биологических и биомедицинских - БД Biosis (Biological Abstracts) и БД Medline (включающую Index Medicus, Index to Dental Literature, HealthSTAR, International Nursing Index); геологических - БД Georef (Geological Reference File) и т. д. Возможно также совместное использование БД SCI и (или) БД CA и тематических кластеров БД сети STN.
В целом можно заключить, что рационально подобранная совокупность информационных ресурсов, моделей, методов и программно-технических средств очень важна для библиометрического анализа научных исследований. Его наиболее ответственная и сложная часть -оценка научной результативности. Существующие здесь подходы можно условно подразделить на качественные и количественные. Качественные подходы - преимущественно экспертные оценки. В условиях быстрого роста научной информации экспертная оценка, одна-
ко, становится все более затруднительной, особенно в случае междисциплинарных исследований. В связи с этим более предпочтителен комбинированный подход - проведение экспертной оценки на основании материала, полученного в ходе формализованного библиометрического исследования. Это позволяет усилить значение объективных факторов и минимизировать субъективизм.
В любом случае системное библиометрическое рассмотрение российских исследований последнего времени, основанное на методически корректных и тщательно документированных процедурах, совершенно необходимо.
Список литературы
Wormell I. Databases as Analytical Tools // Encyclopedia of Library and Information Science. N. Y.: Marcel Dekker, 2000. Vol. 70. Suppl. 33. P. 77-92.
Бузник В. М., Зибарева И. В. Научные публикации академика В. А. Коптюга: библиометрический анализ // Химия в интересах устойчивого развития. 2006а. Т. 14, № 5. С. 535-542.
Бузник В. М., Зибарева И. В. Библиометрический анализ журнала «Химическая технология» // Химическая технология. 2006б. № 4. С. 40-45.
Бузник В. М., Зибарева И. В., Пиоттух-Пелецкий В. Н. и др. Библиометрический анализ «Журнала структурной химии» // Журнал структурной химии. 2004. Т. 45, № 6. С. 1142-1153.
Бузник В. М., Зибарева И. В., Сорокин Н. И. и др. Наукометрические показатели химических институтов Новосибирского научного центра СО РАН в 1995-2003 гг. по данным Science Citation Index и Chemical Abstracts // Химия в интересах устойчивого развития. 2005. Т. 13, № 5. С. 677-692.
Грановский Ю. В. Наукометрический анализ информационных потоков в химии. М.: Наука, 1980.
Зибарева И. В. Томская электрохимическая школа А. Г. Стромберга: наукометрический взгляд // Стромберг Армин Генрихович (1910-2004): библиографический указатель трудов. Томск: Изд-во Томск. политехн. ун-та, 2005. С. 12-19.
Зибарева И. В., Бузник В. М. Chemical Abstracts в сети STN International: база данных для библиометрических исследований // Российский химический журнал. 2007. Т. 41, № 3. С.166-171.
Зибарева И. В., Дерендяев Б. Г. «Химия в интересах устойчивого развития»: библиометрический портрет // Химия в интересах устойчивого развития. 2004. Т. 12, № 1. С. 121-128.
Зибарева И. В., Круковская Н. В. Опыт использования библиографических БД для наукометрических исследований российской химической науки // Образовательные технологии и общество. 2007, № 1. С. 297-303.
Зибарева И. В., Писляков В. В., Теплова Т. Н. и др. Библиометрический анализ журнала «Успехи химии» // Вестник РАН. 2008. Т. 785, № 6. С. 490-499.
Редькина Н. С. Изучение результативности региональных научных исследований библиометрическими методами (на примере геологических наук): Дис. ... канд. пед. наук / Гос. пуб-л. науч.-техн. б-ка Сиб. отд-ния Рос. акад. наук. Новосибирск, 2004. 221 с.
Хайтун С. Д. Количественный анализ социальных явлений. Проблемы и перспективы. М.: КомКнига, 2005. 280 с.
Хайтун С. Д. Проблемы количественного анализа науки. М.: Наука, 1989. 280 с.
Список ресурсов в сети Интернет
(на 20.10.2008) 1
1. CA Database Summary Sheet: http://www.stn-international.de/stndatabases/sum_sheet/ CA.pdf
2. CAPlus Database Summary Sheet: http://www.stn-international.de/ stndatabases/sum_sheet/ CAPLUS.pdf
3. CAS Statistical Summary 1907-2007: www.cas.org/ASSETS/836E3804111B49BFA28B 95BD1B40CD0F/casstats.pdf
4. Essential Science Indicators: http://esi.isiknowledge.com/home.cgi
5. Journal Citation Reports: http://admin-apps.isiknowledge.com/JCR/JCR
6. SciSearch Database Summary Sheet: http://www.stn-international.de/stndatabases/
sum_sheet/SciSearch.pdf
7. STN International: http://www.stn-international.de
Материал поступил в редколлегию 28.10.2008
N. S. Redkina
Bibliometric Study on Russian Chemical Research:
Models and Methods
With representative examples including selected scientists, institutes and journals, application of bibliometric models and methods to some aspects of Russian chemical research has been studied. A generalized multilevel information model has been suggested for investigation of scientific productivity. The methodology elaborated has been used in preliminary study of Russian chemical research in the beginning of XXI century (2001-2005).
Keywords: bibliometric models and methods; databases; Scientific and Technical Network International; Russian chemical research.