Научная статья на тему 'Особенности поиска информации по нанотехнологиям и наноматериалам в научно-технических базах данных'

Особенности поиска информации по нанотехнологиям и наноматериалам в научно-технических базах данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
398
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАУЧНО-ТЕХНИЧЕСКАЯ ИНФОРМАЦИЯ / НАНОТЕХНОЛОГИИ / НАНОМАТЕРИАЛЫ / БАЗЫ ДАННЫХ / ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ / SCIENTIFIC AND TECHNICAL INFORMATION / NANOTECHNOLOGIES / NANOMATERIALS / DATABASES / INFORMATION RETRIEVAL SYSTEMS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зибарева Инна Владимировна

Рассмотрены особенности поиска информации по нанотехнологиям и наноматериалам (НТМ) в научно-технических электронных информационных ресурсах. Проанализированы стратегии, используемые для поиска и отбора публикаций по НТМ с учетом специфики как этой междисциплинарной области, так и БД и информационно-поисковых систем (ИПС): свободный поиск по релевантным терминам; поиск с использованием рубрик, тезаурусов, контролируемой терминологии БД, в том числе для веществ и материалов; поиск по патентным классификациям. Охарактеризованы основные БД и ИПС – источники информации по НТМ.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Зибарева Инна Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Peculiarities of searching information on nanotechnologies and nanomaterials in scientific and technical databases

Pecularities of information retrieval on nanotechnologies and nanomaterials (NTM) in scientific and technical electronic information resources are considered. Strategies used for search and selection of publications on NTM are discussed with the emphasis on specific features of both this interdisciplinary area and relevant databases (DB) and information retrieval systems (IRSs): free search with relevant terms; search with rubrics, thesauri and controlled therminology including those for substancies and materials; search with patent classifications. Most important DB and IRS regarded to NTM are characterized.

Текст научной работы на тему «Особенности поиска информации по нанотехнологиям и наноматериалам в научно-технических базах данных»

Окончание прил.

Название университета (страна) Электронный адрес

University of Copenhagen (Дания) http://kubis.ku.dk/forskerservice/english/services/bibliometricservices

University College Dublin (Ирландия) http://www.ucd.ie/library/supporting_you/research support/bibliometrics

Queen's University Belfast (Ирландия) http://www.qub.ac.uk/directorates/InformationServices/TheLibrary/ LibraryResearchSkills/Bibliometrics

University of Bergen (Норвегия) http://www.uib.no/ub/en/about-the-library/projects/bibliometrics-university-of-bergen

Stockholm University (Швеция) http://www.sub.su.se/publish/bibliometrics .aspx

KTH Royal Institute of Technology (Швеция) http://www.kth.se/en/kthb/publicering/forskare/bibliometri-1.267249

Karolinska Institute (Швеция) https://bibliometrics.ki.se

Lund University (Швеция) http://www.lub.lu.se/en/about-lub/organisation/lund-university-libraries-head-office/bibliometrics.html

Linkoping University (Швеция) http://www.bibl.liu.se/bibliometri?l=en

Lulea University of Technology (Швеция) http://www.ltu.se/ltu/lib/Publicering/Bibliometri?l=en

University of Gothenburg (Швеция) http://www.ub.gu.se/info/bibliometri

Jonkoping University (Швеция) http://hj.se/bibl/en/publishing/bibliometrics.html

Umea University (Швеция) http://www8.umu.se/inforsk

Swedish University of Agricultural Sciences (Швеция) http://www.slu.se/en/library/publish/eindex

Автор выражает признательность проф. Казанского (Приволжского) федерального университета А. М. Елизарову за ценные замечания, высказанные в ходе обсуждения результатов исследования и подготовки данной статьи.

УДК 002.513.5:62-022.53 ББК 78.653+30.6

ОСОБЕННОСТИ ПОИСКА ИНФОРМАЦИИ ПО НАНОТЕХНОЛОГИЯМ И НАНОМАТЕРИАЛАМ В НАУЧНО-ТЕХНИЧЕСКИХ БАЗАХ ДАННЫХ1

© И. В. Зибарева, 2012

Институт катализа им. Г. К. Борескова Сибирского отделения Российской академии наук 630090, г. Новосибирск, пр. Лаврентьева, 5 Новосибирский национальный исследовательский государственный университет 630090, г. Новосибирск, ул. Пирогова, 2

Рассмотрены особенности поиска информации по нанотехнологиям и наноматериалам (НТМ) в научно-технических электронных информационных ресурсах. Проанализированы стратегии, используемые для поиска и отбора публикаций по НТМ с учетом специфики как этой междисциплинарной области, так и БД и информационно-поисковых систем (ИПС): свободный поиск по релевантным терминам; поиск с использованием рубрик, тезаурусов, контролируемой терминологии БД, в том числе для веществ и материалов; поиск по патентным классификациям. Охарактеризованы основные БД и ИПС - источники информации по НТМ.

Ключевые слова: научно-техническая информация, нанотехнологии, наноматериалы, базы данных, информационно-поисковые системы.

1 Работа выполнена при финансовой поддержке СО РАН в рамках междисциплинарного интеграционного проекта № 37 «Наукометрическое исследование текущего состояния, тенденций, динамики и перспектив развития работ в области НТ в Сибирском отделении РАН».

Pecularities of information retrieval on nanotechnologies and nanomaterials (NTM) in scientific and technical electronic information resources are considered. Strategies used for search and selection of publications on NTM are discussed with the emphasis on specific features of both this interdisciplinary area and relevant databases (DB) and information retrieval systems (IRSs): free search with relevant terms; search with rubrics, thesauri and controlled therminology including those for substancies and materials; search with patent classifications. Most important DB and IRS regarded to NTM are characterized.

Key words: scientific and technical information, nanotechnologies, nanomaterials, databases, information retrieval systems.

В настоящее время во всех развитых странах значительное внимание уделяется исследованиям и разработкам в области НТМ. Под нанотехнологиями понимают совокупность методов и приемов, позволяющих создавать и (или) модифицировать объекты, включающие компоненты с размерами менее 100 нм хотя бы в одном измерении, и осуществлять их интеграцию в полноценно функционирующие системы большего масштаба [1]. Под наноматериалами - материалы, свойства которых определяются упорядоченной структурой их фрагментов с размером от 1 до 100 нм [2].

По данным библиометрического анализа, область НТМ, в связи с возлагаемыми на нее большими инновационными ожиданиями, развивается очень быстро - практически экспоненциально [3, 4]. В сочетании с мультидисциплинарным характером НТМ, сложной внутренней структурой, не устоявшейся терминологией и крайней диверсификацией источников (включающих патенты) это серьезно затрудняет поиск информации по НТМ -выбор БД и ИПС, формулирование поисковых запросов [4].

Для поиска информации по НТМ критически важны релевантность ресурсов области, полнота и ретроспектива охвата ими первичных источников различных типов, их функциональные возможности, связанные с обработкой и анализом результатов. Кроме того, работа с разными БД и ИПС предполагает использование разных поисковых стратегий.

При выборе ресурса для поиска информации по НТМ целесообразно учитывать ее общие и функциональные характеристики, среди которых:

• производитель, интерфейс, цена;

• полнота предметного и временного охвата данных и своевременность их обновления;

• характер индексирования; поисковые возможности;

• режимы просмотра, сохранения и анализа результатов;

• система информирования и поддержки пользователя.

Основная методологическая проблема поиска информации по НТМ - критерии отбора публикаций для анализа и их воплощение в поисковые запросы. Сам поиск возможен несколькими способами: свободный поиск по релевантным терминам; поиск с использованием систем индексируемой

терминологии; поиск по патентным классификациям и другие.

Простой способ, реализуемый во всех БД и ИПС и наиболее часто используемый в библиометриче-ских исследованиях - свободный поиск по релевантным НТМ терминам. Основная проблема -не устоявшаяся терминология области. В целом термины можно разделить на три группы: первая состоит из слов, начинающихся с префикса «нано» (nano) с исключением нерелевантных (например, наноампер и т. д.), две другие - из терминов, не содержащих этот префикс [5]. Вторую группу образуют термины, связанные исключительно с НТМ, тогда как третья включает термины, относящиеся к широкому кругу явлений, объектов и методов, которые важны для НТМ, но присущи не только ей.

Основной метод поиска информации по НТМ -лексический запрос, т. е. поиск с использованием набора ключевых слов, содержащих префикс «нано» [3]. Однако такой поиск обычно дает много «шума», например, нанометр, наносить, NaNO3 и т. д. Целесообразно использовать ключевые слова, не содержащие префикс «нано», но относящиеся к НТМ. В этом случае часто требуется помощь экспертов.

Подход, минимизирующий не всегда возможное участие экспертов - автоматическое итеративное получение поисковых ключевых слов. На первом этапе создается представительный набор публикаций по НТМ. На втором - из него отбирается набор ключевых слов, которые ранжируются по уровню их релевантности области на основе частоты встречаемости.

Возможен также гибридный подход - сочетание лексического запроса с цитированием. На первом этапе с помощью лексического запроса создается набор публикаций. Затем идентифицируются работы, наиболее часто цитируемые в этом наборе. Третий этап - составление итогового списка наиболее важных публикаций. Наконец, возможно использование в качестве объекта анализа ведущих журналов в области НТМ и отбор из них статей, релевантных запросу.

В связи со сложностью поиска информации по НТМ большое значение имеет ее индексирование в БД и ИПС. Заслуживают внимания такие ресурсы, как Web of Science (WoS), Inspec, Chemical Abstracts (CA), Российский индекс цитирования (РИНЦ) и ряд патентных БД. Относительно БД

РИНЦ следует сказать, что это ресурс с наибольшим охватом отечественных публикаций за последние годы.

В БД WoS журналы приписаны к категориям. С недавнего времени среди них есть очень полезная в контексте НТМ категория Nanoscience & Na-notechnology. Согласно БД Journal Citation Reports, в 2011 г. к ней было отнесено 66 журналов. Всего на текущий момент категории Nanoscience & Nano-technology релевантны почти 250 тыс. публикаций.

Наиболее значимые журналы, отнесенные к категории Nanoscience & Nanotechnology БД WoS:

Журнал Количество статей

Journal of Physical Chemistry C 16 511

Materials Science and Engineering A 15 356

Nanotechnology 9 454

Journal of Nanoscience and Nano-technology 8 010

Nano Letters 7 066

Advanced Materials 7 032

Journal of Vacuum Science Technology B 6 758

Scripta Materialia 6 577

Microelectronic Engineering 5 924

Physica E Low Dimensional Systems Nanostructures 5 397

В БД Inspec имеется специальный рубрикатор по НТМ и контролируемые термины Inspec Headings, представленные совместно с распределением по ним мировых и отечественных публикаций в табл. 1, 2.

Для построения поисковых запросов очень полезны имплементированные в БД тезаурусы, например, тезаурус CA Lexicon в БД CA. В поиск можно автоматически включать более узкие (NT), более широкие (BT) и родственные термины (RT). Пример, относящийся к контролируемому термину Nanotechnology, приведен в табл. 3.

Наиболее часто встречающиеся контролируемые термины с префиксом «нано» БД CA совместно с соответствующими распределениями мировых и отечественных журнальных публикаций и патентов показаны в табл. 4.

В ряде БД имеется не только предметное индексирование, но и индексирование веществ - так, среди ролей, приписываемых в БД CA веществам или классам веществ, есть роль Nanomaterial.

В области НТМ важную роль играют патенты. Соответственно, при поиске информации велико значение патентных классификаторов. Сравнительно

Т а б л и ц а 1

Классификационные коды для НТМ (БД Inspec)

Код Название кода Количество публикаций

Весь мир Россия

A6146 Structure of solid clusters, nanoparticles, nanotubes and nano-structured materials 115 760 4 600

A8116 Methods of nanofabri-cation and processing 82 907 2 229

B2550N Nanometre-scale semiconductor fabrication technology 30 770 523

A0710C Micromechanical and nanomechanical devices and systems 26 891 203

A7550K Amorphous and na-nostructured magnetic materials 20 772 980

B7230M Microsensors and nanosensors 16 450 208

A8783 Nanotechnology applications in biomedicine 14 931 247

Т а б л и ц а 2

Контролируемые термины Inspec Headings (БД Inspec)

Термин Количество публикаций

Весь мир Россия

Nanostructured materials 83 821 4 067

Nanoparticles 73 058 2 544

Nanotubes 44 332 1 062

Nanofabrication 43 938 1 386

Nanotechnology 38 847 790

Carbon nanotubes 38 250 853

Nanocomposites 32 131 1 049

Nanowires 20 908 272

Nanobiotechnology 11 349 211

недавно три крупнейших мировых патентных ведомства - USPTO, EPO и JPO - усовершенствовали свои классификационные системы, объединив все имеющие отношение к НТМ патенты в единые классы: 977 (USPTO), Y01N (EPO), B82B (IPC) и ZNM (JPO).

Т а б л и ц а 3

Контролируемый термин Nanotechnology тезауруса CA Lexicon (БД CA)

* Действующий заголовок с 2002 г. по настоящее время.

Т а б л и ц а 4 Контролируемая терминология по НТМ (БД CA)

Патентные ведомства и некоторые другие организации (например, MicroPatent и Delphion) предоставляют патентные данные в режиме онлайн бесплатно или по низким ценам. Возможности бесплатного доступа варьируются от простого поиска - библиографического и (или) по ключевым

словам - до уникальных патентных коллекций, отсутствующих в других источниках. Наряду с сайтами патентных ведомств существуют патентные БД, созданные отдельными лицами или компаниями (FreePatentsOnline, Google Patents, Patent Lens, PatBase, др.) - платные (например, FreePatentsOnline) и бесплатные (например, Patent Lens) [6].

Полностью или частично бесплатные БД обладают ограниченными информационными и функциональными возможностями. Они не практичны при проведении масштабных поисков, сохранении или выгрузке результатов. Патентные профессионалы обычно используют их лишь для предварительного поиска. Коммерческие патентные ресурсы лишены многих ограничений бесплатных сайтов.

Платные поисковые службы обычно охватывают несколько БД и являются более полными и оперативными, чем публичные. Кроме того, они имеют надежные серверы и удобные интерфейсы. Информация в них проиндексирована и структурирована. Информационно-поисковые системы Dialog, STN International и Questel-Orbit предоставляют доступ к библиографическим и полнотекстовым патентным БД. Индексирование в них выделяет технические, а не правовые аспекты патентного документа.

Для быстрого и точного поиска в библиографические БД введены разнообразные тезаурусы -иерархические классификаторы, специальные коды и промышленные категории.

В нашей стране в рамках Федеральной целевой программы 2008-2010 гг. по развитию инфраструктуры наноиндустрии участникам национальной нанотехнологической сети на платформе elib-rary.ru Научной электронной библиотеки (НЭБ) открыт доступ к ряду информационных ресурсов в области НТМ. Прежде всего, это тематический рубрикатор и связанный с ним специализированный информационно-библиографический ресурс в области НТМ, позволяющий отбирать релевантные публикации российских организаций.

На платформе представлены распределения публикаций по федеральным округам, регионам, городам, научным организациям, а также по отраслям - согласно Общероссийскому классификатору видов экономической деятельности. Эти информационные ресурсы включены в информационно-аналитическую систему (ИАС) Nano.elibrary.ru, функциональность которой достаточно велика.

Например, отобрав релевантные публикации организации или группы организаций, можно получить для них различные распределения - по тематике, годам публикации, авторам, цитированию и т. д.

В системе Nano.elibrary.ru представлено около 1,5 тыс. отечественных научных организаций, среди которых 80 институтов СО РАН. Система позво-

Количество записей Иерархия терминов Термин

2 905 BT1 Technology

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5 961 -» Nanotechnology

3 554 NT1 Nanofabrication

435 NT2 Directed assembly

47 NT2 Positional assembly

107 NT3 Mechanosynthesis

435 RT Directed assembly

1 560 RT Nanomachines

12 547 RT Nanostructured materials

70 480 RT Nanostructures

Контролируемый термин Публикации Патенты

Весь мир Россия Весь мир Россия

Nanoparticles 173 114 5 138 34 001 608

Nanotubes 92 908 1 993 21 560 225

Nanostructures 83 920 3 011 9 246 246

Nanocompo-sites 56 673 1 838 6 519 154

Nanowires 33 118 334 4 668 22

Nanocrystals 32 543 1 207 3 022 65

Pharmaceutical nanoparticles 17 124 248 3 750 116

Nanofibers 16 535 259 4 660 52

Nanocrystalline materials 8 169 403 534 10

Nanotechnology 6 659 243 492 27

ляет легко выявить наиболее продуктивные из них в области НТМ:

Система Nano.elibrary.ru применена нами в биб-лиометрическом анализе продуктивности СО РАН в области НТМ [7]. Величины основных индикаторов, характеризующих публикации СО РАН 20002011 гг. в области НТМ. ИАС Nano.elibrary.ru:

Среднее количество: цитирований в расчете на 1 статью публикаций в расчете на 1 автора 6,18 0,55

Индекс Хирша 57

В целом, несмотря на серьезные трудности, связанные с недавним возникновением, быстрым развитием, междисциплинарным характером, терминологическими проблемами и диверсифицированными источниками, имеющиеся профессиональные ресурсы позволяют провести полноценный поиск информации в области НТМ. На всех стадиях - от формулировки запроса до анализа результатов - такой поиск требует тесного взаимодействия информационных специалистов и экспертов в области НТМ.

Литература

1. Концепции развития в Российской Федерации работ в области нанотехнологий на период до 2010 г. -URL: http://www.rusnanonet.ru/docs/16687.

2. Андриевский Р. А., Рогуля А. В. Наноструктурирован-ные материалы. - М. : Академия, 2005. - 192 с.

3. Huang C., Notten A., Rasters N. Nanoscience and technology publications and patents: a review of social science studies and search strategies // J. of Technology Transfer. - 2011. - Vol. 36. - P. 145-172.

4. Зибарева И. В., Зибарев А. В., Бузник В. М. Российская нанонаука : библиометрический анализ на основе баз данных STN International // Химия в интересах устойчивого развития. - 2010. - Т. 18, № 2. -С. 215-227.

5. Буйлова Н. М., Леонтьева Т. М., Осипов А. И., Эп-штейн Э. М. Ключевые слова для поиска публикаций по физике нанообъектов и нанотехнологии // Научно-техническая информация. Сер. 2. - 2009. -№ 6. - С. 45-47.

6. Зибарева И. В., Новикова Н. В. Онлайновые патентные информационные ресурсы по нанотехнологиям и наноматериалам // Копирайт. - 2012. - № 3. -С. 109-136.

7. Зибарева И. В., Елепов Б. С. Нанонаука и нанотехно-логия в Сибирском отделении РАН: библиометриче-ский анализ на основе Российского индекса научного цитирования // Библиосфера. - 2012. - № 4. -C. 39-48.

Библиометрический индикатор Значение

Общее количество:

публикаций 4 079

авторов 7 365

цитирований 25 203

самоцитирований 3 933

статей, процитированных хотя бы 1 раз 2 699

Организация, город Количество публикаций

Физико-технический институт им. А. Ф. Иоффе РАН, Санкт-Петербург 4 142

Химический факультет Московского государственного университета им. М. В. Ломоносова (МГУ), Москва 1 426

Московский государственный университет им. М. В. Ломоносова, Москва 1 415

Институт физики полупроводников им. А. В. Ржанова СО РАН, Новосибирск 1 126

Физический факультет МГУ, Москва 997

Институт проблем химической физики РАН, Черноголовка 965

Институт физической химии и электрохимии им. А. Н. Фрумкина РАН, Москва 931

Институт физики твердого тела РАН, Черноголовка 885

Институт катализа им. Г. К. Борескова СО РАН, Новосибирск 828

Физический институт им. П. Н. Лебедева РАН, Москва 785

i Надоели баннеры? Вы всегда можете отключить рекламу.