Научная статья на тему 'Использование многомерного индексирования для повышения точности поиска научной информации'

Использование многомерного индексирования для повышения точности поиска научной информации Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
269
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННО-ПОИСКОВЫЕ КЛАССИФИКАЦИОННЫЕ СИСТЕМЫ / УЗКОТЕМАТИЧЕСКИЙ ПОИСК / ФИЗИКА ПОЛУПРОВОДНИКОВ / INFORMATION RETRIEVAL CLASSIFICATION SYSTEMS / PARTICULAR THEMATIC SEARCH / SEMICONDUCTOR PHYSICS

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Шабурова Наталья Николаевна

Показаны практика работы научной библиотеки Института физики полупроводников СО РАН с информационно-поисковыми классификационными системами и преимущества многомерного индексирования научных материалов в организации поиска информации по узкотематическим запросам.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The author describes the practical of the research library in the Institute of Semiconductor Physics with information retrieval classification systems and the advantages of the use of multidimentional indexing for research documents from the view point of information retrieval and search on the particular thematic requests.

Текст научной работы на тему «Использование многомерного индексирования для повышения точности поиска научной информации»

Информатика ---------------------------------------------------------

УДК 025.4.026 + 002.513.5 ББК 78.37 + 73

ИСПОЛЬЗОВАНИЕ МНОГОМЕРНОГО ИНДЕКСИРОВАНИЯ ДЛЯ ПОВЫШЕНИЯ ТОЧНОСТИ ПОИСКА НАУЧНОЙ ИНФОРМАЦИИ

© Н. Н. Шабурова, 2009

Институт физики полупроводников СО РАН 630090, г. Новосибирск, пр. Академика Лаврентьева, 13

Показаны практика работы научной библиотеки Института физики полупроводников СО РАН с информационно-поисковыми классификационными системами и преимущества многомерного индексирования научных материалов в организации поиска информации по узкотематическим запросам.

Ключевые слова: информационно-поисковые классификационные системы, узкотематический поиск, физика полупроводников.

The author describes the practical of the research library in the Institute of Semiconductor Physics with information retrieval classification systems and the advantages of the use of multidimentional indexing for research documents from the view point of information retrieval and search on the particular thematic requests.

Key words: information retrieval classification systems, particular thematic search, semiconductor physics.

Деятельность библиотеки академического НИИ весьма разнообразна. Но степень востребованности различных направлений библиотечной деятельности неоднородна. Ранжировать их актуальность может помочь учет количества выполненных по запросам ученых справок. Такое ранжирование было проведено в научной библиотеке Института физики полупроводников (ИФП) Сибирского отделения РАН. Оно позволило увидеть, что достаточно часто ученые обращаются в библиотеку, когда при опубликовании полученных результатов своих исследований они сталкиваются с проблемой их библиографической кодировки, необходимой для организации дальнейшей корректной идентификации во все увеличивающемся потоке научной информации. Для последующего поиска, кроме ключевых слов, большое значение имеет систематизация материалов в соответствии с той или иной информационно-поисковой классификационной системой.

Библиотекари ИФП при каталогизации фондов собственной библиотеки по Библиотечно-библиографической классификации (ББК) регулярно выполняют услуги по индексированию материалов в соответствии с рубриками Универсальной десятичной классификации (УДК), а в последнем десятилетии - и Государственного рубрикатора научно-технической информации (ГРНТИ). Поэтому указанное направление работы библиотеки ИФП получило активное развитие и подвело к инициа-

тиве создать сводный справочный инструмент, совмещающий данные тематических рубрик по физике полупроводников этих классификационных систем.

При формировании такого инструмента первоначальной целью являлось предоставление ученым возможности выбора индекса в зависимости от требований издательства, куда будут направляться материалы. Однако в его создании заключался более глубокий смысл, предопределяющий поисковые функции. Анализ соответствия терминов и содержания тематических рубрик друг другу в различных классификациях и попытка сопоставления их поисковых возможностей в области физики полупроводников [1] показали, что ББК, УДК и ГРНТИ представляют собой взаимодополняющие системы, и именно совместное их использование может увеличить точность информационного обслуживания по узкотематическим запросам. Заметим, что целесообразность использования целого набора лингвистических средств для повышения качества тематического поиска была показана в работах Г. А. Скарук [2].

Практически инструмент сейчас находится на уровне традиционного оформления в виде алфавитно-предметного указателя, но имеет характерные отличия. В нем расположенные в алфавитном порядке специальные термины сопровождены смысловой трактовкой и представлены коды предметных рубрик классификаций, к которым следует

обращаться при поиске информации по данной теме (рис. 1). Более того, такое совместное индексирование можно назвать своеобразным трехмерным обозначением местонахождения научной проблемы в информационном потоке. Каждая из классификаций выделяет в теме свои аспекты. В ББК выделен специальный класс для описания свойств полупроводников и явлений, связанных с ними. В УДК соответствующая тематика рассыпана по разделам изучаемых явлений и их применений в технике. В ГРНТИ любые проблемы полупроводниковой тематики рассматриваются через понятие «физика твердого тела». В нем только одна рубрика посвящена физике полупроводников в целом, но она практически пересекается с каждой из соподчиненных рубрик, входящих в один раздел. Поэтому совмещение индексов характеризует предмет исследования с разных точек зрения, что открывает возможности более точного поиска данных.

ВНУТРЕННИЙ ФОТОЭФФЕКТ в ПОЛУПРОВОДНИКАХ -увеличение электропроводности под действием электромагнитного излучения.

ББК_В379.231.42 Фотопроводимость полупроводников. УДК_537.312.5 Действие внешних факторов на проводимость и сопротивление. Действие излучений. ГРНТИ_29.19.21 Влияние облучения на свойства твердых тел.

ЛЕГИРОВАНИЕ ПОЛУПРОВОДНИКОВ - введение примесных атомов с целью изменения величины или типа проводимости, влияющее на электропроводность материала.

ББК_379.231.26 Влияние дефектов на электропроводность полупроводников.

УДК_37.222.22 Электрический заряд: распределение плотности в полупроводниковых материалах. ГРНТИ_29.19.23 Теория электрических свойств твердых тел.

осей образно обозначит место научной проблемы во всем информационном потоке и, например, представленные на рис. 1 темы приобретут свое конкретное местоположение (рис. 2). Несомненно, рисунок является упрощенным макетом расположения сведений (здесь опускается сложность комбинированных индексов УДК для обозначения узкой специализации), но тем не менее, наглядно показывает повышение точности результатов поиска по сравнению с его проведением в единственной плоскости одной из классификаций. Так, по оси Х (ББК), без объемного рассмотрения, местонахождение тем почти слилось бы.

Рис. 2. Макет поиска информации при многомерном индексировании научных тем:

1 - «легирование полупроводников», 2 - «внутренний фотоэффект в полупроводниках»:

подклассы: по оси Х - В379.1, В379.13, В379.2, В379.21, В379.212, В379.22, В379.23 и место, откуда обе проекции, - В379.231; вдоль оси У - 29.19.01, 29.19.03, 29.19.04, 29.19.07, 29.19.09, 29.19.11, 29.19.13, 29.19.15, 29.19.16, 29.19.17, 29.19.19, 29.19.21, 29.19.22, 29.19.23, в точках ...21 и ...23 - начало проекций; по г - 537.222 (первая проекция), 537.226, 537.311, 537.312 (вторая)

Рис. 1. Фрагмент указателя, отражающего совмещение индексов предметных рубрик ББК, УДК и ГРНТИ по физике полупроводников

Если представить весь объем информации по физике полупроводников в виде пространственного объекта, размещающегося между осями координат со значениями индексов разных классификационных систем, то любая тема в нем может быть зафиксирована с трех сторон. Так, пусть ось абсцисс (Х) будет отражать классы ББК, ординат (У) - ГРНТИ и аппликат (Х - УДК. В начале координат О (месте пересечения осей) - верхние классы соответствующих систематизаций рассматриваемой тематики. Единицы измерения одинаковы для всех осей: ОХ, ОУ и ОХ - подчиненные подклассы своей классификации. Тогда точка пересечения проекций выбранных данных с этих

Из перспектив развития созданного указателя можно назвать пополнение его тематических рубрик индексами других классификаций. Прежде всего, это «Physics and Astronomy Classification Scheme» (PACS) [3], которая используется многими международными издателями, а теперь и российскими - в связи с изданием англоязычных версий отечественных журналов. Это, например, «Журнал технической физики» (ЖТФ) («Technical Physics»), «Письма в ЖТФ» («Technical Physics Letters»), «Физика твердого тела» («Physics of the Solid State») и «Физика и техника полупроводников» («Semiconductors»). Само по себе индексирование по этой системе обычно не вызывает вопросов, но использование ее рубрик в комплексе с уже проработанными классификациями представляет определенный интерес. Еще одной системой классификации и индексации с перекликающейся те-

матикой является «Optics Classification and Indexing Scheme» (OCIS) [4]. Явления, связанные с понятиями «Фурье-спектроскопия», «явления Штарка», «эффекты Керра и Фарадея», «материалы для приемников излучения» и пр. находятся на стыке отраслей знания (оптики и физики полупроводников). Это одно из направлений деятельности ИФП СО РАН [5]. Поэтому специалисты института направляют свои публикации в «Оптический журнал» и его англоязычную версию - «Journal of Optical Technology» (которую издает Американский институт физики - AIP), где требуется систематизировать научные материалы в соответствии с OCIS.

Другая перспектива многомерного индексирования - формирование тезауруса тематических рубрик по физике полупроводников для поиска узкотематической научной информации [6].

Список литературы

1. Белоозеров В. Н., Шабурова Н. Н. Классификационные системы как средство поиска информации по

физике полупроводников // Библиосфера. - 2008. -№ 3. - С. 34-42.

2. Скарук Г. А. Языки тематического поиска в электронном каталоге и индивидуальное поисковое взаимодействие // Библиосфера. - 2005. - № 2. -С. 45-50.

3. Physics and Astronomy Classification Scheme [Electronic resource]. - URL : http://www.aip.org/pacs/pacs 06. (24.10.08).

4. Мирошников Н. Н. Классификация тематики «Оптического журнала» // Оптич. журн. - 2000. - Т. 67, № 10. - С. 90-103.

5. Институт физики полупроводников. Научные направления [Электронный ресурс]. - URL : http:// www.isp.nsc.ru/newface/index.php?lang=ru. (24.10.08).

6. Белоозеров В. Н., Шабурова Н. Н. Проблемы сопоставления информационно-поисковых классификационных систем при формировании тезауруса тематических рубрик по физике полупроводников // Роль ГПНТБ СО РАН в развитии информационно-библиотечного обслуживания в регионе : тез. докл. межрегион. науч.-практ. конф. (Новосибирск, 6-10 окт. 2008 г.). - Новосибирск, 2008. -С. 27-29.

Материал поступил в редакцию 14.04.2009 г.

Сведения об авторе: Шабурова Наталья Николаевна - кандидат педагогических наук, заведующий научной библиотекой, тел.: (383) 333-22-72, e-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.