Научная статья на тему 'ОТРАСЛЕВОЙ РУБРИКАТОР КАК ИНСТРУМЕНТ ИНДЕКСИРОВАНИЯ ДОКУМЕНТОВ И ПОИСКА ИНФОРМАЦИИ ПО ПРОБЛЕМАТИКЕ АПК В БАЗЕ ДАННЫХ «АГРОС»'

ОТРАСЛЕВОЙ РУБРИКАТОР КАК ИНСТРУМЕНТ ИНДЕКСИРОВАНИЯ ДОКУМЕНТОВ И ПОИСКА ИНФОРМАЦИИ ПО ПРОБЛЕМАТИКЕ АПК В БАЗЕ ДАННЫХ «АГРОС» Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
105
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАЩИТА РАСТЕНИЙ / АПК / ИНДЕКСИРОВАНИЕ ДОКУМЕНТОВ / ПОИСК ИНФОРМАЦИИ / ИНФОРМАЦИОННО-ПОИСКОВЫЕ ЯЗЫКИ / ОТРАСЛЕВЫЕ РУБРИКАТОРЫ / БАЗЫ ДАННЫХ / ЦНСХБ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Соколова Ж.В.

Рассматривается значение Отраслевого рубрикатора по сельскому хозяйству и продовольствию как одного из основных инструментов индексирования документов и поиска информации по проблематике АПК на примере защиты растений в базе данных «АГРОС». Приводятся основные характеристики и функции рубрикатора. Показаны примеры индексирования документов и поиска информации по защите растений с использованием рубрикатора.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEPARTMENTAL RUBRICATOR AS AN INSTRUMENT OF TEXT INDEXING AND INFORMATION RETRIEVAL IN REGARDS TO THE AGRO-INDUSTRIAL COMPLEX IN THE AGROS DATABASE

The significance of the Departmental Rubricator for Agriculture and Food is considered as one of the basic instruments of text indexing and information retrieval in regards to the Agro-Industrial Complex through plant protection in the AGROS database. The main characteristics and functions of the Rubricator are given. Examples of text indexing and information retrieval in plant protection using the Rubricator are shown.

Текст научной работы на тему «ОТРАСЛЕВОЙ РУБРИКАТОР КАК ИНСТРУМЕНТ ИНДЕКСИРОВАНИЯ ДОКУМЕНТОВ И ПОИСКА ИНФОРМАЦИИ ПО ПРОБЛЕМАТИКЕ АПК В БАЗЕ ДАННЫХ «АГРОС»»

ИНФОРМАЦИОННЫЕ РЕСУРСЫ. СОКОЛОВА Ж.В. ОТРАСЛЕВОЙ РУБРИКАТОР КАК ИНСТРУМЕНТ ИНДЕКСИРОВАНИЯ ДОКУМЕНТОВ И ПОИСКА ИНФОРМАЦИИ ПО ПРОБЛЕМАТИКЕ АПК В БАЗЕ ДАННЫХ «АГРОС»

Рассматривается значение Отраслевого рубрикатора по сельскому хозяйству и продовольствию как одного из основных инструментов индексирования документов и поиска информации по проблематике АПК на примере защиты растений в базе данных «АГРОС». Приводятся основные характеристики и функции рубрикатора. Показаны примеры индексирования документов и поиска информации по защите растений с использованием рубрикатора.

Ключевые слова: защита растений; АПК; индексирование документов; поиск информации; информационно-поисковые языки; отраслевые рубрикаторы; базы данных; ЦНСХБ.

Sokolova J.V.

Departmental Rubricator as an instrument of text indexing and information retrieval in regards to the Agro-Industrial Complex in the AGROS database

The significance of the Departmental Rubricator for Agriculture and Food is considered as one of the basic instruments of text indexing and information retrieval in regards to the Agro-Industrial Complex through plant protection in the AGROS database. The main characteristics and functions of the Rubricator are given. Examples of text indexing and information retrieval in plant protection using the Rubricator are shown.

Key words: plant protection, Agro-Industrial Complex; text indexing; information retrieval; information-retrieval languages, departmental rubricators; databases; CSAL

ИНФОРМАЦИОННЫЕ РЕСУРСЫ. СОКОЛОВА Ж.В. ОТРАСЛЕВОЙ РУБРИКАТОР КАК ИНСТРУМЕНТ ИНДЕКСИРОВАНИЯ ДОКУМЕНТОВ И ПОИСКА ИНФОРМАЦИИ ПО ПРОБЛЕМАТИКЕ АПК В БАЗЕ ДАННЫХ «АГРОС»_

Введение. База данных «АГРОС» (БД «АГРОС») является основным информационным продуктом Федерального государственного бюджетного научного учреждения «Центральная научная сельскохозяйственная библиотека» (ЦНСХБ). Это крупнейшая в мире русскоязычная база данных по вопросам АПК и смежным с ним отраслям знаний. БД «АГРОС» включает документные массивы широкого тематического диапазона и при этом ориентирована на обслуживание достаточно детальных информационных запросов пользователей. Тематический охват БД «АГРОС» определяется границами Отраслевого рубрикатора по сельскому хозяйству и продовольствию (ОР) и максимально полно отражает проблематику АПК и смежных с ним областей.

Для быстрого и эффективного тематического поиска информации по проблематике АПК в автоматизированных информационно-поисковых системах (ИПС) и БД в ЦНСХБ осуществляется индексирование входящего потока документов, то есть процесс выражения и описания содержания документа с помощью информационно-поисковых языков (ИПЯ). В ЦНСХБ для выражения смыслового содержания документов используются предкоординатные и посткоординатные ИПЯ. К предкоординатным (классификационным) языкам относятся: Универсальная десятичная классификация и Отраслевой рубрикатор по сельскому хозяйству и продовольствию. К посткоординатным ИПЯ относятся дескрипторный язык, основным инструментом которого является информационно-поисковый тезаурус (ИПТ), и язык ключевых слов.

Целью исследования является анализ особенностей индексирования документов и поиска информации по проблематике АПК на примере защиты растений в БД «АГРОС» с использованием отраслевого рубрикатора.

Содержание работы. Использование методик индексирования на различных ИПЯ способствует унификации обработки документов, гарантирует отнесение документов одной тематики в одно место, способствует преодолению субъективизма в определении места документа в ИПЯ, способствует точности, полноте и однозначности отображения информации в БД. Именно от точности и единообразия описания исходной информации языковыми средствами зависит релевантность (степень соответствия содержания документа, найденного при поиске, содержанию информационного запроса) и полнота поиска. [2, с. 15-19].

ОР представляет собой иерархически построенный словарь рубрик, предназначенный для формирования фондов, информационных продуктов и поиска информации. Рубрикатор - это классификация научных знаний в структурированном и формализованном виде. Он разработан на основе базового Государственного рубрикатора научно-технической информации (ГРНТИ), максимальная глубина классификации - 5 уровней.

К основным функциям ОР относятся следующие: определение тематического охвата БД; индексирование документов и поиск их по рубрикам; структурирование и систематизация документального потока; формирование и структурирование информационных массивов печатных и электронных продуктов БД в различных целях; создание единого информационного пространства в рамках АПК и смежных отраслей (БД, информационных служб, библиотек и т. п.).

Рубрики состоят из кодов и их текстовых наименований. Код представляет собой цепочку пар арабских цифр (в зависимости от уровня иерархии), разделенных знаком «.» (точка). При рубрике может быть примечание, уточняющее вопросы, которые она отражает в связи с другими рубриками, а также система ссылок (См. и См. также) к другим разделам ОР и ГРНТИ и обратных ссылок от них (Отс. от и См. также). Такие ссылки облегчают понимание тематического охвата рубрик и поиск рубрики, необходимой для индексирования конкретного документа. [1, с.16-20].

Проиллюстрируем это на фрагменте рубрикатора: 68.37 Защита растений

Примечание. В рубрике отражаются вопросы защиты растений от вредителей, болезней, сорняков, в т.ч. вопросы защиты растений от неблагоприятных метеорологических факторов.

Защита леса

см. 68.47.37 Защита леса от болезней и вредителей

Оценка сортов и селекция с.-х. растений на устойчивость к вредителям и болезням

см. 68.35.03 Селекция и семеноводство с.-х. растений

68.37.13 Методы защиты растений от вредителей, болезней

и сорняков

См. также: 68.31.21 Орошение с.-х. земель 68.37.31 Болезни растений и борьба с ними 68.37.31.21 Непаразитарные болезни растений

Нарушение водного режима у растений см. 68.03.03.21.13 Водный режим с.-х. растений 68.37.31.21.05 Генетические болезни растений

Отс. от 68.03.03.17 Генетика с.-х. растений

Для отражения основных аспектов содержания документу приписывается цифровой код одной или нескольких рубрик (но не более трех). Отнесение документа к рубрике - ответственный момент индексирования. Код рубрики определяет место данного документа в информационном массиве БД, издания, релевантность поиска по запросу пользователей. Отметим, что многоаспектный документ может быть отнесен одновременно к разным рубрикам, если его содержание удовлетворяет содержанию этих рубрик [2, с.11-12].

Рассмотрим особенности индексирования документов и поиска информации по защите растений в БД «АГРОС» с использованием отраслевого рубрикатора на конкретных примерах.

Пример: Документ «Полифункциональное действие энтомопатогенных микроорганизмов: оценка инсектицидной и антифунгальной активности Bacillus thuringiensis и Beauveria bassiana в отношении личинок колорадского жука и возбудителя ризоктониоза картофеля Rhizoctonia solani соответственно».

Документ, несомненно, должен быть отнесен к рубрикам 68.37.29.49.17 Насекомые - вредители

картофеля и 68.37.31.49.19 Грибные болезни картофеля, так как содержит информацию о двух объектах, вредящих картофелю. Но, кроме того, в источнике рассмотрены результаты использования полезных микроорганизмов в качестве агентов биологической борьбы с вредными организмами. Поэтому, данный документ должен быть отнесен также к рубрике 68.37.13.17 Биологический метод борьбы с вредителями, болезнями растений и сорняками для наиболее полного раскрытия его содержания.

Поиск документов по кодам ОР позволяет найти в БД большой объем документов по крупным блокам тематической информации, в частности по защите растений, не прибегая к помощи терминов ИПТ или в дополнение к нему.

Пример: Пользователь обращается к ИПС БД «АГРОС» с запросом Интегрированный метод борьбы с вредителями, болезнями растений и сорняками, выраженным посредством соответствующей рубрики 68.37.13.23 (рисунок 1 и 2).

Рисунок 1 - Выбор рубрики в рубрикаторе

Рисунок 2 - Параметры поиска

Поисковая система обрабатывает запрос и выдает результат -достаточно большой массив документов (1098) по искомой теме (рисунок 3). Пользователь анализирует полученную информацию и использует для нужных ему целей.

[Ввод з

Статистика поиска

<В портфель> - упаковать и записать в портфель группу документов

Запрос: (/ЛРУБ (68_37_13_23ж))

Электронный каталог книг:

Книги на иностранных языках (56) Книги на русском языке (80) Электронная Библиотека (1) Электронный каталог статей:

аналитическая роспись 1985-1989 (218) аналитическая роспись 1990-1995 (240) аналитическая роспись 1996-2000 (58) аналитическая роспись 2001-2005 (57) аналитическая роспись 2006-2010 (78) аналитическая роспись 2011-2015 (52) аналитическая роспись 2016-2020 (52) Авторефераты диссертаций:

Авторефераты диссертаций (2) Документы из других библиотек:

Депонированные рукописи ВНИИТЭИагропром (1) Документы из других библиотек (11) Каталог ФАО:

Каталог ФАО (4) Электронная библиотека отчетов по НИР:

Электронная библиотека отчетов по НИР (1) Оглавления журналов и сборников: Оглавления 2020 (2) Оглавления 2019 (11) Оглавления 2018 (10) Оглавления 2017 (7) Оглавления 2016 (8) Оглавления 2015 (14) Оглавления 2014 (6) Оглавления 2013 (11) Оглавления 2012 (9) Оглавления 2011 (6) Оглавления 2010 (16) Оглавления 2009 (12) Оглавления 2008 (17) Оглавления 2007 (13) Оглавления 2006 (18) Оглавления 2005 (18) Оглавления 2004 (9)

Всего найдено документов: 1098

[справка] Портфель

Главная страница ЦНСХБ

!ны 1998-2021 год © Центральная Научная Сельскохоэяйсг

Рисунок 3 - Результаты поискового запроса

Аналогичным образом можно осуществлять поиск информации по любым рубрикам тематической области Защита растений и других областей знаний в БД «АГРОС». Это отвечает задачам формирования, как правило, больших информационных массивов с фиксированной тематикой, которые могут быть полезны информационным центрам, библиотекам и научным учреждениям. Индивидуальный пользователь также может найти в ОР рубрики, адекватно отражающие нужную ему информацию, и сформулировать запрос только кодами рубрик. Следует, однако, иметь в виду, что такой поиск дает значительные по величине массивы документов, часть которых может иметь слишком общий характер. Чтобы исключить их придется использовать другие ИПЯ. В этом и состоит одна из разнообразных стратегий поиска - на первом этапе используется классификационный язык (рубрикатор), на последующих - языки координатного индексирования (дескрипторный язык и язык ключевых слов) [3].

Выводы. Отраслевой рубрикатор является одним из инструментов индексирования документов и поиска информации по защите растений и другим отраслям знаний в БД «АГРОС». С его помощью можно формировать информационные массивы, которые могут использоваться как индивидуальными пользователями, так и информационными центрами, библиотеками, научными учреждения для различных целей: создание тематических БД, структурированных электронных и печатных изданий (библиографические указатели, навигаторы по информационным ресурсам и т.д.).

СПИСОК ИСТОЧНИКОВ

1. Индексирование документов базы данных ЦНСХБ. Методические указания // состав. Пирумова Л.Н., Харченко Л.Т. - Москва, 1995. - 35 с.

2. Пирумова Л.Н., Харченко Л.Т. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в БД АГРОС. (Методические материалы) - Москва, 2001. - 70 с.

3. Харченко Л.Т., Климова Е.В. Оптимизация стратегии поиска в базе данных "Агрос" // Библиотечное дело - 2005: деятельность библиотек и развитие информационной культуры общества / Моск. гос. ун-т культуры и искусств. - Москва, 2005. - С. 172-173.

СВЕДЕНИЯ ОБ АВТОРЕ

Соколова Жанна Владимировна, старший научный сотрудник отдела аналитико-синтетической обработки документов и лингвистического обеспечения Федерального государственного бюджетного научного учреждения «Центральная научная сельскохозяйственная библиотека»

i Надоели баннеры? Вы всегда можете отключить рекламу.