Научная статья на тему 'О РАЗРАБОТКЕ БАЗЫ ДАННЫХ «ОТРАСЛЕВЫЕ РАБОЧИЕ ТАБЛИЦЫ УДК ДЛЯ АГРОПРОМЫШЛЕННОГО КОМПЛЕКСА'

О РАЗРАБОТКЕ БАЗЫ ДАННЫХ «ОТРАСЛЕВЫЕ РАБОЧИЕ ТАБЛИЦЫ УДК ДЛЯ АГРОПРОМЫШЛЕННОГО КОМПЛЕКСА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
58
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНГВИСТИЧЕСКИЕ СРЕДСТВА / ИНФОРМАЦИОННО-ПОИСКОВЫЕ ЯЗЫКИ / УДК / БАЗЫ ДАННЫХ / ЭЛЕКТРОННЫЕ РЕСУРСЫ / АПК / ЦНСХБ / LINGUISTIC TOOLS / INFORMATION RETRIEVAL LANGUAGES / UDC / DATABASES / ELECTRONIC RESOURCES / AGRO-INDUSTRIAL COMPLEX / CSAL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Багрова Т.Б.

Представлены результаты исследований по разработке в ЦНСХБ базы данных «Отраслевые рабочие таблицы УДК для агропромышленного комплекса». База данных используется в процессе систематизации, а также как технологическая база, позволяющая вносить и отслеживать произведенные в таблицах изменения, редактировать отдельные тематические выпуски отраслевых рабочих таблиц и готовить их в автоматизированном режиме к переизданиям.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON DEVELOPMENT OF THE “SPECIAL WORK UDC TABLES FOR AGRO-INDUSTRIAL COMPLEX” DATABASE

The research results of developing the “Special Work UDC Tables for Agro-Industrial Complex” database are presented. The database is used in the systematizing process, as well as a technological base that allows making and tracing the amendments in the tables, revising some thematic issues of the special work tables and preparing them for re-editions in an automated fashion.

Текст научной работы на тему «О РАЗРАБОТКЕ БАЗЫ ДАННЫХ «ОТРАСЛЕВЫЕ РАБОЧИЕ ТАБЛИЦЫ УДК ДЛЯ АГРОПРОМЫШЛЕННОГО КОМПЛЕКСА»

НАУЧНЫЕ КОММУНИКАЦИИ И ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ НАУКИ: ЦЕНТРАЛЬНАЯ НАУЧНАЯ СЕЛЬСКОХОЗЯЙСТВЕННАЯ БИБЛИОТЕКА. БАГРОВА Т.Б. О РАЗРАБОТКЕ БАЗЫ ДАННЫХ «ОТРАСЛЕВЫЕ РАБОЧИЕ ТАБЛИЦЫ УДК ДЛЯ АГРОПРОМЫШЛЕННОГО КОМПЛЕКСА

Представлены результаты исследований по разработке в ЦНСХБ базы данных «Отраслевые рабочие таблицы УДК для агропромышленного комплекса». База данных используется в процессе систематизации, а также как технологическая база, позволяющая вносить и отслеживать произведенные в таблицах изменения, редактировать отдельные тематические выпуски отраслевых рабочих таблиц и готовить их в автоматизированном режиме к переизданиям.

Ключевые слова: лингвистические средства; информационно-поисковые языки; УДК; базы данных; электронные ресурсы; АПК; ЦНСХБ

Bagrova T.B.

On development of the "Special Work UDC Tables for Agro-Industrial Complex" database

The research results of developing the "Special Work UDC Tables for Agro-Industrial Complex" database are presented. The database is used in the systematizing process, as well as a technological base that allows making and tracing the amendments in the tables, revising some thematic issues of the special work tables and preparing them for re-editions in an automated fashion.

Key words: linguistic tools; information retrieval languages; UDC; databases; electronic resources; agro-industrial complex; CSAL

НАУЧНЫЕ КОММУНИКАЦИИ И ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ НАУКИ: ЦЕНТРАЛЬНАЯ НАУЧНАЯ СЕЛЬСКОХОЗЯЙСТВЕННАЯ БИБЛИОТЕКА. БАГРОВА

Т.Б. О РАЗРАБОТКЕ БАЗЫ ДАННЫХ «ОТРАСЛЕВЫЕ РАБОЧИЕ ТАБЛИЦЫ УДК ДЛЯ АГРОПРОМЫШЛЕННОГО КОМПЛЕКСА

Введение. Универсальная десятичная классификация (УДК) с 1963 г. является одним из лингвистических средств в информационно-поисковой системе Федерального государственного бюджетного учреждения «Центральная научная сельскохозяйственная библиотека» (ФГБНУ ЦНСХБ). Несмотря на то, что она не используется при тематическом поиске в базах данных, индексы УДК являются элементом библиографической записи в автоматизированном формате представления данных наряду с кодами отраслевого рубрикатора и дескрипторами информационно-поискового тезауруса по сельскому хозяйству и продовольствию во всех информационных ресурсах библиотеки. Для библиотек научно-исследовательских учреждений она остается основным лингвистическим средством, поскольку их карточные каталоги и фонды построены по УДК. Поэтому в формате записи в Сводном каталоге библиотек АПК УДК также используется. ФГБНУ ЦНСХБ является разработчиком Отраслевых рабочих таблиц УДК по проблематике АПК (ОТР), которые были вначале схемой построения систематических каталогов, а затем использовались при систематизации документов. Первое издание (1985 г.) вышло в 11 выпусках, затем вышли Дополнения к нему, позже отдельные выпуски были переизданы, что позволяло корректно отображать содержание документов индексами УДК [4, с. 205].

Необходимость создания ОРТ объясняется спецификой индексирования документов по вопросам АПК. В Основных таблицах УДК класс 63 Сельское хозяйство не представлен единым рядом индексов, отражающих все аспекты сельского хозяйства, поэтому при систематизации отдельных вопросов применяются в основном комбинированные классы. В ЦНСХБ разработкой ОРТ занимаются высококвалифицированные специалисты, с базовым сельскохозяйственным образованием, изучившие принципы индексирования и построения таблиц УДК, отслеживающие все

дополнения и исправления в переизданиях полных таблиц УДК, переводимых на русский язык, а также включенных в отдельные выпуски «Дополнений и исправлений в УДК».

Однако в 1992 г. был создан консорциум УДК, который стал ее владельцем, а основные таблицы УДК претерпели большие изменения. Россия первоначально не вошла в консорциум и не имела возможности переводить полные таблицы на русский язык и распространять их. С 2000 г. представителем России в международном Консорциуме УДК является ВИНИТИ РАН, он же обладает исключительным правом на распространение документов Консорциума на русском языке, включая типографские и электронные издания таблиц УДК [5, с. 17]. В 2003 г. на основании «Договора о совместном издании сборника «Отраслевые рабочие таблицы УДК для агропромышленного комплекса» ВИНИТИ РАН передал права на издание и распространение на русском языке печатных Отраслевых рабочих таблиц УДК (ОРТ) ФГБНУ ЦНСХБ. Таким образом, ФГБНУ ЦНСХБ получила возможность подготовить печатную версию рабочих таблиц на основе последнего, 4-го издания Полных таблиц УДК на русском языке, подготовленного ВИНИТИ РАН. Необходимость переиздания ОРТ объяснялась, прежде всего, глобальными изменениями, которые были внесены в полное издание таблиц, а также тем, что с момента предыдущего издания появилось много понятий, не вошедших в издание 1985-1988 гг.

В 2011г. было завершено издание 9 тематических выпусков ОРТ и кумулятивного АПУ в 2-х томах; одновременно велась разработка и электронной версии ОРТ [2, 3].

Целью исследования было создание базы данных (БД) «Отраслевые рабочие таблицы УДК для агропромышленного комплекса»» для совершенствования лингвистических средств информационно-поисковой системы ФГБНУ ЦНСХБ.

Результаты исследования. Включения новых или исключения старых индексов на базе Полных таблиц и грамматики УДК, уточнения

формулировок рубрик, дополнения их новым содержанием и т.д. требуют постоянной работы с ОРТ. Учитывая специфику и особенности ОРТ, а именно использование в основном сложных и составных индексов, при разработке неукоснительно соблюдаются все принципы, правила и методики, применяемые в Полных таблицах. Разработанная в УДК грамматика обеспечивает классификационной системе прочность и в то же время гибкость, позволяя создавать индексы на новые научные понятия, отсутствующие в Полных таблицах. Поскольку ОРТ призваны сократить затраты времени и облегчить работу индексатора, каждый индекс должен характеризоваться четкой формулировкой, выражающей конкретное понятие, являться готовым классификационным решением. Как и любой другой информационно-поисковый язык, УДК постоянно меняется вместе с наукой и обществом и должна отражать все изменения, происходящие в ней. Первоначально электронная версия ОРТ, состоявшая из отдельных выпусков, создавалась с целью отражения в них новых понятий и др. изменений для последующего переиздания печатных ОРТ. Однако позже было решено использовать электронную версию таблиц как инструмент систематизатора и разработать рабочую базу данных ОРТ.

База данных позволяет работать с изданиями таблиц в автоматизированном режиме, актуализировать отдельные выпуски: вносить новые понятия, редактировать уже имеющиеся, добавлять методические примечания к таблицам; иными словами, обеспечивает ведение, актуализацию и совершенствование нынешних ОРТ. Отдельно стоит подчеркнуть, что данная разработка предназначена исключительно для внутреннего пользования сотрудниками ФГБНУ ЦНСХБ и является, по сути, частью АРМ систематизатора / индексатора.

Создание базы данных ОРТ направлено на реализацию следующих задач: полное и актуальное представление в базе данных Отраслевых рабочих таблиц; ведение и поддержание таблиц в автоматизированном режиме; автоматизированное формирование тематических выпусков ОРТ;

подготовка оригинал-макета ОРТ; использование базы данных как инструмента систематизатора при индексировании документов (возможность выбора индекса и переноса его в машиночитаемый рабочий лист). Информационной базой данного ресурса являются электронные и печатные тематические выпуски ОРТ (2000-2011 гг.), а также кумулятивный АПУ в 2-х томах (2011г.). При разработке сохранены все принятые в УДК знаки и символы, соблюдены все принципы, правила и методики, применяемые в Полных таблицах УДК.

База данных состоит из: таблиц общих определителей; отраслевых рабочих таблиц; алфавитно-предметного указателя; методических указаний (по индексированию по ОРТ).

Основное окно базы данных представлено на рисунке 1.

Рисунок 1. Интерфейс базы данных ОРТ

Основное окно предусматривает: поиск по терминам (ключевым словам, названиям рубрик и т.д.), в т.ч. в усеченном виде, например «рогат скот» или «ветеринар»; по цифровому коду УДК; поиск в АПУ на русском и латинском языках. Также в основном окне предусмотрена возможность выбора отдельных баз данных по действующим печатным выпускам ОРТ, а

также по выпускам, добавленным в процессе разработки программы (выпуски «И» (изменения), «У» (удаленные). При этом поиск по терминам охватывает как основной текст, так и информацию, содержащуюся в поле «Комментарии» (например, ссылки типа смотри также и аспектные ссылки к другому классу).

Каждая отдельная запись УДК включает код класса, наименование класса, а также может содержать методические указания, ссылки и отсылки [1, с. 2]. Методические указания, а также другая дополнительная информация, необходимая систематизатору, вносится в поле «Комментарии», которое доступно в режиме корректировки рубрики (рисунок 2).

Рисунок 2. Окно для корректировки рубрики УДК В режиме корректировки представлены возможности изменения кода, описания класса, методических указаний (окошко «Комментарии»), номера выпуска ОРТ, а также имеются функции удаления данного индекса и добавления нового.

В случае удаления индекса (например, устаревшего) он автоматически переносится в базу выпуска «Удаленные». При внесении изменений в любое поле рубрики, сам индекс автоматически выделяется цветом. Цветовая индикация свидетельствует о том, что индекс был уточнен, изменен или

введен впервые, т.о. систематизатор может быть уверен, что данный индекс актуален и его перепроверка не требуется. Измененные индексы собираются в базе выпуска «И» путем добавления к номеру выпуска буквенного обозначения «и». Этот выпуск предназначен для последующего формирования «Изменений и дополнений» к нынешним рабочим таблицам.

Стадии жизненного цикла рубрики фиксируются в окне «история», где при внесении изменений сохраняются прежние данные, такие как код, название рубрики, а также указывается, когда, кем были внесены изменения и при необходимости причины.

Выводы. Таким образом, разрабатываемая база данных «Отраслевые рабочие таблицы УДК для агропромышленного комплекса» выполняет с одной стороны функцию технологической базы, позволяющей вносить дополнения, изменения с фиксацией того, кто и когда их внес, формировать в автоматизированном режиме отдельные выпуски ОРТ для переиздания их печатной версии, подготовки к печати Дополнений и Изменений, а с другой стороны используется систематизаторами в процессе научной обработки документов по проблематике АПК, что позволяет сократить время обработки документов.

В настоящее время продолжается работа по апробации БД и актуализации отдельных тематических выпусков «Отраслевые рабочие таблицы УДК для агропромышленного комплекса». БД уже подключена к АСАРД (автоматизированная система аналитической росписи документов) и успешно используется для систематизации документов в автоматизированном режиме.

СПИСОК ИСТОЧНИКОВ

1. ГОСТ Р 7.0.90-2016 СИБИД. Универсальная десятичная классификация. Структура, правила ведения и индексирования. -М., Стандартинформ, 2017. - 23 с.

2. Отраслевые рабочие таблицы Универсальной десятичной классификации (УДК) для агропромышленного комплекса (АПК). Алфавитно-предметный указатель. Ч. 1 - 2 / Центр. науч. с.-х. б-ка Рос. акад. с.-х. наук; сост. Л.П. Батяйкина; отв. ред. Л.Н. Пирумова. - 2-е изд., перераб. и доп. - М. : ЦНСХБ Россельхозакадемии, 2011.

3. Отраслевые рабочие таблицы Универсальной десятичной классификации (УДК) для агропромышленного комплекса (АПК). Вып. 1-9 / Центр. науч. с.-х. б-ка Рос. акад. с.-х. наук; сост. Л.П. Батяйкина; отв. ред. Л.Н. Пирумова. - 2-е изд., перераб. и доп. - М. : ЦНСХБ Россельхозакадемии, 2003-2010.

4. Пирумова Л.Н. (ЦНСХБ Россельхозакадемии). Отраслевые рабочие таблицы УДК для АПК как инструмент систематизатора [В с.-х. библиотеках]. С. 201-213. Материалы научно-практической конференции "Совершенствование информационно-библиотечного обслуживания АПК", (20-23 октября 2008 г.) / Центр. науч. с.-х. б-ка Рос. акад. с.-х. наук. Москва, 2009

5. Учебное пособие по Универсальной десятичной классификации / гл. редактор акад. Ю.М. Арский; ВИНИТИ РАН. - М., 2008. - 150 с.

СВЕДЕНИЯ ОБ АВТОРЕ

Багрова Татьяна Борисовна, Центральная научная

сельскохозяйственная библиотека, старший научный сотрудник отдела аналитико-синтетической обработки документов и лингвистического обеспечения, Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека»

i Надоели баннеры? Вы всегда можете отключить рекламу.