Научная статья на тему 'Аналитико-синтетическая обработка документов по экономике сельского хозяйства в ЦНСХБ'

Аналитико-синтетическая обработка документов по экономике сельского хозяйства в ЦНСХБ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
149
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕЛЬСКОЕ ХОЗЯЙСТВО / ЭКОНОМИКА / ТЕРМИНОЛОГИЯ / ИНФОРМАЦИОННО-ПОИСКОВЫЕ ЯЗЫКИ / ТЕЗАУРУСЫ / ЦНСХБ / AGRICULTURE / ECONOMICS / TERMINOLOGY / INFORMATION RETRIEVAL LANGUAGES / THESAURUSES / CSAL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Урбанская Г.Г.

Представлены критерии отбора документов по экономике сельского хозяйства, методика и технология их аналитико-синтетической обработки, создания вторичных электронных документов с помощью информационно-поисковых языков для размещения в базе данных «АГРОС» и информационных изданиях ЦНСХБ. Рассмотрены особенности семантической обработки документов по экономике АПК: раскрытие их содержания с помощью аннотирования и реферирования, индексирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis and synthesis of documents on agricultural economics in CSAL

Selection criteria for documents on agricultural economics, technique and technology of their analysis and synthesis, creation of secondary electronic documents by means of information retrieval languages to include them in the AGROS database and information publications of CSAL are presented. Specifics of semantic processing of documents on economics of AIC are described: revealing of their subject matter by means of annotation and indexing.

Текст научной работы на тему «Аналитико-синтетическая обработка документов по экономике сельского хозяйства в ЦНСХБ»

УРБАНСКАЯ Г.Г. АНАЛИТИКО-СИНТЕТИЧЕСКАЯ ОБРАБОТКА ДОКУМЕНТОВ ПО ЭКОНОМИКЕ СЕЛЬСКОГО ХОЗЯЙСТВА В ЦНСХБ Представлены критерии отбора документов по экономике сельского хозяйства, методика и технология их аналитико-синтетической обработки, создания вторичных электронных документов с помощью информационно-поисковых языков для размещения в базе данных «АГРОС» и информационных изданиях ЦНСХБ. Рассмотрены особенности семантической обработки документов по экономике АПК: раскрытие их содержания с помощью аннотирования и реферирования, индексирования.

Ключевые слова: сельское хозяйство; экономика; терминология; информационно-поисковые языки; тезаурусы; ЦНСХБ.

G. G. Urbanskaya Analysis and synthesis of documents on agricultural economics in CSAL

Selection criteria for documents on agricultural economics, technique and technology of their analysis and synthesis, creation of secondary electronic documents by means of information retrieval languages to include them in the AGROS database and information publications of CSAL are presented. Specifics of semantic processing of documents on economics of AIC are described: revealing of their subject matter by means of annotation and indexing.

Keywords: agriculture; economics; terminology; information retrieval languages; thesauruses; CSAL.

УРБАНСКАЯ Г.Г. АНАЛИТИКО-СИНТЕТИЧЕСКАЯ ОБРАБОТКА ДОКУМЕНТОВ ПО ЭКОНОМИКЕ СЕЛЬСКОГО ХОЗЯЙСТВА В ЦНСХБ

В настоящее время на смену индустриальному обществу приходит информационное общество, основой которого являются информационные технологии.

Деятельность организаций в большой степени зависит от информированности и способности эффективно использовать имеющуюся информацию.

Для принятия эффективных управленческих решений в условиях рыночной экономики экономисту требуется система информационного обеспечения, объективно отражающая сложившуюся экономическую ситуацию. Эта проблема является наиболее актуальной сегодня, так как информационное обеспечение выступает средством выживания в условиях жесткой конкуренции. Свежая научно-техническая информация помогает руководителю в принятии управленческих решений и является залогом успеха и конкурентоспособности предприятия (1). Современный специалист должен быть в курсе новейших достижений в науке и производстве, уметь ориентироваться в огромном потоке информации, усваивать ее и перерабатывать. Одной из важнейших задач библиотеки является отбор и обработка наиболее актуальной и ценной информации по проблемам АПК для обеспечения информационных потребностей пользователей для проведения ими научных исследований и научно-технических разработок, в том числе по экономике сельского хозяйства и пищевой промышленности.

Задача библиотеки помочь специалисту сориентироваться в огромном информационном потоке, получить необходимую ему информацию и при этом затратить на это минимум времени. При этом важнейшими требованиями является полнота предоставления информации и соответствие предоставленной информации запросу пользователя. Для выполнения этих требований информация должна быть соответствующим образом обработана, структурирована и преобразована в форму, доступную для поиска и представлена в информационно-поисковых системах для дальнейшего хранения и поиска в автоматизированном режиме. Для этого используются современные технологии доступа и обработки информации.

Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека» (ЦНСХБ) является одной из крупнейших библиотек мира. Фонд ЦНСХБ насчитывает более 3 млн. единиц хранения информации по проблемам АПК и смежных отраслей, представленной в виде отечественных и иностранных книг, журналов, газет, CD-ROM. Ежегодное пополнение фонда составляет более 15 тыс. единиц хранения. Документы на русском языке составляют 94%, на иностранных языках - 6%. Фонд раскрывается через электронные каталоги и базы данных, библиографические и реферативные издания. Основным информационным продуктом ЦНСХБ является база данных «АГРОС». Ее объем более 1,9 млн. записей, включая книги и статьи из периодических и продолжающихся изданий по все проблемам АПК и смежным с ним отраслям. Объем ежегодного пополнения базы данных составляет более 45 тыс. документов. В 2017 г., например, включено 38000 отечественных и иностранных статей, более 6,5 тысяч отечественных и иностранных книг. Включено 7,7 тыс. аннотаций и 3,3 тыс. рефератов. В базе данных «АГРОС» документов по

экономике сельского хозяйства насчитывается более 168,2 тыс. документов, т.е. 11,7%. В общем входном потоке, поступающим на обработку на документы по экономике сельского хозяйства на обработку приходится примерно такой процент. Кроме базы данных «АГРОС» в библиотеке создана и ежегодно пополняется проблемно-ориентированная реферативная база данных «Информационно-консультативная служба».

Ежемесячно ЦНСХБ издает систематический указатель «Сельскохозяйственная литература», исполняющий регистрационную функцию, в который включаются практически все отечественные документы, поступившие в фонд библиотеки, поскольку он выполняет функцию регистрирующего органа сельскохозяйственной литературы, изданной на территории России, и систематический указатель иностранной литературы «Сельское хозяйство», включающий наиболее актуальные и научно значимые документы в ретроспекции за три последних года, поступившие в фонд ЦНСХБ. Оба указателя содержат разделы по экономике сельского хозяйства и пищевой промышленности. Раздел «Экономика и организация сельского хозяйства» в указателях представлен 16 рубриками. В указатель «Сельскохозяйственная литература» ежемесячно включается около 260 отечественных документов (за год более 3000), в указатель «Сельское хозяйство» - ежемесячно около 50 иностранных документов (за год более 520).

ЦНСХБ издает ежеквартальный реферативный журнал «Экономика сельского хозяйства», с объемом более 1000 записей в год.

В ЦНСХБ реализуется принцип одноразовой обработки документов, при котором документ обрабатывается один раз (и при этом глубоко и всесторонне раскрывается его содержание) и затем многократно используется (в различных информационных продуктах и др.). Для того, чтобы документ попал в какой-либо информационный продукт, в процессе аналитико-синтетической обработки документа, индексатором ставится соответствующая ему пометка.

Отбор документов: книг, статей из сборников и журналов, авторефератов диссертаций в СХ и СХЛ осуществляется по принципам актуальности проблемы, научной значимости, применения современных методов исследований, новизны информации. При этом учитывается также информационный продукт и его специфика, для каждого из перечисленных информационных продуктов разработаны свои принципы отбора в соответствии с его назначением и задачами. Например, книги по общей экономике, статьи из сборников и журналов рекламного характера, интервью, заметки, рецензии на статьи и книги, информация о конференциях и выставках, студенческие работы, статьи без авторов, материалы тезисного характера, вторичная информация в указатель «Сельскохозяйственная литература» не берутся, а в «Сельское хозяйство» не берутся статьи местного характера и данные за 1 год.

В реферативный журнал «Экономика сельского хозяйства» включается информация о наиболее значимых документах, книгах и статьях из серийных научных и научно-производственных отечественных и иностранных изданий и тематических сборников по экономике сельского хозяйства и пищевой промышленности. Отбираются документы по актуальным или спорным проблемам развития экономики АПК, по новейшим методам и результатам научных исследований в отрасли, в том числе математическим методам планирования и прогнозирования, моделям развития, новым технологическим решениям и технологиям, передовому опыту в сельскохозяйственном производстве, направлениям аграрной политики государства, проблемам продовольственной безопасности и импортозамещения, другим направлениям развития экономической науки. Предпочтение отдается документам, в которых имеется цифровой и фактографический, табличный и иллюстративный материал, со списком источников. Библиографическая запись в реферативном журнале содержит: библиографическое описание; аннотацию или реферат на русском языке; ключевые слова; шифр ЦНСХБ или другой адрес нахождения документа. В документах из журналов, представленных в свободном доступе в Интернете, указан интернет-адрес журнала.

В процессе аналитико-синтетической обработки документов используются научные методы исследования: анализ и синтез. Внешний анализ устанавливает вид документа, его форму, время и место появления, авторов. Эти данные используются для создания библиографического описания документа. При внутреннем анализе исследуется смысловое содержании документа для дальнейшей обработки и преобразования его путем аннотирования, реферирования, индексирования по 4 информационно-поисковым языкам (ИПЯ), использующимся в библиотеке для структурирования, формирования информационных продуктов и семантического раскрытия документа: Отраслевому Рубрикатору по сельскому хозяйству и пищевой промышленности, Информационно-поисковому тезаурусу по сельскому хозяйству и продовольствию, Универсальной десятичной классификации (УДК), языку ключевых слов для отражения в базе данных (БД) АГРОС, а также информационных изданиях ЦНСХБ.

Аннотирование и реферирование помогают раскрыть содержание документа, что особенно важно для документов на иностранных языках. Аннотация отражает кратное содержание документа. В ЦНСХБ используются различные виды аннотаций. Например, в описании содержания документа на иностранном языке, аннотация на русском языке является обязательной и представляет собой перевод заглавия с добавлением важных сведений, необходимых для однозначности толкования документа. Аннотация для документов на русском языке составляется для расширения, уточнения и дополнения заглавия, в случае если заглавие неинформативно (2).

Например, статья «Управление предприятием». Данный документ нуждается в уточняющей аннотации, о какой отрасли сельского хозяйства идет речь, какой организационно-правовой формы и где находится предприятие, какие методы управления при этом используются.

На часть документов (на русском и иностранных языках), отражающих наиболее актуальные проблемы науки, создаются рефераты на русском языке объемом до 2000 печатных знаков для включения в реферативный журнал. Реферат - более широкое, по сравнению с аннотацией, изложение документа. Реферат отображает главные темы публикации и, что важно, фактографические данные и позволяет определить релевантность поиска, не прибегая к полному тексту. При реферировании документов по экономике сельского хозяйства важно отразить актуальность темы, методы проведенного исследования, провести экономический анализ представленных цифровых и графических материалов, отразить место проведения и выводы, сделанные на основании исследования.

Одной из важнейших операций аналитико-синтетической обработки информации является индексирование документов. Индексирование - процесс перевода содержания документа с естественного языка на ИПЯ с помощью терминов индексирования - дескрипторов, ключевых слов, классификационных индексов и кодов, для составления поискового образа документа (ПОД).

ИПЯ - основной элемент логико-семантического аппарата информационно-поисковой системы ЦНСХБ. Создание ИПЯ обусловлено неудобством использования естественного языка из-за его неоднозначности и многозначности в качестве инструмента раскрытия содержания документа.

В ЦНСХБ соблюдается принцип, при котором в индексировании глубина отражения предмета на разных ИПЯ с помощью их лексических единиц (ЛЕ) одинакова.

Например, документ

1. «РЕНТАБЕЛЬНОСТЬ ПРОИЗВОДСТВА ГОВЯДИНЫ В СЕЛЬСКОХОЗЯЙСТВЕННЫХ ПРЕДПРИЯТИЯХ ВОЛОГОДСКОЙ ОБЛАСТИ»

будет проиндексирован:

- по Информационно-поисковому тезаурусу (дескрипторами): МЯСНОЕ СКОТОВОДСТВО; ГОВЯДИНА; ОРГАНИЗАЦИЯ ПРОИЗВОДСТВА; РЕНТАБЕЛЬНОСТЬ; С-Х ПРЕДПРИЯТИЯ; ВОЛОГОДСКАЯ ОБЛ;

- по Отраслевому рубрикатору (индексом): 68.39.29.01.75;

- по УДК (индексом): 631.16:658.155:22/.28.033(470.12). а документ

2. «ПРЕМИРОВАНИЕ РАБОТНИКОВ СЕЛЬСКОГО ХОЗЯЙСТВА В ОВЦЕВОДСТВЕ ДАГЕСТАНА»:

- по Информационно-поисковому тезаурусу (дескрипторами): ОВЦЕВОДСТВО; РАБОТНИКИ СЕЛЬСКОГО ХОЗЯЙСТВА; ПРЕМИРОВАНИЕ; ДАГЕСТАН;

- по Отраслевому рубрикатору (индексом): 68.39.31.01.75;

- по УДК (индексом): 631.158:658.322.5:636.32/.38(470.67).

В результате, какой бы ИПЯ пользователь не использовал при составлении поискового предписания для тематического поиска (кроме УДК, по которой пока поиск в базе данных не ведется), он в любом случае получит требуемый массив документов.

Индексатор, осуществляя анализ документа, раскрывает его содержание и переводит это содержание в более сжатую форму (в ЛЕ ИПЯ), т.е. производит свертывание информации для обеспечения в дальнейшем эффективного поиска ее в БД, что позволяет освободить пользователя от необходимости при поиске прочитывать или просматривать полные тексты документов и повысить скорость поиска. Качественное индексирование определяется тремя категориями: глубиной (или полнотой), точностью и унифицированным языком понятий; зависит от квалификации индексатора, его знания предмета исследования с учетом информационных интересов пользователя, его логики и принципов поиска.

Существует определенная схема, выделения понятий индексирования при индексировании документов по экономике сельского хозяйства:

1. Объект исследования: сельское хозяйство или его отрасли (растениеводство; животноводство); организационно-правовая форма предприятия; сельская местность; земельные ресурсы; трудовые ресурсы; финансы; материально-техническая база и т.д.

2. Воздействие на объект исследования: организация производства; планирование; управление предприятием; диверсификация производства; размещение производства; специализация; концентрация производства; государственное регулирование; экономический анализ и т.д.

3. Применяемые методы исследования: экономико-математические модели; маржинальный анализ; статистические методы и т.д.

4. Цель исследования, рекомендации.

5. Географическое положение объекта: страны; регионы мира; федеральные округа Российской федерации, при необходимости зоны сельскохозяйственного производства (аридные зоны; горные условия). При индексировании материалов конференция по экономике сельского хозяйства указывается место проведения съезда.

Важнейшим условием обеспечения качества индексирования является сам ИПЯ: его структура, лексическая наполненность, отражающая современное состояние науки и практики, справочно-поисковый аппарат, помогающий индексатору принять правильное решение при выборе индекса, кода, рубрики и определении места документа в системе. ИПЯ имеет определенный словарный состав, совокупность ЛЕ, представляющих собой слова, устойчивые словосочетания, встречающиеся максимально часто в большом массиве документов, аббревиатуры, символы, даты, общепринятые сокращения. В ЦНСХБ для автоматизированного поиска используют Отраслевой рубрикатор и Отраслевой тезаурус. Отраслевой рубрикатор используется для формирования, структурирования и поиска в больших информационных массивах, а также для структурирования и формирования систематических библиографических указателей и реферативных изданий. Отраслевой рубрикатор обеспечивает поиск, если нужно получить информацию по большому массиву данных, но, однако, 5 уровней его иерархии позволяют получить и достаточно хорошие результаты при узкотематическом поиске. Отраслевой тезаурус по сельскому хозяйству и продовольствию позволяет вести тематический поиск документов различной глубины и детализации. Помимо важнейшей поисковой функции он играет роль терминологического словаря (3). Для того чтобы ИПЯ были актуальными, не потеряли своих качеств как инструмент индексирования и поиска, ведется постоянная работа по их актуализации, пополнению новой и редактированию уже включенной в ИПЯ лексики. Отраслевой рубрикатор, постоянно развивается за счет добавления новых ЛЕ, отражающих новые направления в развитии науки и производства. Но особенно это важно для Информационно-поискового тезауруса как терминологического справочника. Составление и пополнение словаря терминов происходит путем отбора из заглавий, аннотаций, рефератов и текстов документов слов на естественном языке.

При индексировании документов по экономике сельского хозяйства дескрипторами тезауруса нецелесообразно использовать для раскрытия содержания документа односложные термины.

Основные дескрипторы, имея большие систематизирующие свойства, нуждаются в уточнении, поэтому могут быть выражены словосочетаниями.

Например:

УПРАВЛЕНИЕ КАЧЕСТВОМ; УПРАВЛЕНИЕ ПРЕДПРИЯТИЕМ; УПРАВЛЕНИЕ

ПРОИЗВОДСТВОМ; УПРАВЛЕНИЕ РИСКОМ

Или

ЭКОНОМИЧЕСКАЯ ИНТЕГРАЦИЯ; ЭКОНОМИЧЕСКАЯ ОЦЕНКА ЗЕМЛИ; ЭКОНОМИЧЕСКАЯ ПОЛИТИКА.

Словосочетания сужают поиск документов, а для пользователя делают его более удобным.

При индексировании можно использовать наиболее употребительные экономические сокращения, например:

АТЭС - Азиатско-тихоокеанское экономическое сообщество

ВВП - валовой внутренний продукт

ВНП - валовой национальный продукт

ВТО - Всемирная торговая организация

ЕС - Европейский союз

ЕЭС - Европейское экономическое сообщество МВФ - Международный валютный фонд МОТ - Международная организация труда СЭВ - Совет Экономической Взаимопомощи ТНК - транснациональные корпорации

ФАО - Продовольственная и сельскохозяйственная организация Объединенных Наций.

Важным моментом в процессе индексирования является субъективный фактор - логика индексатора, зависящая от профессиональной подготовки и опыта индексатора, его знание построения и концепции тезауруса и которая позволяет при отображении содержания документа следовать от общего к частному, от основного дескриптора к нижестоящему в логической последовательности.

Например, документ:

«ЭКОНОМИЧЕСКАЯ ЭФФЕКТИВНОСТЬ ПРОИЗВОДСТВА КАРТОФЕЛЯ В ФЕРМЕРСКИХ ХОЗЯЙСТВАХ ТАМБОВСКОЙ ОБЛ.»

При составлении поискового образа данного документа (ПОДа) термины тезауруса целесообразно располагать согласно значимости содержания по схеме, упомянутой выше: КАРТОФЕЛЬ; ОРГАНИЗАЦИЯ ПРОИЗВОДСТВА; ЭКОНОМИЧЕСКАЯ ЭФФЕКТИВНОСТЬ; ФЕРМЕРСКИЕ ХОЗЯЙСТВА; ТАМБОВСКАЯ ОБЛ

Организация производства сельскохозяйственной продукции, планирование и управление, анализ экономических показателей, продовольственная безопасность, внедрение новых технологий, описание передового опыта в АПК неразрывно связано с зоной сельскохозяйственного производства, поэтому отражение в документе географии исследования является обязательным.

Таким образом, аналитико-синтетическая обработка документов в ЦНСХБ позволяет отслеживать основные направления развития экономической науки в АПК, анализировать, систематизировать наиболее ценную и актуальную информацию, создавая из нее электронные вторичные документы для размещения их в фонде ЦНСХБ для быстрого и удобного их поиска и предоставления пользователям.

СПИСОК ИСТОЧНИКОВ:

1. Автоматизированные информационные технологии в экономике. Под. ред. Титаренко М., Инфа -М., 1998. - 258 с.

2. Пирумова Л. Н., Милевская И. А. Научная терминология в публикациях и информационно-поисковых системах по вопросам сельского хозяйства и пищевой промышленности // Библиотечное дело - 2013: библиотечно-информационная деятельность в современной системе информации документных коммуникаций и культуре: Скворцовские чтения / Моск. гос. ун-т культуры и искусств. -М., 2013, ч.1. - с. 182-184.

3. Пирумова Л. Н., Харченко Л. Т. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в ВД «Агрос»: методические материалы. М., 2001 г. - 69 с.

СВЕДЕНИЯ ОБ АВТОРЕ

Урбанская Галина Григорьевна - старший научный сотрудник отдела аналитико-синтетической обработки документов и лингвистического обеспечения, Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека»

sis@cnshb.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.