Научная статья на тему 'Микротезаурус по техническому обеспечению АПК как инструмент точного тематического поиска в информационных потоках ЦНСХБ'

Микротезаурус по техническому обеспечению АПК как инструмент точного тематического поиска в информационных потоках ЦНСХБ Текст научной статьи по специальности «Науки об образовании»

CC BY
44
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕХАНИЗАЦИЯ СЕЛЬСКОГО ХОЗЯЙСТВА / СЕЛЬСКОХОЗЯЙСТВЕННАЯ ТЕХНИКА / ТЕРМИНОЛОГИЯ / ИНФОРМАЦИОННО-ПОИСКОВЫЕ ЯЗЫКИ / ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ / ТЕЗАУРУСЫ / ЦНСХБ / AGRICULTURAL MECHANIZATION / AGRICULTURAL MACHINERY / TERMINOLOGY / INFORMATION RETRIEVAL LANGUAGES / LINGUISTIC SUPPORT / THESAURUSES / CSAL

Аннотация научной статьи по наукам об образовании, автор научной работы — Андреева Е.В.

Рассмотрены вопросы точного тематического поиска документов в базе данных "АГРОС" ЦНСХБ по дескрипторам тезауруса. Кратко описаны критерии отбора, обработки терминов и формирования словарных статей микротезауруса по техническому обеспечению АПК. Отмечена уникальность микротезауруса как таблицы соответствия с другими информационно-поисковыми языками и как терминологического справочника нормативной научной лексики по сельскохозяйственной технике, а также удобство его использования при семантической обработке документов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Microthesaurus on technical support of AIC as an instrument of exact subject search in data flows of CSA

Issues of exact subject search of documents in the AGROS database of CSAL using thesaurus descriptors are presented. Criteria of selection, processing of terms and formation of dictionary entries of a microthesaurus on technical support of AIC are briefly described. The uniqueness of the microthesaurus as a table of compliance with other information retrieval languages and as a terminological guide of controlled scientific vocabulary on agricultural machinery is noted, as well as convenience of its use for semantic document processing.

Текст научной работы на тему «Микротезаурус по техническому обеспечению АПК как инструмент точного тематического поиска в информационных потоках ЦНСХБ»

АНДРЕЕВА Е.В. МИКРОТЕЗАУРУС ПО ТЕХНИЧЕСКОМУ ОБЕСПЕЧЕНИЮ АПК КАК ИНСТРУМЕНТ ТОЧНОГО ТЕМАТИЧЕСКОГО ПОИСКА В ИНФОРМАЦИОННЫХ ПОТОКАХ ЦНСХБ

Рассмотрены вопросы точного тематического поиска документов в базе данных "АГРОС" ЦНСХБ по дескрипторам тезауруса. Кратко описаны критерии отбора, обработки терминов и формирования словарных статей микротезауруса по техническому обеспечению АПК. Отмечена уникальность микротезауруса как таблицы соответствия с другими информационно-поисковыми языками и как терминологического справочника нормативной научной лексики по сельскохозяйственной технике, а также удобство его использования при семантической обработке документов.

Ключевые слова: механизация сельского хозяйства; сельскохозяйственная техника; терминология; информационно-поисковые языки; лингвистическое обеспечение; тезаурусы; ЦНСХБ

E. V. Andreeva

Microthesaurus on technical support of AIC as an instrument of exact subject search in data flows of

CSA

Issues of exact subject search of documents in the AGROS database of CSAL using thesaurus descriptors are presented. Criteria of selection, processing of terms and formation of dictionary entries of a microthesaurus on technical support of AIC are briefly described. The uniqueness of the microthesaurus as a table of compliance with other information retrieval languages and as a terminological guide of controlled scientific vocabulary on agricultural machinery is noted, as well as convenience of its use for semantic document processing.

Keywords: agricultural mechanization; agricultural machinery; terminology; information retrieval languages; linguistic support; thesauruses; CSAL

АНДРЕЕВА Е.В. МИКРОТЕЗАУРУС ПО ТЕХНИЧЕСКОМУ ОБЕСПЕЧЕНИЮ АПК КАК ИНСТРУМЕНТ ТОЧНОГО ТЕМАТИЧЕСКОГО ПОИСКА В ИНФОРМАЦИОННЫХ ПОТОКАХ ЦНСХБ

Лавинообразный рост объема информации по инновационным технологиям и техническим средствам в АПК определили актуальность создания новой системы классификации накопленных знаний для обеспечения их оперативного использования. Одной из важнейших задач научной обработки информационного потока бумажных и электронных документов в научной сельскохозяйственной библиотеке является отбор наиболее ценной и актуальной научно-технической информации по проблемам АПК, которая должна обеспечить удовлетворение информационных потребностей пользователей путем получения ими релевантной информации, необходимой для выполнения научных исследований и научно-технических разработок. Получение пользователем релевантной информации на его запрос зависит от качества индексирования, его полноты и точности раскрытия содержания документа, а также представления этих документов в информационных массивах. Эти процессы обеспечиваются лингвистическими средствами, при использовании которых ведется индексирование документов и формирование, структурирование информационных потоков, тематический поиск в них. Объем и лексическое наполнение лингвистических средств, влияют также на эффективность тематического поиска. В структуру лингвистического обеспечения информационно-поисковой системы ЦНСХБ входят 5 информационно-поисковых языков (ИПЯ): язык библиографического описания, УДК, отраслевой рубрикатор, отраслевой тезаурус, язык ключевых слов. Поиск ведется по 4 ИПЯ (кроме УДК). Кроме информационно-поискового тезауруса по сельскому хозяйству и продовольствию (включающего терминологию по всем отраслям АПК) создают тезаурусы по отдельным отраслям АПК (ветеринария, пищевая промышленность, животноводство и т.д.), так называемые микротезаурусы (МТ), которые позволяют проанализировать терминологическую наполненность отдельной отрасли, выявить лакуны и т.п.. Микротезаурусы имеют такую же структуру, как и информационно-поисковый тезаурус, формируются по той же методике в соответствии с ГОСТом, но имеют существенное отличие. В отличие от информационно-поискового тезауруса по сельскому хозяйству и продовольствию, МТ является также таблицей соответствия терминологии по отдельной отрасли, представленной в нескольких ИПЯ (тезаурус, отраслевой рубрикатор и УДК). Таким образом, микротезаурус является средством индексирования документов, структурирования, формирования информационных массивов и поиска в них. Для этих целей разрабатывался и пополняется новой лексикой микротезаурус по техническому обеспечению АПК, который позволяет максимально точно отобразить содержание документа, создает поисковый образ документа и точно представляет информацию о нем в автоматизированной информационно-поисковой системе, благодаря чему обеспечивается эффективность и качество тематического поиска в базе данных «АГРОС».

По мнению многих специалистов, тезаурус обеспечивает наиболее эффективный и точный тематический поиск, при условии достаточно полного представления в нем отраслевой лексики. Микротезаурус по техническому обеспечению АПК отражает актуальную лексику, обогащенную связями, пояснениями, синонимами, антонимами и приведенную в структуру, не противоречащую системам научных классификаций. Благодаря своему лексическому составу, МТ позволяет индексировать, то есть адекватно и точно раскрыть содержание документа, а структура словарных статей: иерархические деревья, парадигматические связи обеспечивают релевантный поиск. Преимущество тезауруса как поискового средства заложено в его структурных особенностях. В соответствии с методикой, формирование МТ начинается с отбора терминологии тематической области «Техническое обеспечение АПК» из научных отечественных и зарубежных публикаций, который проводился в процессе семантического анализа тексов при индексировании документов из входного тематического потока, поступающего в ЦНСХБ и выделения актуальной терминологии. Для выделения терминов использовали массив базы данных «АГРОС», сформированный тематическими рубриками отраслевого рубрикатора: 55.03 Машиноведение и детали (сельскохозяйственных) машин; 55.57 Тракторное и сельскохозяйственное машиностроение; 67 Строительство (в сельском хозяйстве); 68.01.84 Энергоснабжение, водоснабжение в сельском хозяйстве; 68.85 Механизация и электрификация сельского хозяйства. Затем над термином устанавливается мониторинг в целях определения частотности использования терминов. Затем проводится нормализация термина: выявление синонимичных рядов отобранных понятий, установление между ними внеконтекстных отношений, лингвистическая обработка лексических единиц, редактирование ранее введенных терминов и их отношений в связи с очередным обновлением лексики, формирование словарных статей и формирование словаря нормализованной лексики. В процессе нормализации лексики устраняются элементы неоднозначности, с целью обеспечения однозначности толкования термина. Отношения, которые устанавливаются между терминами, не только определяют его структуру, но влияют на релевантность и полноту поиска. Например, иерархические отношения используются при автоматическом расширении поисковых предписаний тематического запроса. Отношение предпочтения, устанавливаемые между термином со статусом дескриптора (разрешенного к использованию при индексировании термина) и статусом аскриптора (запрещенного к использованию при индексировании термина), делают возможным поиск по любому термину, известному пользователю, независимо от его статуса в словарной статье. Т.е. в поисковом предписании можно использовать любой синоним, и благодаря тому, что все выявленные синонимы находятся (связаны связями) в одной словарной статье микротезауруса, поиск по этому термину будет проведен -обеспечена полнота поиска. Поэтому в ходе создания МТ стояла задача выявления максимального числа известных синонимов. После установления парадигматических связей термина, формирования словаря нормализованной лексики, подбирают соответствующий англоязычный эквивалент каждому дескриптору (термину) и эквивалента из международных тезаурусов; составляют список соответствующих рубрик отраслевого рубрикатора и индексов УДК. (1). Следующий этап заключается в создании таблиц соответствия между дескрипторами МТ и рубриками отраслевого рубрикатора, т.е. дескриптору МТ подыскивали эквивалент в отраслевом рубрикаторе, выраженный рубриками отраслевого рубрикатора, затем дескриптору подыскивали соответствующий эквивалент в УДК и приписывается его индекс. Другими словами понятию, отображенному дескриптором тезауруса, подыскивается соответствующее место в классификационных информационно-поисковых языках и приписывается соответствующий индекс, т.е. происходит установление смыслового соответствия.

Работа над микротезаурусом ведется постоянно: добавления новых терминов, редакция словарных статей и парадигматических (смысловых) связей терминов и т.д. Благодаря этому микротезаурус адекватно отражает отраслевую терминологию, что повышает его качество как терминологического справочника и поискового средства.

Таким образом, микротезаурус по техническому обеспечению АПК охватывает терминологию по строительству в сельском хозяйстве, энергетике, сельскохозяйственной технике, сельскохозяйственному машиностроению и машиноведению. При индексировании документов для полного и адекватного раскрытия содержания документа могут использоваться как дескрипторы (термины, разрешенные к использованию при индексировании) так и ключевые слова (новые термины, не включенные в микротезаурус). Дескрипторы это лексические единицы, выраженные информативными словами или кодами, являющимися именем класса синонимичных или близких по смыслу ключевых слов, которые часто встречаются в технической литературе, и включены в микротезаурус, то есть оснащены связями, выше- и нижестоящими терминами, пояснениями, примечаниями, синонимами, ассоциативными связями и т.п., имеющими кроме того английский эквивалент, рубрику отраслевого рубрикатора и индекс УДК. Ключевые слова это новые термины, не

включенные в микротезаурус, но имеющие возможность быть включенными в него после соответствующей обработки. Индексирование ключевыми словами направлено на обеспечение полноты поиска. Таким образом, в микротезаурусе в электронном формате термины представлены в алфавитном порядке вместе со всеми элементами лингвистического окружения, которые составляют словарную статью термина. В словарной статье термина может быть примечание, имеются эквивалент(ы) термина на английском языке; эквивалент термина в международных тезаурусах (AGROVOC или CABI); вышестоящие термины (метка «В»с указанием уровня иерархии); нижестоящие термины (метка «Н» с указанием уровня иерархии); синонимы (метка «С»); ассоциированные термины (метка «А»).

Примеры словарной статьи:

ПОЧВООБРАБАТЫВАЮЩИЕ МАШИНЫ

Рубрика: 68.47.85.23; 68.85.35.15

УДК: 630*232.216;630*232.322; 630*237.1; 631.31

Иноязычный эквивалент: cultivating machines ; tillage machines

Входит в микротезаурус: Лесное хозяйство; Техника в сельском хозяйстве

■ B1 С-Х МАШИНЫ

■ H1 БОРОНЫ

■ H1 ГРЕБНЕОБРАЗОВАТЕЛИ

■ H1 ГРЯДОДЕЛАТЕЛИ

■ H1 КАТКИ

■ H1 КУЛЬТИВАТОРЫ

■ H1 ЛУЩИЛЬНИКИ ■H1ОКУЧНИКИ

■ H1 ПЛОСКОРЕЗЫ

■ H1 ПЛУГИ

■ H1 ПОЧВОУГЛУБИТЕЛИ

■ H1 ПОЧВОФРЕЗЫ

■ H1 РОТАЦИОННЫЕ МОТЫГИ

■ H1 РЫХЛИТЕЛИ

■ H1 ЧИЗЕЛИ

■ А БОРОЗДОДЕЛАТЕЛИ

■ А ОБРАБОТКА ПОЧВЫ ОПРЫСКИВАТЕЛИ Рубрика: 68.85.37.15 УДК: 631.348:632.934.1 Иноязычный эквивалент: sprayers

Входит в микротезаурус: Защита растений; Пищевая промышленность; Техника в сельском хозяйстве

■ B1 С-Х МАШИНЫ

■ H1 АЭРОЗОЛЬНЫЕ ГЕНЕРАТОРЫ

■ H1 ВЕНТИЛЯТОРНЫЕ ОПРЫСКИВАТЕЛИ

■ H1 МЕЛКОКАПЕЛЬНЫЕ ОПРЫСКИВАТЕЛИ

■ H1 ОБЪЕМНЫЕ ОПРЫСКИВАТЕЛИ

■ H1 ПОЛЕВЫЕ ОПРЫСКИВАТЕЛИ

■ H1 РАНЦЕВЫЕ ОПРЫСКИВАТЕЛИ

■ H1 ТУННЕЛЬНЫЕ ОПРЫСКИВАТЕЛИ

■ H1 ШТАНГОВЫЕ ОПРЫСКИВАТЕЛИ

■ А МАШИНЫ ДЛЯ ЗАЩИТЫ РАСТЕНИЙ

■ А НАСАДКИ

■ А ОПРЫСКИВАНИЕ

■ А ФОРСУНКИ

Поскольку понятие предметной области может иметь несколько возможных вариантов лексического представления, то для обеспечения однозначности в тезаурусе, из них выбирали один термин, называемый дескриптором, который рассматривается как основной способ отображения понятия и используется при индексировании. Дескриптор должен отвечать требованиям общеупотребительности, частоты использования, краткости, терминологической точности. Для уточнения значения термина, придания ему однозначности использовали краткие пометы (реляторы), например: клетки (помещения), мойка (процесс), гусеницы технические, семяпроводы технические и т.д. Кроме того,

значение термина уточнятлись дефинициями, пояснениями, указанием области применения, которые даются в примечании к термину. (1). Например:

АЛЬТЕРНАТИВНЫЕ ИСТОЧНИКИ ЭНЕРГИИ

Рубрика: 65.01.84; 68.01.84.55 УДК: 620.9; 664.08

Примечание: Возобновляемые источники энергии + мускульная сила человека, грозовая энергетика, управляемый термоядерный синтез Иноязычный эквивалент: alternative energy sources

Входит в микротезаурус: Пищевая промышленность; Техника в сельском хозяйстве

■ B1 ЭНЕРГОРЕСУРСЫ

■ H1 ВОЗОБНОВЛЯЕМЫЕ ИСТОЧНИКИ ЭНЕРГИИ

■ А ЭНЕРГИЯ БИОЭТАНОЛ

Рубрика: 68.85.15.43 УДК: 62-631.42; 662.767.2

Примечание: Этиловый спирт, получаемый в процессе переработки растительного сырья для

использования в качестве моторного биотоплива

Иноязычный эквивалент: bioethanol

Входит в микротезаурус: Техника в сельском хозяйстве

■B1БИОТОПЛИВО

■ А МОТОРНОЕ ТОПЛИВО

■ А ЭТИЛОВЫЙ СПИРТ

Кроме того, некоторые термины могут быть заменены на синонимичные

ПРИСПОСОБЛЕНИЯ ТЕХНИЧЕСКИЕ

Иноязычный эквивалент: mechanical facilities

■ см. УСТРОЙСТВА

Иерархические и ассоциативные связи установлены в микротезаурусе только между дескрипторами. Иерархические отношения (отношения подчинения) установлены между понятиями (терминами), объем одного их которых представляет собой часть объема другого. На различных уровнях между основанием и вершиной иерархического дерева находятся термины, каждый из которых имеет только один вышестоящий термин и нижестоящие термины разного уровня иерархии. (2, 3). Наглядно это видно на примере словарных статей «Копатели» и «Машины для обрезки растений»:

КОПАТЕЛИ

Рубрика: 67.29.55; 68.85 УДК: 631.311.3

Иноязычный эквивалент: diggers

Входит в микротезаурус: Техника в сельском хозяйстве

■ B1 С-Х МАШИНЫ

■ H1 ГИДРОБУРЫ

■ H1 ЯМОКОПАТЕЛИ

■ А ЭКСКАВАТОРЫ

МАШИНЫ ДЛЯ ОБРЕЗКИ РАСТЕНИЙ

Рубрика: 68.85.35.21 УДК: 631.342

Примечание: А также устройства для обрезки растений

Иноязычный эквивалент: pruning machines

Входит в микротезаурус: Техника в сельском хозяйстве

■ B1 С-Х МАШИНЫ

■ H1 СУЧКОРЕЗНЫЕ МАШИНЫ

■ С МАШИНЫ ДЛЯ ОБРЕЗКИ КРОНЫ

■ С МЕХАНИЗИРОВАННАЯ ОБРЕЗКА

■ А ИНСТРУМЕНТЫ

■ А ОБРЕЗКА РАСТЕНИЙ

■ А РЕЖУЩИЕ УСТРОЙСТВА

Ассоциативная связь установлены между двумя дескрипторами вне зависимости от их тематической принадлежности или уровня иерархии, но никогда - между терминами, связанными синонимическими или иерархическим отношениями. Основное назначение ассоциативно связанных терминов - помочь

пользователю при поиске точнее выбрать нужный дескриптор для включения его в поисковое предписание. (4). Например:

С-Х ТЕХНИКА

Рубрика: 68.75.41; 68.85 УДК: 631.3

Иноязычный эквивалент: farm machinery, agricultural engineering

Входит в микротезаурус: Пищевая промышленность; Техника в сельском хозяйстве; Экономика сельского хозяйства

■ B1 МТП

■B1ТЕХНИКА

■ H1 ЗАРУБЕЖНАЯ ТЕХНИКА ■H1СПИСАННАЯ ТЕХНИКА

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

■ С СЕЛЬХОЗТЕХНИКА

■ А ГОСТЕХНАДЗОР

■ А ЗАЩИТНЫЕ УСТРОЙСТВА

■ А МЕЛИОРАТИВНАЯ ТЕХНИКА

■ А МЕХАНИЗАЦИЯ ЖИВОТНОВОДСТВА

■ А ПРОКАТ ТЕХНИКИ

■ А РОБОТОТЕХНИКА

■ А С-Х МАШИНЫ

■ А С-Х ОРУДИЯ

■ А ТЕХНИЧЕСКИЕ ХАРАКТЕРИСТИКИ

■ А ХРАНЕНИЕ С-Х ТЕХНИКИ

■ А ЭНЕРГЕТИЧЕСКИЕ СРЕДСТВА

■ А ЭРГОНОМИКА

Таким образом, микротезаурус по техническому обеспечению АПК, включающий термины, обогащенные связями синонимии, обеспечивает возможность построения гибких стратегий информационного поиска. Он способствует более полному, точному и детальному отображению содержания документа в базе данных ЦНСХБ и помогает пользователям в быстром и точном поиске публикаций по конкретным техническим вопросам и проблемам.

СПИСОК ИСТОЧНИКОВ

1. Тимофеевская С. А. Микротезаурус по животноводству как лингвистическое средство в информационно-поисковой системе ЦНСХБ / С. А. Тимофеевская // Молочное и мясное скотоводство.

- 2017. - № 7. - С. 36-39.

2. Пирумова Л. Н., Харченко Л. Т. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в БД «АГРОС»: методические материалы. - М., 2001. - 69.с.

3. Пирумова Л.Н., Милевская И.А. Научная терминология в публикациях и информационно-поисковых системах по вопросам сельского хозяйства и пищевой промышленности // Библиотечное дело - 2013: библиотечно-информационная деятельность в современной система информации, документальных коммуникаций и культуры: Скворцовские чтения / Моск. гос. ун-т культуры и искусств. - М. 2014, ч. 1.

- С. 182-184.

4. Пирумова Л.Н., Милевская И.А. К вопросу о семантической обработке документов в научной библиотеке. Библиотечное дело - 2016: библиотечно-информационные коммуникации в поликультурном пространстве: Скворцовские чтения; Материалы двадцать первой международной научной конференции (Москва, 27-28 апреля 2016 года) / Мос. гос. ун-т культуры и искусств. - М., 2016. - С. 540-544.

СВЕДЕНИЯ ОБ АВТОРЕ

Андреева Елена Владимировна - старший научный сотрудник отдела аналитико-синтетической обработки документов и лингвистического обеспечения, Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека» sis@cnshb.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.