УДК 025.4:577.17:631.811.98:632.951 DOI 10.24411/0235-2516-2018-10064
ТЕЗАУРУС КАК СИСТЕМА ОТРАЖЕНИЯ СОСТОЯНИЯ ПРЕДМЕТНОЙ ОБЛАСТИ «РЕГУЛЯТОРЫ РОСТА»
Л.Н. Пирумова, к.пед.н., И.А. Милевская
Центральная научная сельскохозяйственная библиотека, e-mail: pln@cnshb.ru
Представлены результаты научных исследований по разработке новых элементов общеотраслевых лингвистических средств, обеспечивающих формирование и структурирование баз данных и эффективный поиск в них. Целью работы была актуализация политематического информационно-поискового тезауруса по сельскому хозяйству и продовольствию (ИПТ) новой лексикой для обеспечения точного описания предметных областей, унифицированного представления данных, отображения и индексирования документов. Проведено обогащение контента ИПТ в части терминологической области «Регуляторы роста» иерархическими деревьями для обеспечения полноты описания предметной области. ИПТ создается с 1992 г., в 2018 г. его объем составил более 51 тыс. лексических единиц. В ходе исследований выявляли отсутствующую в ИПТ терминологию, в т.ч. на понятия, уже утвердившиеся в современной науке и практике в предметной области «Регуляторы роста». Проведено редактирование словарной статьи в части выявления, добавления и проверки синонимии, парадигматических отношений, построения иерархических деревьев, статуса терминов и их меток. Представлено отражение объектов и связей объектов в данной предметной области в ИПТ ЦНСХБ. Словарные статьи из терминологической области «Регуляторы роста» были отредактированы и пополнены в соответствии с современными научными представлениями об их строении и механизмах действия. Показано, что в словарную статью «Регуляторы роста растений» включены дескрипторы, отражающие современную их классификацию. Сделаны выводы, что создание и развитие ИПТ ЦНСХБ соответствует современному мировому уровню развития тезаурусов; в ИПТ достаточно полно отражена терминология, относящая к предметной области «Регуляторы роста», общим объемом 288 лексических единиц; приведенные словарные статьи не противоречат современной классификации регуляторов роста.
Ключевые слова: регуляторы роста, терминология, информационно-поисковые языки, тезаурусы.
THESAURUS AS A REFLECTION SYSTEM OF THE STATE OF SUBJECT AREA «PLANT
GROWTH REGULATORS»
Ph.D. L.N. Pirumova, I.A. Milevskaya
Central Scientific Agricultural Library, e-mail: pln@cnshb.ru
The results of researches on development of new elements of industry-wide linguistic facilities allowing to form, structure databases and effective search in them are presented. The purpose of the work was to actualize the polythematic information retrieval thesaurus in agriculture and foods (IRT) with new lexis to provide exact description of domain areas, reflection of the content of documents, unified representation of data and indexing documents. The content of the IRT was enriched in terms of terminological area «Growth regulators» in hierarchic trees to make the description of the domain area full The IRT has been created since 1992, in 2018 its volume amounted to 51 thousand lexical items. During the research the terminology absent in the IRT was revealed, including for concepts that have already become firmly established in the modern science and practice in the domain area «Growth regulators». The lexical entry has been revised in terms of revealing, adding and verifying synonymy, paradigmatic relations, building hierarchic tree, status terms and their tags. The reflection of objects and relations of objects in this subject area in the CSAL IRT is presented. Lexical entries from the terminological area «Growth regulators» were revised and replenished in accordance with the modern scientific ideas of their structure and mechanisms of action. It is shown that the lexical entry «Growth regulators» comprised descriptors reflecting their modern classification. Conclusions are made that the creation and development of the CSAL IRT meet the current world level of development of thesauri; in the IRT the terminology relating to the domain area «Growth regulators» having a total volume of288 lexical items fully enough reflected; the given lexical entries do not contradict with the modern classification of the growth regulators.
Keywords: plant growth regulators, terminology, information-search_, thesauruses.
Тезаурус - словарь терминов из определенной области знания. В отличие от обычного терминологического словаря тезаурус стремится не только представить все значения понятия, но и с максимальной полнотой отразить его синонимы, а также сведения о его различных связях. Термины, представленные в тезаурусе, содержат информацию о семантических отношениях с другими терминами, включенными в него. Стремление тезауруса как можно полнее представить терминологию по конкретной тематической области оправдывает название «сокровищница» (от греческого thesaurдs - сокровище, сокровищница). Исследователи рассматривают тезаурус как систему, отражающую состояние знаний ученых и специалистов в конкретной тематической области, поскольку терминология определяет конкретные явления и понятия в науке и производстве, относящиеся к данной научной области, и таким образом описывает ее современное состояние. И наконец, тезаурус - это информационно-поисковый язык, инструмент, предназначенный для индексирования документов и последующего поиска их в информационных массивах. Эти два процесса крайне важны для создания информационных ресурсов и обеспечения в них тематического поиска. В процессе индексирования анализируется и раскрывается смысловое содержание документа, осуществляется его перевод с естественного языка на информационно-поисковый язык с помощью лексических единиц - дескрипторов информационно-поискового тезауруса, определяется место документа в информационно-поисковой системе. Информационно-поисковый тезаурус структурирует информационные массивы, обеспечивая в них релевантный тематический поиск. Он должен максимально полно отражать отраслевую лексику для наиболее адекватного раскрытия смыслового содержания документа и для отображения состояния развития данной отрасли. Если явление появилось недавно, то оно отображается ограниченным количеством научных понятий, но с развитием знаний о нем количество терминов, связанных с ним, увеличивается [1].
Цель работы - актуализация политематического информационно-поискового тезауруса по сельскому хозяйству и продовольствию (ИПТ) новой лексикой для обеспечения точного описания предметных областей, отображения содержания документов и эффективного тематического поиска, а также унифицированного представления данных и индексирования документов в автоматизированных информационно-поисковых системах и базах данных. Задача исследования - обогащение контента ИПТ и развитие иерархических деревьев в словарных статьях терминов для обеспечения полноты описания предметной области «Регуляторы роста».
Актуальность работы. ИПТ как терминологический справочник и система знаний, отражающая и
описывающая предметные области, лингвистическое средство формирования, структурирования баз данных и эффективного поиска в них, нуждается в постоянном пополнении новой лексикой, чтобы отражать современный уровень развития аграрной науки.
Методика. Исследования проводили с использованием системы стандартов по информации, библиотечному делу, а также сравнительного анализа, сопоставления, мониторинга, моделирования и синтеза. Методика включала: отбор новых терминов и проверку их на отсутствие в ИПТ; выявление или проверка синонимии; определение или подтверждение статуса термина; установление или проверка парадигматических отношений термина; построение или проверка иерархических деревьев и формирование или редактирование словарной статьи. Место каждой лексической единицы в структуре отношений ИПТ определяется специальными метками или ссылками, такими как: В - вышестоящий термин; Н - нижестоящий термин; А - ассоциации; С - синоним и т.д.
Тезаурус считается наиболее эффективным лингвистическим средством тематического поиска, обеспечивая его точность и полноту. В то же время он наиболее удобен в использовании, т.к. состоит из лексических единиц на естественном языке. В крупнейших международных (АОЫБ, САВ1, МБ) и зарубежных (АОЫСОЬА) базах данных по сельскому хозяйству тезаурусы служат основным лингвистическим средством. ИПТ по сельскому хозяйству и продовольствию является основным информационно-поисковым языком автоматизированной информационно-поисковой системы ЦНСХБ, обеспечивающим релевантный и эффективный тематический поиск. В ЦНСХБ ИПТ разрабатывают с 1992 г., он включает научную лексику по всем отраслям АПК и смежным с ним областям знаний и представляет собой сложную терминологическую систему, между элементами (лексическими единицами) которой существуют различные виды связей - отношения. Объем ИПТ в 2018 г. составил 51839 лексических единиц, в т.ч.: по ветеринарии 9770; пищевой промышленности 6562; защите растений 9353; животноводству 3702; лесному хозяйству 3123; садоводству и плодоводству 3232; генетике и селекции 2187; техническому обеспечению сельского хозяйства 1394; экономике 849; по остальным предметным областям - 11666 лексических единиц [2].
Результаты исследования. Выявлена новая и отсутствующая в ИПТ терминологии на понятия, уже утвердившиеся в современной науке и практике, из предметной области «Регуляторы роста». Из входного документного потока проведен анализ поступивших в ЦНСХБ научных публикаций по предметной области «Регуляторы роста», представленных в отечественных и зарубежных базах данных «АГРОС», АОМБ, АОМСОЬА. Проверяли и дополняли синонимичный ряд, иерархические де-
ревья и статус терминов. В целях гармонизации отечественной и международной терминологии изучали словарные статьи из данной предметной области в тезаурусах международных баз данных по сельскому хозяйству: АОЯОУОС (база данных АОЫБ, ФАО ООН) [3] и тезаурус САВ1 (Информационного бюро по сельскому хозяйству стран Британского содружества) [4]. Разработка ИПТ представляет собой сложный, многоэтапный процесс, в котором, как считают некоторые разработчики, необходимо найти «золотую середину». С одной стороны, набор дескрипторов тезауруса должен быть достаточен для описания документа из предметной области, с другой - дескрипторов не должно быть слишком много, поскольку слишком большая величина тезауруса повышает субъективность индексирования и затрудняет его развитие и использование [5]. Однако чем полнее тезаурус отражает тематическую область, тем большую ценность представляет для специалистов. ИПТ ЦНСХБ стремится к максимально полному отражению отраслевой терминологии для описания различных предметных областей, т.е. позиционируется как классификация знаний по сельскому хозяйству и продовольствию, как словарь нормализованной научной лексики, но при этом развивается и как лингвистическое средство индексирования и эффективного тематического поиска в базе данных «АГРОС».
В ИПТ ЦНСХБ понятие обозначается термином, т.е. термин - это описание языком научной лексики какого-либо понятия из предметной области АПК. Понятие отражает свойства, связи, смысловые отношения конкретного объекта, предмета или явления, которое обозначается термином. В ИПТ термины - это лексические единицы, т.е. отдельные понятия из предметной области представлены определенными лексическими единицами (дескрипторами). В качестве лексических единиц в ИПТ используют одиночные слова (имена существительные), словосочетания, аббревиатуры и сокращения. Ввод одиночных прилагательных, причастий и т.п. не допускается [6]. Одно понятие в ИПТ описано одной лексической единицей - дескриптором, который представлен со всеми отношениями, связывающими его с другими терминами тезауруса [7]. На примере словарной статьи «Регуляторы роста» рассмотрим, как ИПТ ЦНСХБ отражает объекты и связи объектов отдельных областей знания. Регуляторы роста растений - органические соединения, вызывающие стимуляцию или подавление роста и морфогенеза растений. Природные регуляторы роста растений (нередко называемые фитогормонами), синтезирующиеся в растениях, способны действовать в очень малых дозах и передвигаться по растениям, вызывая у них характерные морфофизиологические изменения. Они участвуют в регуляции обмена веществ и формообразо-
вательных процессов, контролируют рост и развитие растений на всех этапах онтогенеза: от эмбриогенеза, регуляции развития отдельных тканей и органов и репродуктивных процессов до защитных реакций на вредителей и патогены, до стрессо-устойчивости и т.д. [8].
Словарная статья РЕГУЛЯТОРЫ РОСТА РАСТЕНИИ имеет следующий вид: В1 Регуляторы роста; Н1 Антиауксины; Н1 Ауксины; Н1 Гаметоци-ды; Н1 Гиббереллины; Н1 Дефолианты; Н1 Ингибиторы роста; Н1 Ингибиторы этилена; Н1 Неклассифицированные регуляторы роста растений; Н1 Ретарданты; Н1 Стимуляторы роста; Н1 Цитоки-нины; Н1 Эндогенные регуляторы роста; Н1 Эти-ленпродуценты; С Гормоны растений; С Фитогор-моны; А Агат-25К; А Агматин; А Агрохимикаты; А Аминобензойные кислоты; А Апикальное доминирование; А Ацетальдегид; А Биологически активные вещества; А Диаминопропан; А Диметилсуль-фоксид; А Кукурбиновая кислота; А Кумарины; А Левулиновая кислота; А Мевалоновая кислота; А Микробиологические удобрения; А Парааминобен-зойная кислота; А Полиамины; А Путресцин; А Ростстимулирующие ризобактерии; А Тиосульфат аммония; А Тирамин; А Трихлоруксусная кислота; А Флавоноиды; А Фосфоновая кислота; А Хитозан; А Янтарная кислота.
В словарную статью включены дескрипторы, отражающие современную классификацию регуляторов роста растений. Важнейшую группу регуляторов роста растений составляют гиббереллины -вещества дитерпеновой природы, самый характерный эффект которых - ускорение роста органов, прежде всего стебля, как за счет деления, так и за счет растяжения клеток [9, 10]. Гиббереллины устраняют физиологическую и генетическую карликовость растений, прерывают покой семян, луковиц и клубней, стимулируют прорастание пыльцы, индуцируют цветение короткодневных видов [11] и вызывают многие другие физиологические изменения у растений. В качестве регулятора роста растений производят гибберелловую кислоту [12] и отечественный препарат Гибберсиб, представляющий собой сумму различных гиббереллинов, получаемую микробиологическим путем [13].
ГИББЕРЕЛЛИНЫ: В1 Дитерпеноиды; В1 Регуляторы роста растений; Н1 Гибберелловая кислота; Н1 Гибберсиб; А Карбоновые кислоты.
Обширную и чрезвычайно важную группу регуляторов роста растений составляют ингибиторы роста. В отдельную словарную статью выделены ретарданты - биологически активные вещества, способные задерживать процесс роста растительной клетки, которые имеют различную химическую структуру, но обладают одинаковой биологической активностью, выражающейся в задержке деления и растяжения клеток в субапикальной меристеме [14].
В ИПТ разделы, посвященные этим группам соединений, отражены следующим образом.
ИНГИБИТОРЫ РОСТА: B1 Ингибиторы; B1 Регуляторы роста растений; Ш 2,3,5-Трийодбензой-ная кислота; Ш Абсцизовая кислота; Ш Анцими-дол; Ш Бутралин; H1 Глифосин; Ш Дикегулак; H1 Жасмоновая кислота; Ш Изопиримол; H1 Ингибиторы прорастания; Ш Ингибиторы цветения; Ш Карбарил; H1 Малеиновый гидразид; Ш Ме-пикват; H1 Морфактиын; Ш Прогидрожасмон; H1 Профам; H1 Флуметралин; H1 Флуоридамид; H1 Фосамин; Ш Хлорпрофам; А Гербициды; А Ксан-тохинины; А Ретарданты; А Хлорхолинхлорид.
РЕТАРДАНТЫ: B1 Регуляторы роста растений; Ш 2,3-Дихлоризомасляная кислота; H1 Ами-дохлор; H1 Даминозид; H1 Мефлуицид; H1 Пакло-бутразол; H1 Тетциклацис; H1 Униконазол; H1 Флурпримидол; Ш Хлорхолинхлорид; А Ингибиторы роста.
К числу основных гормонов растений отнесены цитокинины, производные 6-аминопурина, индуцирующие в присутствии ауксина деление клеток и дифференцировку стеблевых почек у каллюсов, активирующие рост клеток листа, задерживающие старение срезанных листьев травянистых растений [15]. Словарная статья по цитокининам и их синтетическим аналогам представлена в тезаурусе следующим образом.
ЦИТОКИНИНЫ: В1 Регуляторы роста растений; Ш 4-Гидроксифенэтиловый спирт; H1 Бензи-ладенин; Н1 Бензимидазол; Н1 Дигидрозеатин; Ш Дифенилмочевина; Н1 Зеатин; Н1 Зеатинрибозид;
Н1 Изопентениладенин; Н1 Изопентениладенозин; Н1 Картолин; Н1 Кинетин; А Кинины.
Предметная область «Регуляторы роста» представлена в ИПТ ЦНСХБ 288 терминами, что дает полное представление о ее состоянии и развитии. В процессе актуализации ИПТ проведена редакция и пополнение словарных статей из предметной области «Регуляторы роста» выявленными новыми лексическими единицами (дескрипторами, синонимами), парадигматическими связями. Использование актуализированной новой лексикой версии ИПТ в библиотеках отрасли в процессе индексирования документов обеспечивает точность и унификацию отображения содержания документа и представления информации в электронных каталогах и базах данных. Такая детализация словарной статьи позволяет делать узкие тематические запросы по теме «Регуляторы роста» и обеспечивает релевантный поиск в базе данных «АГРОС».
Таким образом, создание ИПТ ЦНСХБ соответствует современному мировому уровню развития тезаурусов и служит эффективным средством индексирования и тематического поиска. В ИПТ достаточно полно отражена терминология, относящая к предметной области «Регуляторы роста»; приведенные в ИПТ словарные статьи не противоречат современной классификации регуляторов роста. Для того, чтобы данная тематическая область в ИПТ отражала новые виды регуляторов роста или их синтетические аналоги необходим постоянный мониторинг научных публикаций по этой теме.
Литература
1. Мдивани Р.Р. О разработке серии тезаурусов по социальным и гуманитарным наукам // Научно-техническая информация. Серия 2, 2004, № 7. - С. 1-9.
2. ИПТ ЦНСХБ [Электронный ресурс]. - 2018. - Режим доступа: http://www.cnshb.ru/jour/user.asp. - Загл. с экрана.
3. AGROVOC [Электронный ресурс]. - 2018. - Режим доступа: http://aims.fao.org/vest-registry/ vocabularies/agrovoc-multilingual-agricultural-thesaurus. - Загл. с экрана.
4. CABI [Электронный ресурс]. - 2018. - Режим доступа: http://www.cabi.org/cabthesaurus/. - Загл. с экрана.
5. Лукашевич Н.В. Тезаурус в задачах информационного поиска. - М.: Изд-во МГУ, 2011. - 512 с.
6. Пирумова Л.Н., Харченко Л.Т. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в БД АГРОС (Методические материалы). - М.: ЦНСХБ, 2001. - 69 с.
7. Добров Б.В., Иванов В.В., Лукашевич Н.В., Соловьев В.Д. Онтология и тезаурусы: модели, инструменты, приложения: учеб. пособие. - М.. : Интернет-университет информационных технологий. Бином. Лаборатория знаний, 2013. - 157 с.
8. Захарычев В.В. Фитогормоны, их аналоги и антагонисты в качестве гербицидов и регуляторов роста растений: учеб. пособие. - М.: РХТУ им. Д.И. Менделеева, Изд. центр, 1999. - 55 с.
9. Jones R.L., Moll C. Gibberellin-induced Growth in Excised Lettuce Hypocotyls // The Biochemistry and Physiology of Gibberellins. - USA: Praeger, 1983, Vol. 2. - P. 95-128.
10. Kaufman P.B., Dayanandan P. Gibberellin-induced Growth in Avena Internodes // The Biochemistry and Physiology of Gibberellins. - USA: Praeger, 1983, Vol. 2. - P. 129-157.
11. Zeevaart J.A.D. Gibberellins and Flowering // The Biochemistry and Physiology of Gibberellins. - USA: Praeger, 1983, Vol. 2. - P. 333-374.
12. Martin G.C. Commercial Uses of Gibberellins // The Biochemistry and Physiology of Gibberellins. - USA: Praeger, 1983, Vol. 2. - P. 395-444.
13. Муромцев Г.С., Агнистикова В.Н. Гиббереллины / отв. ред. С.В. Летунова - М.: Наука, 1984. - 208 с.
14. Шаповал О.А., Вакуленко В.В., Прусакова Л.Д., Можарова И.П. Регуляторы роста растений в практике сельского хозяйства. - М.: ВНИИА, 2009. - 60 с.