Versatile Method of Modeling Content kemerovo state university
Оригинальная статья
Разработка универсального метода построения модели состава и структуры терминологических полей
Журавлев Александр Павлович
Самарский государственный технический университет, Россия, г. Самара
https://orcid.org/0000-0002-2SS3-9307
palych32@rambler.ru
Поступила в редаакцию 20.11.2021. Принята после рецензирования 28.01.2022. Принята в печать 10.03.2022.
Аннотация: Представлена разработка уникального метода построения модели терминополей. Цель разработки -создать основы для компьютерной программы, способной осуществлять оценку знаний учащихся высших учебных заведений как в количественном, так и в качественном аспектах. Метод включает в себя несколько этапов: обработка лексического состава терминополя, выделение структурирующих его элементов, графическое представление модели терминополя. Для разработки указанного способа моделирования использованы такие методы, как тезаурусный подход и метод компонентного анализа лексических значений. Первый позволяет выявить преобладающие виды семантических отношений, связывающих термины в составе терминополя, второй служит для экспликации элементов, структурирующих эти единицы. Произведен выбор наиболее подходящего способа графической репрезентации модели терминополя; таковым признается древовидный граф, который оптимально подходит для представления многоуровневых иерархических структур. На этом графе отображаются элементы двух видов - как сами термины, так и структурирующие их элементы. При разработке метода большое внимание уделяется его универсальности, то есть возможности его адекватного применения к любым терминополям. В дальнейшем планируется применить разработанный метод для построения модели какого-либо конкретного терминополя с учетом характерных особенностей его состава и структуры. Ключевые слова: компонентный анализ, тезаурус, дифференциальная сема, термин, антоним, синоним, гипероним, гипоним, граф
Цитирование: Журавлев А. П. Разработка универсального метода построения модели состава и структуры терминологических полей. Вестник Кемеровского государственного университета. 2022. Т. 24. № 2. С. 220-230. https://doi. org/10.21603/2078-8975-2022-24-2-220-230
Full article
Versatile Method of Modeling Content and Structure of a Terminological Field
Aleksandr P. Zhuravlev
Samara State Technical University, Russia, Samara
https://orcid.org/0000-0002-2SS3-9307
palych32@rambler.ru
Received 20 Nov 2021. Accepted after peer review 28 Jan 2022. Accepted for publication 10 Mar 2022.
Abstract: The paper introduces a new method for modeling a terminological field with its content and structure. The method is a foundation for a computer program able to evaluate students' professional knowledge both in qualitative and quantitative aspects. The method includes several stages: processing the lexical content of a terminological field, revealing elements that н structure this content, and graphical representation of the terminological field model. The list of methods included the thesaurus g approach and the componential analysis of lexical meaning. The thesaurus approach detects the basic types of semantic
< relationships between lexical units within a terminological field. The componential analysis explicates elements that arrange g these units. The model is represented as a tree graph structure, which is ideal for visualizing multi-level hierarchic structures. jg This graph consists of two types of elements: terms and structure units. The method is designed to be flexible and versatile Eg so that it can be effectively applied to any terminological field. The method can be applied to a specific terminological field ^ in order to build its model with particular regard to all characteristic features of its content and structure.
< Keywords: componential analysis, thesaurus, differential seme, term, antonym, synonym, hyperonym, hyponym, graph о
ej Citation: Zhuravlev A. P. Versatile Method of Modeling Content and Structure of a Terminological Field. Vestnik Kemerovskogo £ gosudarstvennogo universiteta, 2022, 24(2): 220-230. (In Russ.) https://doi.org/10.21603/2078-897S-2022-24-2-220-230
220 © 2022. The Author(s). This article is distributed under the terms of the CC BY 4.0 International License
Введение
Данная статья является частью исследования, посвященного идеографическому моделированию состава и структуры терминополя. Под идеографическим моделированием терминологического поля (представляющего собой частный случай лексико-семантического поля) нами понимается построение его модели на основе идеографического описания как входящих в него терминов, так и семантических связей между ними. По А. Середницкой, идеографическая классификация представляет собой группирование слов по тем понятиям, которые ими выражаются [1]. Идеографическая классификация подразумевает установление иерархических (гиперо-гипони-мических) отношений между лексическими микрополями, терминами и тематическими группами, а кроме того, выявление предметно-понятийных отношений между терминами.
Актуальность темы исследования обусловлена возникновением объективных предпосылок для разработки новых подходов к оценке профессиональных знаний. В свете появления большого количества новых профессий (и, следовательно, терминологических полей) для вузов все более важным становится вопрос о контроле над тем, в какой степени учащиеся владеют той или иной терминосистемой. Таким образом, одним из важнейших вызовов, которые встают сегодня перед системой высшего образования, является задача повышения и контроля качества профессионального обучения. Разработанная в данном исследовании методика ориентирована именно на качественную и количественную оценку знаний учащихся и специалистов.
Научная новизна состоит в разработке нового метода построения модели лексико-семантической структуры терминологических полей. Показан иерархический характер структуры терминополя, а для графической презентации его состава и структуры разработан граф, составленный из элементов не одного, а двух типов. Также нами показана возможность использовать предлагаемый метод моделирования для оценивания знаний как в количественном отношении, так и в качественном.
Цель - разработка универсального метода построения модели лексико-семантической структуры терминологических полей. Разработанный нами метод в дальнейшем может послужить основой для разработки квалиметрической компьютерной программы, т.е. программы, предназначенной для оценивания уровня знаний студентов.
Задачи:
1) проанализировать наиболее актуальные для нашего исследования методы работы с терминополями как с точки зрения описания входящих в их состав лексических единиц, так и с точки зрения анализа семантических отношений между этими единицами;
2) разработать универсальные приемы обработки лексического материала терминополей;
3) выявить преобладающие виды семантических связей между терминологическими единицами, формирующими специализированное лексико-семантическое поле;
4) выбрать способ идеографической презентации модели терминополя и обосновать целесообразность этого выбора.
Разработка метода построения модели терминологических полей проводится на основе материала медицинского терминополя Травматология. Повреждения таза [2].
Методы
Поскольку данное исследование посвящено разработке формализованных описаний структуры терминополей, то наиболее актуальным для нас методом анализа эмпирического материала является метод тезаурусного моделирования. Не будет преувеличением сказать, что построение тезауруса специальных областей знания является одной из наиболее актуальных прикладных задач современной науки о языке, определяющей направление исследований в области теории и практики терминологического моделирования на протяжении уже нескольких десятков лет.
В своей более ранней работе мы уже отмечали тот факт, что «во второй половине XX века в языкознании наметилась тенденция к его подъему на качественно новый уровень - от дескриптивного метода (простого наблюдения за фактами языка) и анализа языковых закономерностей к синтезу» [3, с. 13]. Иными словами, описательный метод уступил место созданию новых объектов. Последнее нашло свое отражение в работах Ю. Н. Караулова: «Естественный язык, будучи только объектом изучения, долгое время оставался для языковедов феноменом неприкосновенным, некоторым образом "вещью в себе". Лишь в последнее время <...> появились основания для пересмотра устоявшегося взгляда, поскольку намечается особое направление исследований - построение новых лингвистических объектов с заданными свойствами. Реализация этих задач должна осуществляться на принципах лингвистического конструирования» [4, с. 16].
Мы касаемся темы лингвистического конструирования потому, что этот метод может быть эффективно применен для создания разного рода тезаурусов - как относящихся к бытовой лексике, так и к профессиональной: «Сущность тезаурусного подхода к построению словарной статьи заключается в понимании того, что в основе подобного описания лежит методика лингвистического конструирования» [5, с. 117].
В качестве отправной точки мы возьмем мысль И. И. Жучковой о том, что «тезаурусный подход к моделированию терминологии предполагает конструирование семантических полей посредством выделения семантических отношений между терминами» [6, с. 27]. В свою очередь Е. Ю. Горбунов отмечает: «тезаурус является инструментом структурирования понятийного аппарата некой гуманитарно-социальной ПО [предметной области] на основании выделения понятийно-логических связей между объектами» [7, с. 172]. В данном случае автор пишет
kemerovo state university
I
E-
конкретно о гуманитарных предметных областях, но тезау-русный подход можно применять и к другим областям профессионального знания, в том числе и естественно-научным.
В другом исследовании И. И. Жучкова указывает на то, что «словарь-тезаурус является одним из наиболее актуальных способов упорядочения терминологических единиц определенной предметной области, а разработка модели терминологического поля данной предметной области на основе тезаурусного подхода предполагает анализ и синтез терминологии и позволяет выявить ее особенности как знаковой системы, определить характеристики входящих в нее лингвистических единиц» [8, с. 232]. В более поздней своей статье упомянутый автор пишет об этом более конкретно: «Одним из способов конструирования понятийной картины ПО [предметной области] является метод тезаурусного моделирования терминологической системы» [9, с. 37].
На актуальность метода тезаурусного моделирования указывает С. О. Коршунова [5, с. 117], отмечая, что «терминология составляет ядро профессиональной коммуникации. Термин работает только в системе, сущность которой заключается в иерархических отношениях, которые успешно выявляются с помощью тезаурусного моделирования» [10, с. 56]. Таким образом, С. О. Коршунова обращает внимание на очень важный дидактический аспект, и метод тезаурусного моделирования может послужить одним из потенциальных путей его реализации. Значимость дидактической стороны тезаурусного моделирования отмечается и другими авторами, например, Н. Н. Горбуновой [11, с. 7], Е. С. Краснопеевой [12, с. 215].
Ю. Н. Карауловым упоминается еще одно весьма важное в современном мире свойство тезаурусного подхода: его высокий потенциал в области поиска информации автоматическими системами [4, с. 222].
В рамках данной статьи мы опираемся на этот материал для того, чтобы кратко сформулировать некоторые основные черты метода тезаурусного моделирования, которые будут иметь значение в нашем дальнейшем исследовании.
1. Тезаурусный подход подразумевает не только описание отдельных лексических единиц, но и обязательное описание семантических отношений между ними. При помощи тезаурусного подхода формируется то, что принято называть семантическим пространством.
2. Применение тезаурусного подхода к массиву лексики
(особенно специальной) дает возможность представить его структуру в виде иерархии, состоящей из произвольного числа уровней.
3. По описанным выше причинам тезаурусный подход позволяет создавать модель структуры практически любой предметной области, в том числе для прикладных целей.
Продолжая тему актуальности тезаурусного подхода [3] и прорабатывая вопрос его применения для построения модели состава и структуры терминологического поля,
мы делаем следующий шаг и углубляем наше исследование, переходя к рассмотрению основных видов семантических отношений, отображаемых в тезаурусе. Эти отношения составляют важную часть тезаурусного подхода к описанию лексики, а их выявление и применение для построения лексико-семантических групп терминов будут способствовать решению некоторых задач, поставленных нами в настоящем исследовании.
Исследователи несколько по-разному дифференцируют и толкуют разные виды семантических отношений: так, некоторые пишут о трех основных видах системных связей лексических единиц в составе терминополя - эквивалентных, иерархических и ассоциативных [13, с. 45; 14, с. 47; 15, с. 48]. Следует пояснить, что под эквивалентными и ассоциативными отношениями подразумеваются соответственно синонимия и антонимия, а под иерархическими - гиперо-гипонимия. Бывает, что исследователи вообще не объединяют типы отношений в группы, а просто перечисляют их: «синонимы, антонимы, паронимы, гипонимы, гиперонимы и т. п.» [16, с. 88].
Помимо вышеупомянутых семантических отношений нас интересуют и некоторые другие, например, род - вид и часть - целое (т. е. меронимия) [17, с. 265]. У разных исследователей встречаются упоминания таких системных отношений, как омонимия, полисемия и т. д., однако мы не принимаем их рассмотрение, т.к. они не представляются нам релевантными в контексте данной работы.
Можно убедиться, что в качестве основных типов лексико-семантических отношений, объединяющих термины в терминополе, выделяются прежде всего иерархические (гиперо-гипонимия / род - вид). На втором месте находятся синонимия, антонимия и меронимия.
Итак, тезаурусный подход имеет большой прикладной потенциал и может выступать в качестве мощного и универсального инструмента для описания состава и структуры предметных областей, поскольку позволяет выявлять и моделировать системные отношения между лексическими единицами в составе терминополя.
Другим методом, который мы активно используем в нашем исследовании, является метод компонентного анализа лексических значений.
Д. Таалайбек уулу и И. А. Костина пишут следующее: «Компонентный анализ исходит из признаков явлений, которые лежат в основе названий предметов действительности. <.> ... такие признаки выражаются частями значения (семантическими компонентами, семами, семантическими множителями, фигурами)» [18, с. 52]. Мысль о значении как совокупности минимальных смысловых компонентов встречается и у других исследователей, например у Н. А. Стадульской [19, с. 112].
Применение компонентного анализа показало, что значение слова не является просто неупорядоченным массивом сем. Наоборот, оно имеет свою структуру: «Несмотря на множество различных мнений о природе компонентного
анализа, в его основе лежит значение слова как организованная структура семантических и дифференцирующих единиц» [20, с. 50]. Здесь мнение автора перекликается с мыслями, изложенными в работе А. М. Кузнецова [21, с. 14].
Эта структура имеет нелинейный характер и представляет собой иерархию [22, с. 295]. Как пишет А. Я. Шайкевич, «В описании системы языка большое значение имеет переход от синтагматических (текстуальных) связей к связям парадигматическим (системным)» [23, с. 370].
Ю. Н. Караулов обозначает семы понятием семантические множители, под которыми понимает «элементарные единицы содержательного плана, которые, соединяясь друг с другом в различных количествах и комбинациях, задают значение любого слова в языке» [24, с. 4].
Представление о массиве элементарных компонентов значения - сем - как об иерархически упорядоченной структуре является ключевым для нашего исследования. Действительно, адекватно описать можно только структурно оформленный массив компонентов значения, т.е. массив, в котором эти компоненты объединены некоторыми системными отношениями.
Исследователи дают несколько разные определения метода компонентного анализа, но в них содержатся общие черты: «В целом компонентный анализ можно определить как метод исследования содержательной стороны значимых единиц языка, разрабатываемый в рамках структурной семантики и имеющий целью разложение значения на минимальные семантические составляющие» [21, с. 8]. Сходные определения содержатся в других работах, например у О. Н. Селиверстовой [25, с. 81].
Традиционно выделяются несколько типов сем. В рамках нашего исследования нас более всего интересует деление сем на интегральные и дифференциальные [19, с. 112].
Необходимо отметить, что к анализу значения ни в коем случае не следует подходить сугубо структурно. Комбинирование ограниченного числа дифференциальных признаков может дать результат в плане выражения, но не содержания. Действительно, наше познание не ограничено; язык, являясь средством выражения содержания, есть лишь проекция этого содержания и вследствие этого ограничен, как и всякая проекция. Иными словами, индивид, оперируя ограниченными возможностями языка, отображает бесконечный мир конечными средствами [26, с. 181-182].
Следует отметить, что выявление сем - не цель, а способ структурировать лексико-семантическую группу или терминополе. Среди исследователей распространено мнение, что «предел членения семемы на семы задается мерой человеческого знания о денотате. В практических целях членение семемы на семы выполняется в ограниченных пределах в зависимости от поставленных задач» [27, с. 35].
Метод компонентного анализа с полным правом может быть использован в нашем исследовании для анализа лексического значения в рамках лексико-семантических полей, относящихся к специализированным областям знания.
Результаты
Обработка лексического состава терминополя
Разрабатывая универсально применимый метод моделирования состава и структуры терминополя, мы в первую очередь должны выделить некоторые основные его этапы; более того, нам нужно проработать приемы обработки лексического материала на каждом из них.
При выделении этапов предлагаемой нами процедуры, равно как и при разработке связанных с ними приемов, нужно действовать с учетом некоторых соображений. С одной стороны, разрабатываемый нами метод построения модели терминополя должен характеризоваться максимально возможной степенью универсальности, поскольку этот метод в перспективе предполагается применять к лексико-семантическим полям, относящимся к самым разным областям профессионального знания. С другой - нам крайне важно предусмотреть возможность того, чтобы прорабатываемые нами приемы помогали максимально адекватно моделировать структуру конкретного терминополя с учетом характерных особенностей его строения и лексического наполнения.
Итак, первым этапом разрабатываемого нами метода построения модели терминополя станет обработка его лексического состава; речь идет об отборе лексики и ее анализе. Это нужно для адаптации лексической базы терминополя для последующего моделирования его структуры. Данный этап включает в себя несколько процедур.
Во-первых, при формировании лексической подборки мы решили включать в нее лишь термины, отличающиеся наибольшей частотностью употребления в выбранной предметной области. Дело в том, что одни термины характеризуются большей частотностью использования, чем другие, а некоторые вообще могут стать неактуальными и в конечном итоге исчезнуть из общения специалистов между собой. В предыдущих своих работах мы пришли к выводу, что такие терминологические единицы следует исключать из рассмотрения, т.к. они «вряд ли полезны в рамках своей предметной области и не внесут какого-либо существенного вклада в модель ее лексико-семантической структуры» [28, с. 56].
Во-вторых, в составе очень многих предметных областей присутствуют нетерминологические единицы, никак не закрепленные в справочниках или словарях по этому предмету. И все же эти «нетермины» широко употребляются специалистами наряду с терминами - либо в качестве их синонимов, либо для ликвидации лакун. Мы считаем, что вопрос о включении такого рода лексических единиц в выборку должен решаться исследователем с учетом особенностей конкретного терминологического поля. С одной стороны, с прикладной точки зрения желательно устранять лакуны в профессиональном лексиконе, с другой - в некоторых случаях нетерминологические единицы могут быть нежелательным явлением, «засоряющим» исследуемый лексический материал и, соответственно, отрицательно влияющим на достоверность результатов исследования.
kemerovo state university
I
E-
Представляется очевидным тот факт, что процедура отбора лексики для формирования лексической базы терминополя с целью смоделировать его состав и структуру должна осуществляться в тесном взаимодействии со специалистом-предметником. Лишь человек, погруженный в конкретную предметную область, сможет пояснить исследователю-лингвисту, какие именно термины и жаргонизмы действительно актуальны на настоящий момент.
Следующий шаг - анализ лексических единиц, формирующих созданную на предыдущем шаге выборку; эта процедура проводится с целью установления характера семантических взаимодействий между терминами и нетерминологическими единицами в составе терминополя. Раннее мы пришли к заключению, что для этой цели можно использовать метод тезаурусного моделирования [28, с. 57]. В то же время мы отмечали, что «терминополя, относящиеся к разным предметных областям, могут характеризоваться разными видами преобладающих в них системных связей» [28, с. 57]. Например, в рамках одних терминополей лексические единицы соотносятся друг с другом преимущественно по принципу многоуровневой иерархии, в то время как в составе терминополей, принадлежащих к другим областям профессионального знания, термины могут относиться друг к другу как целое - часть.
Для удобной и наглядной репрезентации семантических отношений между терминами, образующими терминологическое поле, нами было принято решение представлять лексическую выборку в специальных таблицах. Вид таких таблиц может меняться в зависимости от особенностей конкретного терминополя, но основной принцип их построения остается неизменным.
В первой графе таблицы предполагается указывать уникальный индекс термина. Во второй графе должен приводиться сам термин. В последующих графах указываются выделенные в ходе анализа массива профессиональной лексики преобладающие виды семантических отношений, объединяющих термины в составе терминополя. Количество таких граф и указываемые в них типы отношений определяются характерными особенностями конкретного терминополя. К примеру, там могут быть указаны синонимы, антонимы, гиперонимы и т. д.
Таковы предлагаемые нами приемы обработки лексического состава терминополя. Мы считаем, что основные критерии составления выборки профессиональной лексики для задач моделирования будут примерно одинаковы для всех терминополей; характерные особенности конкретного терминополя подразумевают наличие тех или иных нюансов.
Таким образом, разработанные приемы имеют универсальный характер и могут быть адекватно применены к лексическому составу любой предметной области.
Однако проработка лексической составляющей тер-минополя - это только первый этап процедуры построении его модели. Второй этап (весьма ответственный) -
систематизация этого материала. Структурирование лексического материала осуществляется в силу разных причин. В нашем исследовании мы делаем это для наглядного представления материала в учебных целях; в перспективе разработка определенных правил и процедур организации лексической базы терминополя может послужить делу создания оценивающей компьютерной программы.
Ранее мы уже упоминали, что анализ лексического наполнения терминологического поля (наподобие описанного выше) может способствовать осуществлению оценки знаний именно в количественном плане, а для оценки профессиональных знаний по неким качественным параметрам нам необходимо «структурировать лексический материал с использованием каких-либо категорий» [28, с. 58]. Этому и посвящен второй этап предлагаемого нами метода: проведя анализ лексического наполнения терминополя, мы приступаем к поиску путей представления его структуры.
По этой причине второй этап построения модели терминополя подразумевает выявление элементов, которые будут упорядочивать лексическое наполнение терминологического поля, группируя термины по неким общим принципам. Так мы предполагаем получить группы из двух и более терминов, состоящих друг с другом в отношении антонимии.
В рамках настоящего исследования для выделения структурирующих элементов мы решили использовать метод компонентного анализа, поскольку очень часто лексические единицы в составе терминополя связаны между собой отношениями несовместимости; в математической комбинаторике это называется «или-или». Действительно, подавляющее большинство терминов в составе терминологического поля противопоставлены друг другу и формируют различного размера группы антонимов. Это происходит потому, что они реализуют какой-то общий компонент значения; лингвист, работая совместно со специалистом-предметником, может легко этот компонент выделить.
В свете этого использование дифференциальных сем в качестве основы для выделения структурирующих элементов представляется нам наиболее подходящим и эффективным приемом.
Считаем необходимым отметить следующее о выделении структурирующих элементов: в исследовательских работах, связанных с проблемами описания терминологии и создания профессиональных тезаурусов, многие авторы принимают в рассмотрение (и, соответственно, визуально отображают) только термины. С элементами, структурирующими эти термины, наблюдается следующая ситуация: они или приводятся в форме довольно неоднозначных определений (т.е. подразумевающих наличие более чем одного толкования; программная реализация таких формулировок практически невозможна), или не указаны вовсе, а лишь подразумеваются. Е. Ю. Горбунов отмечал эту проблему, описывая трудности, возникающие при построении модели
некоторых областей знания: «Во-первых, это нечетко структурированная, "мягкая", с трудом поддающаяся дискретной модельной структуризации природа гуманитарных объектов. Во-вторых, это невыработанность во многих гуманитарных предметных областях (ПО) четких и надежных классификационных критериев» [29, с. 169].
Данную ситуацию необходимо рассматривать с двух сторон. С одной стороны, мы принимаем излагаемую этими авторами точку зрения. Но с другой - мы должны помнить о важности практического применения предлагаемого нами метода построения модели состава и структуры терминологического поля. В этой связи мы посчитали обоснованным шагом репрезентировать не только термины, формирующие лексическую базу терминополя, но и те элементы, которые структурируют эти термины с учетом всех видов семантических отношений между ними. В этом вопросе мы руководствуемся рядом соображений.
Во-первых, вычленение упорядочивающих элементов необходимо для достижения поставленной нами цели. Мы не видим возможности для разработки универсально применимого метода построения модели терминологического поля, если не будут эксплицированы структурирующие это поле элементы. Не будем забывать, что нашей целью в перспективе является возможное применение настоящих наработок для программной реализации алгоритма оценивания профессиональных знаний. Структурирующие элементы выступают здесь в качестве остова предметной области, в том числе и с точки зрения иерархии; вокруг этого остова упорядоченно располагаются термины. Зная структурирующие элементы, можно быстро и просто построить компьютерную модель любой предметной области.
Во-вторых, выполнить ряд поставленных нами задач можно лишь в том случае, если учебный материал будет репрезентирован в форме, обеспечивающей доступную подачу его студентам. Это требуется для создания в мышлении учащихся адекватно выстроенной терминологической картины изучаемой ими профессиональной области, и важность наличия при этом четко эксплицированных структурирующих элементов трудно переоценить.
Как следствие, структурирующие элементы могут способствовать выявлению и устранению лакун в профессиональных знаниях учащихся. Часто наблюдается следующая ситуация: студент знает термин, но не помнит его антонима. Причиной тому может служить тот факт, что у этого студента есть знание лексического состава изучаемой им предметной области, однако нет понимания ее структуры. Профессиональная лексика хранится в его памяти неупорядоченным массивом.
Знание и понимание не только состава, но и структуры профессионального знания обеспечит гораздо более высокий уровень владения материалом, а также позволит ликвидировать лакуны: уяснив для себя структурирующие элементы, учащийся запомнит и относящиеся к ним
группы терминов. (Далее по тексту по отношению к структурирующим элементам мы будем употреблять наименование критерии.)
Итак, мы решили вырабатывать критерии формирования антонимических групп терминов на основе дифференциальных сем. При этом мы исходили из следующих предпосылок.
1. Принимаемые к рассмотрению критерии должны быть часто используемыми и наиболее релевантными для данной предметной области на настоящий момент.
2. Используемые для построения модели критерии должны быть общепринятыми (т.е. универсальными). Действительно, в рамках настоящего исследования нас мало интересуют критерии, встречающиеся лишь как частный случай в составе специализированных классификаций.
3. Имеет смысл рассматривать лишь те критерии, которые позволяют сформировать минимально полную группу терминов, т. е. образованную не менее чем двумя лексическими единицами. Таким образом, мы устанавливаем ограничение по минимальному объему антонимической группы. При этом максимальное количество терминов в этой группе теоретически может быть неограниченным; как правило, в состав группы входят не более четырех терминов. Мы заостряем свое внимание на этом пункте по той причине, что очень часто имеет место следующая ситуация: парный термин либо вообще отсутствует, либо является профессионализмом, жаргонизмом, а то и вовсе неологизмом. В любом случае термином такое слово не является, но тем не менее активно употребляется профессионалами (например, для ликвидации лакун). Однако в нашем случае нам совершенно необходимо указать антонимическую пару терминов полностью, поскольку программа для оценивания знаний по определению не допускает наличия лакун.
По итогам проведенного отбора предполагается составлять специальную таблицу критериев для наглядной демонстрации того, как эти критерии выстраивают термины в некую структуру. В отличие от таблицы, которую предполагалось строить на предыдущем этапе, таблица критериев имеет строго три столбца. Первый столбец служит для указания индекса критерия, коррелирующего с индексами терминов из построенной ранее таблицы. Во второй графе приводится непосредственно сам критерий. Третья графа используется для перечисления терминов, входящих в состав антонимической группы, которая выделяется согласно данному критерию.
Наконец, третий этап разрабатываемого в настоящем исследовании метода построения модели терминополя заключается в идеографической репрезентации его состава и структуры. Ниже мы рассмотрим способ визуального представления нашей модели.
kemerovo state university
I
E-
Выбор способа графического представления состава и структуры терминополя
При выборе способа визуального представления состава и структуры терминологического поля для получения нужных нам результатов мы должны учитывать несколько важных факторов. В частности, выбираемый нами способ должен быть функциональным. Аспект функциональности приобретает особое значение по причине того, что целью настоящего исследования является разработка метода построения модели терминологического поля с перспективой использования этого метода в качестве основы для квалиметрической программы. Более того, этот способ должен быть способен реализовывать предлагаемые нами приемы работы с лексическим составом терминополя и способствовать их реализации в виде алгоритма компьютерной программы.
Выбирая способ визуального представления структуры терминополя, мы считаем необходимым сделать следующее замечание: разговор идет не только и не столько об отображении на модели того или иного терминополя только лишь его лексического состава. С технической точки зрения репрезентация лексических единиц не представляет затруднений. Нашей главной задачей в данном случае является представление принципов построения того или иного терминополя, где были бы учтены все присущие ему типы системных отношений между терминами. В силу определенных причин структура специализированной предметной области (и, следовательно, относящегося к ней терминополя) часто имеет вид сложной многоуровневой системы, упорядоченной по иерархическому принципу. В этой связи нам представлялся логичным вывод, что для адекватного отображения такой структуры необходимо идеографическое представление ее по принципу разветвленной многоуровневой структуры. Такое графическое представление позволяет визуализировать не только горизонтальные отношения между терминами (например, между синонимами, антонимами и т. д.), но и вертикальные (между гиперонимом и гипонимами, меронимами и т. д.).
Приняв во внимание все упомянутые условия, мы приняли решение использовать граф в качестве способа идеографической репрезентации модели терминополя. Использование графа в такой функции является вполне распространенным явлением, причем не только в направлениях, связанных с языкознанием. В этом факте нет ничего удивительного, поскольку графовые структуры идеально отвечают требованиям по репрезентации знаний в виде разного рода классификаций. Кроме того, теория графов является смежной с такими областями, как логика, математика и программирование, что делает возможной реализацию результатов настоящего исследования в виде программы для оценивания знаний.
Итак, общая структура терминологического поля может быть представлена в виде графовой структуры. При этом каждый полилексемный термин, каждый ответ учащегося
может быть представлен в виде графа, являющегося частным случаем графа терминополя. Путем сопоставления такого частного графа с общим графом терминополя (естественно, с применением параметров количественной и качественной оценки) можно будет произвести оценивание степени владения студентом как лексическим материалом, так и структурирующими элементами, организующими этот материал в четко выстроенную языковую картину предметной области.
При выборе способа графического представления состава и структуры терминополя было важно ответить как на вопрос о характере представляемой на графе информации, так и на вопрос о способе ее организации. И мы снова возвращаемся к вопросу о необходимости экспликации элементов, структурирующих лексическую базу терминополя; однако теперь мы рассмотрим этот вопрос в ключе идеографической репрезентации состава и структуры терминополя.
Дело в том, что при использовании графа как способа репрезентации некоей базы знаний, на нем очень часто отображают только термины. При этом на таком графе, как правило, не представлены какие-либо явно выраженные структурирующие элементы, объясняющие расположение этих терминов или понятий именно в таком порядке; а ведь сам граф может иметь достаточно сложную структуру, насчитывающую несколько уровней.
Однако, нельзя сказать, что упомянутых структурирующих элементов нет вообще. Это не так - они представлены, но имплицитно. Теоретически человек может интуитивно догадаться о критериях объединения каких-либо понятий в группы. Однако так происходит только в случае с простейшими классификациями на бытовом уровне. Когда же речь заходит о профессиональной классификации и, соответственно, о профессиональном обучении, имплицитный характер структурирующих элементов может представлять серьезную проблему как в плане подачи материала, так и в плане его восприятия и усвоения. Обратимся к монографии А. Н. Краснова «Психолого-педагогические основы технологии открытого тестирования» [2], содержащей свыше 300 ответов студентов относительно классификации повреждений таза, и рассмотрим один из них:
Переломы таза
I - открытые
II - закрытые
а) (1) со смещением тазового кольца (2) без смещения тазового кольца
б) (1) с нарушением функции органов малого таза (2) без нарушения функции органов малого таза
Визуализация примера как графа представлена рис. 1. Из приведенного графа следует, что рассматриваемый ответ содержит только лексическую информацию; ни одного явно выраженного структурирующего элемента здесь не наблюдается.
Так, совершенно неочевидно, как связаны между собой термины открытые переломы и закрытые переломы. Иными словами, непонятно, почему они входят в одну группу, а термины переломы с нарушением функции органов малого таза и без нарушения - в другую. В рассматриваемом нами ответе не представлено то, что можно было бы назвать опорными точками; при их наличии преподаватель смог бы провести оценку знаний обучаемого не только в количественном отношении (по степени лексического наполнения ответа), но и в качественном (по полноте и целостности структуры ответа).
Конечно, экзаменатор так или иначе извлекает эти опорные точки из того ответа, что дает учащийся, и поэтому в принципе способен оценить его знания в качественном отношении. Тем не менее по причине того, что студента будет тестировать не живой человек, а компьютер, опорные точки классификации должны быть представлены в его ответе максимально четко и однозначно. В этой связи очевидно, что единственным способом решения этой проблемы является экспликация элементов, структурирующих состав терминополя. Именно они и выступят в роли тех
- Переломы таза
< <
С
■с
с {
открытые
закрытые
J
3
со смещением тазового кольца
без смещения [тазового кольца]
J
3
с нарушением функции органов малого таза
без нарушения [функции органов малого таза]
3 3
Рис. 1. Граф, содержащий только термины Fig. 1. A terms-only graph
самых необходимых нам точек, на которые сможет опереться программа для качественного и количественного оценивания знаний.
Вновь обратимся к примеру, очевидно, что термины открытые переломы и закрытые переломы имеют некий общий смысловой компонент. Значит, их можно объединить в бинарную оппозицию на основе критерия, эксплицированного нами в соответствии с этим компонентом. Назовем этот критерий по наличию раны и обозначим его Кр-1. Совершенно так же мы поступаем и с другими группами терминов-антонимов из рассматриваемого ответа. В результате получаем еще два критерия: Кр-2 - по наличию смещения тазового кольца и Кр-3 - по наличию нарушения функции органов малого таза. На рис. 2 показан граф, адаптированный для процедуры оценивания квалиметриче-ской программой. На графе появились четко выраженные опорные точки - критерии выделения антонимических групп терминов. Эти термины восходят к гиперониму -корневой вершине графа переломы таза.
Итак, для идеографической репрезентации состава и структуры терминополя мы выбрали граф как способ, наиболее подходящий для целей нашего исследования. При этом граф состоит из элементов двух видов - лексических единиц (терминов) и структурирующих элементов (критериев объединения этих терминов в группы). Движение по такому графу можно осуществлять как вверх (восходящее движение), так и вниз (нисходящее движение). Нисходящее движение более предпочтительно в плане обучения, поскольку постепенное движение от общего к частному позволяет обучаемому охватить структуру предметной области в целом.
Заключение
На данном этапе мы считаем разработку метода построения модели лексико-семантической структуры терминополя в целом законченной. Мы описали основные этапы процедуры моделирования, основанные на методах компонентного анализа и тезаурусного моделирования, а также выявили преобладающие виды семантических отношений, связывающих термины в составе терминополя. Кроме того, мы показали необходимость экспликации элементов,
Переломы таза
Рис. 2. Граф ответа с эксплицированными структурирующими элементами Fig. 2. A graph representing both terms and structure units
BULLETIN
kemerovo state university
структурирующих лексическую базу терминополя (критериев), и подобрали подходящий способ графического представления его структуры и лексического наполнения. Конечно, предлагаемый нами метод не полон и не идеален, но судить о его сильных и слабых сторонах можно будет только при применении его к конкретному терминополю.
По итогам проведенного нами исследования сделаны следующие выводы:
1. Метод тезаурусного моделирования может быть эффективно и адекватно применен для установления характера преобладающих видов семантических отношений, связывающих лексические единицы в составе терминополя.
2. После осуществления предложенной нами процедуры обработки лексической базы терминополя эту базу можно репрезентировать в виде древовидного графа с ярко выраженной иерархической структурой.
3. Для адекватного отображения состава и структуры терминополя на графе необходимо репрезентировать не только лексические единицы, но и структурирующие их элементы. Эти элементы можно сформулировать с применением метода компонентного анализа на основе дифференциальных сем, выделенных на этапе обработки лексического материала терминополя. Такое представление состава
и структуры терминополя позволяет, помимо прочего, реализовать процедуру оценивания качественной и количественной составляющей ответов студентов в виде квалиметрической компьютерной программы, поскольку теория графов и программирование тесно связаны между собой.
Собранные материалы и сделанные выводы в перспективе могут послужить методологической основой для разработки систем автоматизированной количественной и качественной оценки знаний учащихся всех уровней, а также специалистов всех профилей. Результаты работы могут быть использованы для создания справочников по какой-либо предметной области, при разработке специальных курсов по терминоведению, полевому анализу и идеографическому моделированию. В дальнейшем нами планируется применить разработанный метод к конкретному терминологическому полю с учетом характерных особенностей его структуры и лексического состава.
Конфликт интересов: Автор заявил об отсутствии потенциальных конфликтов интересов в отношении исследования, авторства и / или публикации данной статьи. Conflicting interests: The author declared no potential conflicts of interests regarding the research, authorship, and / or publication of this article.
Литература / References
1. Середницкая А. Метод отбора реестровых единиц идеографического словаря глаголов перемещения украинского языка. Украинская национальная идея: реалии и перспективы развития. 2008. № 20. С. 156-159. Serednitskaia A. A. A method of sorting out registered units for ideographic vocabulary of Ukrainian movement verbs. Ukrainskaia natsionalnaia ideia: realii iperspektivy razvitiia, 2008, (20): 156-159. (In Russ.)
2. Краснов А. Н. Психолого-педагогические основы технологии открытого тестирования. Самара: СамНЦ РАН, 2005. 442 с. Krasnov A. N. Psychological and pedagogical basis of open testing technology. Samara: SSC RAS, 2005, 442. (In Russ.)
3. Журавлев А. П. Актуальность применения тезаурусного подхода для моделирования лексико-семантической структуры терминополя. Известия Самарского научного центра Российской академии наук. Социальные, гуманитарные, медико-биологические науки. 2021. Т. 23. № 78. С. 13-16. https://doi.org/10.37313/2413-9645-2021-23-78-13-16 Zhuravlev A. P. Applicability of the thesaurus approach to modelling the lexical-semantic structure of a terminological field. Izvestiya of the Samara Science Centre of the Russian Academy of Sciences. Social, Humanitarian, Biomedical Sciences, 2021, 23(78): 13-16. (In Russ.) https://doi.org/10.37313/2413-9645-2021-23-78-13-16
4. Караулов Ю. Н. Лингвистическое конструирование и тезаурус русского литературного языка. М.: Наука, 1981. 367 с. Karaulov Yu. N. Linguistic engineering and standard Russian thesaurus. Moscow: Nauka, 1981, 367. (In Russ.)
5. Коршунова С. О. Роль тезаурусного моделирования в организации терминополя «Text - текст». Вестник Иркутского государственного лингвистического университета. 2009. № 1. С. 116-124.
Korshunova S. O. The interlingual field "Text - tekst" as a result of thesaurus modeling. Vestnik Irkutskogo gosudarstvennogo lingvisticheskogo universiteta, 2009, (1): 116-124. (In Russ.) g 6. Жучкова И. И. Тезаурусное моделирование английской спортивной терминологии (на примере семантического поля J "Football" (футбол)). Вестник Чувашского государственного педагогического университета им. И. Я. Яковлева. 2021.
о № 3. С. 25-30.https://doi.org/10.37972/chgpu.2021.112.3.004
Zhuchkova I. I. Thesaurus modelling of English terminology of sport (semantic field "Football"). Vestnik Chuvashskogo gosudarstvennogo pedagogicheskogo universiteta imeni I. Ya. Yakovleva, 2021, (3): 25-30. (In Russ.) https://doi.org/10.37972/ g chgpu.2021.112.3.004
¡g 7. Горбунов Е. Ю. Лингвистический потенциал тезаурусного моделирования как инновационная образовательная S технология. Теория и практика приоритетных научных исследований: мат-лы III Международ. науч.-практ. конф.
£ (Смоленск, 30 апреля 2018 г.) Смоленск: НОВАЛЕНСО, 2018. С. 170-173.
u
ВЕСТНИК Журавлев А. П.
кемеровского государственного университета Разработка универсального метода
Gorbunov E. Yu. Linguistic potential of thesaurus modelling as an innovative educational technology. Theory and practice of priority scientific research: Proc. III Intern. Sci.-Prac. Conf., Smolensk, 30 Apr 2018. Smolensk: NOVALENSO, 2018, 170-173. (In Russ.)
8. Жучкова И. И. Преимущества компьютерной реализации гипертекстового тезауруса английских терминов по лингвистике текста. Текст: филологический, социокультурный, региональный и методический аспекты: мат-лы V Междунар. науч. конф. (Тольятти, 15-17 апреля 2015 г.) Тольятти: ТГУ, 2015. С. 232-238.
Zhuchkova I. I. Advantages of computer implementation of hypertext thesaurus of English text linguistics terminology. Text: philological, socio-cultural, regional and methodological aspects: Proc. 5th Int. Sci.-Prac. Conf., Tolyatti, 15-17 Apr 2015. Tolyatti: TSU, 2015, 232-238. (In Russ.)
9. Жучкова И. И. Методика построения тезауруса английской терминологии лингвистики текста. Вестник Волжского университета им. В. Н. Татищева. 2016. Т. 1. № 1. С. 36-42.
Zhuchkova I. I. Methodology for constructing terminological English-Russian "text linguistics" thesaurus. Vestnik Volzhskogo universiteta im. V. N. Tatishcheva, 2016, 1(1): 36-42. (In Russ.)
10. Коршунова С. О. Тезаурус как способ систематизации юридической терминологии. Проблемы современного российского законодательства: мат-лы IV Всерос. науч.-практ. конф. (Иркутск, 11 сентября 2015 г.) Иркутск, 2015. С. 56-59. Korshunova S. O. Thesaurus as the way of arranging law terminology. Problems of modern Russian legislation: Proc. 4th All-Russian Sci.-Prac. Conf., Irkutsk, 11 Sep 2015. Irkutsk, 2015, 56-59. (In Russ.)
11. Горбунова Н. Н. Некоторые результаты тезаурусного моделирования англоязычной терминосистемы менеджмента. Ученые записки Национального общества прикладной лингвистики. 2014. № 2. С. 7-17.
Gorbunova N. N. Some results of thesaurus modelling of the English management terminology system. Uchenye zapiski Natsionalnogo obshchestva prikladnoi lingvistiki, 2014, (2): 7-17. (In Russ.)
12. Краснопеева Е. С. Об использовании тезаурусного подхода в качестве дидактического инструмента при представлении новой терминологии в курсах теории перевода. Исследование лингвокреативных процессов в когнитивно-дискурсивном аспекте: мат-лы Междунар. науч.-практ. конф. (Челябинск, 23 ноября 2016 г.) Челябинск: Энциклопедия, 2016. С. 214-219. Krasnopeeva E. S. Thesaurus approach as a didactic tool when presenting new terminology within the translation theory course. The study of linguo-creative processes in the cognitive-discursive aspect: Proc. Intern. Sci.-Prac. Conf., Chelyabinsk, 23 Nov 2016. Chelyabinsk: Entsiklopediia, 2016, 214-219. (In Russ.)
13. Быкова С. Е. Терминология как объект тезаурусного моделирования. Вестник Южно-Уральского государственного университета. Серия: Лингвистика. 2012. № 25. С. 45-49.
Bykova S. E. Terminology as object of thesaurus modeling. Bulletin of the South Ural State University. Ser. Linguistics, 2012, (25): 45-49. (In Russ.)
14. Ведерникова Ю. В. Тезаурусный подход к моделированию английской когнитивно-лингвистической терминологии на примере терминополя Blending theory (теория блендинга). Филологические науки. Вопросы теории и практики. 2015. № 12. С. 47-50.
Vedernikova Yu. V. A thesaurus approach to the modeling English cognitive and linguistic terminology by the example of the term field of the notion Blending theory. Philology. Theory & Practice, 2015, (12): 47-50. (In Russ.)
15. Горбунов Е. Ю. Семиотико-синергетические принципы тезаурусного моделирования семантического поля термина Lexicology Лексикология'. Вестник Чувашского государственного педагогического университета им. И. Я. Яковлева. 2015. № 2. С. 46-53.
Gorbunov E. Yu. Semiotic-synergetic principles of thesaurus modelling of the semantic field of the term Lexicology. Vestnik Chuvashskogo gosudarstvennogo pedagogicheskogo universiteta imeni I. Ya. Yakovleva, 2015, (2): 46-53. (In Russ.)
16. Сергеева Т. Н. Тезаурусное моделирование предметной области «Корпусная лингвистика» на примере английского языка. Вектор науки Тольяттинского государственного университета. 2009. № 1. С. 87-91.
Sergeeva T. N. Thesaurus modeling of the object domain Corpus Linguistics based on the English sourses. Vektor nauki Toliattinskogogosudarstvennogo universiteta, 2009, (1): 87-91. (In Russ.)
17. Гаврилова Н. В. Принципы построения терминосистем французской и английской деловой терминологии «Международной экономики» в тезаурусном аспекте. Вестник Тамбовского университета. Серия: Гуманитарные науки. s 2009. № 7. С. 264-267. рр Gavrilova N. V. Greating principles of French and English business terminology systems in International economics based я on the thesaurus approach. Vestnik Tambovskogo universiteta. Seriya: Gumanitarnye nauki, 2009, (7): 264-267. (In Russ.) т
18. Таалайбек уулу Д., Костина И. А. Оппозитивный анализ как инструмент компонентного анализа. Тенденции развития с науки и образования. 2018. № 39-4. С. 51-53. https://doi.org/10.18411/lj-06-2018-72 я Taalaibek uulu D., Kostina I. A. Oppositive analysis as an instrument of componential analysis. Tendentsii razvitiia nauki ы i obrazovaniia, 2018, (39-4): 51-53. (In Russ.) https://doi.org/10.18411/lj-06-2018-72 а
Versatile Method of Modeling Content kemerovo state university
19. Стадульская Н. А. Компонентный анализ значения слова как способ выявления содержания концепта. Вестник Челябинского государственного университета. 2012. № 32. С. 112-117.
Stadulskaya N. A. Componential analysis of word meaning as the way of determining the content of a concept. Bulletin of Chelyabinsk State University, 2012, (32): 112-117. (In Russ.)
20. Храмова А. В., Амирова О. Г. Метод компонентного анализа глаголов с общим значением «манера передвижения» в английском и русском языках. Развитие образования. 2020. № 2. С. 49-54. https://doi.org/10.31483/r-75570 Hramova A. V., Amirova O. G. Componential analysis of verbs with general meaning "Manner of movement" in English and Russian languages. Razvitie obrazovaniya, 2020, (2): 49-54. (In Russ.) https://doi.org/10.31483/r-75570
21. Кузнецов А. М. От компонентного анализа к компонентному синтезу. М.: Наука, 1986. 123 с. Kuznetsov A. M. From componential analysis to componential synthesis. Moscow: Nauka, 1986, 123. (In Russ.)
22. Гулыга Е. В., Шендельс Е. И. О компонентном анализе значимых единиц языка. Принципы и методы семантических исследований, отв. ред. В. Н. Ярцева. М.: Наука, 1976. С. 291-314.
Gulyga E. V., Shendels E. I. Componential analysis of notional lexical units. Principles and methods of semantic research, ed. Yartseva V. N. Moscow: Nauka, 1976, 291-314. (In Russ.)
23. Шайкевич А. Я. Дистрибутивно-статистический анализ в семантике. Принципы и методы семантических исследований, отв. ред. В. Н. Ярцева. М.: Наука, 1976. С. 353-378.
Shaikevich A. Y. Distributional and statistical analysis in semantics. Principles and methods of semantic research, ed. Yartseva V. N. Moscow: Nauka, 1976, 353-378. (In Russ.)
24. Караулов Ю. Н. Частотный словарь семантических множителей русского языка. М.: Наука, 1980. 208 с. Karaulov Yu. N. Frequency word book of semantic multipliers in Russian. Moscow: Nauka, 1980, 208. (In Russ.)
25. Селиверстова О. Н. Труды по семантике. М.: Яз. славян. культуры, 2004. 960 с. Seliverstova O. N. Semantic studies. Moscow: Iaz. slavian. kultury, 2004, 960. (In Russ.)
26. Савицкий В. М. Основы общей теории идиоматики. М.: Гнозис, 2006. 208 с. Savitsky V. M. Principles of general idiomatics. Moscow: Gnozis, 2006, 208. (In Russ.)
27. Стернин И. А. Лексическое значение слова в речи. Воронеж: ВГУ 1985. 170 с. Sternin I. A. Lexical meaning in language. Voronezh: VSU, 1985, 170. (In Russ.)
28. Журавлев А. П. Разработка метода моделирования состава и структуры терминополя в общем и терминополя «Повреждения таза» в частности. Вестник Челябинского государственного университета. 2020. № 3. С. 56-65. https://doi.org/10.24411/1994-2796-2020-10307
Zhuravlev A. P. Developing a method of modeling lexical-semantic structure of a terminological field in general and the "Pelvis injuries" field in particular. Bulletin of Chelyabinsk State University, 2020, (3): 56-65. (In Russ.) https:// doi.org/10.24411/1994-2796-2020-10307
29. Горбунов Е. Ю. Технология тезаурусного моделирования английских лингвистических терминов. Актуальные проблемы теоретической и прикладной лингвистики и оптимизация преподавания иностранных языков: VI Междунар. науч. конф. (Тольятти, 11-12 октября 2018 г.) Тольятти: ТГУ 2018. С. 169-176.
Gorbunov E. Yu. Technology for thesaurus modeling of English linguistic terms. Actual problems of theoretical and applied linguistics and optimization of teaching foreign languages: VI Intern. Sci. Conf., Togliatti, 11-12 Oct 2018. Togliatti: TSU, 2018, 169-176. (In Russ.)
I
E-