Научная статья на тему 'Объективные трудности извлечения данных об иерархической соотнесенности смежных терминов из научных текстов'

Объективные трудности извлечения данных об иерархической соотнесенности смежных терминов из научных текстов Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
127
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕРМИН / ПОНЯТИЕ / ТЕРМИНОЛОГИЧЕСКАЯ СЕМАНТИЧЕСКАЯ СЕТЬ / СИСТЕМНОЕ ОТНОШЕНИЕ / ВЕРБАЛИЗАТОР / ИЕРАРХИЧЕСКИЕ СВЯЗЬ / СИСТЕМНОСТЬ / ТИПОЛОГИЯ / TECHNICAL TERM / ACADEMIC CONCEPT / TERMINOLOGICAL SEMANTIC NETWORK / SYSTEMIC RELATION / LINGUISTIC MARKER / HIERARCHICAL RELATION / SYSTEM / TYPOLOGY

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Лату М.Н., Левит А.А.

Статья посвящена проблеме установления системной организации смежных понятий, связанных иерархическими типами отношений на основе анализа научных текстов при построении терминологических сетей. Исследование проводилось на материале терминологии астрофизики и контекстов ее функционирования. На примере терминов «активная галактика», «активное ядро галактики», «сейфертовская галактика», «радиогалактика», «квазар», «лацертида», «блазар» рассматриваются объективные трудности, которые могут возникнуть при установлении корреляции понятий, связанных данными типами системных отношений. Анализируются языковая репрезентация различных и иногда противоречивых вариантов иерархической соотнесенности данных терминов, а также лингвистические и экстралингвистические факторы, которыми они могут быть обусловлены.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Лату М.Н., Левит А.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Objective difficulties in extracting data on the hierarchical correlation of technical terms from academic texts

The article is devoted to the problem of the detection of the systemic organization of adjacent concepts linked by the hierarchical types of relations based on the analysis of academic texts as it is applied to terminological network construction. The research is focused on the technical terms of astrophysics and the contexts where they appear. The objective difficulties in detecting the correlation of concepts linked by hierarchical systemic relations are considered on example of such technical terms as active galaxy, active galactic nucleus, radio galaxy, Seyfert galaxy, quasar, BL Lacertae object and blazar. The verbal representation of different and sometimes controversial variants of their correlation and some linguistic and extralinguistic factors that may stand behind their existence are analyzed.

Текст научной работы на тему «Объективные трудности извлечения данных об иерархической соотнесенности смежных терминов из научных текстов»

DOI: 10.15643/libartrus-2018.5.6

Объективные трудности извлечения данных об иерархической соотнесенности смежных терминов из научных текстов

© М. Н. Лату*, А. А. Левит

Пятигорский государственный университет Россия, 357500 г. Пятигорск, проспект Калинина, 9.

*Email: latumn@pgu.ru

Статья посвящена проблеме установления системной организации смежных понятий, связанных иерархическими типами отношений на основе анализа научных текстов при построении терминологических сетей. Исследование проводилось на материале терминологии астрофизики и контекстов ее функционирования. На примере терминов «активная галактика», «активное ядро галактики», «сейфертовская галактика», «радиогалактика», «квазар», «лацер-тида», «блазар» рассматриваются объективные трудности, которые могут возникнуть при установлении корреляции понятий, связанных данными типами системных отношений. Анализируются языковая репрезентация различных и иногда противоречивых вариантов иерархической соотнесенности данных терминов, а также лингвистические и экстралингвистические факторы, которыми они могут быть обусловлены.

Ключевые слова: термин, понятие, терминологическая семантическая сеть, системное отношение, вербализатор, иерархические связь, системность, типология.

Одной из значимых задач современного терминоведения остаются систематизация и стандартизация терминологии, а также понятийного аппарата, который она выражает, поскольку «форма науки оказывается отнюдь не безразличной к содержанию самой науки» [5]. Несистематизированные, неудачные термины могут тормозить развитие научного знания, в то время как упорядоченная терминология способствует его плодотворному и успешному развитию [1, 7]. При этом «системный подход к обобщению речевой практики обусловливает видение языка как специфического единства» [3, с. 5-13].

Развитие науки неразрывно связано с процессами концептуализации и категоризации, которые неизбежно находят отражение в языке. Исследование особенностей, принципов и механизмов языковой репрезентации соотнесенности смежных структур знания посредством конкретных типов системных отношений представляется значимым для разработки сетевых моделей предметных областей, создаваемых на их основе экспертных систем, автоматизации обработки и извлечения необходимой информации, а также решения ряда некоторых других прикладных задач. При этом «моделирование терминологии является не только эффективным инструментом обработки языкового материала и его компактного представления, но и дает качественно новые возможности интерпретации полученных данных» [24]. Одной из таких прикладных моделей является терминологическая сеть, которая позволяет выявить особенности системной организации понятий в рамках моделируемой области научного знания. Основными структурными элементами сети являются вершины разных категорий, которые

отражают естественную стратификацию терминов в соответствии с основными типами обозначаемых понятий, и дуги, представляющие собой разные типы системных семантических отношений, которыми сопряжены смежные понятия [12, с. 142-149; 15, с. 98-110].

Одним из наиболее важных и универсальных методов познания является классификация [31]. Систематизация элементов знания в виде многоступенчатой разветвленной типологии, выстраиваемой по иерархическому принципу, предполагает, что понятие, расположенное на каждом уровне абстракции, потенциально может одновременно выступать в качестве и гипонима, и гиперонима для ряда смежных понятий [29]. Иными словами, являться как видовым по отношению к понятию предшествующего более высокого уровня, которое представляет собой его прямой непосредственный гипероним, так и выступать в качестве ближайшего рода для ряда понятий последующего более низкого уровня, которые рассматриваются как его разновидности, гипонимы. Среди прочих типов системных отношений, которые существуют между понятиями определенной области знания, ключевую роль в этом процессе играют именно иерархические связи. К таковым, в первую очередь, относятся системные отношения AKO («a kind of»), которые представляют собой родовидовую связь, указывающую на соотнесенность видового понятия (гипонима) и его ближайшего рода (непосредственного гиперонима) и ISA («is а»), отношение совпадения или включения во множество, где один из референтов не является ближайшим родом, прямым гиперонимом для другого. Следует заметить, что отношение AKO является продуктивным не для всех категорий понятий, репрезентируемых терминами определенной области знания. Так, например, понятия, относящиеся к категориям Характеристика, Локус, Деятель, не обнаруживают тенденции к образованию многоступенчатых разветвленных иерархических классификаций, тогда как они весьма характерны для понятий категорий Естественный объект или Механизм [16, с. 123-136]. Некоторые исследователи также причисляют к группе иерархических связей отношение части и целого [20, с. 145-151], которое представляет собой отдельный тип системных отношений PO («part of»), указывающих на соотнесенность меронима и холонима, референтов, один из которых является вещественным или структурным составляющим другого.

Каждый тип системных отношений репрезентируется на языковом уровне посредством определенного набора вербализаторов, выступающих маркерами характера соотнесенности двух смежных понятий [27, с. 12-17; 14, с. 672-677]. Так, к вербализаторам системного отношения PO относятся: «состоит из», «входит в состав», «входит в структуру», «представлен в составе», «является частью», «содержит в структуре» и др. Вербализаторами системного отношения АКО являются: «это», «-», «вид» «разновидность», «тип», «класс» «представляет собой», «разделяют на», «выделяют подклассы», «одна из разновидностей», «разновидность... называется», «одним из подклассов... является» и др. Англоязычные языковые маркеры данной связи представлены такими языковыми средствами, как «a kind of», «a type of», «classified into», «classified as», «these are», «are divided into», «variants of», «a class of», «a subclass of» и др.

Анализ языкового материала фрагментов научных текстов на предмет установления системных отношений между смежными понятиями и определения характера их корреляции с учетом статистических показателей представляется весьма продуктивным и результативным для разработки сетевых моделей областей научного знания. Тем не менее при выявлении соотнесенности конкретных смежных понятий посредством иерархических связей в отдельных случаях могут возникать некоторые объективные трудности, указывающие на наличие ряда

ограничений, которые необходимо учитывать при автоматической и полуавтоматической обработке данных. В рамках настоящей работы рассмотрим некоторые из них на примере корреляции понятий, передаваемых терминами «активная галактика», «ядро активной галактики», «радиогалактика», «сейфертовская галактика», «квазар», «лацертида», «блазар». Общий объем выборки исследования составил 720 фрагментов специализированных текстов.

Непосредственным гиперонимом для термина «активная галактика» (галактика с активными ядрами или галактика с нестационарными ядрами) является термин «галактика», с которым он понятийно связан системным отношением AKO, что подтверждается статистическими данными их представленности в контекстах. Также не вызывает сомнений и трудностей для установления наличие системного отношения PO между терминами «активная галактика» и «ядро активной галактики» (активное ядро галактики), поскольку референт последнего является ее структурным элементом. Данные связи ясно прослеживаются в их дефинициях, например, «active galaxy - a galaxy that contains an active galactic nucleus (AGN), i.e. a central region that gives off a great deal of electromagnetic radiation» [28], где они репрезентируются посредством вербализаторов «-» и «contain», а также в структуре самих терминов.

Гораздо в меньшей степени однозначным представляется определение характера корреляции с ними и между собой понятий сейфертовская галактика, радиогалактика, квазар, ла-цертида, блазар в системе научного знания на основе анализа данных языкового материала. Так, из ряда контекстов следует, что термин «активная галактика» является родовым по отношению к терминам «сейфертовская галактика», «квазар», «лацертида» и «радиогалактика», поскольку объекты, которые они называют, согласно данным формулировкам, представляют собой разные типы активных галактик: «галактики с активными ядрами принято разделять на четыре основных типа: сейфертовские, радиогалактики, лацертиды и квазары» [22]; «принято подразделять галактики с нестационарными ядрами на четыре основных типа: сейфертовские галактики, радиогалактики, лацертиды и квазары» [19]; «галактики с нестационарными ядрами обычно подразделяют на четыре типа: сейфертовские галактики, радиогалактики, лацертиды, квазары» [19]. Таким образом, исходя из данных контекстов и специфики языковых маркеров связи данные понятия системно соотносятся с понятием активная галактика посредством семантического отношения АКО. Особый интерес в этой связи представляют квазары и лацертиды. Так, в качестве других примеров можно привести следующие фрагменты научного текста: «квазизвездные объекты, или квазизвездные радиоисточники, или квазары - класс активных галактик со сверхмалыми размерами, распространяющие радиоизлучение и обладающие значительной светимостью, несоизмеримой с их массой, учитывая уровень современных физических знаний» [2, с. 60-66]; «лацертида - немногочисленная группа галактик с активными ядрами...» [20]. Отметим, что некоторые исследователи включают в типологию активных галактик и бла-зары: «блазары как класс галактик с активными ядрами характеризуются поляризацией оптического и радиоизлучения и сильной переменностью в широком диапазоне частот, простирающихся до гамма-диапазона» [22, с. 936-1376], «blazar - a very active type of galaxy, named from a combination of BL Lacertae object and quasar» [28].

Однако, согласно другим контекстам, сейфертовская галактика, радиогалактика, квазар, лацертида представляют собой классификацию активных ядер галактик, в связи с чем

родовым термином, с которым они соотносятся посредством системного отношения АКО, является активное ядро галактики: «галактики отличаются большим разнообразием. Среди них выделяются галактики с активными ядрами, в которых происходит огромное энерговыделение. К классу активных ядер галактик относятся квазары, сейфертовские галактики, радиогалактики, объекты типа BL Ящерицы (лацертиды)» [19]; «квазары - это самая яркая из разновидностей активных галактических ядер» [10], «по современным представлениям,, квазары - это активные ядра очень далеких галактик» [18]; «лацертиды -редко встречающийся тип активных ядер у гигантских эллиптических галактик; выглядят как переменные звезды с крайне слабыми спектральными линиями и частично поляризованным излучением» [9].

В качестве еще одного примера можно привести отрывок научного текста из англоязычного источника: «historically, AGN have been classified into several categories. Seyfert galaxies -broad emission lines from a galactic nucleus were first reported in 1907... Radio galaxies - many radio sources observed in the 1950s were identified with luminous elliptical galaxies... Quasars - the first quasars (quasi-stellar radio sources) were discovered in the 1960s as "radio galaxies with no galaxy"... BL Lac objects - these are quasars with very weak emission lines and are possibly the most extreme form of AGN» [32]. В связи с этим утверждение, что сейфертовская галактика и радиогалактика являются именно разновидностью активного ядра галактики - центрального структурного элемента активной галактики (т.е. являются не галактикой, а ядром галактики) - представляется неочевидным, неоднозначным и требует пояснений.

В первую очередь, полагать, что теперь данные термины приобретают статус ложноори-ентирующих (где мотивированность терминоэлементов вступает в противоречие со спецификой обозначаемого понятия и препятствует его правильному пониманию), было бы неверным. При этом возникновение контекстов, где представлена такая корреляция понятий, а также причисление квазаров и лацертид к разновидностям активных галактик, обусловлено рядом факторов. Непрерывное развитие науки, появление новых сведений об изучаемых объектах на разных исторических этапах исследований могут приводить к изменениям в организации знания. В связи с этим определенную роль играет специфика самих рассматриваемых понятий, референты которых, в современном понимании, представляют собой практически одну сущность под разным углом наблюдения: «Quasars, Seyfert galaxies, radio galaxies, N galaxies and blazars are all manifestation of the same phenomenon... The differences between the various kinds of AGN can be accounted for by the level of their power output and the angle from which they are viewed. The black hole is surrounded by a ring of dust and gas at right angles to the jets. In radio galaxies the ring is edge-on, obscuring the light from the black hole. Blazars are thought to have their jets pointing along the line of sight to Earth. In quasars and Seyfert galaxies, the ring is oriented so that the light emitted by the accretion disk around the central black hole is visible» [34]. В случае радиогалактик и сейфертовских галактик объектом наблюдения является именно галактика, и они, бесспорно, являются разновидностями активных галактик. В случае квазаров, лацертид, блазаров наблюдаемый объект представляет собой именно ядро активной галактики, в то время как другие ее структурные элементы не идентифицируются.

Тот факт, что активное ядро является ключевым структурным элементом, с которым связаны наблюдательные проявления активной галактики, а также выстраивание рассмат-

риваемых видовых понятий в единый ряд в рамках данной концепции приводят к совмещению двух классификаций и активации когнитивного механизма метонимического переноса с части на целое и с целого на часть, что на языковом уровне находит отражение в контекстах, где квазары, блазары и лацертиды описываются как разновидности активных галактик, а радиогалактики и сейфертовские галактики рассматривают как типы активных ядер галактик, например, «Viewed from close to the axis of the ring, a radio-loud AGN will be classified as a blazar and the radio jet will often appear to be moving faster than the speed of light (superluminal velocity); viewed from close to the plane of the ring, the AGN will be classified as a radio galaxy, with not many signs of activity in the nucleus, but with huge lobes of radio-emitting plasma on either side of the galaxy» [38]. Таким образом, происходит отождествление понятий активная галактика и активное ядро галактики, результатом которого является нетипичная контекстуальная синонимия данных терминов (схема 1). Расположение референтов модели в определенной последовательности в соответствии с изменением угла наблюдения приводит к сближению границ их понятий, что также находит отражение в языке: «квазары представляют собой более масштабную форму сейфертовских галактик, когда сама галактика просто не видна на фоне активного ядра, которое определяет энергетику самого объекта» [23]; «quasars, discovered in the 1960s, appear to be a more luminous version of the Seyferts in which the nucleus is so bright that the surrounding galaxy can hardly be seen at all» [38].

В связи с этим гораздо более логичной представляется типология, в соответствии с которой активные ядра галактик, помимо квазаров и лацертид, подразделяются на ядра сейфертовских галактик и ядра радиогалактик, как отмечается в следующем фрагменте научного текста: «активные ядра галактик разделяют по характеру активности на ядра_сей-фертовских галактик, ядра радиогалактик, квазары и лацертиды» [9]. Таким образом, термин «активная галактика» связан системным отношением AKO с терминами «радиогалактика» и «сейфертовская галактика», а термин «активное ядро галактики» связан данным типом системных отношений с терминами «ядро радиогалактики», «ядро сейфертовской галактики», «квазар», «лацертида», «блазар».

Активная галактика

Т

АКО

РО

Активные ядра галактики

т

АКО

Г

АКО

т

АКО

т

АКО

Радиогалактика Сейфертовская Квазар Лацертида Блазар

галактика

Схема 1. Слияние иерархических ветвей сетевой модели при отождествлении понятий активная галактика и ядро активной галактики.

При этом фрагменты научных текстов также указывают на различную соотнесенность понятий блазар, квазар, лацертида, в соответствии с которой они не являются согипонимами, а находятся на разных уровнях иерархической классификации. Так, с одной стороны, в ряде

источников отмечается, что блазар представляет собой понятие более высокой степени аб-страции и как подклассы включает лацертиды и некоторые квазары (оптически активные переменные квазары, сильно поляризованные квазары и квазары с плоскими спектрами): «как класс, блазары объединяют внегалактические объекты, такие, как ВL Lас и сильно поляризованные квазары» [17], «Quasars which vary greatly in their light output are termed optically violently variable (OVV) and are classified as blazars along with BL Lacertae objects» [38], «quasars with similar variability but stronger emission lines are known as optically violently variable (OVV) quasars. These and BL Lacs are collectively known as Blazars» [32]; «blazar -a class of extragalactic violently variable objects that includes BL Lacertae objects and optically violently variable (OVV) quasars, from which the name is contracted» [38]; «Because of many similarities of their characteristics, optically violently variable (OVV) quasars and BL Lac objects are generally grouped under the category of blazars... Thus, some authors suggested that OVV quasars and BL Lac objects should be regarded as a single class which shows blazar behavior» [41, с. 6-10]; «Blazars, which include flat spectrum radio quasars, optically violently variable quasars, highly polarized quasars, and BL Lac objects...» [39]; «One of the distinguishing characteristics of the blazars which includes BL Lacertae type objects, high polarization quasars (HPQ) and optical violently variable (OW) quasars, is that their flux densities are highly variable at all wavelength from...» [30]. Данный факт отражает и структура термина-бленда блазар, в которой в качестве системных термино-элементов выступают обозначение первого изученного представителя класса лацертид «BL Lac» и термин квазар. Как класс блазар изначально характеризовался определенной переменностью, высокой поляризацией, но отсутствием заметных линий в спектрах. Со временем к нему стали относить квазары с высокой переменностью, у которых присутствуют заметные линии в спектрах. Заметим, что в одном из источников оптически активные переменные квазары (OVV) описываются как тип радиогалактики: «an OVV (optically violent variable) quasar is a type of highly variable, rather rare, bright radio galaxy, whose visible light output can change by 50% in a day» [33].

С другой стороны, в следующем контексте лацертида определяется уже как разновидность квазара: «исходя из вида непрерывного спектра Fv (v) (v - частота излучения) и интенсивности линий излучения все квазары подразделяют на несколько типов: тип I - во всем диапазоне длин волн преобладает нетепловое излучение со степенным видом спектра Fv~v-a, а« 1; тип II - излучение в оптическом диапазоне сильно поглощено и преобладает ИК-излучение или/и жесткое рентгеновское излучение; лацертиды (объекты типа BL Ящерицы) - по виду спектра похожи на квазары типа I, но с очень слабыми линиями излучения, сильной переменностью и поляризацией» [11]. В соответствии с данной формулировкой и спецификой вербали-затора «подразделяют на типы» в качестве ближайшего рода для понятия лацертида выступает именно квазар.

Заметим, что квазары как класс включает такие разновидности, как радиоспокойные квазары и радиогромкие (радиошумные) квазары: «первоначально были обнаружены квазары, являющиеся сильными радиоисточниками, но впоследствии были найдены квазары также и со слабым радиоизлучением (около 98.8% всех квазаров, доступных обнаружению). Эта многочисленная разновидность квазаров называлась радиоспокойными_квазарами, квазигалактиками (квазагами), интерлоперами, а иногда - голубыми звездоподобными объектами» [4], «radio-quiet quasars (also known as quasi-stellar objects or QSOs) were subsequently

found by searching for objects that appeared stellar on optical photographs but emitted too strongly at IR or UV wavelengths. Radio-quiet quasars outnumber radio-loud quasars by a factor 10-30. Both radio-loud and radio-quiet QSOs are_ now thought to be variants of the same type of object, and the term 'quasar' now includes QSOs» [32]. Квазары с крутыми спектрами, квазары с плоскими спектрами, а также оптически активные переменные квазары являются разновидностями радиогромких квазаров: «Radio quasars are generally divided into steep-spectrum radio quasars (SSRQ) and flat-spectrum radio quasars (FSRQ)» [36].

Наконец, встречаются и контексты, где блазар определяется как подкласс квазаров и соответственно находится на ступень ниже в иерархической классификации: «На сегодняшний день каталогизированы уже сотни тысяч квазаров, а все их многообразие разделено на несколько феноменологических типов. И одним из самых интересных подклассов этих объектов являются блазары. Блазар - это квазар...» [25]; «The blazar CTA 102 belongs to the subclass of flat-spectrum radio quasars (FSRQs)» [37, с. 374-377]; «Blazars are a particular kind of very variable quasar, viewed from Earth down the axis of a relativistic jet» [37, с. 374-377]; «A multiteam collaboration detected a high-energy neutrino event whose arrival direction was consistent with a known blazar - a type of quasar with a relativistic jet oriented directly along our line of sight» [40]; «Researchers have shed new light on blazars, a type of quasar that forms the energetic region surrounding the supermassive black hole at the centre of an active elliptical galaxy» [35]. Неоднозначность корреляции данных понятий, которая представлена в данных противоречивых контекстах, в первую очередь, является отражением разных концепций, взглядов и подходов к делению и объединению на основе отличных критериев и наблюдаемых свойств, что представляет собой объективную проблему, которая приводит к вариациям построения одного и того же фрагмента сетевой модели терминосистемы. Также одной из возможных причин появления разных формулировок соотнесенности понятий блазар и квазар является тот факт, что первые как класс включают не все, а только определенные типы квазаров. Это порождает некоторую двойственность восприятия, когда блазар ассоциируется с понятием, меньшим по объему, чем квазар, и которое, являясь для последнего гипонимом, по определению расположено на более низком уровне классификации. Появление различных интерпретаций может быть также обусловлено трансформациями в организации понятий, вызванными более поздним по времени появлением и включением в систему научного знания понятия блазар.

В связи с этим отдельного внимания также заслуживают контексты, где представлена связь не с прямым гиперонимом, а с понятием, располагающимся на более высоком уровне абстракции иерархической классификации или принадлежащим другой ее ветви. Так, квазар определяется также и как астрономический объект, и как галактика, и как внегалактический объект, и как радиоисточник, например, «квазар - исключительно мощно светящаяся удаленная галактика, по виду напоминающая звезду» [21]; «Quasars - a class of astronomical objects that appear on optical photographs as star-like but have large redshifts quite unlike those stars» [28]; «квазары - внегалактические компактные радиоисточники, отождествляемые со слабыми голубыми звездообразными объектами» [11, с. 427]. При этом к радиоисточникам причисляются объекты весьма различной природы и относящиеся к разным ветвям и уровням иерархической классификации, как видно из следующей дефиниции: «Radio source - any cosmic source of radio waves. Major celestial radio sources include the Sun, Jupiter, flare stars, novae, pulsars, supernovae remnants, HII regions, the Milky Way, the galactic centre, radio galaxies,quasars

and other active galaxies, and the cosmic microwave background» [38]; «Many BL Lac objects are also radio source» [34].

В системном плане такие понятия связаны отношением ISA, поскольку одно из них выступает в роли множества, а другое - одного из элементов (представителей) данного множества. Так, термин квазар 2 типа, в первую очередь, является разновидностью квазара, который выступает для него прямым гиперонимом, но также относится к классу активных ядер галактик, являясь его представителем: «the term type II quasar refers to a category of active galactic nuclei where the energy received is primarily in the infrared and submillimeter region of the spectrum» [34]. Таким образом, термины квазар II типа и квазар, квазар и активное галактическое ядро соотносятся посредством системного отношения AKO, тогда как термины квазар II типа и активное галактическое ядро связаны системным отношением ISA, на что указывает вербализатор данной связи «refer to». В связи с этим совпадение части вербализаторов системных отношений AKO и ISA представляет объективную трудность при обработке информации, установлении типа связи, определении ближайшего рода (непосредственного гиперонима) и, как следствие, моделировании иерархической классификации понятий. Определение понятия через непрямой род является нежелательным для дефиниции термина, но в целом допустимо для его толкования, которое ориентировано на неспециалиста, а также широко представлено в научно-популярных текстах.

Системное отношение ISA может также устанавливаться между понятиями, относящимися к параллельным классификациям, построенных на основе разных признаков. Так, например, существует типология активных ядер галактик в рамках объединенной модели в соответствии с особенностями излучения и широтой эмиссионных линий, согласно которой их разновидностями являются радиоспокойные АЯГ и радиогромкие АЯГ. В свою очередь радиоспокойные АЯГ подразделяются на радиоспокойные АЯГ I типа, радиоспокойные АЯГ II типа, радиоспокойные АЯГ 0 типа, а радиогромкие АЯГ на радиогромкие АЯГ I типа, радиогромкие АЯГ II типа, радиогромкие АЯГ 0 типа. Данные термины связаны системным отношением AKO. Далее каждый подкласс включает понятия из другой классификации, с которыми они соотносятся посредством системного отношения ISA. Так, квазары с широкими абсорбционными линиями (BAL QSO) относятся к радиоспокойным АЯГ 0 типа, ядра сей-фертовских галактик I типа и радиоспокойные квазары относятся к радиоспокойным АЯГ I типа, а ядра сейфертовских галактик II типа и галактики с узкими эмиссионными линиями - к радиоспокойным АЯГ II типа, блазары (лацертиды, оптически активные переменные квазары, высокополяризованные квазары) относятся к радиогромким АЯГ 0 типа, ядра радиогалактик с широкими эмиссионными линиями, радиоквазары с крутыми спектрами и радиоквазары с плоскими спектрами - к радиогромким АЯГ I типа, ядра радиогалактик FR I и радиогалактик FR II - к радиогромким АЯГ II типа: «Группа радиоспокойных объектов 1 типа включает галактики типа Сейферт 1... Кроме того, эта группа включает радиоспокойные квазары... Радиогромкий 1 тип AGN включает радиогалактики с широкими эмиссионными линиями (BLRG: Broad Line Radio Galaxies) и с низкими светимостями и радиогромкие квазары с высокими светимостями: с крутыми спектрами (SSRQ: steep-spectrum radio quasars) и с плоскими спектрами (FSRQ: flat-spectrum radio quasars). Радиоспокойные AGN типа 2 включают галактики типа

Сейферт 2, а также наблюдаемые в рентгеновском диапазоне галактики с узкими эмиссионными линиями (NELG: Narrow-Emission Line Galaxies). Радиогромкие AGN2-го типа, часто называемые радиогалактиками с узкими линиями (NLRG: Narrow-Line Radio Galaxies) включают радиогалактики с низкой светимостью FR I и радиогалактики с высокой светимостью FRII» [6].

Таким образом, анализ языкового материала позволил установить, что контексты содержат неоднозначные сведения о корреляции понятий активная галактика, ядро активной галактики, радиогалактика, сейфертовская галактика, квазар, лацертида, блазар. Контекстуальная синонимия терминов «активная галактика» и «активное ядро галактики» является результатом ситуативного отождествления понятий вследствие специфики их содержания, где первое понимается через второе, и объединения двух ветвей классификации. Определение квазара, лацертид и блазаров как разновидностей активных галактик представляет собой результат метонимического переноса. Показательны также различные варианты иерархической соотнесенности, в частности определение квазаров как подтипа блазаров и блазаров как подтипа квазаров.

В целом рассмотренные трудности с установлением иерархических связей между конкретными понятиями и определением характера связи могут быть обусловлены лингвистическими и экстралингвистическими факторами. Так, определенную роль играют динамические процессы в науке в результате ее развития, использования приборов разных поколений, появления нового знания и связанные с этим трансформации в организации системы понятий. Вышесказанное и сосуществование различных концепций и взглядов на соотнесенность одних и тех же понятий проявляется на языковом уровне в неоднозначных, а иногда противоречивых контекстах. Специфика содержания отдельных научных концептов также может приводить к возникновению неодинаковых формулировок об их соподчиненности, отражающих, какое понятие является гиперонимом, а какое гипонимом. Так, одной из причин того, что в ряде контекстов понятие блазар рассматривается как гипоним понятия квазар может являться то, что к блазарам относятся не все, а только определенные типы квазаров. Нередко в контекстах в качестве родового понятия может указываться не непосредственный гипероним, а понятия, расположенные на более высоких уровнях абстракции в иерархической классификации, что соответствует разным типам системных отношений. При этом отдельной проблемой является совпадение определенной части вербализаторов связей AKO и ISA, что является существенным препятствием для определения ближайшего рода при автоматической и полуавтоматической обработке данных и построения фрагментов сетевой модели предметной области. Следует отдельно отметить проблему полноты сообщаемой информации, когда, например, в разных контекстах представлены сведения не обо всех гипонимах. Некоторые из данных трудностей преодолимы за счет увеличения обрабатываемого корпуса выборки языкового материала, однако в ряде случаев при получении неоднозначных данных требуется обращение к специалистам моделируемой области научного знания.

Публикация выполнена в рамках реализации проектов "Комплексное когнитивное исследование языковой репрезентации системных отношений между терминами в прикладных моделях организации научного знания" по гранту Президента Российской Федерации (№14.Z56.18.895-MK); «Разработка лингвистических принципов проектирования и создание экспертной системы представления элементов

научного знания на основе конструирования терминологических семантических сетей» по проектной части государственного задания Министерства образования и науки РФ на 2017-2019 гг.» (№34.3234.2017/ПЧ).

Литература

1. Азаматова А. Х. Унификация лингвистической терминологии: понятие и значение // Русский язык в современном мире: традиции и инновации в преподавании русского языка как иностранного и в переводе: Мат-лы III международной научной конференции. Греция, 2013. С. 12-28.

2. Баранов Г. В. Концепции астрономии:учебник. Гамбург: Anchor Akademie Publishing, 2014. 214 с.

3. Баркович А. А. Корпусная лингвистика: специфика современных метаописаний языка // Вестник Томского государственного университета. 2016. №406. С. 5-13.

4. Бербидж Дж., Бербидж М. Квазары. М.: Мир, 1969.

5. Будагов Р. А. Терминология и семиотика. Человек и его язык. М.: МГУ, 1974. 262 с.

6. Верходанов О., Парийский Ю. Радиогалактики и космология. М.: Физматлит, 2009. 300 с.

7. Гринев-Гриневич С. В. Терминоведение. М.: Академия, 2008. 304 с.

8. Ефремова Т. Ф. Новый словарь русского языка. Толково-словообразовательный. М.: Русский язык, 2000. 410 с.

9. Засов А. В. Активные ядра галактик // Большая российская энциклопедия. Электронная версия (2016). URL: https://bigenc.ru/physics/text/4024421.

10. Комаров В. В. Справочник необходимых познаний. М.: Аиф Принт, 2001. 368 с.

11. Комберг Б. В. КВАЗАРЫ // Большая российская энциклопедия. М., 2009. Т. 13. С. 427.

12. Лату М. Н. Принципы построения терминологических сетей: типы вершин и отношений // Вопросы когнитивной лингвистики. 2016. 4(49). С. 142-149.

13. Лату М. Н. Информационные блоки и характер системных связей в определениях политических терминов // Политическая лингвистика. 2017. 5(65). С. 100-104.

14. Лату М. Н. Ключевые слова и сочетания информационного блока составляющих в дефиниции термина // Когнитивные исследования языка. 2018. №33. С. 672-677.

15. Лату М. Н., Левит А. А. Использование терминологических сетей для навигации в электронных специализированных словарях // Труды Института системного анализа РАН. 2017а. Т. 67. №3. С. 98-110.

16. Лату М. Н., Левит А. А. Продуктивные семантические отношения терминов категорий «Процесс», «Характеристика», «Локус» // Вопросы когнитивной лингвистики. 2017б. №4. С. 123-136.

17. Мартынов Д. Я. Курс общей астрофизики: Учебное пособие. 1988. 640 с.

18. Прохоров А. М. Физика космоса. М.: Рипол Классик, 1986. 783 с.

19. Российская Астрономическая Сеть. URL: http://www.astronet.ru.

20. Савотченко С. Е., Проскурина Е. А. Показатели семантических связей информационно-поисковых систем // Научные ведомости. 2013. №1. С. 145-151.

21. Словари и энциклопедии на Академике. URL: https://dic.academic.ru.

22. Фиделис В. В. Вариации рентгеновского и гамма-излучения сверхвысоких энергий от блазара Mkn 421 в 2002-2004 гг. // Известия Российской академии наук: Серия физическая. 2007. Т. 71. №7. С. 945-947.

23. Хоперсков А., Фридман А. Физика галактических дисков. М.: ЛитРес, 2017. 639 с.

24. Шевцова А. Ю. Моделирование нормативного двуязычного словаря-тезауруса терминов авиационной экологии: автореф. дис. ...канд. филол. наук. Тюмень, 2014. 24 с.

25. Элементы. Новости науки. URL: http://elementy.ru/novosti_nauki.

26. Энциклопедия Колльера. М.: Открытое общество, 2000.

27. Arauz L., Faber P. Natural and contextual constraints for domain-specific relations // Proceedings of the Workshop Semantic Relations. Theory and Applications. 2010. Рp. 12-17.

28. Daintith J., Martin E. Oxford Dictionary of Science. New York: Oxford University Press, 2010. 900 p.

29. Hayakawa S. I., Hayakawa A. R. Language in thought and action. San Diego, 1990. 196 p.

30. Heuvel E., Wijers R., Zand J. BeppoSAX: Proceedings of the BeppoSAX Conference "The Restless High-Energy Universe". Amsterdam, the Netherlands, 2004. 723 p.

31. Knigi.link. URL: http://knigi.link.

32. Liddle A., Loveday J. Oxford Companion to Cosmology. New York: Oxford University Press, 2014. 343 p.

33. Marziani P., Sulentic J. Fifty Years of Quasars: From Early Observations and Ideas to Future Research. Springer, 2012. 584 p.

34. Mitton J. Cambridge Dictionary of Astronomy. New York: Cambridge University Press, 2001. 461 p.

35. Naturelndia. URL: https://www.natureasia.com/en/nindia.

36. Padovani P. High energy emission from AGN and unified schemes // Vulcano Workshop 1998: Frontier Objects in Astrophysics and Particle Physics. Bologna, Italy: Italian Physical Society, 1999. P. 159.

37. Raiteri C. M. Blazar spectral variability as explained by a twisted inhomogeneous jet // Nature. 2017. Vol. 552. No. 7685. Pp. 374-377.

38. Ridpath I. Oxford Dictionary of Astronomy. New York: Oxford University Press, 2012. 535 p.

39. Gamma 2001: Gamma-Ray Astrophysics. American Institute of Physics. Baltimore, Maryland, 2001. Pp. 821.

40. The IceCube Collaboration. Multimessenger observations of a flaring blazar coincident with high-energy neutrino IceCube-170922A // Science. Vol. 361. No. 6398. P. 147.

41. Xie G. Z., Zhang Y. H., Fan J. H., Liu F. K. The relation between BL Lacertae objects and OVV quasars, and the unified model of BL Lacertae objects, FR-I and FR-II (G) radio galaxies // Astronomy and Astrophysics. Vol. 278. No. 1. Pp. 6-10.

nocmynuAa e peda^uw 24.09.2018 г.

DOI: 10.15643/libartrus-2018.5.6

Objective difficulties in extracting data on the hierarchical correlation of technical terms from academic texts

© M. N. Latu*, A. A. Levit

Pyatigorsk State University 9 Kalinin Avenue, 357532 Pyatigorsk, Russia.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

*Email: laatuu@yandex.ru

The article is devoted to the problem of the detection of the systemic organization of adjacent concepts linked by the hierarchical types of relations based on the analysis of academic texts as it is applied to terminological network construction. The research is focused on the technical terms of astrophysics and the contexts where they appear. The objective difficulties in detecting the correlation of concepts linked by hierarchical systemic relations are considered on example of such technical terms as active galaxy, active galactic nucleus, radio galaxy, Seyfert galaxy, quasar, BL Lacertae object and blazar. The verbal representation of different and sometimes controversial variants of their correlation and some linguistic and extralinguistic factors that may stand behind their existence are analyzed.

Keywords: technical term, academic concept, terminological semantic network, systemic relation, linguistic marker, hierarchical relation, system, typology.

Published in Russian. Do not hesitate to contact us at edit@libartrus.com if you need translation of the article.

Please, cite the article: Latu M. N., Levit A. A. Objective difficulties in extracting data on the hierarchical correlation of technical terms from academic texts // Liberal Arts in Russia. 2018. Vol. 7. No. 5. Pp. 396-408.

References

1. Azamatova A. Kh. Russkii yazyk v sovremennom mire: traditsii i innovatsii v prepodavanii russkogo yazyka kak inostrannogo i v perevode: Mat-ly III mezhdunarodnoi nauchnoi konferentsii. Gretsiya, 2013. Pp. 12-28.

2. Baranov G. V. Kontseptsii astronomii: uchebnik [Astronomy concepts: textbook]. Hamburg: Anchor Akademic Publishing, 2014.

3. Barkovich A. A. Vestnik Tomskogo gosudarstvennogo universiteta. 2016. No. 406. Pp. 5-13.

4. Burbidge G., Burbidge M. Kvazary [Quasars]. Moscow: Mir, 1969.

5. Budagov R. A. Terminologiya i semiotika. Chelovek i ego yazyk [Terminology and semiotics. Human and language]. Moscow: MGU, 1974.

6. Verkhodanov O., Pariiskii Yu. Radiogalaktiki i kosmologiya [Radio galaxies and cosmology]. Moscow: Fizmatlit, 2009.

7. Grinev-Grinevich S. V. Terminovedenie [Terminology science]. Moscow: Akademiya, 2008.

8. Efremova T. F. Novyi slovar' russkogo yazyka. Tolkovo-slovoobrazovatel'nyi [New dictionary of the Russian language. Explanatory and word building]. Moscow: Russkii yazyk, 2000.

9. Zasov A. V. Bol'shaya rossiiskaya entsiklopediya. Elektronnaya versiya (2016). URL: https://bigenc.ru/phy sics/text/4024421.

10. Komarov V. V. Spravochnik neobkhodimykh poznanii [Handbook of necessary knowledge]. Moscow: Aif Print, 2001.

11. Komberg B. V. KVAZARY. Bol'shaya rossiiskaya entsiklopediya. Moscow, 2009. Vol. 13. Pp. 427.

12. Latu M. N. Voprosy kognitivnoi lingvistiki. 2016. 4(49). Pp. 142-149.

13. Latu M. N. Politicheskaya lingvistika. 2017. 5(65). Pp. 100-104.

14. Latu M. N. Kognitivnye issledovaniyayazyka. 2018. No. 33. Pp. 672-677.

15. Latu M. N., Levit A. A. Trudy Instituta sistemnogo analiza RAN. 2017a. Vol. 67. No. 3. Pp. 98-110.

16. Latu M. N., Levit A. A. Voprosy kognitivnoi lingvistiki. 2017b. No. 4. Pp. 123-136.

17. Martynov D. Ya. Kurs obshchei astroflziki: Uchebnoe posobie [Course in general astrophysics: Textbook]. 1988.

18. Prokhorov A. M. Fizika kosmosa [Space physics]. Moscow: Ripol Klassik, 1986.

19. Rossiiskaya Astronomicheskaya Set'. URL: http://www.astronet.ru.

20. Savotchenko S. E., Proskurina E. A. Nauchnye vedomosti. 2013. No. 1. Pp. 145-151.

21. Slovari i entsiklopedii na Akademike. URL: https://dic.academic.ru.

22. Fidelis V. V. Izvestiya Rossiiskoi akademii nauk: Seriya fizicheskaya. 2007. Vol. 71. No. 7. Pp. 945-947.

23. Khoperskov A., Fridman A. Fizika galakticheskikh diskov [Physics of galactic disks]. Moscow: LitRes, 2017.

24. Shevtsova A. Yu. Modelirovanie normativnogo dvuyazychnogo slovarya-tezaurusa terminov aviatsionnoi ekologii: avtoref. dis. ...kand. filol. nauk. Tyumen', 2014.

25. Elementy. Novosti nauki. URL: http://elementy.ru/novosti_nauki.

26. Entsiklopediya Koll'era [Collier's encyclopedia]. Moscow: Otkrytoe obshchestvo, 2000.

27. Arauz L., Faber P. Proceedings of the Workshop Semantic Relations. Theory and Applications. 2010. Pp. 12-17.

28. Daintith J., Martin E. Oxford Dictionary of Science. New York: Oxford University Press, 2010.

29. Hayakawa S. I., Hayakawa A. R. Language in thought and action. San Diego, 1990.

30. Heuvel E., Wijers R., Zand J. BeppoSAX: Proceedings of the BeppoSAX Conference "The Restless High-Energy Universe". Amsterdam, the Netherlands, 2004.

31. Knigi.link. URL: http://knigi.link.

32. Liddle A., Loveday J. Oxford Companion to Cosmology. New York: Oxford University Press, 2014.

33. Marziani P., Sulentic J. Fifty Years of Quasars: From Early Observations and Ideas to Future Research. Springer, 2012.

34. Mitton J. Cambridge Dictionary of Astronomy. New York: Cambridge University Press, 2001.

35. NatureIndia. URL: https://www.natureasia.com/en/nindia.

36. Padovani P. Vulcano Workshop 1998: Frontier Objects in Astrophysics and Particle Physics. Bologna, Italy: Italian Physical Society, 1999. P. 159.

37. Raiteri C. M. Nature. 2017. Vol. 552. No. 7685. Pp. 374-377.

38. Ridpath I. Oxford Dictionary of Astronomy. New York: Oxford University Press, 2012.

39. Gamma 2001: Gamma-Ray Astrophysics. American Institute of Physics. Baltimore, Maryland, 2001. Pp. 821.

40. The IceCube Collaboration. Science. Vol. 361. No. 6398. Pp. 147.

41. Xie G. Z., Zhang Y. H., Fan J. H., Liu F. K. Astronomy and Astrophysics. Vol. 278. No. 1. Pp. 6-10.

Received 24.09.2018.

i Надоели баннеры? Вы всегда можете отключить рекламу.