Научная статья на тему 'Основные типы семантических отношений между терминами предметной области'

Основные типы семантических отношений между терминами предметной области Текст научной статьи по специальности «Инженерия знаний.»

CC BY
2006
230
Поделиться
Ключевые слова
СЕМАНТИЧЕСКИЕ ОТНОШЕНИЯ

Аннотация научной статьи по кибернетике, автор научной работы — Найханова Лариса Владимировна

Рассматриваются классификации концептуальных объектов текста на естественном языке, на основе которых строится иерархия семантических отношений. Приводится соответствие семантических отношений и типов предикатов. Предикаты предназначены для извлечения знаний о терминосистеме монологического текста.

Текст научной работы на тему «Основные типы семантических отношений между терминами предметной области»

УДК 004.82

Л. В. Найханова

ОСНОВНЫЕ ТИПЫ СЕМАНТИЧЕСКИХ ОТНОШЕНИЙ МЕЖДУ ТЕРМИНАМИ ПРЕДМЕТНОЙ ОБЛАСТИ

Рассматриваются классификации концептуальных объектов текста на естественном языке, на основе которых строится иерархия семантических отношений. Приводится соответствие семантических отношений и типов предикатов. Предикаты предназначены для извлечения знаний о терминосистеме монологического текста.

Введение

Автоматическое извлечение знаний из научных текстов предполагает не только выявление терминов, но и извлечение знаний о терминах. Для этого необходимо распознать в тексте семантические отношения между терминами, т.к. с их помощью описывается семантическая структура терминологии.

Система терминов подразумевает сложную систему семантических отношений между ними. Описание терминосистем всегда связано с классификацией самих терминов и классификацией отношений. В лингвистике классической является классификация Е. Вюстера, в которой отношения делятся на онтологические и логические. Внутри каждой категории устанавливается собственная иерархия. Логические отношения определяются как отношения подобия, онтологические - как отношения смежности в пространстве и времени. В число онтологических отношений входят отношения материала/продукта, каузальные, инструментальные, генетические. Одна из первых классификаций связей между понятиями в предметных областях предложена Л. Канделаки. Известны еще несколько глобальных классификаций терминов и отношений. Характерно, что наиболее подробные и четкие классификации ориентированы на системы информационного поиска и явились итогом соединения философско-логических исследований о природе знания с прагматическими запросами информатики. Так, возникновение одной из международных организаций по терминологии - СОСТА (Conceptual and Terminological Analyis) - стимулировалось потребностями специалистов-гуманитариев в логико-философском анализе своей терминологии. Возникновение другой - InterConcept - потребностями в области информатики. Однако в скором времени появилась необходимость в наведении между ними мостов. Такими мостами, по мнению И. Дальберг, являются, прежде всего, единая интерпретация [1] таких метапонятий, как термин, дефиниция, референт, интенсионал и экстенсио-нал, концепт, категориальная классификация концептуальных объектов и их характеристик.

1 Единая интерпретация метапонятий

Термин - это знак специальной семиотической системы, являющийся минимальным носителем научного знания, и это краткое название устоявшегося понятия, имеющего дефиницию.Дефиниция - это такое сочетание форм

структурной и субстанциональной дефиниций, при котором из структурной информации вытекает представление о наиболее вероятной субстанциальной, а из субстанциальной информации - наиболее вероятные структурные взаимодействия элементов поля терминосистемы, так что вместе эти два аспекта обеспечивают представление о ее целостности и функциональной оправданности. Это означает, что необходимо иметь в качестве субстанциональной дефиниции термина словесное толкование (определение) термина, а в качестве структурной дефиниции - фрагмент сети знаков.

Референт - это представление о денотатах сущности реального мира (объект, явление, процесс), знание о котором описывается в знаковой системе.

Концепт - это знание, которое выражается данным понятием при концептуальном моделировании предметной области.

Интенсионал - это содержание понятия, соответствующее структурной дефиниции и описываемое как внутренняя форма понятия, объединяющая его лексис и логос и достаточная для задания экстенсионала.

Экстенсионал - это объем понятия.

Классификация концептуальных объектов и отношений. Концептуальные объекты делятся следующим образом:

- сущность: материальные и нематериальные объекты, способы их рассмотрения (принципы);

- свойства: количественные, качественные, релятивные (отношения);

- действия: операции, процессы, состояния;

- величины (dimensions): время, положение, пространство.

Концептуальные отношения:

- квантитативные (совпадают с теоретико-множественными отношениями: тождества, включения, исключения, пересечения, объединения);

- квалитативные (в большинстве онтологические и включают в себя иерархические и функциональные отношения).

Эти глобальные классификации представляют собой некоторые априорные схемы научного знания, которые могут накладываться на конкретную терминологию. Классификации показывают, как организуется и воплощается знание в семантической структуре терминологии.

2 Концептуальные отношения

Следуя классификации И. Дальберг, исследуем концептуальные отношения: квалитативные и квантитативные (табл. 1).

Рассмотрим их в разрезе понятийных сфер [2]:

- абстрактное - конкретное;

- принадлежности;

- формы и содержания;

- процессуальности;

- тождества и противопоставления.

Группировка отношений по понятийным сферам (уровням абстракции) дает возможность более четко описать семантику каждого отношения.

Таблица 1

Иерархия отношений между терминами

Категория отношений Группа отношений Отношение Понятийная сфера

Квалитативные Иерархии Род о вид Сфера абстрактного -конкретного

Признак о значение признака

Инвариант о вариант

Агрегации Целое о часть Сфера принадлежности

Объект о пространство реализации (локализации) объекта

Объект о свойства/признак

Уровень о единица уровня

Функцио- нальные Объект действия о Действие о субъект действия Причина о следствие Условие о действие Событие о действие Состояние о действие Событие о состояние Инструмент о действие Данные о действие Данные о величины Сфера процессуальности

Семиотиче- ские Термин о способ выражения Сфера формы и содержания

Термин о способ представления

Термин о метазнак термина

Квантитативные Тождества Термин о синоним термина Сфера тождества и противопоставления

Корреляции Термин о коррелят термина

Квалитативные отношения

Отношения первой категории «Иерархия» делятся на три группы. Первая группа отношений принадлежит сфере «абстрактное - конкретное». В ней члены отношения соотносятся друг с другом как абстрактное и конкретное. Иногда эту сферу называют сферой «быть» по глаголу, который связывает члены отношения:

1) род о вид;

2) признак о значение признака;

3) инвариант о вариант.

Отношение «род о вид» является внутрикатегориальным отношением, отношение «признак о значение признака» - межкатегориальным, отношение «инвариант о вариант» - общекатегориальным. В отличие от общелогических отношений «род о вид» и «признак о значение признака», безразличных к научным областям, в которых они реализуются, общекатегориальное отношение «инвариант о вариант» в своей семантике тесно связано с теорией, описываемой в конкретном научном тексте. В общефилософском плане категории «инвариант - вариант» связаны с делением на сущность и явление.

Вторая группа отношений принадлежит сфере принадлежности. Члены отношений этой группы связаны глаголом «иметь». В нее входят отношения, являющиеся как внутрикатегориальными, так и межкатегориальными:

1) целое о часть/компонент;

2) объект о пространство реализации объекта (локализации или позиции);

3) объект о свойства/признак;

4) уровень о единица уровня.

Третья группа отношений - функциональные отношения принадлежат сфере процессуальности. Основным отношением является отношение вида аЯЬ, где а - объект действия, Ь - субъект действия, Я - действие. Например, «Анализатор распознает цепочку», а - анализатор, Ь - цепочка, Я - распознает. Как правило, эти отношения присущи в основном рассматриваемой предметной области и отражают ее прагматику. К функциональным отношениям также относятся следующие отношения:

1) причина о следствие;

2) условие о действие;

3) событие о действие;

4) объект действия о состояние;

5) состояние о действие;

6) инструмент о действие;

7) данные о действие;

8) данные о величина.

В отличие от остальных статичных понятийных сфер, сфера процессу-альности является динамичной. Эти отношения позволяют описанию знака, как некоторому знанию, придать свойство активности.

Четвертая группа отношений принадлежит сфере «Форма и содержание». К этой группе относятся отношения, предназначенные для выражения соответствий между понятиями знаковых систем:

1) термин о способ выражения - отражает свойства языка как системы знаков;

2) термин о способ представления термина;

3) термин о способ метаязыкового представления.

Посредством этих отношений можно создавать иерархии понятий знаковых систем. При этом каждый уровень иерархии будет соответствовать одному метаязыку.

Квантитативные отношения

Квантитативные отношения лежат в сфере тождества и противопоставления. К ним относятся отношения тождества (синонимии) и оппозиции (корреляции). Они симметричны, неиерархичны. Е. Вюстер делил отношения на вертикальные, горизонтальные и диагональные. Квантитативные отношения являются горизонтальными.

Отношение синонимии - это языковое отношение различия между тождественными элементами реальности. Отношение корреляции выражает различия между понятиями и, соответственно, между объектами научного знания.

Корреляты - это термины, относящиеся к одной категории, но противопоставленные по некоторому существенному признаку.

Отношение корреляции включает:

1) отношение противоположности или контрарное противопоставление;

2) отношение противоречия или контрадикторное противопоставление;

3) противопоставление грамматических форм;

4) противопоставление соподчиненных видовых понятий, имеющих общее родовое понятие;

5) противопоставление частей, образующих единое целое;

6) противопоставление членов отношения соподчинения.

Контрарное противопоставление подразумевает наличие общего континуального признака, крайние точки которого образуют этот вид антонимии (например, твердость - мягкость, отрицание - утверждение). В основе контрадикторных противопоставлений лежит дихотомическое деление: однозначность - неоднозначность, значащее - незначащее, производность - не-производность. Противопоставление грамматических форм или корреляция терминов, обозначающих грамматические формы, не относятся к антонимам. Например, по отношению противопоставления друг к другу выступают термины: мужской род, женский род и средний род; будущее, настоящее, прошедшее времена. Примером противопоставления соподчиненных видовых понятий, имеющих общее родовое понятие, является: главное предложение -придаточное предложение. Здесь родовое понятие - предложение. В качестве примеров пятого и шестого видов отношения корреляции можно привести следующие: тема - рема; управляющее - управляемое, ведущий - ведомый.

Итак, рассмотрены базовые семантические отношения и их классификация. Как упоминалось выше, семантические отношения необходимы для извлечения знаний о терминосистеме из научного текста. Поэтому необходимо рассмотреть и типы предикатов, которым они соответствуют и которые требуются для реализации процедуры извлечения знаний.

З Типы предикатов и семантические отношения

Категории отношений позволили определить типы предикатов, необходимые для извлечения знаний о терминах из научных текстов (табл. 2).

Как видно из табл. 2, использованы трехместные и четырехместные предикаты, причем первый аргумент является признаком, уточняющим семантическое отношение, которое отражает предикат. Рассмотрим элементы кортежа предикатов.

І. Отношение иерархии. Данному отношению соответствует предикат PHier(a, x, у). Причем если предикат описывает отношение «Род о вид», то значение первого аргумента ae {Class, Kind}, т.е. если а = «Род», то это означает, что переменная х обозначает имя родового понятия, а у - имя видового понятия и наоборот. В отношении «признак о значение признака» значение первого аргумента ae {Category, Value}, в отношении «инвариант о вариант» - ae {Invariant, Variant}. Переменные x и у обозначают понятия аналогично предыдущему отношению.

Таким образом, введение первого аргумента позволяет уменьшить количество типов предикатов, что, во-первых, является положительным фактором при использовании метода резолюций для логического вывода, и, во-вторых, уточняет позицию расположения понятия относительно семантического отношения в предложении. Последнее является важным при извлечении знаний из научного текста.

2. Отношение агрегации. Данному отношению соответствуют три типа предикатов: PAggr(a,x,y), PExist(a,x,y,z), PProp(a,x,y). Предикат PAggr(a,x,y) используется для определения двух видов отношений: «часть ^ целое» и «уровень ^ единица уровня». В первом отношении значение первого аргумента ae {Whole, Part}, во втором - ae {Level, UnitLevel}, переменные x и y обозначают понятия аналогично отношениям иерархии.

Таблица 2

Соответствие семантических отношений и типов предикатов

Группа отношений Отношение Предикат Множество значений первого аргумента

Иерархии Род о вид PHier(a, x, y) {Class, Kind} {Category, Value} {Invariant, Variant}

Признак о значение признака

Инвариант о вариант

Агрегации Целое о часть PAggr(tf, x. у) {Whole, Part}

Уровень о единица уровня PAggr(tf, x, v) {Level, UnitLevel}

Объект о пространство реализации (локализации/позиции) объекта PExist(a, x, y, z) {Being, Location, Position, Order}

Объект о свойства/признак PProp(a, x, y) {Property, Indication, character, Parameter, Factor, Criterion}

Функцио- нальные Объект действия о Действие о субъект действия PFun(a, x, y, z) {Function, Causal, Condition, Event, ActState, ObjectState,

Причина о следствие

Условие о действие

Событие о действие

Объект действия о состояние

Состояние о действие Tool, Data, Quantity}

Инструмент о действие

Данные о действие

Данные о величины

Семиотиче- ские Термин о способ выражения PForm(a, x, y, z) {Expression, Representation, MetaSign}

Термин о способ представления

Термин о метазнак термина

Тождества Термин о синоним термина PEquiv(a, x, y) {Synonym, Quasisynonym}

Корреляции Термин о коррелят термина PCor(a, x, y) {Correlate, Oppose)

Отношение «объект ^ пространство реализации (локализации/позиции) объекта» включает в себя несколько отношений: существование объекта в какой-либо среде, местонахождение объекта, пространственное положение объекта, отношение порядка объекта. Всем отношениям соответствует предикат PExist(a, x, y, z), уточнение отношения осуществляется посредством первого аргумента предиката ae {Being, Location, Position, Order}.

Отношению «объект ^ пространство реализации/существования/проявления ...» соответствует значение первого аргумента «Being», причем в кортеже

предиката переменная х обозначает понятие, имя которого идентифицирует пространство, среду или объект, в котором реализован термин, обозначаемый переменной y, z обозначает тип пространства реализации. Например, имеем предложение «Сом обитает в реке». Для распознавания этого предложения должен использоваться предикат PExist(«Being», x, y, z), где x - объект существования (сом), y - среда существования (река), z = «среда обитания». Для предложения «В глобальной сети Интернет существует очень большое количество информационных ресурсов» z = «информационное пространство», х = «информационный ресурс», у = «глобальная сеть Интернет».

Отношению «объект ^ пространство локализации» соответствует значение первого аргумента «Location». Например, для распознавания предложения «Государство Ангола расположено в Африке» необходим предикат PExist(«Location», x, y, z), х - объект локализации (Государство Ангола), y -место локализации (Африка), z = «Местонахождение».

Отношению «объект ^ позиция объекта» соответствует предикат PExist(«Position», x, y, z), в котором х - позиционируемый объект, y - объект, относительно которого осуществляется позиционирование первого, z e {«Слева», «Справа», «Сверху», «Снизу», «Рядом», .}. Предложение «Пассажиры находятся внутри самолета» распознается предикатом PExist(«Position», x, y, z), где z = «Внутри».

Отношению «объект ^ порядок объекта» соответствует предикат PExist(«Order», x, y, z), в котором х - термин, обозначающий объект, порядок которого задан в предложении, y - термин, обозначающий объект, относительно которого определяется порядок первого, ze {«Первый», «Второй», «Последний», «Текущий», «Следующий», ...}. Для предложения «После текущей темы курса рассмотрим тему «асинхронные процессы» х = «асинхронные процессы», y = «тема курса», z = «Текущая».

К группе отношений агрегации также относится отношение «объект ^ свойства/признак». Ему соответствует предикат PProp(a, x, y), в первом аргументе которого записывается имя свойства/признака, или ae {Property, Indication, Character, Parameter, Factor, Criterion}, т. е. в предикате уточняется, о каком типе свойства идет речь: свойстве, признаке, характеристике, параметре, факторе или критерии. Эти же слова являются дополнительными словами-признаками, определяющими данное отношение.

3. Функциональные отношения. Данные отношения описываются одним предикатом. Уточнение отношения осуществляется посредством значения первого аргумента ae {Function, Causal, Condition, Event, ActState, Object-State, Tool, Data, Quantity}. Предикат PFun(«Function», x, y, z) определяет основное функциональное отношение, аргументы обозначают x - объект действия, y - субъект действия, ze {«Метод», «Способ», «Процесс», «Процедура», «Действие», «Операция», .}.

Каузальному отношению «причина ^ следствие» соответствует предикат PFun(«Causal», x, y, z), где х - термин, обозначающий причину, y - термин, обозначающий следствие, ze {«из-за того, что», «в связи с тем, что», «потому что», «Так как - то».}.

Отношению «условие ^ действие» соответствует предикат

PFun(«Condition», x, y, z), где х - термин, обозначающий условие выполнения действия, y - действие, ze {«если - то», «необходимо - достаточно», «когда -то», ...}.

Отношению «событие ^ действие» соответствует предикат PFun(«Event», x, y, z), где х - термин, обозначающий событие, связанное с действием, y - термин, обозначающий действие, ze {«действие активизируется при», «процесс активизируется при», «процесс выполняется при наступлении», «после выполнения действия возникает», ...}. Значения переменной z поясняются следующим образом: действие может выполняться после возникновения определенного события, результатом выполнения действия может быть тоже возникновение некоторого события.

Отношению «объект действия ^ состояние» соответствует предикат PFun(«ObjectState», x, y, z), где х - объект действия, y - состояние объекта действия, ze {«находится в состоянии», .}.

Отношению «состояние ^ действие» соответствует предикат

PFun(«ActState», x, y, z), где х - термин, обозначающий состояние, в котором находится действие, y - действие, ze {«активное», «пассивное», «ожидание»}.

Отношению «инструмент ^ действие» соответствует предикат PFun(«Tool», x, y, z), где х - термин, обозначающий инструмент, который используется для выполнения действия, y - действие, ze {«с помощью», «посредством», «с использованием», «с применением», .}.

Отношению «данные ^ действие» соответствует предикат

PFun(«Data», x, y, z), где х - термин, обозначающий данные, y - действие, ze {«входные», «промежуточные», «выходные», «статистические», «динамические», «временные», «пространственные», ...}.

Отношению «данные ^ величины» соответствует предикат

PFun(«Quantity», x, y, z), где х - термин, обозначающий величины, y - данное, значение z принадлежит семейству множеств, описывающих время, пространство и положение, причем величины могут быть как количественного характера, так и качественного, z e {T, 51, 52}, где T - время и T = {NT, QT},

51 - пространство и 51 = {N51, Q51}, 52 - положение (ситуация) и

52 = {Q52}. Символ N идентифицирует количественные величины, а символ Q - качественные. Примеры: NT = { эпоха, неделя, сутки, час, день, минута, .}, QT = {раньше, позже, год назад, ...}, N51 = {объем, высота, длина, ширина, координаты, диаметр, ...}, Q51 = {больше, меньше, средний, большой, низкий, высокий,.}, Q52 = {международное, семейное, официальное, социальное, материальное, чрезвычайное, осадное, безнадежное, внутриполитическое, ...}.

4. Семиотические отношения описываются одним предикатом PForm(a, x, y, z), в котором первый аргумент уточняет отношение ae {Expression, Representation, MetaSign}.

В отношении «термин ^ способ выражения» значение ze {«слово», «предложение», «текст»}, отношении «термин ^ способ представления» значение ze{«граф», «рисунок», «схема», «график», «формула», «модель», ...} и в отношении «термин ^ метазнак термина» z = null. Например, предложение «Результат синтаксического анализа представляется в виде графа зависимостей» распознается предикатом PForm(«Representation», x, y, z), где х = «результат синтаксического анализа», y = «граф зависимостей», z = «граф». Предложение «Логус предложения можно описать формулой логики предиката первого порядка» распознается предикатом PForm(«Representation», x, y, z), где х = «Логус предложения», y = «формулой предиката первого порядка», z = «формула».

Предложение «Булева алгебра - это алгебра, несущим множеством которой является множество всех логических функций, операциями - конъюнкция, дизъюнкция, отрицание» распознается предикатом PForm(«Expression», х, у, z), где х = «Булева алгебра», у = «- это алгебра, несущим множеством которой является множество всех логических функций, операциями - конъюнкция, дизъюнкция, отрицание», z = «предложение».

5. Отношение тождества или синонимии определяется предикатом PEquiv(a, х, у), отношение корреляции - PCor(a, х, у). В первом случае ae {Synonym, Quasisynonym}, во втором - ae {Correlate, Oppose}.

Таким образом, для распознавания тех или иных отношений между терминами в научном тексте необходима дополнительная информация об этих отношениях в виде термов-спутников или термов-признаков отношений, составляющих зачастую устойчивые словосочетания с глаголом семантического отношения. В табл. 3 приведены примеры значений кортежа предикатов для некоторых семантических отношений.

Таблица 3

Примеры значений кортежа предикатов

Отношение Терм-спутник x Я Терм-спутник У a

1 2 3 4 5 б 7

Род (А) о вид (В) А имеет виды във2,... Class

к видам А относится В]. В2. ... Class

к семейству .1 относится /І,. в2.... Class

к классу .1 относится В\. В2. ... Class

В относится к семейству А Kind

относится к классу А Kind

относится к роду А Kind

родом В является А Kind

в принадлежит А Kind

А есть В Category

Признак (А) о значение признака (В) А - В .Categoiy Category

А имеет имя В

А именуется в Category

А называется в Category

А имеет значение в Category

В имеет категорию А Value

к вариантам А относятся В\, в2,... Invariant

Инварианто вариант инвариантом А является В Invariant

целое А - часть в Whole

Целое(А) о часть (В) целое А имеет часть в Whole

А состоит из В-оа Whole

А включает в себя как часть В Whole

А включает в свой состав В Whole

А имеет своими частями В\, в2, ..., в„ Whole

Окончание табл. 3

1 2 3 4 5 б 7

А имеет своими элементами ВЪ ^ .... В„ Whole

В входит в состав А Part

В составляет часть А Part

в является частью А Part

в является элементом А Part

А обладает свойством В Property

Объект о свойство/ признак А имеет существенным признаком В Indication

ДЛЯ А характерно В Character

А характеризу- ется наличием В Character

факторами А являются В\. в2 Factor

Знание описанной информации позволяет построить диагностирующие конструкции по распознаванию каждого вида семантического отношения и уже на основе диагностирующих конструкций построить множество продукционных правил для извлечения знаний о терминах из научного текста. Ядром продукционного правила является предикат.

Заключение

В статье предпринята попытка раскрыть классификацию концептуальных объектов и отношений И. Дальберг. Главным основанием классификации семантических отношений, предложенной в работе, является их принадлежность понятийным сферам. Такой подход позволил значительно сократить количество типов предикатов, что достаточно важно для системы резолютивного логического вывода. Приведено соответствие семантических отношений и типов предикатов.

Список литературы

1. Дальберг, И. Организация знаний: ее сфера и возможности / И. Дальберг // Организация знаний: проблемы и тенденции : программа и тез. докл. конф. (Москва, 10-14 мая 1993 г.). - М., 1993. - С. 14.

2. Ни китина, С. Е. Семантический анализ языка науки / С. Е. Никитина. - М. : Наука, 1987. - 143 с.