Научная статья на тему 'Семантико-прагматическая модель документа в нотации XML'

Семантико-прагматическая модель документа в нотации XML Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
89
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Семантико-прагматическая модель документа в нотации XML»

Семантико-прагматическая модель документа в нотации XML

Коровин С.Е.( sergey korovin@nm.ru ) Южно-Уральский государственный университет, г. Челябинск

1. Семантические модели и World Wide Web

2. Понятия, лежащие в основе семантико-прагматической модели документа

3. Структура семантико-прагматической модели документа

4. Пример моделирования с использованием СПМД

5. Использование семантико-прагматической модели документа

1. Семантические модели и World Wide Web

На сегодняшний день существует два основных подхода к решению проблемы автоматизации семантического анализа естественно-языковых текстов.

Первый подход заключается в поиске методов интерпретации синтаксических и поверхностно-семантических конструкций естественного языка - ассоциации лексем и словокомплексов с некоторой соответствующей им системой понятий. Такая постановка проблемы семантического анализа позволяет достаточно эффективно решать задачи, непосредственно связанные со знаковой системой языка, - задачи семантического поиска, классификации, автоматического реферирования и т.п. Однако, поверхностно-семантические модели (словарь понятий, на который отражаются лексемы и словокомплексы, и правила этого отображения) - сложны, объемны и существенно изменяются от одной предметной области к другой, что значительно снижает эффективность их практического использования.

Вторым подходом к решению проблем семантического анализа является создание искусственной семиотической системы - семантической модели (глубинно-семантической модели). Семантическая модель представляет собой необъемную систему однозначных и строго структурированных понятий, полученных путем обобщения концептов (понятий) естественного языка. С семантической моделью ассоциируется формализованная нотация, еще более упрощающая автоматизацию анализа модели.

В последние несколько лет второй подход получает все большое распространение, поскольку уровень развития первого подхода не позволяет решать многие практические задачи. Одним из примеров, подтверждающих данную тенденцию, является развитие стека протоколов World Wide Web, базирующегося на расширенном языке разметки - XML [1]. Одной из задач данного стека является создание основы для автоматизации семантической обработки информации в Web. Эту задачу призвана решить связка XML + RDF, в которой язык XML играет роль синтаксиса (формализованной нотации), а модель RDF [2] -роль семантической модели (структурированного набора смысловых понятий). Узким местом данной связки (а возможно и всего стека протоколов) является модель RDF, представляющая собой, фактически, семантическую сеть (основным недостатком практически любой семантической сети является ее статичность, которая резко усложняет моделирование динамических явлений).

Создание семантических моделей, которые бы расширили возможности RDF, вызвало к жизни новое исследовательское направление, поддерживаемое WWW-консорциумом, - Semantic Web. В его контексте созданы такие модели, как, например, DAML+OIL [3].

Описываемая в данной статье семантико-прагматическая модель документа, так же, относится к направлению Semantic Web и расширяет функциональность существующих в рамках этого направления моделей, поддерживая представление динамических явлений и прагматики документов.

2. Понятия, лежащие в основе семантико-прагматической модели документа

Начиная построение глубинно-семантической модели естественноязыкового сообщения (документа), т.е. выделение его базовых смысловых понятий, мы, фактически, должны ответить на следующий фундаментальный вопрос: "что, в принципе, может сообщить автор; что, в принципе, может составлять смысловое содержание документа"?

Ответ на данный вопрос мы начнем с формулировки следующей гипотезы: основу ощущений, восприятий, представлений человека составляет разграничение им своего внутреннего мира и окружающего мира (рис.1.)

Рис.1 Разграничение человеком внутреннего и окружающего миров

Эта гипотеза дает нам возможность разбить множество концептов естественного языка на два класса: понятия, описывающие окружающий мир и понятия, описывающие внутренний мир человека. Следующим шагом создания глубинно-семантической модели будет формирование двух этих классов понятий.

2.1. Понятия, описывающие окружающий мир

Что бы двигаться дальше, сформулируем второю гипотезу: основу представления человека об окружающем мире составляют два фундаментальных свойства этого мира: детерминированное движение и системность.

Понятие "детерминированное движение" распадается на следующие более простые понятия: свойство, объект, отношение, взаимодействие, причина и следствие. Попытаемся формально описать их:

• свойство - кортеж вида:

Рп = <П, Vcur> | Vcur е {VI, У2, •.., Ук, • • •}, (1)

п - имя свойства,

усшг - текущее значение свойства

{у1, у2, • • •, Ук, • • } - множество допустимых значений свойства.

• объект - множество свойств, такое, что:

а) в универсальном множестве объектов - нет в данный момент времени другого объекта, абсолютно идентичному данному;

б) данный объект находится в связи как минимум с одним отличным от него объектом;

в) множество свойств и/или их значений изменяются с течением времени (объект движется):

О? = {Р1, Р2, • , Рк, •} | (2)

V(O/tи, О*) | О* е иО, О? е иО ^

з (Р/° РтО7) | (Р/° Рт°7) е О/" X О", I Ф т V Р?1 Ф РтО^;

3 О? | О/" е иО О/" ф О? ^ (О/" , О/") е Rtи, Я^ с иОх иО;

V(Oгtm, т | (ОЛ т е Ог X Т ^ 3 (О!", д | (ОД " е Ог х Т, п > т, ОД Ф О?

здесь

иО - универсальное множество объектов в момент времени tn; Т = <•.., t п-1, tn, t п+1, •> - время (абстрактный эталон изменения); О/ = {О/1, Ог12, • , О/1", •..}- объект на протяжении всего времени его существования (множество состояний объекта);

• отношение - изменяемое во времени множество пар объектов (участвующих в отношении или связанных отношением):

Я" = {(О/" , О/") : (О/п , О/") е ИОхИО} | (3)

V(Rtm, т | (Rtm, т е Я X Т ^ 3 (Я" У | (Rtn, д е Я X Т, " > т, Rtm Ф Я"

здесь

иО - универсальное множество объектов; Т - время.

R/■ = Rt2, • , Rtn, •..}- отношение на протяжении всего времени его существования.

• взаимодействие объектов - взаимное изменение во времени свойств объектов и отношений, в которых они состоят:

(O/m ^ O/n), (Rtm ^ Rtn) ^ (O/n ^ O/p), (Rtn ^ Rtp) ^ (4)

(O/p ^ O*), (Rtp ^ Rte) здесь

(O/tn ^ O/tm) - переход объекта из одного состояния в другое;

tm tn

(R ^ R ) - изменение отношения R.

• причина, следствие - взаимные изменения свойств и отношений объектов, одни из которых (изменения-причины) обязательно влекут за собой другие (изменения-следствия):

V tm I (O/m ^ O/n), (Rtm ^ Rtn) ^ O" ^ Oytp), (Rtn ^ Rtp); (5) n - m = const, p - n = const.

здесь

tm tn tm tn

(O/ ^ Oj ), (R ^ R ) - причина;

(Ojn ^ Ojp\ (Rtn ^ Rtp) - следствие.

Таким образом, окружающий мир представляется человеку, как совокупность взаимодействующих между собой объектов. В процессе взаимодействия объекты изменяют свои свойства в строгом соответствии с законом взаимодействия, таким, что для любого изменения всегда найдет пара других изменений, одно из которых - причина, а другое - следствие. При этом закон не зависит от времени: при равных условиях он действует в разные моменты времени совершенно одинаково.

• система - составной объект, для которого выполняется два принципиальных условия: его свойства не сводимы к сумме свойств составляющих его объектов; некоторый набор его свойств из всего множества свойств - постоянен (объект относительно стабилен):

S = (E;, E2, ..., Ej, ..., Rs}, Ej- объект (элемент) (6)

Rs С (E;

S Ф U Ej

Rs С (E^ E2, Eb .}2

V (tn, tm) I tn ^ T, tm ^ T, n > m ^ ^ Sconst I Sconst С S, S const S const

Объекты (Ej), составляющие систему, называются элементами. Множество отношений между элементами (R) называется структурой системы. Элементы системы могут быть, в свою очередь, системами, но в контексте данной системы рассматриваются как объекты (далее неделимы).

Таково множество понятий, описывающих окружающий мир. Далее мы должны сформулировать понятия, описывающие, в соответствии с нашей гипотезой, - внутренний мир человека.

2.2. Понятия, описывающие внутренний мир человека

Сформулируем третью гипотезу - гипотезу о модели участника общения (автора или адресата документа): человек, как участник процесса общения, может быть охарактеризован двумя типами свойств: психологическими и социальными. Психологические свойства описывают внутренний мир (сознание) человека. Внутренний мир человека можно разбить на четыре горизонтальных уровня: цели (цели, ценности, нормы); система знаний об окружающем мире; система эмоциональных состояний, которые может принимать человек; воля (готовность человека к действиям различного типа). Социальные свойства описывают социальный статус человека по отношению к другим участникам общения.

Описать формально цели, знания, эмоциональное состояние, волю, социальный статус человека - представляется достаточно проблематичным. Оценка подобных характеристик на практике осуществляется человеком, поэтому введем понятие "экспертной оценки". Оно близко понятию свойства, которые было введено в предыдущем параграфе, однако множество значений в данном случае должно быть нечетким:

Dn = <n, v | v: ({Vmin, Vmax}, цех) >, (7)

K

цЕХ = ( S Ц ■ ) / K | цЕХ e [0,1] (8)

i=l

(здесь D - характеристика (description)); n - имя характеристики; V - значение свойства;

{vmin, Vmax} - нечеткое множество допустимых значений свойства (здесь vmin и vmax - граничные значения характеристики; цех - оценка принадлежности ve {vmin, vmax}, цех принадлежит множеству вещественных чисел от 0 до 1 и является средним арифметическим оценок K экспертов).

Тогда модель участника общения можно представить, как

H = {H1, H2, Нз, H4, Из}, (9)

Н1 = <{abD1A}, ...,{ak,DkA}, ...> | ak e A; H2 = <{n1,D1N}, .,{nk,DkN}, ...> | nk e N; H3 = <{e1,D1E}, .,{ek,DkE}, ...> | ek e E; H4 = <{W1,DSW}, .,{Wk,DkW}, .> | Wk e W; H5 = <{S1,D1S}, .,{Sk,DkS}, ...> | Sk e S.

Здесь, А - множество целей; N - множество знаний; Е - множество эмоций; W

- множество волевых компонент, Б - множество типов социального статуса.

Модель участника общения, помимо предоставления возможности описывать различные характеристики автора сообщения, наталкивает нас на важную мысль: автор имеет множество целей в отношении адресата. Возникает вопрос: можно ли классифицировать эти цели и как, вообще, автор достигает их, учитывая, что он воздействует на адресата посредством документа (сообщения)?

Ответ на первую часть вопроса следует из модели участника общения: целью автора может быть лишь изменение состояние адресата: физического, эмоционального, волевого; системы знаний адресата.

Ответ на вторую часть вопроса таков: достичь своих целей автор может посредством особой языковой организации документа (как говорят в прагматике - типом иллокутивного акта [4]). Так, он может передавать адресату информацию в форме утверждения, предположения, вопроса, приказа и т.п., добиваясь тем самым нужного ему изменения состояния адресата.

Исходя из этого, можно предположить следующее: любой документ может быть разбит на относительно независимые друг от друга "прагматические блоки". Критерием разбиения служит способ языковой организации конкретного блока и соответствующая ему цель. С этой точки зрения, представим документ следующим образом:

Бос = <(В1, к1, Р1), (В2, к2, Р2), ••., (В/, к/, р/), ...>, (10)

В/ - прагматический блок (некоторая часть документа);

к/ е {Побуждение к действию, Разрешение, Запрещение, Ограничение, Утверждение, Вопрос, Предположение, Одобрение, Неодобрение, Обещание, Обязательство, Оспаривание, Протест, Сожаление, Благодарность, Объяснение, Изложение} - иллокутивный тип /-го прагматического блока; рг- е {Изменение физического состония, Изменение эмоционального состония, Изменение мнения, Передача информации} - цель автора в /-м прагматическом блоке;

Понятие "прагматического блока" и не описывает непосредственно внутренний мир человека, однако тесно связано с ним и является основным средством представления прагматики документа.

3. Структура семантико-прагматической модели документа

Итак, исходя из множества сформулированных концептов, можно сделать следующие выводы:

- Знания человека об окружающем мире (а значит и семантическое содержание документа) можно выразить в виде конечного числа сочетаний семантических сущностей, количество типов которых, так же, - конечно и невелико

(свойства, объекты, отношения, системы, взаимодействие, причина и следствие);

- Знания человека (автора и адресата документа) о своем внутреннем мире (а значит и контекст создания документа) можно свести к экспертным оценкам целей; знаний; эмоций; волевых компонент, и социального статуса автора и адресата документа;

- Документ может быть разбит на относительно независимые друг от друга "прагматические блоки". Критерием разбиения служит тип иллокутивного акта, осуществляемого конкретным блоком (способ языковой организации) и цель автора в данном блоке.

Тогда структура СПМД (будем называть ее, так же, мета-документом) должна включать в себя три базовых модели (рис. 2): модель контекста создания документа (описание автора и адресата документа), прагматическую модель (описание прагматических блоков) и семантическую модель (описание глубинной семантики документа).

М

ЕТА-ДОКУМЕНТ *

МОДЕЛЬ КОНТЕКСТА ДОКУМЕНТА (ДОКУМЕНТ) ПРАГМАТИЧЕСКАЯ МОДЕЛЬ

... ПРАГМА-БЛОК СЕМАНТИЧЕСКАЯ МОДЕЛЬ —► ВРЕМЕННАЯ ШКАЛА

... ОБЪЕКТ

* Здесь и далее, •.." означает, что элемент может присутствовать 0, 1 и б. раз

означает, что элемент может присутствовать 0 или 1 раз

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис.2 Мета-документ

• Ключевым и единственным элементом модели, содержащей информацию о контексте создания документа, является элемент "ДОКУМЕНТ" (рис. 3)

ДОКУМЕНТ

' -► НАЗВАНИЕ

-► ДАТА

-► ВРЕМЯ

УЧАСТНИК ОБЩЕНИЯ

► ТИП (Автор или Адресат)

► СОЦИАЛЬНЫЙ СТАТУС (экспертная оценка)

► ЗНАНИЯ ПО ТЕМЕ ДОКУМЕНТА (экспертная оценка)

► ОТНОШЕНИЕ К ТЕМЕ ДОКУМЕНТА (экспертная оценка)

► УВЕРЕННОСТЬ (экспертная оценка)

ЭМОЦИОНАЛЬНОЕ СОСТОЯНИЕ (экспертная оценка)

-► ... СВОЙСТВО_ДОКУМЕНТА

ИМЯ СВОЙСТВА ЗНАЧЕНИЕ СВОЙСТВА

Рис.3 Элемент "ДОКУМЕНТ"

Определенная часть контекста является общей для любых документов: наименование документа, дата и время его создания, автор, адресат. Кроме этой общей части, у конкретного контекста могут быть свои особенности (место его создания, регистрационный номер и т.п.), которые описываются дополнительно при помощи элементов "СВОЙСТВО ДОКУМЕНТА".

Важнейшими элементами контекста создания документа являются автор документа и его адресат, другими словами, - участники общения. Информация об участниках общения в общем случае явно не указывается в документе и в тоже время является совершенно необходимой для его интерпретации. Каков социальный статус автора, в каком настроении он писал документ, каковы его знания и мнение по освещаемому вопросу, кому он предназначал документ, -все это необходимо знать, что бы извлечь из документа информацию, пригодную для принятия решений на ее основе. Для того, что бы предоставить интерпретатору документа (адресату или аналитику) указанную информацию вводится особый элемент "УЧАСТНИК ОБЩЕНИЯ".

Для описания участников общения используется пять типов элементов. Для каждого из них задается описывающая его характеристика, ее значение и/или степень соответствия ей (степень соответствия оценивается количественной оценкой от 0 до 10). Например,

<ЗНАНИЯ ПО ТЕМЕ>

<ХАРАКТЕРИСТИКА> Качественный уровень </ХАРАКТЕРИСТИКА> <ЗНАЧЕНИЕ> Поверхностный </ЗНАЧЕНИЕ>

</ЗНАНИЯ ПО ТЕМЕ>

или

<ЗНАНИЯ ПО ТЕМЕ>

<ХАРАКТЕРИСТИКА> Тема </ХАРАКТЕРИСТИКА> <ЗНАЧЕНИЕ Степень="1"/> <ХАРАКТЕРИСТИКА> Рема </ХАРАКТЕРИСТИКА> <ЗНАЧЕНИЕ Степень='7"/>

</ЗНАНИЯ ПО ТЕМЕ>

В первом случае, эксперт считает, что автор документа просто плохо разбирается в том, о чем он пишет. Во втором случае, эксперт считает, что автор хорошо ориентируется в некоем узком вопросе, который он рассматривает, но имеет слабое представление об области знаний, к которой относится этот вопрос.

• На рис.4 показана структура прагматической модели СПМД.

Прагматическая модель состоит из некоторого количества прагма-блоков, каждый из которых ассоциирует с определенной частью документа (с текстом (поверхностной семантикой) и с семантической моделью через ссылки на нее (глубинной семантикой)) - цели автора и средства их достижения (типы иллокутивных актов). Каждый прагматический блок может включать в себя множество детализирующих его прагматических блоков.

ПРАГМАТИЧЕСКАЯ_МОДЕЛЬ РАГМА-БЛОК —► НАЗВАНИЕ БЛОКА

—► .ЦЕЛЬ (Изменение физ. состояния; Изм. эмоц. сост.;

Изм. мнения; Передача информации) —► .СРЕДСТВО (Побуждение к действию; Разрешение; Запрещение Ограничение; Утверждение; Вопрос; Одобрение; Неодобрение; Обещание; Обязательство; Оспаривание; Протест; Сожаление; Благодарность; Объяснение; Изложение) —► .ТЕКСТ (текст, ассоциируемый с иллокутивным актом) .ССЫЛКА НА СЕМАНТИЧЕСКУЮ МОДЕЛЬ .ПРАГМА-БЛОК

Рис.4 Прагматическая модель

Примерное соответствие (на наш взгляд) целей и иллокутивных актов приведено в таблице 1:

Таблица 1

ЦЕЛИ ИЛЛОКУТИВНЫЕ АКТЫ

Изменение физического состояния Побуждение к действию; Протест; Разрешение; Запрещение; Ограничение;

Изменение эмоционального состояния Обещание; Сожаление; Благодарность; Одобрение; Неодобрение; Протест; Разрешение; Запрещение; Ограничение;

Изменения мнения (волевого состояния) Вопрос; Оспаривание; Обязательство; Разрешение; Запрещение; Ограничение; Одобрение; Неодобрение

Передача информации (изменение системы знаний адресата) Утверждение; Объяснение; Изложение Вопрос;

Элемент "ТЕКСТ" используется для явного представления текста, составляющего содержание иллокутивного акта автора. Таким образом, этот элемент ассоциирует некоторый текст с определенными целями и определенными типами иллокутивного акта. В дальнейшем, подобные элементы могут быть ис-

пользованы, как база знаний о способах организации конкретных иллокутивных актов. Ссылки на семантическую модель используется для ассоциации данного прагматического блока с элементами семантической модели документа (ссылка содержит в себе идентификатор одного из элементов семантической модели.

• Ядром СПМД является, конечно, семантическая модель, которая, собственно, и представляет смысловое содержимое документа.

Если кратко сформулировать все сделанные ранее предположения относительно представления человека об окружающем мире, то получим следующее: человек представляет окружающий его мир в виде объектов, характеризуемых свойствами и отношениями (взаимодействиями) между собой или, другими словами, - своими состояниями. Состояния объектов постоянно изменяются. Существует два способа рассмотрения этих изменений: временной (изменения состояний объектов рассматриваются относительно некоторого эталонного изменения - времени) и причинно-следственный (изменения состояний объектов рассматриваются относительно состояний объектов, с которыми они взаимодействуют). Таким образом, динамическая семантическая модель должна представлять собой описание временной и причинно-следственной составляющих изменения свойств и отношений взаимодействующих между собой объектов.

Движение объекта можно описывать двумя способами. Первый способ заключается в разбиении процесса изменения свойств и отношений объекта на статические состояния ("мгновенные снимки"). Ему, в частности, соответствует мат. модель - абстрактный автомат. Второй способ описания заключается в формировании последовательности переходов (т.е. единичных изменений) объекта. Он позволяет более точно и компактно описывать каждое конкретное изменение и по своей сущности напоминает табличное представление функции. СПМД поддерживает оба этих способа (и в этом смысле, напоминает по своей структуре сети Петри). Полученная структура семантической модели показана на рис.5.

Как видно из этого рисунка, элементами верхнего уровня семантической модели являются "временная шкала" и "объект". Объект является ключевым элементом семантической модели. При моделировании явления, описываемого в документе, в явлении выделяются взаимодействующие объекты, после чего движение каждого объекта описывается отдельно.

Временная шкала разбивает моделируемое явление на несколько последовательных интервалов, путем описания ключевых моментов (с помощью элементов "деление"). Описание осуществляется либо посредством указания абсолютного времени момента, либо путем его ассоциации с некоторым ключевым событием. Заданные таким образом моменты используются далее при описании временных промежутков конкретных переходов и состояний объектов.

Объект характеризуются своими свойствами; отношениями (какие роли он играет в этих отношениях, с какими объектами он ими связан, каков тип данного отношения - классификационный, ролевой); и, если данный объект

является системой, - структурными связями (парами вида "объект1 - объект2", множество которых позволяет задать структуру системы).

При описании объекта, прежде всего, задаются статические свойства, отношения и структурные связи (те, которые не изменяются на всем протяжении моделируемого явления; например, наименование объекта). Они размещаются внутри элемента "объект" и не входят в элементы "переход" и "состояние".

СЕМАНТИЧЕСКАЯ_МОДЕЛЬ

ВРЕМЕННАЯ_ШКАЛА (позволяет сопоставлять движение объектов) ' ДЕЛЕНИЕ

■ ВРЕМЯ или СОБЫТИЕ

ОБЪЕКТ

->... ИМЯ, АБСТРАКТНОСТЬ (абстрактный или конкретный);

СТАТИЧЕСКИЕ: СВОЙСТВА, ОТНОШЕНИЯ, СТРУКТУРНЫЕ СВЯЗИ

НАЧАЛЬНОЕ_ СОСТОЯНИЕ

-... СВОЙСТВА, ОТНОШЕНИЯ, СТРУКТУРНЫЕ СВЯЗИ

ПЕРЕХОД (Изменение, произошедшее с объектом) ХАРАКТЕР (Появление, Исчезновение, Изменение

Совершение) ВРЕМЯ (Временной промежуток перехода) . УСЛОВИЕ (Без чего переход был бы невозможен) . ПРИЧИНА (Что стало прямой причиной перехода) . СЛЕДСТВИЕ (Причиной чего является переход) . СВОЙСТВА, ОТНОШЕНИЯ, СТРУКТУРНЫЕ СВЯЗИ (появившиеся, исчезнувшие, изменившиеся в данном переходе) . ЦЕЛЬ ОБЪЕКТА (к которой он стремится в переходе) . ДОПУСТИМОСТЬ ПЕРЕХОДА (соответствие целям)

ВАРИАНТЫ (Для описания потенциальных вариантов движения) .ВАРИАНТ

■►НАЧАЛЬНОЕ СОСТОЯНИЕ

► . ПЕРЕХОД

► . ВАРИАНТЫ

► . СОСТОЯНИЕ ■►КОНЕЧНОЕ СОСТОЯНИЕ

. СОСТОЯНИЕ ("Мгновенный снимок"изменения объекта)

■ ВРЕМЯ (Временной промежуток, в котором имеет место данное состояние)

■ . СВОЙСТВА, ОТНОШЕНИЯ, СТРУКТУРНЫЕ СВЯЗИ . ЦЕЛЬ ОБЪЕКТА (цель нахождения в состоянии)

■ . ДОПУСТИМОСТЬ СОСТОЯНИЯ (соответствие целям)

КОНЕЧНОЕ_СОСТОЯНИЕ

■ . СВОЙСТВА, ОТНОШЕНИЯ, СТРУКТУРНЫЕ СВЯЗИ

Рис.5 Семантическая модель

Далее осуществляется описание движения объекта. Для этого вводится последовательность переходов (они группируются друг за другом в порядке их возникновения). Каждый переход содержит в себе следующие элементы: "характер", "время", "условие", "причина", "следствие" и набор элементов, которые, собственно, составляют содержание перехода ("свойство", "отношение", "структурная связь").

Характер описывает сущность изменения: появление, прекращение, изменение, совершение (появление или исчезновение свойства, отношения; изменения значения свойства или роли отношения, совершения действия и т.п.). Здесь:

- "появление": до перехода данный элемент отсутствовал, после перехода -присутствует;

- "прекращение": до перехода данный элемент присутствовал, а после перехода - отсутствует;

- "изменение" (прекращение + появление): значение свойства, роль отношения и т.п. изменилось в результате данного перехода;

- "совершение" (появление + прекращение): особый вид отношения - действие появилось и исчезло - совершилось.

Время ассоциирует данный переход с одним из интервалов временной шкалы. Для этого в него входят такие элементы, как "В_МОМЕНТ", "ДО" и "ПОСЛЕ", значения которых - моменты абсолютного времени или ключевые события. Множество таких элементов определяет конкретный временной интервал данного перехода.

Условие, причина и следствие характеризуют данный переход, как элемент некоторой причинно-следственной связи. Эти элементы указывают на переходы, отношения, конкретные элементы переходов (свойства, отношения, структурные связи), которые являются соответственно условиями, причинами и следствиями данного перехода.

Помимо описания движения в виде переходов, модель, так же, поддерживает описание движения в виде совокупности состояний, расположенных в порядке их смены. Этот уровень описания является более абстрактным, чем основной способ и дополняет его. Он присутствует в модели как минимум в виде пары: начальное и конечное состояния. Однако эксперт, формирующий модель, может ввести в нее, так же, любое число промежуточных состояний. Каждое состояние содержит описание временного промежутка, в течении которого оно имеет смысл, и всех свойств, всех отношений и всех структурных связей объекта, которыми он обладает в данном временном промежутке.

Модель описывает последовательность переходов и состояний объекта, которые имели место в действительности. Однако может потребоваться описать и потенциальные варианты движения объекта, которые могли быть (могут быть в настоящем или будущем). Более того, такие потенциальные состояния и переходы могут быть условиями и причинами выбора объектом реального варианта

движения. Для описания потенциальных переходов и состояний в модель введен элемент "Варианты".

Уникальный набор свойств объекта (рис.6) - это то, что, собственно выделяет объект среди множества других объектов. Свойства бывают второстепенными и системообразующими (без последних объект не может существовать) и могут быть заданы, как экспертные оценки.

СВОЙСТВО

ИМЯ СВОЙСТВА

КАЧЕСТВО (Системообразующее или второстепенное) ЗНАЧЕНИЕ СВОЙСТВА ЗНАЧЕНИЕ

СТЕПЕНЬ СООТВЕТСТВИЯ ЗНАЧЕНИЮ (1, .,10) Рис.6 Свойство объекта

НАЧЕ £

Отношения объекта (рис.7) - это то, что вписывает объект в картину окружающего мира. Фактически, отношение - это "мгновенный снимок" взаимодействия (взаимного изменения свойств объектов) или, наоборот, обобщение взаимодействия. В отношении объект характеризуется ролью и целью. Роль объекта в отношении - это обобщенная характеристика отношения с точки зрения объекта, который в него вступает. Например, "Покупатель", "Продавец" и т.д. Отношение объекта не может быть однозначно идентифицировано одним только наименованием (в отличие, скажем, от свойства), так как объект может вступать в отношения с одним и тем же именем, но выступать в них в разных ролях (и в этом случае два таких отношения считаются различными). Если роли всех объектов, участвующих в данном отношении можно разбить на три стандартных группы: актор (совершающий), объект (подвергающийся), адресат (получающий), то отношение можно, так же, называть действием.

ОТНОШЕНИЕ

► ИМЯ ОТНОШЕНИЯ

► КАЧЕСТВО (Системообразующее или второстепенное)

► РОЛЕВОЙ ТИП ОТНОШЕНИЯ (отношение или действие)

► . РОЛЬ ОБЪЕКТА В ОТНОШЕНИИ (Актор, Объект действия, Адресат - в

действии и др. - в отношении)

^ . ЦЕЛЬ ОБЪЕКТА (цель нахождения объекта в отношении) ^ . КЛАССИФИКАЦИОННЫЙ ТИП ОТНОШЕНИЯ (пространственное, временное, каузальное, информационное, ресурсное, владения, управления, соперничества, классификационное, признаковое, количественное, сравнения) . УЧАСТНИК (ссылка на другой объект, участвующий в отношении) ^ . СВОЙСТВО (характеристика отношения) ^ . ОТНОШЕНИЕ (детализирующее)

Рис.7 Отношение

Для отношения введено множество его свойств. Строго говоря, это - неправильно, так как отношение характеризуется лишь объектами, которые в нем участвуют. Однако, в процессе моделирования могут возникнуть ситуации, когда в центре внимания окажется именно отношение, а не объекты, связанные им. В этом случае будет достаточно сложно определить, какие свойства объектов изменяются. Гораздо проще и логичнее будет охарактеризовать свойства сразу всех связанных отношением объектов (систем). Например, "удар был очень силен" или "между ними существовала подозрительная связь". Для разрешения подобных ситуаций мы и ввели множество свойств отношения.

Рекурсивные ссылки "ОТНОШЕНИЕ" используются для детализации данного отношения. "КАЧЕСТВО" отношения характеризует объекты, участвующие в нем, как элементы некоторой системы. Если качество отношения определено, как системообразующее, значит, система не может существовать в отсутствие данного отношения между ее элементами. Если же отношение -второстепенное, то система не перестает быть системой и в его отсутствие.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Особое значение для анализа знаний, представленных в виде СПМД, имеют типы отношений. В модели определены ролевые и классификационные типы отношений. С точки зрения ролей участвующих объектов, отношение может быть собственно отношением, связью (здесь нет жестко заданных ролей) или действием (в нем жестко определены три роли: актор - тот, кто осуществляет действие; объект действия - тот, кто подвергается действию; адресат - тот, в отношении кого (во вред или на пользу) направлено действие). Классификационные типы отношений указаны на рис.7.

Если данный объект является системой, то возникает необходимость описать его структуру, то есть задать структурные связи. Фактически, структурная связь - это ссылка на пару "объект-объект". Каждый объект этой пары описывается независимо, как элемент семантической модели (задаются его переходы и состояния; свойства и отношения). Причем для отношений между этими двумя объектами заполняются элементы "КАЧЕСТВО ", которые и определяют -является ли данная структурная связь системообразующей или второстепенной. С помощью подобных пар можно описать всю структуру системы.

При этом, поскольку структурные связи входят в состав элементов "ПЕРЕХОД" и "СОСТОЯНИЕ", с их помощью (в сочетании с временной шкалой, где изменения объектов структурной связи соотносятся с изменениями системы) можно ассоциировать изменения системы, как единого целого, с изменениями составляющих ее элементов, показывая тем самым процесс самоорганизации системы.

Такова структура семантико-прагматической модели. В целях экономии места, в данной статье не приводится формальное описание структуры и элементного состава СПМД, которое реализовано в виде X-схем (X-Schema).

4. Пример моделирования с использованием СПМД

Рассмотрим пример моделирования небольшого сообщения. Допустим, что журнал PC-WEEK сообщил: "Появились слухи. что после того, как Джон

До возглавил WWW-консорциум, он уволился из корпорации Microsoft, поскольку не мог совмещать одновременно две руководящих должности. Доподлинно известно, что он переехал из Вашингтона в Амстердам ".

Графическая иллюстрация семантической модели представлена на рис.8. (Здесь кругами обозначаются состояния; прямоугольниками - переходы [/возникновение; \ - прекращение; \/\ - изменение]; линиями с точками на концах - отношения; двойными линиями - причинно-следственные связи). Прагматическая модель проиллюстрирована таблицей 2. СПМД этого документа в нотации XML и пояснения к ней - приведены ниже.

Объект (Джон До) Объект (корпорация Объект^ЗС)

Microsoft)

Работа в Microsoft

(Место жительства) (Амстердам)

Рис.8. Графическая иллюстрация семантической модели

Таблица 2. Прагматическая модель

№ Название прагма-блока Текст Цель Средство

1 Появились слухи Появились слухи. что после того, как Джон До возглавил WWW-консорциум, он уволился из корпорации Microsoft, поскольку не мог совмещать одновременно две руководящих должности. - Передача информации - Изменение эмоционального состояния Предположение

2 Доподлинно известно Доподлинно известно, что он переехал из Вашингтона в Амстердам - Передача информации - Изменение эмоционального состояния Утверждение

СПМД документа в нотации XML:

<?xml version="1.0" encoding="cp866"?>

<МЕТА-ДОКУМЕНТ>

<ДОКУМЕНТ>

<НАЗВАНИЕ>Сообщение журнала "РС^ЕЕК"</НАЗВАНИЕ> <УЧАСТНИК_ОБЩЕНИЯ Имя^'РС-WEEK" Тип="Автор"> <СОЦИАЛЬНЫЙ_СТАТУС>

<ХАРАКТЕРИСТИКА> Печатное издание</ХАРАКТЕРИСТИКА> </СОЦИАЛЬНЫЙ_СТАТУС> </УЧАСТНИК_ОБЩЕНИЯ> </ДОКУМЕНТ>

<ПРАГМАТИЧЕСКАЯ_МОДЕЛЬ>

<ПРАГМА-БЛОК Имя=" Появились слухи"> <ЦЕЛЬ Тип="Передача_информации"/> <ЦЕЛЬ Тип="Изменение_эмоц_состония"/> <СРЕДСТВО Тип="Предположение"/>

<ТЕКСТ> Появились слухи. что после того, как Джон До возглавил WWW-

консорциум, он уволился из корпорации Microsoft, поскольку не мог совмещать одновременно две руководящих должности.

</ТЕКСТ> </ПРАГМА-БЛОК>

<ПРАГМА-БЛОК Имя="Доподлинно известно"> <ЦЕЛЬ Тип="Передача_информации"/> <ЦЕЛЬ Тип="Изменение_эмоц_состония"/> <СРЕДСТВО Тип="Утверждение"/>

<ТЕКСТ> Доподлинно известно, что он переехал из Вашингтона в Амстердам </ТЕКСТ> </ПРАГМА-БЛОК> </ПРАГМАТИЧЕСКАЯ_МОДЕЛЬ>

<СЕМАНТИЧЕСКАЯ_МОДЕЛЬ> <ВРЕМЕННАЯ_ШКАЛА> <ДЕЛЕНИЕ>

<СОБЫТИЕ Значение="До возглавил W3C"/> </ДЕЛЕНИЕ> <ДЕЛЕНИЕ>

<СОБЫТИЕ Значение="До уволился из Microsoft"/> </ДЕЛЕНИЕ> </ВРЕМЕННАЯ_ШКАЛА>

<ОБЪЕКТ Имя="Джон До">

< НАЧАЛЬНОЕ_СОСТОЯ НИЕ >

<СВОЙСТВО ию="Месго_жительства_до_переезда">

< ИМЯ > Место жительства </ИМЯ> <ЗНАЧЕНИЕ>Вашингтон</ЗНАЧЕНИЕ> </СВОЙСТВО>

<ОТНОШЕНИЕ Имя="Работа в Microsoft" ию="Работа в Microsoft"> < РОЛЬ >Служащий </РОЛ Ь > < РОЛ Ь > Руководитель </РОЛ Ь > <УЧАСТНИК Объект="корпорация Microsoft"/> </ОТНОШЕНИЕ> </НАЧАЛЬНОЕ_СОСТОЯНИЕ>

<ПЕРЕХОД Характер="Появление" ию="До начал работу в W3C"> <ВРЕМЯ>

<В_МОМЕНТ Измерение="Событие" Значение="До возглавил W3C"/> </ВРЕМЯ>

<ОТНОШЕНИЕ Имя ="Работа в W3C" иЮ="Работа в W3C">

<РОЛЬ>Руководитель</РОЛЬ> <УЧАСТНИК Объект='^3С"/> </ОТНОШЕНИЕ> </ПЕРЕХОД>

<СОСТОЯНИЕ ию="Одновременное руководство">

<ДОПУСТИМОСТЬ Значение="Отрицательно"

ию="Запрет на совмещение"/> <СВОЙСТВО Ссылка="Месго_жительства_до_переезда"/>

<ОТНОШЕНИЕ Имя="Работа в W3C" Ссылка="Работа в W3C"/> <ОТНОШЕНИЕ Имя="Работа в Microsoft" Ссылка="Работа в Microsoft"/> </СОСТОЯНИЕ>

<ПЕРЕХОД Характер="Прекращение" ию="До уволился из Microsoft"> <ВРЕМЯ>

<В_МОМЕНТ Измерение="Событие" Значение="До уволился из Microsoft"/> </ВРЕМЯ> <УСЛОВИЕ>

<ССЫЛКА ию="Запрет на совмещение"/>

</УСЛОВИЕ> <ПРИЧИНА>

<ССЫЛКА иЮ="Работа в W3C"/> </ПРИЧИНА>

<ОТНОШЕНИЕ Имя="Работа в Microsoft" ию="Увольнение из Microsoft"> <РОЛЬ>Служащий</РОЛЬ> <РОЛЬ>Руководитель</РОЛЬ>

<УЧАСТНИК Объект="корпорация Microsoft"/> </ОТНОШЕНИЕ> </ПЕРЕХОД>

<ПЕРЕХОД Характер="Изменение" УЮ="До сменил место жительства"> <ВРЕМЯ>

<ПОСЛЕ Измерение="Событие" Значение="До уволился из Microsoft"/> </ВРЕМЯ>

< ПРИЧИНА>

<ССЫЛКА UID="Pa6oTa в W3C"/> </ ПРИЧИНА>

<СВОЙСТВО UID="Месro_жительства_после_переезда">

<ИМЯ>Место жительства </ИМЯ> <ЗНАЧЕНИЕ> Амстердам </ЗНАЧЕНИЕ> </СВОЙСТВО> </ПЕРЕХОД>

< КОНЕЧНОЕ_СОСТОЯ НИЕ > <СВОЙСТВО Ссылка="Место_жительства <ОТНОШЕНИЕ Имя="Работа в W3C" Ссылка

</КОНЕЧНОЕ_СОСТОЯ НИЕ > </ОБЪЕКТ>

<ОБЪЕКТ Имя="корпорация Microsoft ">

< НАЧАЛЬНОЕ_СОСТОЯ НИЕ >

<ОТНОШЕНИЕ Имя="Работа в Microsoft" UID="Microsoft/Pa6oTa">

<РОЛЬ>Работодатель</РОЛЬ> <УЧАСТНИК Объект="Джон До"/> </ОТНОШЕНИЕ> </НАЧАЛЬНОЕ_СОСТОЯНИЕ>

< ПЕРЕХОД Характер="Прекращение" UID="Microsoft рассталась с До">

<ВРЕМЯ>

<В_МОМЕНТ Измерение="Событие" Значение="До уволился из Microsoft"/> </ВРЕМЯ> <УСЛОВИЕ> <ССЫЛКА UID="3anpeT на совмещение"/>

</УСЛОВИЕ>

< ПРИЧИНА>

<ССЫЛКА UID="Работа в W3C"/> </ПРИЧИНА>

<ОТНОШЕНИЕ Имя="Работа в Microsoft" Ссылка="Microsoft/Работа"/> </ПЕРЕХОД>

< КОНЕЧНОЕ_СОСТОЯ НИЕ/> </ОБЪЕКТ>

<ОБЪЕКТ Имя='^3С>

< НАЧАЛЬНОЕ_СОСТОЯ НИЕ/>

<ПЕРЕХОД Характер="Появление" UID="W3C возглавлен Джоном До"> <ВРЕМЯ>

<В_МОМЕНТ Измерение="Событие" Значение="До возглавил W3C"/> </ВРЕМЯ>

<ОТНОШЕНИЕ Имя ="Работа в W3C" UID="W3C/Работа с До">

< РОЛЬ > Работодатель </ РОЛ Ь ><УЧАСТНИК Объект="Джон До"/> </ОТНОШЕНИЕ>

_после_переезда"/> ="Работа в W3C"/>

</ПЕРЕХОД>

< КОНЕЧНОЕ_СОСТОЯ НИЕ >

<ОТНОШЕНИЕ Имя ="Работа в W3C" Ссылка ^^^Работа с До"/> </ КОНЕЧНОЕ_СОСТОЯ НИЕ > </ОБЪЕКТ> </СЕМАНТИЧЕСКАЯ_МОДЕЛЬ> </МЕТА-ДОКУМЕНТ>

Моделируя данное сообщение, мы рассуждали следующим образом:

1) Сформировали временную шкалу. В данном случае мы выделили два ключевых момента: "Джон До возглавляет W3C" и "Джон До увольняется из Microsoft".

2) Определили множество объектов, составляющих семантическую модель документа: Джон До, корпорация Microsoft и W3C (WWW-консорциум).

3) Для каждого объекта сформировали кортеж их переходов и состояний. Все состояния и переходы в данной модели - реальные.

• Описание движения объекта "Джон До" составляют три перехода, начальное, конечное и одно промежуточное состояние:

- начальное состояние описывает исходное место жительства (Вашингтон) и исходное место работы (Microsoft) Джона До;

- первый переход описывает появление отношения "работа в W3C";

- промежуточное состояние ("Одновременное руководство") подводит итог первого перехода - показывает наличие одновременно двух отношений "Работа в W3C" и "Работа в Microsoft", а так же указывает (с помощью элемента <ДОПУСТИМОСТЬ>) на нежелательность такого положения; это состояние введено в модель потому, что оно является условием второго перехода (прекращения работы в Microsoft).

- второй переход описывает прекращение отношения "работа в Microsoft"; условием этого перехода является нежелательность состояния "Одновременное руководство", причиной - появление в первом переходе отношения "Работа в W3C", следствие перехода не описывается.

- третий переход описывает смену места жительства Джона До; его причиной, так же, как и причиной второго перехода, является появление в первом переходе отношения "Работа в W3C";

- конечное состояние подводит итог всех изменений, произошедших с Джоном До, описывая наличие отношения "работа в W3C" и новое место жительства Джона До - Амстердам.

• В описании объекта "корпорация Microsoft" - присутствует начальное состояние и один переход. Начальное состояние указывает на то, что до начала моделируемого явления, Microsoft, в качестве работодателя, состояла с Джоном До в отношении "Работа в Microsoft". А переход описывает прекращение этого отношения (условием прекращения явилось нежелательность состояния "Одновременное руководство", а причиной - появления отношения "Работа в W3C" между Джоном До и W3C).

• Описания движения объекта '^3С" составляет один переход, описывающий появление отношения "Работа в W3C" между Джоном До и W3C, а так же конченое состояние, которое подчеркивает, что появление этого отношения явилось окончательным результатом изменений объекта W3C. 4) Сформировали прагматическую модель (ее составили два прагматических блока).

5. Использование семантико-прагматической модели документа

Таким образом, мы получили модель, которая позволяет описывать на формальном языке (XML) аналитическую информацию о смысловом содержимом документа. Поскольку указанная информация представляется в формальном виде, то появляется возможность достаточно быстро создавать различные алгоритмы ее анализа. А поскольку модель использует для записи аналитической информации общепринятую нотацию (язык XML), имеется возможность использования стандартных программных инструментов (XML-анализаторов), которые значительно облегчают и ускоряют создание этих алгоритмов анализа.

В частности, в рамках данного исследования разработаны несколько типовых алгоритмов:

- Анализ отношений объекта. На практике, данный анализ проводится в тех случаях, когда нужно охарактеризовать некоторый объект с точки зрения отношений, в которых он состоит (какие типы отношений наиболее характерны для этого объекта, какие он играет в них роли).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- Анализ окружения объекта. Этот анализ дает возможность узнать - с кем общался (состоял в отношениях, в отношении кого совершал действия) интересующий объект.

- Анализ истории изменений объекта. Этот анализ дает возможность проследить ретроспективу реальных изменений, произошедших с интересующим объектом за определенный период.

Возникает, правда, иная проблема - проблема формирования такой модели (получить ее из текста на естественном языке на данный момент не представляется возможным). Возможен вариант решения с использованием синтезатора текстов: эксперт формирует эталонную модель для класса однотипных документов, которая затем объединяется с формой (шаблоном) данного класса документов. Во время заполнения оператором формы, синтезатор текста (который собственно и обеспечивает заполнение шаблона) автоматически, на базе эталонной модели, создает модель конкретного документа.

Литература

1. Extensible Mark-up Language (XML) 1.0. (Second Edition) //

W3C Recommendation 6-October-2000. http://www.w3.org/TR/REC-xml

2. Resource Description Framework (RDF) Model and Syntax Specification //

W3C Recommendation 22-February-1999. http://www.w3.org/TR/REC-rdf-syntax

3. Annotated DAML+OIL Ontology Markup // W3C Note 18 December 2001 http://www.w3.org/TR/daml+oil-walkthru

4. Остин Дж. Слово как действие. // Новое в зарубежной лингвистике: Вып. 17, М.: Прогресс, 1986

i Надоели баннеры? Вы всегда можете отключить рекламу.