Научная статья на тему 'Теория отношений как инструмент семантического анализа данных и знаний'

Теория отношений как инструмент семантического анализа данных и знаний Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
280
110
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕОРИЯ ОТНОШЕНИЙ / ИСЧИСЛЕНИЯ ПРЕДИКАТОВ / СЕМАНТИЧЕСКИЙ АНАЛИЗ / КОЛЛИЗИЯ / АБДУКТИВНОЕ ЗАКЛЮЧЕНИЕ / МОДИФИЦИРУЕМОЕ РАССУЖДЕНИЕ / THEORY OF RELATIONS / PREDICATE CALCULUS / SEMANTIC ANALYSIS / COLLISION / ABDUCTIVE CONCLUSION / MODIFIABLE REASONING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кулик Борис Александрович, Курбанов Вугар Гариб Оглы, Фридман Александр Яковлевич

Одной из задач семантики является разработка языка семантического анализа. В качестве такого языка часто применяют язык исчисления предикатов. Его основное преимущество в том, что он обладает широкими аналитическими возможностями. Однако использовать его для анализа конкретных приложений не всегда возможно, поэтому приходится применять некоторые его подмножества. Кроме того, использование языка исчисления предикатов вызывает определенные трудности при анализе модифицируемых рассуждений, видимо, такие трудности привели к тому, что в качестве инструмента для анализа гипотез и абдуктивных заключений часто применяются неклассические логики, интерпретация которых либо отсутствует, либо не соответствует задачамсем антического анализа данных и знаний. В основе многих методов и теорий семантического анализа информации часто используется понятие отношение. Однако имеющиеся в этом направлении теоретические разработки ограничиваются лишь достаточно развитымя зыкомтеории бинарных отношений, которые часто применяются в семантическом анализе (семантические сети, онтологии и т. д.), и языкомреляционной алгебры, аналитические возможности которого, с точки зрения логического анализа, весьма ограничены. В то же время многие объекты семантического анализа по своей структуре не укладываются в тесные рамки бинарных отношений. Кроме того, в математической логике противоречивость системы рассуждений (теории) определена лишь для случая, когда из посылок одновременно выводится некоторое следствие и его отрицание. Однако и в повседневных, и в неформализованных научных рассуждениях один из бесспорных критериев несостоятельности системы это вывод контрарных следствий (например, из посылок следует, что всемA присуще B и одновременно всемA не присуще B). Формально такие два суждения не являются отрицаниями друг друга. Чтобы устранить эти и другие несоответствия между формальной логикой и естественными рассуждениями, в систему логического анализа системпре дложено ввести понятие коллизия. Коллизии в основномпро являются в модифицируемых рассуждениях при вводе новых знаний (гипотез) как нарушение некоторых формально выраженных правил или ограничений, с помощью которых регулируется целостность или смысловое содержание системы. В статье с учетом коллизий предложен метод анализа модифицируемых рассуждений на структурах алгебры кортежей, с помощью которого появляется возможность использовать в семантических исследованиях универсальные методы анализа модифицируемых рассуждений, не нарушая при этом законов классической логики. Библиогр. 12 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кулик Борис Александрович, Курбанов Вугар Гариб Оглы, Фридман Александр Яковлевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Theory of relations as instrument of semantic analysis of data and knowledge

One of the semantics objects is developing semantic analysis language. Predicate calculus language is often used as this kind of language. Its principal advantage is in its wide range of analytical potential. However, it is not always possible to utilize this language for analysing particular applications; therefore we need to implement some subsets of this language. Furthermore, usage of predicate calculus language provokes certain difficulties when analysing modifiable reasoning. These complications are likely to have led to the situation when non-classical logic, whose interpretation either doesn't exist or doesn't correspond to the tasks of semantic analysis of data and knowledge and is used as an instrument for hypothesis and abductive conclusion analysis. The concept of 'relationship' is frequently used in the basis of many methods and theories of semantic analysis of data. However, present theoretic approaches are just limited to a fairly developed language of theory of binary relations which are used in semantic analysis (semantic nets, ontologies, etc), and a language of relational algebra whose analytic capacity is rather restricted from the point of logical analysis. At the same time, man objects of semantic analysis by their structure do not meet narrow limits of binary relations. Moreover, in the field of mathematical logic the discrepancy of reasoning (theory) system is defined only for the case when some consequence and its negation are simultaneously concluded from some premises. However, both in everyday and non-formalized scientific reasoning one of the indisputable criteria of system inconsistency is derivation of contrary consequences (e. g. it is concluded from premises, that "all a own B" and simultaneously "all A do not own B"). Formally both statements are not negative relative to each other. to eliminate this and other discrepancies between formal logic and natural reasoning it is suggested to introduce the concept of 'collision' to the system of logical analysis. Collisions become apparent generally in modifiable reasoning in introducing new knowledge (hypothesis) as violations of some formally expressed rules or restrictions, which help regulate integrity or semantic content of the system. The method of modifiable reasoning analysis with provision for collisions on structures of N-tuple algebra is brought forward in the paper. This method allows to use universal techniques of modifiable reasoning analysis in semantic studies without violation of classical logic rules.

Текст научной работы на тему «Теория отношений как инструмент семантического анализа данных и знаний»

Сер. 10. 2010. Вып. 4

ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

ИНФОРМАТИКА

УДК 510.66

Б. А. Кулик, В. Г. Курбанов, А. Я. Фридман

ТЕОРИЯ ОТНОШЕНИЙ КАК ИНСТРУМЕНТ СЕМАНТИЧЕСКОГО АНАЛИЗА ДАННЫХ И ЗНАНИЙ*)

1. Введение. В литературе по искусственному интеллекту и логике существует несколько вариантов понимания семантики. К ним, в частности, относятся:

1) понимание семантики как законов, в соответствии с которыми логическим формулам и выражениям приписываются некоторые значения истинности [1, 2];

2) семантическая интерпретация представляет собой процесс связывания с некоторым словосочетанием некоторого выражения логики первого порядка [2];

3) семантика - это построение соответствий между знакосочетаниями, образующими осмысленные тексты, и их интерпретацией, выраженной в виде совокупностей отношений [3].

Иногда эти подходы объединяются, например, в [2]. Для практических целей второй и третий варианты более предпочтительны.

Одной из задач семантики является разработка языка семантического анализа. В качестве такого языка часто применяют язык исчисления предикатов. Основное его преимущество в том, что он обладает широкими аналитическими возможностями. Однако использовать этот язык для анализа конкретных приложений не всегда возможно, потому приходится применять некоторые его подмножества. Например, при семантическом анализе в качестве инструмента служат семантические графы [2], т. е. бинарные отношения, а это означает, что анализ ограничивается лишь структурами, выраженными как одноместные и двуместные предикаты.

Кулик Борис Александрович — доктор физико-математических наук, старший научный сотрудник, ведущий научный сотрудник лаборатории методов и средств автоматизации Института проблем машиноведения РАН. Количество опубликованных работ: 70. Научные направления: методы логического анализа систем, искусственный интеллект, логико-вероятностные методы. E-mail: [email protected].

Курбанов Вугар Гариб оглы — кандидат физико-математических наук, старший научный сотрудник лаборатории методов и средств автоматизации Института проблем машиноведения РАН. Количество опубликованных работ: 45. Научные направления: математическое моделирование процессов управления, методы логического анализа систем, логико-вероятностные методы. E-mail: [email protected].

Фридман Александр Яковлевич — доктор технических наук, профессор, заведующий лабораторией информационных технологий управления промышленно-природными комплексами Института информатики и математического моделирования (ИИММ) Кольского научного центра РАН. Количество опубликованных работ: 120. Научные направления: системный анализ, концептуальные модели, семантический анализ, искусственный интеллект. E-mail: [email protected].

*) Работа выполнена при финансовой поддержке Президиума РАН (проект 4.3 Программы № 3).

© Б. А. Кулик, В. Г. Курбанов, А. Я. Фридман, 2010

Кроме того, применение языка исчисления предикатов вызывает определенные трудности при анализе модифицируемых рассуждений. Видимо, данные трудности привели к тому, что как инструмент для анализа гипотез и абдуктивных заключений часто используются неклассические логики [4], интерпретация которых либо отсутствует, либо не соответствует задачам семантического анализа данных и знаний.

Многие методы и теории семантического анализа информации часто основываются на понятии «отношение». Семантические сети и графы - это по сути совокупности бинарных отношений. Многие предложения естественного языка при концептуализации преобразуются в элементы определенных отношений. Интерпретацией логических выражений и формул также являются отношения. Отсюда кажется вполне закономерным вопрос: почему бы в качестве инструмента для семантического анализа не использовать теорию отношений?

Однако имеющиеся в этом направлении теоретические разработки ограничиваются лишь достаточно развитым языком теории бинарных отношений, которые часто применяются в семантическом анализе (семантические сети, онтологии и т. д.) и языком реляционной алгебры, аналитические возможности которого, с точки зрения логического анализа, весьма ограничены. В то же время многие объекты семантического анализа по своей структуре не укладываются в тесные рамки бинарных отношений.

Чтобы язык теории отношений сделать более приспособленным к задачам семантического анализа, предлагается в качестве его математической основы выбрать алгебру кортежей (АК)[5, 6].

2. Основные термины и структуры алгебры кортежей. Описание АК имеется в ряде публикаций. Начальные сведения по АК можно найти в Интернете [7]. Здесь приводится неформальное введение в АК, необходимое для понимания дальнейшего.

Все четыре структуры АК (они определены ниже) содержат в качестве элементов элементарные кортежи, которые состоят из последовательностей элементов, заданных в определенной схеме отношения. Например, если задан элементарный кортеж

Т[ХУЯ\ = (а, Ъ,с),

то подразумевается, что Т - имя элементарного кортежа (а,Ъ,с),Х,У^ - имена атрибутов, \ХУ%\ - схема отношения (т. е. пространство атрибутов), а € Х,Ъ € У и с € Z . Множество всех значений атрибута называется доменом; множество атрибутов, имеющих разные имена, но относящихся к одному и тому же домену, - сортом. Структуры, заданные в одной и той же схеме отношения, называются однотипными.

Множество однотипных элементарных кортежей можно представить как обычную таблицу отношения. Помимо элементарного кортежа в АК определены еще 4 структуры (С-кортеж, С -система, Д-кортеж, Д-система), с помощью которых сжато представляются множества элементарных кортежей. Они называются АК-объектами и представлены в виде векторов или матриц, состоящих из компонент. Компоненты определены как произвольные подмножества соответствующих доменов атрибутов. Среди компонент особую роль играют две фиктивные компоненты:

1) * - полная компонента, т. е. множество, равное домену соответствующего (по месту ее расположения в кортеже) атрибута; используется в С-кортежах и С-системах;

2) 0 - пустое множество, применяется в Д-кортежах и Д-системах.

Свойства и аналитические возможности АК основаны на свойствах декартова (прямого) произведения множеств [8]. Рассмотрим остальные структуры АК.

С-кортеж - это ограниченный прямыми скобками кортеж компонент. Множество элементарных кортежей в С-кортеже вычисляется как декартово произведение

его компонент. После этого С -кортеж можно представить в виде обычной таблицы отношения. Например, если задан С-кортеж Rl[XYZ] = [{а, с} {с^1,/} {Ь}], то

Ri[XYZ] = [{a,c} {c, d, f} {b}] =

X Y Z

а с b

а d b

а f b

с с b

с d b

с f b

(1)

В равенстве (1) {а, с} С X, {с, ¿, /} С Y, {6} С Z, а все строки таблицы формируются как результат вычисления декартова произведения {а, с} х {с, ¿, /} х {6}.

Если задан С-кортеж R2[XYZ] = [{а, с}{с, ¿, /}*], то это означает, что третья компонента представлена множеством, равным домену атрибута Z. В частности, если Z = {а, Ь, с, ¿}, то [{а, с}{с, ¿, /}*] = [{а, с}{с, ¿, /}{а, Ь, с, ¿}].

С -система - это выраженное в виде матрицы и ограниченное прямыми скобками объединение однотипных С-кортежей и соответственно представленных ими объединение отношений. Например,

Q[XYZ]

{a, b, c} {c} {c, d}

{f} {g,h}

{e,f} {f,h} {d,f,g} {g}

X Y Z X Y Z

a f 9 X Y Z с d 9

a f h с е f с f 9

b f 9 U с е h и с 9 9

b f h с f f d d 9

с f 9 с / h d f 9

с f h d 9 9

Рассмотрим еще две структуры АК (Д-кортежи и Д-системы), которые используются в расчетах и, кроме того, позволяют установить соответствия между структурами АК и формулами исчисления предикатов.

Д-кортеж - по сути сокращенное отображение диагональной С -системы. Диагональная С-система - это С-система размерности п х п, у которой все недиагональные компоненты - фиктивные. В частности, в равенстве

A * *

* B *

* * C

--]ABC [

в левой части изображена диагональная C-система, а в правой - эквивалентный ей D-кортеж. D-кортежи и D-системы ограничиваются перевернутыми прямыми скобками.

С помощью D-кортежей удобно вычислять дополнения C-кортежей. Так, дополнением C -кортежа [ABC] является D-кортеж ]AB С[, где Ai, В ,C - дополнения множеств A, B, C относительно доменов соответствующих атрибутов.

D-система - это записанная в виде матрицы совокупность однотипных D-кортежей. Она интерпретируется как пересечение содержащихся в ней D-кортежей и для отличия от C-систем ограничивается перевернутыми прямыми скобками.

С помощью В-систем легко вычисляется дополнение С-систем. Например, дополне-

нием С -системы

А В

* Е

С

является В-система

А В

0 Е

С однотипными АК-объектами можно выполнять любые операции алгебры множеств. Алгоритмы этих операций и проверок включения одного АК-объекта в другой приведены в [5-7]. При этом нет необходимости преобразовывать их в множества элементарных кортежей - все операции выполняются с компонентами. Такое свойство позволяет существенно уменьшить трудоемкость вычислений, в том числе и за счет возможности эффективного распараллеливания операций на матрицеподобных структурах АК. Структурами алгебры множеств в АК являются: 1) все компоненты отдельных доменов; 2) все однотипные АК-объекты.

3. Операции с атрибутами. Для выполнения операций с АК-объектами, имеющими разные схемы отношений, требуются операции с атрибутами. К ним относятся:

1) переименование атрибутов;

2) перестановка атрибутов;

3) обращение отношений;

4) добавление фиктивного атрибута (+АЬт);

5) элиминация атрибута (-АЬт).

Рассмотрим их более подробно.

Переименование атрибутов применяется только для атрибутов одного сорта.

Перестановка атрибутов - операция, при выполнении которой в матрице АК-объекта одновременно меняются местами столбцы и соответствующие атрибуты в схеме отношения. По сути, это эквивалентное преобразование.

Обращение отношений. В случае бинарных отношений перестановка столбцов без перестановки атрибутов позволяет получить отношение, обратное исходному. Например,

если С[ХУ] =

{а} {а, Ь} {Ь, с} {а с}

то а-1\ху ] =

{а, Ь} {а, с}

{а}" {Ь,с}

Добавление фиктивного атрибута осуществляется в том случае, если добавляемый атрибут отсутствует в схеме отношения АК-объекта. Тогда в схему отношения добавляется имя нового атрибута, а в структуру добавляется на соответствующем месте новый столбец с фиктивными компонентами, при этом в С-кортежи и С-системы добавляются фиктивные компоненты «*», а в В-кортежи и В-системы - фиктивные компоненты «0».

При выполнении данной операции содержательный смысл отношения не изменяется. Это свойственно ситуации в исчислении предикатов, когда квантор Ух применяется к формуле А, в которой отсутствует переменная х [9, с. 54]. Например, если задан АК-объект Р[У%], которому соответствует формула Е(у, г) исчисления предикатов, то, добавив в Р[У£] фиктивный атрибут X, получим АК-объект +Х(Р[УZ]), который отвечает формуле УхЕ(у, г). Эта формула по смыслу соответствует Е(у, г). Такое обстоятельство позволяет отнести операцию добавления фиктивного атрибута к семантически равносильным преобразованиям.

При элиминации атрибута из АК-объекта удаляется столбец, а из его схемы отношения - соответствующий атрибут. В отличие от предыдущей, логический смысл данной операции зависит от того, к какому классу АК-объектов она применяется. Доказано, что элиминация атрибута Х из С-кортежей и С-систем отвечает навешиванию квантора Эх в соответствующую логическую формулу, а элиминация того же атрибута

из Д-кортежей и Д-систем - навешиванию квантора Ух. Потому операции добавления и элиминации атрибутов в АК-объектах можно без потери смысла заменять операциями приписывания соответствующих кванторов. При этом переменной х под квантором соответствует область значений атрибута X.

Например, пусть заданы С -система и ее дополнение, выраженное как Д-система:

Q[XYZ]

Тогда

{а,Ъ,3} {¡,Н} {Ъ}' {ь, с} * {а с}

и Q[XYZ]

{с} {д}

{а, 3} 0

Зx(Q[XYZ]) = -X (Q[XYZ])

а, м {ь} ■

* {а, с}

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

{а, с} {Ъ}

Уx(Q[XYZ]) = -X (Q[XYZ]) =

{д} {а,с} 0 {Ъ}

4. Операции соединения и композиции. Операции «+А£г» и «-АЬт» применяются, в частности, при вычислении соединения и композиции двух разнотипных отношений, заданных АК-объектами. Пусть заданы две структуры Rl[У] и R2[W], при этом У и Ш являются множествами атрибутов и У = Ш, которые можно разложить на непересекающиеся подмножества X,Y, Z с помощью следующих преобразований: X = Ш \ У; Y = Ш П У; Z = У \ Ш. Тогда получим У = Y и Z и Ш = X и Y. С учетом этого данные отношения можно переписать так: Rl[YZ] и R2[XY].

Операция соединения R1\УZ ] ф R2[XY] отношений в реляционных системах обычно выполняется с помощью попарного сравнения всех элементарных кортежей из разных отношений. В АК операция соединения отношений существенно упрощается, и ее можно вычислить без попарного сравнения всех элементарных кортежей по формуле

R1[YZ] ф Н2^] =+X(НО П +Z(Н2) = Ух(н1) пУг(Н2).

Операция композиции Н1 [YZ] о Н2 [XY] отношений рассчитывается после вычисления соединения. В АК она определяется по формуле

Rl[YZ] о Н2[XY] = -У(^(Н1) П +Z(Н2)) = ^(Н1 ф Н2),

при условии, что (Rl ф R2) является С-кортежем или С -системой. С учетом того, что имеются алгоритмы преобразования Д-систем в С -системы, это условие не ограничивает вычисление композиции, хотя в некоторых случаях увеличивает трудоемкость операций.

Рассмотрим пример. Пусть заданы два АК-объекта с разными схемами отношений

Rl =

{а} {а, с} {Ъ,с} {3 е}

и R2[YZ] =

{а, 3} {а, Ъ} {3} {Ъ, с}

Тогда, добавляя фиктивный

атрибут Z в Rl и фиктивный атрибут X в R2, получаем

и

Rl Ф R2

{а} {а, с} {Ъ, с} {3 е}

{а, 3} {3}

{а, Ъ} {Ъ, с}

{а} {а} {а, Ъ} {Ъ, с} {3} {а, Ъ} {Ъ, с} {3} {Ъ, с}

П

я1 о е2 =

{а} {а, Ь} {Ь, с} {а Ь} {Ь,с} {Ь, с}

5. Соответствие между АК и исчислением предикатов. В исчислении предикатов С-кортежу в тривиальном случае (когда отдельные атрибуты не соотносятся с многоместными отношениями) отвечает конъюнкция одноместных предикатов с разными переменными.

Так, С-кортежу Р\ХУ2\ = [Р1Р2Р3] соответствует формула Р\ = Р\(х) Л Р2(у) Л Рз(г), ^-кортежу Q[XYZ\ =\QlQ2Qз[ - формула Р2 = Яг(х) V Q2(y) V д3(г).

Конъюнкция формул исчисления предикатов с несовпадающими совокупностями свободных переменных отвечает операции соединения соответствующих АК-объектов.

Элементарный кортеж, входящий в состав непустого АК-объекта, соответствует выполняющей подстановке логической формулы; АК-объект, оказавшийся при проверке пустым, - тождественно ложной формуле; непустой АК-объект - выполнимой формуле.

Доказательство того, что АК-объект равен декартовому произведению доменов атрибутов, входящих в схему его отношения, означает, что логическая формула, соответствующая этому АК-объекту, общезначима.

Домены атрибутов в АК могут быть любыми не обязательно равными друг другу множествами. Это означает, что структуры АК соответствуют формулам многосортного исчисления предикатов.

Методы квантификации в АК приведены в описании операций с атрибутами.

6. Обобщенные операции и логический вывод. В АК можно непосредственно выполнять операции алгебры множеств с АК-объектами, только если они однотипны (т. е. имеют одну и ту же схему отношения). Если же у АК-объектов разные схемы отношения, то для выполнения операций с ними и проверок включения их необходимо привести к одной схеме отношения с помощью добавления недостающих фиктивных атрибутов. По сути, это означает равносильное преобразование.

Назовем операции алгебры множеств с АК-объектами с предварительным добавлением недостающих фиктивных атрибутов обобщенными операциями и отношениями алгебры множеств в АК и обозначим их соответственно П^, и^, \о, Сс, =а и т. д. Первые две операции полностью соответствуют логическим операциям Л и V. Отношение Сс в АК соответствует отношению выводимости в исчислении предикатов. Это обстоятельство позволяет использовать принципиально новый подход к построению процедур логического вывода и проверок выводимости.

В математической логике выводом в теории Т называется всякая последовательность А\, ...,Ап формул такая, что для любого г формула А^ есть либо аксиома теории Т, либо непосредственное следствие каких-либо предыдущих формул по одному из правил вывода [9]. В логике и системах искусственного интеллекта широко применяются следующие системы логического вывода:

1) на основе правил вывода исчисления предикатов ([9] и др.);

2) натуральный вывод [10] - система вывода с расширенным по сравнению с предыдущим набором правил;

3) вывод на основе принципа резолюции [11];

4) на основе специфических правил вывода, предусмотренных в конкретной системе знаний [2, 4]; эти правила предусматривают формирование новых отношений

с помощью соединения или композиции исходных отношений, в силу чего их можно назвать семантическими правилами.

В АК при использовании обобщенных операций и соотношений предусматривается новая система логического вывода. Предположим, что задана система аксиом А\,..., Ап, которые отображены как АК-объекты. Тогда возможно решение следующих задач.

1. Задача проверки правильности следствия. Если задано предполагаемое следствие В, то процедура доказательства производится как проверка правильности обобщенного включения, заданного в виде соотношения

(А1 По ... По Ап) Со В. (2)

2. Задача вывода произвольных следствий. Для ее решения сначала вычисляется АК-объект А = А1 По ... По Ап, после чего производится выбор таких В^, для которых соблюдается А Со В^. При этом можно не только применять известные правила вывода. Авторами разработаны алгоритмы, позволяющие при известном А уменьшить неопределенность при подборе следствий В^.

Соответствие соотношения (2) процедуре логического вывода доказано. Кроме того, для его подтверждения была произведена проверка всех известных в классической логике правил логического вывода. Оказалось, что для всех правил вывода это соотношение выполняется. Исключением является формулировка правила обобщения, приводимая в некоторых монографиях по математической логике. Например, в [9, с. 66] данное правило формулируется так: «правило обобщения (или связывания квантором всеобщности): из А следует Ух1А».

Элементарная проверка показывает, что в случае, когда Х1 является свободной переменной в формуле А, то соотношение (2) выполняется лишь в исключительных случаях. При внимательном прочтении текста в [9] можно лишь предположить, что в формулировке правила обобщения подразумевается случай, когда в формуле А переменная х1 не является свободной . Однако явного указания на такое обстоятельство применительно к правилу обобщения в тексте нет.

На сомнительность правила обобщения в приведенной формулировке обратили внимание некоторые логики. В частности, в системе натурального вывода, разработанного Г. Генценом (см. [10]), данное правило применяется лишь для случая, когда в формуле А отсутствует переменная Х1. Это соответствует операции добавления фиктивных атрибутов в АК - они могут добавляться лишь в случае, когда их нет в схеме отношения соответствующего АК-объекта.

Предложенный подход к решению задач логического вывода позволяет по-новому осмыслить суть логического следования в классической логике. Известно, что справедливость отношения А С В означает, что В является необходимым условием или свойством А. Из соотношения (2) ясно, что логическое следствие корректно не только потому, что получено на основе правил вывода, смысл которых не всегда понятен, но и потому, что является необходимым условием существования антецедента.

7. Семантический анализ с точки зрения теории отношений. Знакомство с многими источниками, в которых рассматривается семантический анализ, показывает, что речь идет о выполнении следующих процедур:

*) На это указывает приведенная на той же странице аксиома (4): Ух1А(х1) Э А(х1). Если предположить, что в правиле обобщения переменная Х1 в А свободная, то получается, что правило обобщения в данном случае оказывается утверждением, обратным аксиоме (4), а это является логической ошибкой.

1) отбор основополагающих понятий данной предметной области; предварительная классификация отобранных понятий;

2) дальнейшая систематизация, установление иерархических связей между некоторыми понятиями;

3) выявление отношений между понятиями в рамках некоторого заранее заданного списка значимых отношений (типа часть - целое, принадлежать к совокупности, быть синонимом, иметь сходство и т.п.); здесь же можно использовать и более конкретные, специфичные для данной предметной области отношения;

4) формализация информации с помощью установленных отношений в виде семантических графов, семантических сетей и предикатов.

Стоит отметить, что графы и сети - это бинарные отношения, а предикаты можно рассматривать как своеобразное представление отношений: если отношение Я задано набором элементарных кортежей, то предикат - это функция на множество {0,1}, в которой каждому из кортежей в Я приписывается значение 1, а всем остальным кортежам универсума - значение 0. Отсюда ясно, что этап формализации информации при семантическом анализе можно выполнить единообразно на основе АК.

8. Анализ модифицируемых рассуждений. В математической логике противоречивость системы рассуждений (теории) определена лишь для случая, когда из посылок одновременно выводятся некоторое следствие и его отрицание. В то же время и в повседневных, и в неформализованных научных рассуждениях один из бесспорных критериев несостоятельности системы - это вывод контрарных следствий (например, из посылок следует, что «всем А присуще В» и в то же время - «всем А не присуще В»). Формально данные суждения не отрицают друг друга. Отрицанием формулы Ух(А(х) Э В(х)) в исчислении предикатов является формула Зх(А(х) А—В(х)) - «некоторым А не присуще В», но не формула Ух(А(х) Э —В(х)), которая соответствует суждению «всем А не присуще В». Чтобы устранить это и другие несоответствия между формальной логикой и естественными рассуждениями, в систему логического анализа систем предложено ввести понятие «коллизия» [7]. Коллизии в основном проявляются в модифицируемых рассуждениях при вводе новых знаний (гипотез) как нарушение некоторых формально выраженных правил или ограничений, с помощью которых регулируется целостность или смысловое содержание системы. В системах пересматриваемой аргументации коллизиям в какой-то степени соответствуют такие ситуации как «опровержение», «подрыв аргумента», «атака» и т. д. [4].

С учетом коллизий можно сформулировать методы анализа модифицируемых рассуждений на структурах АК. Пусть А1,...,А„ - совокупность аксиом или посылок и А = А1 Пс ... Пс А„. Рассмотрим структуру гипотез.

Формула Н является гипотезой, если неверно, что А С с Н .В противном случае в соответствии с (2) Н является следствием. Отсюда ясно, что Н в первом приближении можно считать гипотезой, если А\сН = 0.

Во втором приближении устанавливается корректность гипотезы. Гипотеза корректна, если объект НПс А не содержит коллизий (предполагается, что гипотеза играет роль аксиомы). Формулировка и проверка гипотез обычно применяются в совокупности с другими методами анализа рассуждений. Здесь мы рассмотрим использование гипотез при поиске и анализе абдуктивных заключений.

Абдукция - это процесс формирования объясняющей гипотезы, когда известны посылки и предполагаемое следствие, которое при формальной проверке не является следствием посылок, но, тем не менее, подтверждается фактами или обоснованными аргументами. Прототипом абдукции является задача диагностики.

Пусть Б - предполагаемое следствие из посылок А1, ...,Ап, при этом оказывается, что неверно А Б. Тогда формула Н по сути допустимое абдуктивное заключение, если соблюдаются следующие условия: 1) Н корректная гипотеза (т. е. Н П^ А не содержит коллизий) и 2) (Н П^ А) Б (т. е. при добавлении Н в систему посылок предполагаемое следствие Б становится выводимым). Отсюда можно вывести алгоритм поиска абдуктивных заключений:

1) вычисляем «остаток» К = А\аБ;

2) подбираем промежуточный объект К. такой, чтобы соблюдалось К К.;

3) вычисляем Щ = К^

4) рассчитываем Н..П^ А и выполняем проверку на наличие коллизий; если коллизии обнаружены, то возвращаемся к шагу 2, иначе конец алгоритма.

Нами был разработан алгоритм поиска вариантов К. для случая, когда известно К. Ниже этот алгоритм будет приведен вместе с примером из статьи [12], в которой в качестве метода анализа модифицируемых рассуждений выбрана логика высказываний. Предложенный авторами этой статьи алгоритм поиска относительно сложен. С помощью АК его можно существенно упростить.

Рассмотрим пример [12]. Базу знаний, выраженную в виде импликаций, можно представить как множество дизъюнктов, входящих в определенную конъюнктивную нормальную форму (КНФ):

(х2 Vxз У-1Хб)Л(х5 V—х7)Л(—Х14x2 Ухз V Х5) Л(—Х5 Ухд Ух1о)Л(—Х4 У—Хд)л(—Х4 V—хю). Данную КНФ можно представить как В-систему

0 {1} {1} 0 0 {0} 0 0 0 0

0 0 0 0 {1} 0 {0} 0 0 0

{0} {1} {1} 0 {1} 0 0 0 0 0

0 0 0 0 {0} 0 0 {1} {1} {1}

0 0 0 {0} 0 0 0 0 {0} 0

0 0 0 {0} 0 0 0 0 0 {0}

Л[Х1Х2Х3Х4ХбХ6Х7Х8ХдХ10] —

Заключение в данном примере выражено в виде формулы (х1 ЛХ4 ЛХ7) Э хд, которую можно преобразовать в дизъюнкцию —Х1 V —Х4 V —Х7 V хд ив В-кортеж

БХАХгХд] =]{0} {0} {0} {1}[.

Теперь можно использовать приведенный выше алгоритм поиска абдуктивных заключений. Все расчеты были выполнены с помощью разработанной авторами программы. После вычисления по формуле К = А\аБ и соответствующих преобразований была получена С-система:

К

Х1 Х2 Хз Х4 Х5 Хб Х7 Х8 Хд Х1о

{1} {1} * {1} {1} * {1} {1} {0} {0}

{1} {0} {1} {1} {1} * {1} {1} {0} {0}

{1} {0} {0} {1} {1} {0} {1} {1} {0} {0}

(3)

В верхней строке (3) для облегчения анализа полученной структуры записаны соответствующие атрибуты. Рассмотрим, как можно применить эту структуру для поиска вариантов К. и соответственно абдуктивного заключения Н. (шаги 2 и 3 алгоритма).

При поиске вариантов абдуктивного заключения обычно исходят из следующих предпосылок: 1) в абдуктивном заключении желательно использовать небольшое число

переменных; 2) состав переменных нередко определяется исходя из смыслового анализа конкретной системы рассуждений.

Здесь рассмотрим формальную задачу выбора переменных и формул для представления абдуктивного заключения Н^ на основе вычисленного «остатка» Я, для которого необходимо выполнение соотношения К Сс Н^. Когда Я — С-система (если это не так, то можно использовать алгоритмы преобразования Д-кортежей или ^-систем в С -системы), то сокращение числа переменных в Н^ можно осуществить с помощью элиминации атрибутов. При этом ясно, что при таком преобразовании соотношение Я С.с Нг будет выполняться. Например, в С-системе Я можно элиминировать все атрибуты кроме Хд, тогда получим С -систему Д^Хд] = [{0}\, которая соответствует логической формуле —хд . Отсюда Н = хд.

Рассмотрим теперь формальные (т. е. без учета коллизий и смысловых ограничений) правила выбора атрибутов (переменных), которые могут быть применены в Hi. Если, допустим, элиминировать из Я почти все атрибуты кроме Х2, то останется проекция, в которой содержатся все возможные значения этого атрибута. Аналогичная ситуация возникнет для проекции [Х2Хз\. Это означает, что выбор соответствующих переменных для абдуктивного заключения приведет к пустоте Щ, а соответствующая ему логическая формула будет тождественно ложной. Потому при выборе переменных для Н должно соблюдаться следующее правило: проекция по выбранным переменным в Я не должна содержать полный набор всех возможных значений атрибутов.

С учетом данного правила сформируем набор неполных проекций в Я. В приведенном примере такими проекциями являются: [Хх\, [Х4\, [Хб\, [Х7\, [Хэ\, [Хд\, [Хю\, [Х2ХзХб\. Выбранные проекции позволяют легко формировать АК-объекты и соответственно логические формулы, удовлетворяющие условию Я Сс Н^. Многообразие вариантов формирования Н3 может быть выражено такими правилами:

1) оставить в качестве Нг одну из неполных проекций;

2) выбрать в качестве Нг любую проекцию при условии, что в ее состав входит, по крайней мере, одна неполная проекция;

3) для выбранного по предыдущим правилам АК-объекта построить покрывающий его неполный АК-объект.

Доказано, что эти правила охватывают все возможные случаи «наращивания» Я.

Рассмотрим примеры.

Пример 1. Выберем проекцию [ХхХд\. Она после сокращений будет равна С-кортежу Яг[Х\Хо\ = [{1} {0}]. Тогда можно сформировать следующие формулы для Нг : 1) х\ Л~'Хд (соответствует С-кортежу 2) {х\ Л->хд) V (-1Ж1 Лжд); 3) х\ V —'Жд (последние две формулы отвечают АК-объектам, которые покрывают С-кортеж Я^ и т. д.

Пример 2. Выберем в качестве Н3 проекцию \X2X3XQ]. Она является С-системой

{1} * *

{0} {1} * , равной Д-кортежу\{1}{1}{0}[, и соответствует формуле Х2VxзV—хб.

{0} {0} {0}]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Отрицанием этой формулы является формула —Х2 Л —хз Л Х6, которую можно использовать в качестве абдуктивного заключения.

Сформулированные выше алгоритм и правила формирования абдуктивных заключений применимы не только для АК-объектов, отображающих формулы исчисления высказываний, но и для общего случая, когда домены атрибутов имеют более двух значений. Ясно, что в конкретной системе знаний выбор переменных и их значений для абдуктивного заключения производится по критериям, связанным с содержанием

системы, и поэтому выбор возможных вариантов существенно ограничен. Разработанная система формальных правил выбора переменных позволяет более просто отсеивать ошибочные варианты.

9. Заключение. Предложенный подход к логико-семантическому анализу позволяет выразить в единых структурах данные и знания, в силу чего можно существенно сократить затраты на разработку программных средств для реализации сложных интеллектуальных систем.

В современных языках программирования, предназначенных для моделирования информационных систем, многие процедуры и модели (например, запросы, правила вывода, команды преобразования структур и т. д.) выражены декларативно, в силу чего алгоритмы реализации этих процедур не являются прозрачными. Данное обстоятельство не всегда позволяет находить эффективные алгоритмы в тех случаях, когда в системе применяются разнородные структуры или когда требуется оценить быстродействие алгоритмов. При использовании общей теории отношений и, в частности, АК многие декларативные команды можно выразить с помощью сравнительно простых процедур.

Структуры АК обладают естественным параллелизмом, что позволяет сравнительно легко реализовать интеллектуальные системы в вычислительных комплексах параллельной обработки данных.

Литература

1. Тейз А., Грибомон П., Юлен Г. и др. Логический подход к искусственному интеллекту: От модальной логики к логике баз данных / пер. с франц. П. П. Пермякова; под ред. Г. П. Гаврилова. М.: Мир, 1998. 494 с.

2. Рассел С., Норвиг П. Искусственный интеллект: современный подход. 2-е изд. / пер. с англ.; ред. К. А. Птицына. М.: Изд. дом «Вильямс», 2006. 1408 с.

3. Попов Э. В. Общение с ЭВМ на естественном языке. М.: Наука, Гл. ред. физ.-мат. лит-ры, 1982. 360 с.

4. Вагин В. Н., Головина Е. Ю., Загорянская А. А., Фомина М. В. Достоверный и правдоподобный вывод в интеллектуальных системах / под ред. В. Н. Вагина, Д. А. Поспелова. М.: Физматлит, 2004. 704 с.

5. Кулик Б. А. Система логического программирования на основе алгебры кортежей // Изв. РАН. Техн. кибернетика. 1993. № 3. С. 226-239.

6. Кулик Б. А. Вероятностная логика на основе алгебры кортежей // Изв. РАН. Теория и системы управления. 2007. № 1. С. 118-127.

7. Кулик Б. А. Курс лекций по логике и математике. URL: http//logic-cor.narod.ru/kurs.htm.

8. Бурбаки Н. Теория множеств / пер. с франц. М.: Мир, 1965. 455 с.

9. Мендельсон Э. Введение в математическую логику / пер. с англ. Ф. А. Кабакова; под ред. С. И. Адяна. М.: Наука, 1971. 320 с.

10. Гладкий А. В. Введение в современную логику. М.: МЦНМО, 2001. 200 с.

11. Чень Ч., Ли Р. Математическая логика и автоматическое доказательство теорем / пер. с англ. Г. В. Давыдова и др.; под ред. С. Ю. Маслова. М.: Наука, 1983. 358 с.

12. Страбыкин Д. А., Томчук М. Н. Метод логического вывода модифицируемых рассуждений // Изв. РАН. Теория и системы управления. 2008. № 2. С. 89-95.

Статья рекомендована к печати проф. И. Л. Братчиковым. Статья принята к печати 10 июня 2010 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.