Сер. 10. 2010. Вып. 4
ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
ИНФОРМАТИКА
УДК 510.66
Б. А. Кулик, В. Г. Курбанов, А. Я. Фридман
ТЕОРИЯ ОТНОШЕНИЙ КАК ИНСТРУМЕНТ СЕМАНТИЧЕСКОГО АНАЛИЗА ДАННЫХ И ЗНАНИЙ*)
1. Введение. В литературе по искусственному интеллекту и логике существует несколько вариантов понимания семантики. К ним, в частности, относятся:
1) понимание семантики как законов, в соответствии с которыми логическим формулам и выражениям приписываются некоторые значения истинности [1, 2];
2) семантическая интерпретация представляет собой процесс связывания с некоторым словосочетанием некоторого выражения логики первого порядка [2];
3) семантика - это построение соответствий между знакосочетаниями, образующими осмысленные тексты, и их интерпретацией, выраженной в виде совокупностей отношений [3].
Иногда эти подходы объединяются, например, в [2]. Для практических целей второй и третий варианты более предпочтительны.
Одной из задач семантики является разработка языка семантического анализа. В качестве такого языка часто применяют язык исчисления предикатов. Основное его преимущество в том, что он обладает широкими аналитическими возможностями. Однако использовать этот язык для анализа конкретных приложений не всегда возможно, потому приходится применять некоторые его подмножества. Например, при семантическом анализе в качестве инструмента служат семантические графы [2], т. е. бинарные отношения, а это означает, что анализ ограничивается лишь структурами, выраженными как одноместные и двуместные предикаты.
Кулик Борис Александрович — доктор физико-математических наук, старший научный сотрудник, ведущий научный сотрудник лаборатории методов и средств автоматизации Института проблем машиноведения РАН. Количество опубликованных работ: 70. Научные направления: методы логического анализа систем, искусственный интеллект, логико-вероятностные методы. E-mail: [email protected].
Курбанов Вугар Гариб оглы — кандидат физико-математических наук, старший научный сотрудник лаборатории методов и средств автоматизации Института проблем машиноведения РАН. Количество опубликованных работ: 45. Научные направления: математическое моделирование процессов управления, методы логического анализа систем, логико-вероятностные методы. E-mail: [email protected].
Фридман Александр Яковлевич — доктор технических наук, профессор, заведующий лабораторией информационных технологий управления промышленно-природными комплексами Института информатики и математического моделирования (ИИММ) Кольского научного центра РАН. Количество опубликованных работ: 120. Научные направления: системный анализ, концептуальные модели, семантический анализ, искусственный интеллект. E-mail: [email protected].
*) Работа выполнена при финансовой поддержке Президиума РАН (проект 4.3 Программы № 3).
© Б. А. Кулик, В. Г. Курбанов, А. Я. Фридман, 2010
Кроме того, применение языка исчисления предикатов вызывает определенные трудности при анализе модифицируемых рассуждений. Видимо, данные трудности привели к тому, что как инструмент для анализа гипотез и абдуктивных заключений часто используются неклассические логики [4], интерпретация которых либо отсутствует, либо не соответствует задачам семантического анализа данных и знаний.
Многие методы и теории семантического анализа информации часто основываются на понятии «отношение». Семантические сети и графы - это по сути совокупности бинарных отношений. Многие предложения естественного языка при концептуализации преобразуются в элементы определенных отношений. Интерпретацией логических выражений и формул также являются отношения. Отсюда кажется вполне закономерным вопрос: почему бы в качестве инструмента для семантического анализа не использовать теорию отношений?
Однако имеющиеся в этом направлении теоретические разработки ограничиваются лишь достаточно развитым языком теории бинарных отношений, которые часто применяются в семантическом анализе (семантические сети, онтологии и т. д.) и языком реляционной алгебры, аналитические возможности которого, с точки зрения логического анализа, весьма ограничены. В то же время многие объекты семантического анализа по своей структуре не укладываются в тесные рамки бинарных отношений.
Чтобы язык теории отношений сделать более приспособленным к задачам семантического анализа, предлагается в качестве его математической основы выбрать алгебру кортежей (АК)[5, 6].
2. Основные термины и структуры алгебры кортежей. Описание АК имеется в ряде публикаций. Начальные сведения по АК можно найти в Интернете [7]. Здесь приводится неформальное введение в АК, необходимое для понимания дальнейшего.
Все четыре структуры АК (они определены ниже) содержат в качестве элементов элементарные кортежи, которые состоят из последовательностей элементов, заданных в определенной схеме отношения. Например, если задан элементарный кортеж
Т[ХУЯ\ = (а, Ъ,с),
то подразумевается, что Т - имя элементарного кортежа (а,Ъ,с),Х,У^ - имена атрибутов, \ХУ%\ - схема отношения (т. е. пространство атрибутов), а € Х,Ъ € У и с € Z . Множество всех значений атрибута называется доменом; множество атрибутов, имеющих разные имена, но относящихся к одному и тому же домену, - сортом. Структуры, заданные в одной и той же схеме отношения, называются однотипными.
Множество однотипных элементарных кортежей можно представить как обычную таблицу отношения. Помимо элементарного кортежа в АК определены еще 4 структуры (С-кортеж, С -система, Д-кортеж, Д-система), с помощью которых сжато представляются множества элементарных кортежей. Они называются АК-объектами и представлены в виде векторов или матриц, состоящих из компонент. Компоненты определены как произвольные подмножества соответствующих доменов атрибутов. Среди компонент особую роль играют две фиктивные компоненты:
1) * - полная компонента, т. е. множество, равное домену соответствующего (по месту ее расположения в кортеже) атрибута; используется в С-кортежах и С-системах;
2) 0 - пустое множество, применяется в Д-кортежах и Д-системах.
Свойства и аналитические возможности АК основаны на свойствах декартова (прямого) произведения множеств [8]. Рассмотрим остальные структуры АК.
С-кортеж - это ограниченный прямыми скобками кортеж компонент. Множество элементарных кортежей в С-кортеже вычисляется как декартово произведение
его компонент. После этого С -кортеж можно представить в виде обычной таблицы отношения. Например, если задан С-кортеж Rl[XYZ] = [{а, с} {с^1,/} {Ь}], то
Ri[XYZ] = [{a,c} {c, d, f} {b}] =
X Y Z
а с b
а d b
а f b
с с b
с d b
с f b
(1)
В равенстве (1) {а, с} С X, {с, ¿, /} С Y, {6} С Z, а все строки таблицы формируются как результат вычисления декартова произведения {а, с} х {с, ¿, /} х {6}.
Если задан С-кортеж R2[XYZ] = [{а, с}{с, ¿, /}*], то это означает, что третья компонента представлена множеством, равным домену атрибута Z. В частности, если Z = {а, Ь, с, ¿}, то [{а, с}{с, ¿, /}*] = [{а, с}{с, ¿, /}{а, Ь, с, ¿}].
С -система - это выраженное в виде матрицы и ограниченное прямыми скобками объединение однотипных С-кортежей и соответственно представленных ими объединение отношений. Например,
Q[XYZ]
{a, b, c} {c} {c, d}
{f} {g,h}
{e,f} {f,h} {d,f,g} {g}
X Y Z X Y Z
a f 9 X Y Z с d 9
a f h с е f с f 9
b f 9 U с е h и с 9 9
b f h с f f d d 9
с f 9 с / h d f 9
с f h d 9 9
Рассмотрим еще две структуры АК (Д-кортежи и Д-системы), которые используются в расчетах и, кроме того, позволяют установить соответствия между структурами АК и формулами исчисления предикатов.
Д-кортеж - по сути сокращенное отображение диагональной С -системы. Диагональная С-система - это С-система размерности п х п, у которой все недиагональные компоненты - фиктивные. В частности, в равенстве
A * *
* B *
* * C
--]ABC [
в левой части изображена диагональная C-система, а в правой - эквивалентный ей D-кортеж. D-кортежи и D-системы ограничиваются перевернутыми прямыми скобками.
С помощью D-кортежей удобно вычислять дополнения C-кортежей. Так, дополнением C -кортежа [ABC] является D-кортеж ]AB С[, где Ai, В ,C - дополнения множеств A, B, C относительно доменов соответствующих атрибутов.
D-система - это записанная в виде матрицы совокупность однотипных D-кортежей. Она интерпретируется как пересечение содержащихся в ней D-кортежей и для отличия от C-систем ограничивается перевернутыми прямыми скобками.
С помощью В-систем легко вычисляется дополнение С-систем. Например, дополне-
нием С -системы
А В
* Е
С
является В-система
А В
0 Е
С однотипными АК-объектами можно выполнять любые операции алгебры множеств. Алгоритмы этих операций и проверок включения одного АК-объекта в другой приведены в [5-7]. При этом нет необходимости преобразовывать их в множества элементарных кортежей - все операции выполняются с компонентами. Такое свойство позволяет существенно уменьшить трудоемкость вычислений, в том числе и за счет возможности эффективного распараллеливания операций на матрицеподобных структурах АК. Структурами алгебры множеств в АК являются: 1) все компоненты отдельных доменов; 2) все однотипные АК-объекты.
3. Операции с атрибутами. Для выполнения операций с АК-объектами, имеющими разные схемы отношений, требуются операции с атрибутами. К ним относятся:
1) переименование атрибутов;
2) перестановка атрибутов;
3) обращение отношений;
4) добавление фиктивного атрибута (+АЬт);
5) элиминация атрибута (-АЬт).
Рассмотрим их более подробно.
Переименование атрибутов применяется только для атрибутов одного сорта.
Перестановка атрибутов - операция, при выполнении которой в матрице АК-объекта одновременно меняются местами столбцы и соответствующие атрибуты в схеме отношения. По сути, это эквивалентное преобразование.
Обращение отношений. В случае бинарных отношений перестановка столбцов без перестановки атрибутов позволяет получить отношение, обратное исходному. Например,
если С[ХУ] =
{а} {а, Ь} {Ь, с} {а с}
то а-1\ху ] =
{а, Ь} {а, с}
{а}" {Ь,с}
Добавление фиктивного атрибута осуществляется в том случае, если добавляемый атрибут отсутствует в схеме отношения АК-объекта. Тогда в схему отношения добавляется имя нового атрибута, а в структуру добавляется на соответствующем месте новый столбец с фиктивными компонентами, при этом в С-кортежи и С-системы добавляются фиктивные компоненты «*», а в В-кортежи и В-системы - фиктивные компоненты «0».
При выполнении данной операции содержательный смысл отношения не изменяется. Это свойственно ситуации в исчислении предикатов, когда квантор Ух применяется к формуле А, в которой отсутствует переменная х [9, с. 54]. Например, если задан АК-объект Р[У%], которому соответствует формула Е(у, г) исчисления предикатов, то, добавив в Р[У£] фиктивный атрибут X, получим АК-объект +Х(Р[УZ]), который отвечает формуле УхЕ(у, г). Эта формула по смыслу соответствует Е(у, г). Такое обстоятельство позволяет отнести операцию добавления фиктивного атрибута к семантически равносильным преобразованиям.
При элиминации атрибута из АК-объекта удаляется столбец, а из его схемы отношения - соответствующий атрибут. В отличие от предыдущей, логический смысл данной операции зависит от того, к какому классу АК-объектов она применяется. Доказано, что элиминация атрибута Х из С-кортежей и С-систем отвечает навешиванию квантора Эх в соответствующую логическую формулу, а элиминация того же атрибута
из Д-кортежей и Д-систем - навешиванию квантора Ух. Потому операции добавления и элиминации атрибутов в АК-объектах можно без потери смысла заменять операциями приписывания соответствующих кванторов. При этом переменной х под квантором соответствует область значений атрибута X.
Например, пусть заданы С -система и ее дополнение, выраженное как Д-система:
Q[XYZ]
Тогда
{а,Ъ,3} {¡,Н} {Ъ}' {ь, с} * {а с}
и Q[XYZ]
{с} {д}
{а, 3} 0
Зx(Q[XYZ]) = -X (Q[XYZ])
а, м {ь} ■
* {а, с}
{а, с} {Ъ}
Уx(Q[XYZ]) = -X (Q[XYZ]) =
{д} {а,с} 0 {Ъ}
4. Операции соединения и композиции. Операции «+А£г» и «-АЬт» применяются, в частности, при вычислении соединения и композиции двух разнотипных отношений, заданных АК-объектами. Пусть заданы две структуры Rl[У] и R2[W], при этом У и Ш являются множествами атрибутов и У = Ш, которые можно разложить на непересекающиеся подмножества X,Y, Z с помощью следующих преобразований: X = Ш \ У; Y = Ш П У; Z = У \ Ш. Тогда получим У = Y и Z и Ш = X и Y. С учетом этого данные отношения можно переписать так: Rl[YZ] и R2[XY].
Операция соединения R1\УZ ] ф R2[XY] отношений в реляционных системах обычно выполняется с помощью попарного сравнения всех элементарных кортежей из разных отношений. В АК операция соединения отношений существенно упрощается, и ее можно вычислить без попарного сравнения всех элементарных кортежей по формуле
R1[YZ] ф Н2^] =+X(НО П +Z(Н2) = Ух(н1) пУг(Н2).
Операция композиции Н1 [YZ] о Н2 [XY] отношений рассчитывается после вычисления соединения. В АК она определяется по формуле
Rl[YZ] о Н2[XY] = -У(^(Н1) П +Z(Н2)) = ^(Н1 ф Н2),
при условии, что (Rl ф R2) является С-кортежем или С -системой. С учетом того, что имеются алгоритмы преобразования Д-систем в С -системы, это условие не ограничивает вычисление композиции, хотя в некоторых случаях увеличивает трудоемкость операций.
Рассмотрим пример. Пусть заданы два АК-объекта с разными схемами отношений
Rl =
{а} {а, с} {Ъ,с} {3 е}
и R2[YZ] =
{а, 3} {а, Ъ} {3} {Ъ, с}
Тогда, добавляя фиктивный
атрибут Z в Rl и фиктивный атрибут X в R2, получаем
и
Rl Ф R2
{а} {а, с} {Ъ, с} {3 е}
{а, 3} {3}
{а, Ъ} {Ъ, с}
{а} {а} {а, Ъ} {Ъ, с} {3} {а, Ъ} {Ъ, с} {3} {Ъ, с}
П
я1 о е2 =
{а} {а, Ь} {Ь, с} {а Ь} {Ь,с} {Ь, с}
5. Соответствие между АК и исчислением предикатов. В исчислении предикатов С-кортежу в тривиальном случае (когда отдельные атрибуты не соотносятся с многоместными отношениями) отвечает конъюнкция одноместных предикатов с разными переменными.
Так, С-кортежу Р\ХУ2\ = [Р1Р2Р3] соответствует формула Р\ = Р\(х) Л Р2(у) Л Рз(г), ^-кортежу Q[XYZ\ =\QlQ2Qз[ - формула Р2 = Яг(х) V Q2(y) V д3(г).
Конъюнкция формул исчисления предикатов с несовпадающими совокупностями свободных переменных отвечает операции соединения соответствующих АК-объектов.
Элементарный кортеж, входящий в состав непустого АК-объекта, соответствует выполняющей подстановке логической формулы; АК-объект, оказавшийся при проверке пустым, - тождественно ложной формуле; непустой АК-объект - выполнимой формуле.
Доказательство того, что АК-объект равен декартовому произведению доменов атрибутов, входящих в схему его отношения, означает, что логическая формула, соответствующая этому АК-объекту, общезначима.
Домены атрибутов в АК могут быть любыми не обязательно равными друг другу множествами. Это означает, что структуры АК соответствуют формулам многосортного исчисления предикатов.
Методы квантификации в АК приведены в описании операций с атрибутами.
6. Обобщенные операции и логический вывод. В АК можно непосредственно выполнять операции алгебры множеств с АК-объектами, только если они однотипны (т. е. имеют одну и ту же схему отношения). Если же у АК-объектов разные схемы отношения, то для выполнения операций с ними и проверок включения их необходимо привести к одной схеме отношения с помощью добавления недостающих фиктивных атрибутов. По сути, это означает равносильное преобразование.
Назовем операции алгебры множеств с АК-объектами с предварительным добавлением недостающих фиктивных атрибутов обобщенными операциями и отношениями алгебры множеств в АК и обозначим их соответственно П^, и^, \о, Сс, =а и т. д. Первые две операции полностью соответствуют логическим операциям Л и V. Отношение Сс в АК соответствует отношению выводимости в исчислении предикатов. Это обстоятельство позволяет использовать принципиально новый подход к построению процедур логического вывода и проверок выводимости.
В математической логике выводом в теории Т называется всякая последовательность А\, ...,Ап формул такая, что для любого г формула А^ есть либо аксиома теории Т, либо непосредственное следствие каких-либо предыдущих формул по одному из правил вывода [9]. В логике и системах искусственного интеллекта широко применяются следующие системы логического вывода:
1) на основе правил вывода исчисления предикатов ([9] и др.);
2) натуральный вывод [10] - система вывода с расширенным по сравнению с предыдущим набором правил;
3) вывод на основе принципа резолюции [11];
4) на основе специфических правил вывода, предусмотренных в конкретной системе знаний [2, 4]; эти правила предусматривают формирование новых отношений
с помощью соединения или композиции исходных отношений, в силу чего их можно назвать семантическими правилами.
В АК при использовании обобщенных операций и соотношений предусматривается новая система логического вывода. Предположим, что задана система аксиом А\,..., Ап, которые отображены как АК-объекты. Тогда возможно решение следующих задач.
1. Задача проверки правильности следствия. Если задано предполагаемое следствие В, то процедура доказательства производится как проверка правильности обобщенного включения, заданного в виде соотношения
(А1 По ... По Ап) Со В. (2)
2. Задача вывода произвольных следствий. Для ее решения сначала вычисляется АК-объект А = А1 По ... По Ап, после чего производится выбор таких В^, для которых соблюдается А Со В^. При этом можно не только применять известные правила вывода. Авторами разработаны алгоритмы, позволяющие при известном А уменьшить неопределенность при подборе следствий В^.
Соответствие соотношения (2) процедуре логического вывода доказано. Кроме того, для его подтверждения была произведена проверка всех известных в классической логике правил логического вывода. Оказалось, что для всех правил вывода это соотношение выполняется. Исключением является формулировка правила обобщения, приводимая в некоторых монографиях по математической логике. Например, в [9, с. 66] данное правило формулируется так: «правило обобщения (или связывания квантором всеобщности): из А следует Ух1А».
Элементарная проверка показывает, что в случае, когда Х1 является свободной переменной в формуле А, то соотношение (2) выполняется лишь в исключительных случаях. При внимательном прочтении текста в [9] можно лишь предположить, что в формулировке правила обобщения подразумевается случай, когда в формуле А переменная х1 не является свободной . Однако явного указания на такое обстоятельство применительно к правилу обобщения в тексте нет.
На сомнительность правила обобщения в приведенной формулировке обратили внимание некоторые логики. В частности, в системе натурального вывода, разработанного Г. Генценом (см. [10]), данное правило применяется лишь для случая, когда в формуле А отсутствует переменная Х1. Это соответствует операции добавления фиктивных атрибутов в АК - они могут добавляться лишь в случае, когда их нет в схеме отношения соответствующего АК-объекта.
Предложенный подход к решению задач логического вывода позволяет по-новому осмыслить суть логического следования в классической логике. Известно, что справедливость отношения А С В означает, что В является необходимым условием или свойством А. Из соотношения (2) ясно, что логическое следствие корректно не только потому, что получено на основе правил вывода, смысл которых не всегда понятен, но и потому, что является необходимым условием существования антецедента.
7. Семантический анализ с точки зрения теории отношений. Знакомство с многими источниками, в которых рассматривается семантический анализ, показывает, что речь идет о выполнении следующих процедур:
*) На это указывает приведенная на той же странице аксиома (4): Ух1А(х1) Э А(х1). Если предположить, что в правиле обобщения переменная Х1 в А свободная, то получается, что правило обобщения в данном случае оказывается утверждением, обратным аксиоме (4), а это является логической ошибкой.
1) отбор основополагающих понятий данной предметной области; предварительная классификация отобранных понятий;
2) дальнейшая систематизация, установление иерархических связей между некоторыми понятиями;
3) выявление отношений между понятиями в рамках некоторого заранее заданного списка значимых отношений (типа часть - целое, принадлежать к совокупности, быть синонимом, иметь сходство и т.п.); здесь же можно использовать и более конкретные, специфичные для данной предметной области отношения;
4) формализация информации с помощью установленных отношений в виде семантических графов, семантических сетей и предикатов.
Стоит отметить, что графы и сети - это бинарные отношения, а предикаты можно рассматривать как своеобразное представление отношений: если отношение Я задано набором элементарных кортежей, то предикат - это функция на множество {0,1}, в которой каждому из кортежей в Я приписывается значение 1, а всем остальным кортежам универсума - значение 0. Отсюда ясно, что этап формализации информации при семантическом анализе можно выполнить единообразно на основе АК.
8. Анализ модифицируемых рассуждений. В математической логике противоречивость системы рассуждений (теории) определена лишь для случая, когда из посылок одновременно выводятся некоторое следствие и его отрицание. В то же время и в повседневных, и в неформализованных научных рассуждениях один из бесспорных критериев несостоятельности системы - это вывод контрарных следствий (например, из посылок следует, что «всем А присуще В» и в то же время - «всем А не присуще В»). Формально данные суждения не отрицают друг друга. Отрицанием формулы Ух(А(х) Э В(х)) в исчислении предикатов является формула Зх(А(х) А—В(х)) - «некоторым А не присуще В», но не формула Ух(А(х) Э —В(х)), которая соответствует суждению «всем А не присуще В». Чтобы устранить это и другие несоответствия между формальной логикой и естественными рассуждениями, в систему логического анализа систем предложено ввести понятие «коллизия» [7]. Коллизии в основном проявляются в модифицируемых рассуждениях при вводе новых знаний (гипотез) как нарушение некоторых формально выраженных правил или ограничений, с помощью которых регулируется целостность или смысловое содержание системы. В системах пересматриваемой аргументации коллизиям в какой-то степени соответствуют такие ситуации как «опровержение», «подрыв аргумента», «атака» и т. д. [4].
С учетом коллизий можно сформулировать методы анализа модифицируемых рассуждений на структурах АК. Пусть А1,...,А„ - совокупность аксиом или посылок и А = А1 Пс ... Пс А„. Рассмотрим структуру гипотез.
Формула Н является гипотезой, если неверно, что А С с Н .В противном случае в соответствии с (2) Н является следствием. Отсюда ясно, что Н в первом приближении можно считать гипотезой, если А\сН = 0.
Во втором приближении устанавливается корректность гипотезы. Гипотеза корректна, если объект НПс А не содержит коллизий (предполагается, что гипотеза играет роль аксиомы). Формулировка и проверка гипотез обычно применяются в совокупности с другими методами анализа рассуждений. Здесь мы рассмотрим использование гипотез при поиске и анализе абдуктивных заключений.
Абдукция - это процесс формирования объясняющей гипотезы, когда известны посылки и предполагаемое следствие, которое при формальной проверке не является следствием посылок, но, тем не менее, подтверждается фактами или обоснованными аргументами. Прототипом абдукции является задача диагностики.
Пусть Б - предполагаемое следствие из посылок А1, ...,Ап, при этом оказывается, что неверно А Б. Тогда формула Н по сути допустимое абдуктивное заключение, если соблюдаются следующие условия: 1) Н корректная гипотеза (т. е. Н П^ А не содержит коллизий) и 2) (Н П^ А) Б (т. е. при добавлении Н в систему посылок предполагаемое следствие Б становится выводимым). Отсюда можно вывести алгоритм поиска абдуктивных заключений:
1) вычисляем «остаток» К = А\аБ;
2) подбираем промежуточный объект К. такой, чтобы соблюдалось К К.;
3) вычисляем Щ = К^
4) рассчитываем Н..П^ А и выполняем проверку на наличие коллизий; если коллизии обнаружены, то возвращаемся к шагу 2, иначе конец алгоритма.
Нами был разработан алгоритм поиска вариантов К. для случая, когда известно К. Ниже этот алгоритм будет приведен вместе с примером из статьи [12], в которой в качестве метода анализа модифицируемых рассуждений выбрана логика высказываний. Предложенный авторами этой статьи алгоритм поиска относительно сложен. С помощью АК его можно существенно упростить.
Рассмотрим пример [12]. Базу знаний, выраженную в виде импликаций, можно представить как множество дизъюнктов, входящих в определенную конъюнктивную нормальную форму (КНФ):
(х2 Vxз У-1Хб)Л(х5 V—х7)Л(—Х14x2 Ухз V Х5) Л(—Х5 Ухд Ух1о)Л(—Х4 У—Хд)л(—Х4 V—хю). Данную КНФ можно представить как В-систему
0 {1} {1} 0 0 {0} 0 0 0 0
0 0 0 0 {1} 0 {0} 0 0 0
{0} {1} {1} 0 {1} 0 0 0 0 0
0 0 0 0 {0} 0 0 {1} {1} {1}
0 0 0 {0} 0 0 0 0 {0} 0
0 0 0 {0} 0 0 0 0 0 {0}
Л[Х1Х2Х3Х4ХбХ6Х7Х8ХдХ10] —
Заключение в данном примере выражено в виде формулы (х1 ЛХ4 ЛХ7) Э хд, которую можно преобразовать в дизъюнкцию —Х1 V —Х4 V —Х7 V хд ив В-кортеж
БХАХгХд] =]{0} {0} {0} {1}[.
Теперь можно использовать приведенный выше алгоритм поиска абдуктивных заключений. Все расчеты были выполнены с помощью разработанной авторами программы. После вычисления по формуле К = А\аБ и соответствующих преобразований была получена С-система:
К
Х1 Х2 Хз Х4 Х5 Хб Х7 Х8 Хд Х1о
{1} {1} * {1} {1} * {1} {1} {0} {0}
{1} {0} {1} {1} {1} * {1} {1} {0} {0}
{1} {0} {0} {1} {1} {0} {1} {1} {0} {0}
(3)
В верхней строке (3) для облегчения анализа полученной структуры записаны соответствующие атрибуты. Рассмотрим, как можно применить эту структуру для поиска вариантов К. и соответственно абдуктивного заключения Н. (шаги 2 и 3 алгоритма).
При поиске вариантов абдуктивного заключения обычно исходят из следующих предпосылок: 1) в абдуктивном заключении желательно использовать небольшое число
переменных; 2) состав переменных нередко определяется исходя из смыслового анализа конкретной системы рассуждений.
Здесь рассмотрим формальную задачу выбора переменных и формул для представления абдуктивного заключения Н^ на основе вычисленного «остатка» Я, для которого необходимо выполнение соотношения К Сс Н^. Когда Я — С-система (если это не так, то можно использовать алгоритмы преобразования Д-кортежей или ^-систем в С -системы), то сокращение числа переменных в Н^ можно осуществить с помощью элиминации атрибутов. При этом ясно, что при таком преобразовании соотношение Я С.с Нг будет выполняться. Например, в С-системе Я можно элиминировать все атрибуты кроме Хд, тогда получим С -систему Д^Хд] = [{0}\, которая соответствует логической формуле —хд . Отсюда Н = хд.
Рассмотрим теперь формальные (т. е. без учета коллизий и смысловых ограничений) правила выбора атрибутов (переменных), которые могут быть применены в Hi. Если, допустим, элиминировать из Я почти все атрибуты кроме Х2, то останется проекция, в которой содержатся все возможные значения этого атрибута. Аналогичная ситуация возникнет для проекции [Х2Хз\. Это означает, что выбор соответствующих переменных для абдуктивного заключения приведет к пустоте Щ, а соответствующая ему логическая формула будет тождественно ложной. Потому при выборе переменных для Н должно соблюдаться следующее правило: проекция по выбранным переменным в Я не должна содержать полный набор всех возможных значений атрибутов.
С учетом данного правила сформируем набор неполных проекций в Я. В приведенном примере такими проекциями являются: [Хх\, [Х4\, [Хб\, [Х7\, [Хэ\, [Хд\, [Хю\, [Х2ХзХб\. Выбранные проекции позволяют легко формировать АК-объекты и соответственно логические формулы, удовлетворяющие условию Я Сс Н^. Многообразие вариантов формирования Н3 может быть выражено такими правилами:
1) оставить в качестве Нг одну из неполных проекций;
2) выбрать в качестве Нг любую проекцию при условии, что в ее состав входит, по крайней мере, одна неполная проекция;
3) для выбранного по предыдущим правилам АК-объекта построить покрывающий его неполный АК-объект.
Доказано, что эти правила охватывают все возможные случаи «наращивания» Я.
Рассмотрим примеры.
Пример 1. Выберем проекцию [ХхХд\. Она после сокращений будет равна С-кортежу Яг[Х\Хо\ = [{1} {0}]. Тогда можно сформировать следующие формулы для Нг : 1) х\ Л~'Хд (соответствует С-кортежу 2) {х\ Л->хд) V (-1Ж1 Лжд); 3) х\ V —'Жд (последние две формулы отвечают АК-объектам, которые покрывают С-кортеж Я^ и т. д.
Пример 2. Выберем в качестве Н3 проекцию \X2X3XQ]. Она является С-системой
{1} * *
{0} {1} * , равной Д-кортежу\{1}{1}{0}[, и соответствует формуле Х2VxзV—хб.
{0} {0} {0}]
Отрицанием этой формулы является формула —Х2 Л —хз Л Х6, которую можно использовать в качестве абдуктивного заключения.
Сформулированные выше алгоритм и правила формирования абдуктивных заключений применимы не только для АК-объектов, отображающих формулы исчисления высказываний, но и для общего случая, когда домены атрибутов имеют более двух значений. Ясно, что в конкретной системе знаний выбор переменных и их значений для абдуктивного заключения производится по критериям, связанным с содержанием
системы, и поэтому выбор возможных вариантов существенно ограничен. Разработанная система формальных правил выбора переменных позволяет более просто отсеивать ошибочные варианты.
9. Заключение. Предложенный подход к логико-семантическому анализу позволяет выразить в единых структурах данные и знания, в силу чего можно существенно сократить затраты на разработку программных средств для реализации сложных интеллектуальных систем.
В современных языках программирования, предназначенных для моделирования информационных систем, многие процедуры и модели (например, запросы, правила вывода, команды преобразования структур и т. д.) выражены декларативно, в силу чего алгоритмы реализации этих процедур не являются прозрачными. Данное обстоятельство не всегда позволяет находить эффективные алгоритмы в тех случаях, когда в системе применяются разнородные структуры или когда требуется оценить быстродействие алгоритмов. При использовании общей теории отношений и, в частности, АК многие декларативные команды можно выразить с помощью сравнительно простых процедур.
Структуры АК обладают естественным параллелизмом, что позволяет сравнительно легко реализовать интеллектуальные системы в вычислительных комплексах параллельной обработки данных.
Литература
1. Тейз А., Грибомон П., Юлен Г. и др. Логический подход к искусственному интеллекту: От модальной логики к логике баз данных / пер. с франц. П. П. Пермякова; под ред. Г. П. Гаврилова. М.: Мир, 1998. 494 с.
2. Рассел С., Норвиг П. Искусственный интеллект: современный подход. 2-е изд. / пер. с англ.; ред. К. А. Птицына. М.: Изд. дом «Вильямс», 2006. 1408 с.
3. Попов Э. В. Общение с ЭВМ на естественном языке. М.: Наука, Гл. ред. физ.-мат. лит-ры, 1982. 360 с.
4. Вагин В. Н., Головина Е. Ю., Загорянская А. А., Фомина М. В. Достоверный и правдоподобный вывод в интеллектуальных системах / под ред. В. Н. Вагина, Д. А. Поспелова. М.: Физматлит, 2004. 704 с.
5. Кулик Б. А. Система логического программирования на основе алгебры кортежей // Изв. РАН. Техн. кибернетика. 1993. № 3. С. 226-239.
6. Кулик Б. А. Вероятностная логика на основе алгебры кортежей // Изв. РАН. Теория и системы управления. 2007. № 1. С. 118-127.
7. Кулик Б. А. Курс лекций по логике и математике. URL: http//logic-cor.narod.ru/kurs.htm.
8. Бурбаки Н. Теория множеств / пер. с франц. М.: Мир, 1965. 455 с.
9. Мендельсон Э. Введение в математическую логику / пер. с англ. Ф. А. Кабакова; под ред. С. И. Адяна. М.: Наука, 1971. 320 с.
10. Гладкий А. В. Введение в современную логику. М.: МЦНМО, 2001. 200 с.
11. Чень Ч., Ли Р. Математическая логика и автоматическое доказательство теорем / пер. с англ. Г. В. Давыдова и др.; под ред. С. Ю. Маслова. М.: Наука, 1983. 358 с.
12. Страбыкин Д. А., Томчук М. Н. Метод логического вывода модифицируемых рассуждений // Изв. РАН. Теория и системы управления. 2008. № 2. С. 89-95.
Статья рекомендована к печати проф. И. Л. Братчиковым. Статья принята к печати 10 июня 2010 г.