Научная статья на тему 'Эквивалентность двух способов упорядочения множества морфизмов с  общим источником'

Эквивалентность двух способов упорядочения множества морфизмов с  общим источником Текст научной статьи по специальности «Математика»

CC BY
156
760
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРЕДСТАВЛЕНИЕ ЗНАНИЙ / ПРОДУКЦИОННАЯ СИСТЕМА / PRODUCTION SYSTEM / ТЕОРИЯ КАТЕГОРИЙ / CATEGORY THEORY / УНИВЕРСАЛЬНАЯ АЛГЕБРА / UNIVERSAL ALGEBRA / PATTERN MATCHING

Аннотация научной статьи по математике, автор научной работы — Жожикашвили Александр Владимирович

Работа посвящена решению математической задачи, возникшей в исследованиях автора по продукционным системам. Одним из способов управления сложными си-стемами является использование экспертных систем и аналогичных им интеллектуальных компьютерных систем, основанных на знании. Многие системы подобного рода основаны на использовании правил или продукций. В своих работах автор построил математическую теорию таких систем, основанную на аппарате теории категорий. Одним из основных понятий этой теории является понятие образца – описания множества ситуаций, в которых пра-вило применимо. Важными с теоретической точки зрения являются вопросы о том, насколько точно образец опреде-ляется множеством описываемых им ситуаций. В работе решена одна из задач, относящейся к этому кругу вопросов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The equivalence of the two orderings of a set of morphisms with a common domain

In previous works, the author proposed a mathematical language for describing the rules in artificial intelligence. A single production acts over a set of situation, taking one situation as a source and generating the another situation as the result of its application. The concept of pattern for a generalized description of similar situations is important in this theory. Both the situation and the pattern are coded in the proposed language by morphisms of the appropriately chosen category. Samples can be ordered by a degree of generality. Two methods of such ordering could be considered. We can assume that the first pattern is more general than the second one if the second can be obtained by specifying the first. We also can assume that the first pattern is more general than the second if each situation, suitable for the first pattern, is suitable for the second one. These two ways of ordering are close but not identical. The reformulation of these two definitions in the language of a category theory leads to the mathematical problem of comparing of two ways of ordering a certain set of morphisms. An article is devoted to an investigation of this problem.

Текст научной работы на тему «Эквивалентность двух способов упорядочения множества морфизмов с  общим источником»

УДК 004.82,512.58,512.57 ББК 32.813,22.144

ЭКВИВАЛЕНТНОСТЬ ДВУХ СПОСОБОВ УПОРЯДОЧЕНИЯ МНОЖЕСТВА МОРФИЗМОВ С ОБЩИМ ИСТОЧНИКОМ1

Жожикашвили А. В.2

(ФГБУН Институт проблем передачи информации РАН, Москва)

Работа посвящена решению математической задачи, возникшей в исследованиях автора по продукционным системам. Одним из способов управления сложными системами является использование экспертных систем и аналогичных им интеллектуальных компьютерных систем, основанных на знании. Многие системы подобного рода основаны на использовании правил или продукций. В своих работах автор построил математическую теорию таких систем, основанную на аппарате теории категорий. Одним из основных понятий этой теории является понятие образца - описания множества ситуаций, в которых правило применимо. Важными с теоретической точки зрения являются вопросы о том, насколько точно образец определяется множеством описываемых им ситуаций. В работе решена одна из задач, относящейся к этому кругу вопросов.

Ключевые слова: представление знаний, продукционная система, теория категорий, универсальная алгебра.

1 Работа частично финансировалась РФФИ по проекту 15-07-07486 и по программе №211 Президиума РАН.

2 Александр Владимирович Жожикашвили, кандидат технических наук, старший научный сотрудник (zhozhik@iitp.ru).

Управление большими системами. Выпуск 72 1. Введение

Настоящая работа посвящена достаточно специальной математической задаче, однако для того чтобы объяснить интерес автора к этой задаче, необходимо рассказать о тех исследованиях, которые он вел в прикладных областях.

Одним из способов управления сложными системами, поведение которых не удается описать простыми алгоритмами, является использование экспертных систем и аналогичных интеллектуальных компьютерных систем, основанных на знании. Автор многие годы изучал системы, знания в которых записываются в виде набора правил, или продукционных систем (в данной статье термины «правило» и «продукция» являются синонимами). Для теоретического исследования таких систем автору потребовалось абстрактное определение правила, не зависящее от вида конкретных структур данных, на которые действует это правило[11].

Такое определение было дано на языке теории категорий [3]. Основанная на этом определении математическая теория не только позволяет решать в общем виде теоретические вопросы, связанные с использованием правил, но и сильно сокращает трудозатраты на разработку продукционных систем. Автором была развита базирующаяся на этих идеях технология разработки интеллектуальных систем, основанных на знании [2]. Она позволяет писать ядро программы в общем виде, практически в теоретико-категорных терминах. Настройка для решения конкретной задачи осуществляется путем программной реализации категории, наиболее адекватно отражающей характер знаний, используемых при решении этой задачи. Последнее означает, что должны быть выработаны структуры данных, кодирующие морфизмы категории, и написаны процедуры, реализующие основные операции над ними - композицию и ряд других.

Опишем в самых общих чертах понимание правила, которым пользовался автор. Применение классического правила состоит из двух шагов. На первом шаге проверяется применимость правила в данной ситуации. В случае положительного

ответа на этот вопрос правило преобразует эту ситуацию, в результате чего возникает новая ситуация. После этого можно искать правило, применимое в этой новой ситуации и т.д. до достижения некоторой заданной цели.

В своих исследованиях автор использовал специальный вид правил. Строение этих правил и алгоритм применения может быть описан несколько более детально. Правило такого вида состоит из двух компонент: левой части - описания ситуации, в которой правило применимо, и правой части - описания ситуации, которая должна возникнуть после его применения. Оба описания являются приблизительными, некоторые компоненты в них не детализированы. Такое описание в работах автора называется образцом ситуации или просто образцом. Образец, таким образом, описывает множество близких ситуаций, отличающихся друг от друга не очень существенными деталями. Образец может быть конкретизирован, в результате чего он превратится в описание конкретной ситуации. Сопоставление ситуации с образцом - проверка того, можно ли конкретизировать данный образец так, чтобы в результате получить данную ситуацию. Проверка применимости правила к ситуации состоит в сопоставлении этой ситуации с левой частью правила. Если сопоставление успешно, правая часть конкретизируется так же, как была конкретизирована левая часть при сопоставлении с ситуацией. Результат этой конкретизации и будет результатом действия правила. В работах автора приведено много примеров, показывающих, что в такую схему укладывается большинство правил, используемых для представления знаний.

Для построения математической теории две основные операции - сопоставление и конкретизация - были формально описаны на языке теории категорий. На этом языке может быть придан точный смысл словосочетаниям «конкретизируется так же» и другим подобным, используемым автором в теории продукций.

Поскольку образец служит для описания множества близких ситуаций, возникает естественное упорядочение образцов по степени общности. Этот порядок играет важную роль в использовании развитого автором аппарата для представления

знаний. К примеру, важным является вопрос о том, является ли это множество решеткой. В последнем случае можно считать, что если образец содержит некоторую информацию о классе ситуаций, то верхняя грань двух образцов содержит общую часть информации, относящейся к каждому из них. Это означает, что операция взятия верхней грани может быть полезна при автоматическом построении гипотез посредством обобщения. По терминологии автора такая верхняя грань называется наименьшим обобщением двух образцов. Есть и другие свойства порядка на множестве образцов, изучение которых может потребоваться для формализации действий со знаниями.

Если определение продукции, используемое автором, вполне оригинально, определение образца имеет многочисленные аналоги. Сопоставление с образцом, представляющее собой частный случай того, которое использует в своих работах автор, является основным элементом теории унификации [8]. Обычно в этих работах вместо языка морфизмов используется язык подстановок, но теоретико-категорный смысл изучаемых понятий достаточно хорошо осознавался исследователями. В [4] термин «категория» вынесен в название. Автор этой работы выводит из свойств многообразия универсальных алгебр свойства категории свободных в этом многообразии алгебр, а из них - свойства процедуры унификации. Эту линию исследования он продолжает и в более поздних работах. Изучались упорядоченные множества, аналогичные тем, о которых говорится в настоящей статье. На языке таких множеств унификатор можно рассматривать, как нижнюю грань. В работах встречается теоретико-категорное определение унификатора. Верхняя грань исследуется меньше, в теории унификации она получила название антиунификатор [9]. В последние годы эта тема получила развитие в рамках дескрипционной логики [5]. В частности, изучается понятие Least common subsumer [7], соответствующее в терминологии автора понятию наименьшего обобщения.

Автора интересовал в частности вопрос о соотношении свойств образцов и свойств описываемых ими множеств ситуаций. Самый первый вопрос, который возникает на этом пути, следующий: тождественны ли утверждения «образец P сопоста-

вим с образцом Q» и «всякая ситуация, сопоставимая с образцом Р, сопоставима также и с образцом Q». Решение этого вопроса должно предшествовать изучению порядка на множестве образцов теоретико-категорными средствами. В случае положительного ответа такое изучение возможно, в случае же отрицательного надо исследовать вопрос о том, насколько велика неточность, связанная с переходом от исследования множеств ситуаций, описываемых образцами, к исследованию свойств самих образцов, сформулированных на теоре-тико-категорном языке. Этому вопросу и посвящена статья.

2. Основные понятия категорной теории продукций

Рассмотрим некоторую малую категорию С и определим в терминах морфизмов этой категории основные понятия, связанные с сопоставлением. Пусть - объект категории. 5-образцом назовем любой морфизм ф е С(С, 5), где С - произвольный объект категории. Для каждой пары объектов С и 5 определим множество Со(С, 5) с С(С, 5), элементы которого будем называть 5-ситуациями. Какие именно морфизмы являются ситуациями, определяется спецификой конкретной задачи. Единственное требование, которое накладывается на класс ситуаций, состоит в выполнении следующего условия ситуационной замкнутости:

если ф е С(С, 5), щ е С(П, 5), о е С(С, П), и ф = що, то

ф е С0(С, 5) тогда и только тогда, когда щ е С0(П, 5).

Будем говорить, что ситуация а е С0(А, 5) сопоставима с образцом ф е С(С, 5), если для некоторого морфизма в е С(А, С) имеем а = ф/3. Продукцией из 5 в Т называется пара морфизмов ф е С(С, 5) и щ е С(С, Т). Такая продукция действует на 5-ситуации, превращая их в Т-ситуации. Продукция (р, ц) считается применимой к ситуации а е С0(А, 5), если эта ситуация сопоставима с образцом р, т.е. а = фв для некоторого в е С(А, С). Результатом применения продукции (р, ц) к ситуации а в этом случае считается морфизм щв: А ^ Т. Этот морфизм является ситуацией в силу выписанного выше условия

ситуационной замкнутости. Можно отметить, что результат применения продукции к ситуации определен неоднозначно, ибо неоднозначен выбор морфизма /.

Определение продукции дано больше для полноты картины, в дальнейшем нам потребуются только образцы.

Отметим: в приведенных определениях ничего не говорится о том, что представляет собой объекты и морфизмы категории. Работая с определенным видом знаний, исследователь должен подобрать категорию таким образом, чтобы ситуация, образец и операция сопоставления, определенные на категорном языке, имели бы правильный смысл: ситуация должна описывать реальную ситуацию, в которой действует продукция, образец -класс близких ситуаций, в которых применимы одни и те же действия, и т.д. В работах автора (см., к примеру, [1]), приведены разнообразные примеры выбора категорий.

Как уже отмечалось, важным для приложений объектом исследования является порядок на множестве образцов. Ему посвящена и эта работа. Дадим необходимые определения.

Пусть C - объект категории С. Определим P(C) формулой P(C) = иС(Д О, где объединение берется по всем объектам D категории (напомним, что С - малая категория). Пусть Ф, у е P(C), т.е. ф е С^, О, у е С^, О для некоторых объектов D и E категории. Будем считать, что р< у если р = ух для некоторого морфизма х- D ^ E. Легко проверяется, что отношение < является предпорядком. Символом Po(C) обозначим множество P(C) = иС0^, О, где D опять пробегает все множество объектов категории. Ясно, что P0(C) с P(C). Если р е P(C), положим P0(ф) = (а е P0(C) | а < ф}. Если р, уе P(C), будем говорить, что р<0 р, если P0(р) с P0(у). Очевидно, что отношение <0 также задает предпорядок на множестве P(C). Нас будет интересовать связь < и <0. Элементарно доказывается, что из условия р< у следует условие р<0 у, однако, как мы увидим ниже, обратное в общем случае не верно.

Связь между условиями р< у и р<0 у т.е. P0(р) с P0(у) -это один из вопросов о том, в какой степени изучение множеств ситуаций, описываемых образцами, может быть сведена к изу-

чению свойств самих этих образцов. Условие р< ц означает, что первый образец сопоставим со вторым, условие р<0 ц- что всякая ситуация, сопоставимая с первым, сопоставима и со вторым. Второе условие является более значимым для прикладных исследований, ибо образец задуман как способ описания множества близких ситуаций. Первое же условие легче проверить, так как для этого не требуется рассмотрение множеств ситуаций (возможно, бесконечных), сопоставимых с каждым из образцов. Вопрос о том, как выразить на категорном языке свойство, состоящее в том, что множество ситуаций, описанное одним образцом, содержатся в множестве ситуаций, описанном другим образцом, является первым из большой серии подобных вопросов. За ним следуют такие же вопросы, касающиеся продукций, например, как записать на категорном языке то, что одна продукция является частным случаем другой, или то, что продукция является композицией двух других.

3. Категория Клейсли и категория свободных универсальных алгебр

Определения были даны в самом общем случае, но для получения содержательной теории надо конкретизировать вид категории. В своих работах автор изучал категорию специального вида, построенную по монаде на категории множеств. названную им ^-категорией. Эта категория описывает случай, когда ситуации задаются определенными структурами данных, а образцы представляют собой аналогичные структуры, в которых некоторые фрагменты оставлены незаполненными и при конкретизации могут быть заполнены структурами такого же вида. К таким структурам относятся строки, в которые на определенным места могут быть подставлены подстроки; списки, в которые могут вставляться подсписки; выражения, в которые вместо переменных могут быть вставлены подвыражения; деревья, к концевым вершинам которых могут прикрепляться поддеревья, и т.д. Точного определения ^-категории мы давать не будем, его можно найти, например, в [1]. Там же было доказано, что если задана монада на категории множеств, то

fi-категория, построенная по этой монаде, дуальна полной подкатегории категории Клейсли, построенной по той же монаде, объектами которой являются конечные подмножества некоторого счетного множества. Такой понимание Q-категории даже удобнее для исследования. Единственное, что нужно сделать -заменить все приведенные выше определения их дуальными аналогами.

Пусть Set - категория множеств и отображений, функтор F: Set ^ Set - монада на Set, X- счетное множество. Объектами указанной выше подкатегории категории Клейсли являются конечные подмножества множества X, морфизмами из U с X в V с X - отображения из множества U в множество FV. Обозначим эту категорию символом C°, ибо она дуальна исходной категории, служащей для описания образцов.

Пусть множество U с X конечно. Определим множество

P(U) формулой P(U) = U C°(U,V). Для любой пары мор-

V с X V <»

физмов ф, yeP(U) положим р< у, если ф = ху для некоторого морфизма Х- Не вдаваясь в объяснения, отметим, что в Q-категории ситуацией считается морфизм I ^ S, где I - финальный объект категории. Дуальным объектом в категории C° является инициальный объект 0. Это означает, что множеству ситуаций в дуальной категории соответствует множество Po(U) =C°(U, 0). Соответственно, Ро(ф) = (а е Pq(U) | а < ф}. Если ф, у е P(U, будем говорить, что р<0 у, если P0(p) с P0( у).

В остальной части статьи мы сосредоточимся на еще более специальном, но важном для практики частном случае. Будем рассматривать многообразие универсальных алгебр с сигнатурой Q, задаваемое набором тождеств E [10]. Обозначим символом Cq,e категорию алгебр этого многообразия вместе с гомоморфизмами Q-алгебр. Пусть Set - категория множеств и отображений, S: Set ^ CQE - функтор свободы, ставящий в соответствие множеству U свободную алгебру с множеством образующих U, а T: CQ,E ^ Set - забывающий функтор, ставящий в соответствие Q-алгебре A множество A, а гомоморфизму Q-алгебр ф: A ^ B - отображение множеств ф: A ^ B. Тогда

функтор F = TS: Set ^ Set - монада на Set. Эту монаду мы и используем для построения fi-категории и дуальной ей подкатегории C° категории Клейсли. Как уже отмечалось, морфизмами категории C° из U с X в V с X служат отображения из U в FV. Поскольку такие отображения находятся во взаимнооднозначном соответствии с гомоморфизмами fi-алгебр из SU в SV, а композиция морфизмов в категории Клейсли соответствует при этом обычной композиции гомоморфизмов, можно заключить, что категория C° изоморфна полной подкатегории категории Cq,e, объектами которой являются свободные алгебры вида SU, U с X, \ U\ < то.

Эту категорию мы будем рассматривать в остальной части статьи. Отметим, что именно эту категорию изучали специалисты по теории унификации в упомянутых выше работах. Большинство категорий, который автор использовал в своих работах для представления знаний, также относятся к этому виду. Однако даже для этого вида категорий исследование связи между порядками < и <0 оказалось весьма непростым делом. Автору неизвестно, какие условия, наложенные на сигнатуру Q и множество тождеств E, являются необходимыми и достаточными для того, чтобы эти порядки совпадали. То, что из условия р < у следует условие р<0 у, достаточно очевидно, однако обратное в общем случае не верно. Вот простой пример, подтверждающий это.

Пусть Q = {a,f}, причем a - 0-арный оператор, т.е. константа, а f - бинарный. Будем считать, что множество E состоит из одного тождества: fa, a) = a. Здесь и далее будем опускать скобки после 0-арных операторов, ибо запись a выглядит более естественно, чем a(-). Очевидно что множество F0 состоит из одного элемента - элемента a, P0(U) для любого Uтоже состоит из одного морфизма a: FU ^ F0, отображающего все элементы FU в a. Легко видеть, что для любого ф е P(U) выполнено неравенство a < ф, т.е. Р0(ф) = {a}. Это означает, что неравенство р<0 у выполнено для любых ф, у е P(U). Однако для неравенства р< у это не так. Действительно, возьмем U = {u1, u2}, V = {vi, v2}, W = {w}, гомоморфизм ф: SU^ SV

зададим формулами ф(щ) = VI, ф(и2) = v2, гомоморфизм щ: 5и ^ 5Ж - формулой щ(щ) = щ(и2) = w. Ясно, что ф Ф хщ ни для какого х: ^ ибохщ(и\)=хщ(и2).

Пример этот приведен потому, что он содержит более-менее нормальное многообразие, с операциями и тождеством. Более простые, но совсем уж вырожденные примеры, дает теорема из следующего раздела.

4. Случай абсолютно свободных алгебр

Повторим: в общем случае, для произвольных О и Е, условия того, что порядки < и <0 совпадают, представляются довольно сложными. В настоящей статье разобран самый простой случай, когда Е = 0. Не следует думать, что этот случай является вырожденным и малоинтересным для практики. Такие категории возникают, к примеру, при манипулировании выражениями, записанными на языке логики предикатов первого порядка [1].

В случае Е = 0 элементы Еи равны, если они совпадают тождественно. Алгебра Би - это то, что называется абсолютно свободной алгеброй, - множество правильно построенных выражений, состоящих из операторов множества О и переменных множества X. В этом случае связь между порядками < и <0 определяется следующей теоремой, доказательству которой посвящена оставшаяся часть статьи.

Теорема. В категории абсолютно свободных О алгебр порядки < и <0 совпадают на каждом Р(и) в том и только том случае, если сигнатура О содержит хотя бы 2 оператора, один из которых 0-арный.

Доказательство. Начнем с доказательства того, что условия, наложенные на О, являются необходимыми.

Пусть О не содержит ни одной 0-арной операции. Очевидно, что в этом случае 50 = 0, Р(и) = 0 для любого и, Р0(ф) = 0 для любого р, неравенство р<0 ц выполнено для любых ф, щ е Р(Ц), неравенство же р< ц - нет. Для того чтобы убедиться в последнем, можно использовать то же рассуждение,

которое было использовано при разборе примера в конце предыдущего раздела.

Пусть О содержит 0-арную операцию а и больше не содержит ничего. Тогда Б0 = (а}, Р0(и) состоит из единственного гомоморфизма а- Би ^ 50, который отображает все элементы Би в а. Очевидно, что а < ф для любого ф е Р(и), поэтому Р0(ф) = (а}. Мы снова видим, что р<0 у всегда, но р< у не всегда. Подтверждающий это пример - тот же.

Перейдем теперь доказательству достаточности. Пусть р, д е О, оператор р является 0-арным. Тогда Г0 содержит элементы р и д(р,р, ...,р). Количество аргументов во втором элементе зависит от арности д, в частности, он может быть равен просто д, если эта арность - 0.

Прежде чем продолжить доказательство, докажем ряд лемм.

Лемма 1. Пусть а е Би1, а £ и. Существует элемент с е Б0 такой, что £(а) Ф с для любого морфизма £ Би ^ 50.

Доказательство. Поскольку а £ и, а = И(а\, а2, ..., ап), И е О, а7 е Би. Тогда £(а) = И(£(а1), £(а2), ..., £(ап)). Если И Фр, положим с = р, если же И = р, т.е. И Ф д, положим

с = д(р, р, ..., р). □

Лемма 2. Пусть а, Ь е Би и а Ф Ь. Существует морфизм а- Би ^ Б0 такой, что а(а) Ф а(Ь).

Доказательство. Пусть М с Би - множество таких а е Би, что для любого Ь е Би, Ь Ф а, найдется морфизм а-Би^Б0 такой, что а(а) Ф а(Ь). Достаточно доказать, что М = Би. Для этого докажем, что и с М и что из а, е М, 7 = 1,2,...,п, следует что Даьа2,.. ,,ап) е М для любого п-арного оператора /.

Первое из этих двух утверждений доказывается следующими рассуждениями. Пусть а е и , Ь е Би , а Ф Ь . Если Ь е и , то можно определить гомоморфизм а- Би ^ Б0 формулами

1 В работе не всегда различаются выражения Би и ГП. В частности, оба выражения - а е Би и а е ГП - одинаково корректны. Будем надеяться, что это не приведет к путанице.

а(а) = р, а(Ь) = д, значение а на остальных элементах можно выбрать произвольно. Получим а(а) Ф а(Ь). Пусть теперь Ь £ и. Согласно лемме 1, в 50 есть такой элемент с, что с Ф £(Ь) ни для какого 5и ^ 50. Определим а: 5и ^ 50 так, чтобы а(а) = с. Образы остальных переменных из и можно выбрать произвольно. Мы снова получим, что а(а) Ф а(Ь).

Для доказательства второго утверждения допустим, что а = Даь а2, ..., ап) и а7 е М, 7 = 1, 2, ..., п. Возьмем Ь е Еи, Ь Ф а. Случай Ь е и был только что разобран. Пусть Ь £ и. Тогда Ь = £(...), ё е О. Если ё Ф£ то а(а) Ф а(Ь) для любого а: Еи ^ Е0 (а множество таких а, очевидно, не пусто). Осталось рассмотреть случай ё = £ т.е. Ь = £(Ь\, Ь2, ..., Ьп). Поскольку Ь Ф а, Ь7 Ф а7 для некоторого 7. Но а7 е М. Следовательно, для некоторого а:3и^50 имеем а(Ь7) Ф а(а7), а тогда

а(а) = а(Даьа2,...,ап)) =

=£(а(а\),а(а2),.,а(ап)) Ф £а(Ь\),а(Ь2),...,а(Ьп)) = а(Ь), что и завершает доказательство леммы. □

Лемма 3. Пусть а е 5и, ф, щ: 5и ^ 5У, ф(а) = щ(а). Тогда для любой переменной х, входящей в выражение а, имеем ф(х) = щ(х).

Доказательство. Пусть М - множество таких а е 5и, для которых это утверждение верно. Докажем, что М = 5и.

То, что и с М, очевидно. Рассмотрим теперь выражение а = Даь а2, ., ап), для которого а7 е М, 7 = 1,2,.,п. Поскольку

ф(£а\, а2, ., ап)) = Аф(а\), ф(а2), ..., ф(ап))

и

щ(Да\,а2,.,ап)) = £щ(а\),щ(а2), .. ,,щ(ап)), из равенства ф(а) = щ(а) следуют равенства ф(а7) = щ(а7), 7 = 1, 2, ..., п. Учитывая, что а7 е М, заключаем, что ф(х) = щ(х) для всех переменных х, входящих в выражения а\, а2, ..., ап, т.е. входящих в а. □

Следствие. Пусть задан морфизм ф: 5и ^ Ъ'У. Если для каждого V е V найдется и е и такое, что V входит в выражение ф(и), то ф - эпиморфизм □

Продолжение доказательства теоремы.

Как уже отмечалось, тот факт, что из условия ф < у следует Ф <0 у, элементарно может быть доказан для любых О и Е. Наша задача - доказать, что в условиях теоремы из ф <0 у следует

ф < у.

Итак, пусть заданы морфизмы ф-БП^БУ и у-Би^БЖ. Условие ф <0 у на категорном языке записывается следующим образом:

1) для любого морфизма а- БУ ^ Б0 найдется морфизм в- БЖ ^ Б0, делающий диаграмму

Б0

коммутативной.

Условие ф < у означает что 2) существует морфизм х- БЖ ^ БУ, делающего коммутативной диаграмму

БЖ -Х-> БУ

Би

Наша задача, следовательно, показать, что из выполнения условия 1 следует выполнение условия 2.

Пусть а е БХ (в частности, это относится к элементам множеств Би, БУ и других подобных). Это означает, что а - выражение, построенное из операторов - элементов множества О, и переменных - элементов множества X. Обозначим через Ь(а)

количество символов операторов, входящих в выражение а. Формальное определение выглядит следующим образом:

если а е X, то Ь(а) = 0;

если а = Дсь с2, ..., сп), /е О, с7 е БХ, 7 = 1, 2, ..., п, то Ь(а) = Ь(с1) + Ь(с2) + . + ь(сп) + 1.

В частности, если / - 0-арный оператор, то Ь(/ = 1.

Для любого морфизма £- Би ^ БЖ положим

№и)).

иеи

Рассмотрим теперь множество М таких морфизмов у- Би ^ БЖ, что для некоторого морфизма ф- Би ^ БУ условие 1 выполнено, а условие 2 - нет. Наша задача - показать, что М = 0. Допустим, это не так. Выберем тогда в М элемент у с наименьшим значением Ь(у). Возможны два варианта: Ь(у) = 0 и ¿(у) > 0. Покажем, что оба варианта приводят к противоречию.

Рассмотрим первый вариант - Ь(у) = 0 - и докажем, что в этом случае условие у е М невозможно, т.е. если морфизм ф- Би ^ БЖ таков, что ф и у удовлетворяют условию 1, они удовлетворяют и условию 2.

Согласно определению Ь, равенство Ь(у) = 0 означает, что у(и) е Ж для всех и е и. Определим морфизм х- БЖ ^ БУ следующим образом: если w е Ж таково, что для любого и е и имеем у(и) Ф w, значение у^) можно выбрать произвольно, если же у(и) = w для некоторого и е и, положим у(^) = ф(и). Чтобы такое определение было бы корректным, нужно, чтобы при и], и2 е и, у(и1) = у(и2) имело бы место равенство ф(и1) = ф(и2). Докажем, что это так.

Пусть у(и1) = у(и2), ф(и1) Ф ф(и2). Согласно лемме 2, существует морфизм а- БУ ^ Б0 такой, что а(ф(и1)) Ф а(ф(и2)). Поскольку ф и у удовлетворяют условию 1 , должен найтись мор-физм в- БЖ ^ Б0 такой, что аф = ву. Но это невозможно, ибо а(ф(и0) Ф а(ф(и2)), в (ф(щ)) = в (ф(и2)).

Итак, мы можем построить морфизм х- БЖ ^ БУ так, что ху = ф. Таким образом, морфизмы ф и у удовлетворяют условию 2. Вариант Ь(у) = 0 невозможен.

Рассмотрим теперь вариант Ц(щ) > 0.

То, что щ е М, означает, что существует морфизм ф: 5и ^ SV такой, что ф и щ удовлетворяют условию 1, но не условию 2. Ниже мы построим множество и' с X, эпиморфизм

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/и: 5и ^ 5и' и морфизмы щ': 5и' ^ и ф': 5и' ^ SV такие, что а) щ = щ/, ф = ф/

Тогда морфизмы ф и щ' также будут удовлетворять условию 1 , но не условию 2. Действительно, пусть задан морфизм а: SV ^ 50. Поскольку ф и щ удовлетворяют условию 1, существует морфизм [в: ^ 50 такой, что аф = /Зщ. Тогда аф/и = вщ'и, откуда, в силу эпиморфности /, следует равенство аф = вщ\ и мы видим, что морфизмы ф и щ удовлетворяют условию 1 . Однако они не удовлетворяют условию 2. В самом деле, если б существовал морфизм х: ^ 5У, такой, что ф' = хщ', то были бы выполнены равенства ф = ф/ = хщ/ = хщ, и морфизмы ф и щ удовлетворяли бы условию 2, что противоречит выбору этих морфизмов.

SV

б) Дщ') < Ц(щ).

Б0

ЕЖ

FV

Еи Еи /

Поскольку Ь(у') < Ь(у), все это противоречит тому, что у -элемент М с наименьшим Ь(у).

Таким образом, для завершения доказательства нам осталось провести построение и' сX, ¡¡- Би ^ Би', у'- Би' ^ БЖ и ф'- Би' ^ БУ с указанными выше двумя свойствами. Для этого отметим сперва, что условие Ь(у) > 0 влечет условие Ь(у(и0)) > 0 для некоторого и0 е и. Это, в свою очередь, означает, что у(и0) ё X, т.е. у(и0) = /аи а2, ..., ат), / е О, а7 е БЖ, 7 = 1, 2, ..., т. Выберем произвольные иь и2, ..., ит- и, е X\U, и пусть и = и и (иь и2, ..., ит}\{и0}. Пусть ¡¡- Би ^ Би' - мор-физм, определяемый формулами ¡¡(и0) = /(щ, и2, ..., ит), ¡¿(и) = и для всех и е и, и Ф и0. Следствие из леммы 3 показывает, что так определенный морфизм ¡ является эпиморфизмом.

Определим теперь морфизм у'- Би' ^ БЖ формулами у(и7) = а7, у (и) = у(и) при и е и, и Ф и0. Тогда у = у'^. В самом деле,

у(щ) = /(аь а2, ..., ат) = АуХи), у'(и2), ..., у'(ит)) =

= у'(Ди:, и2, ..., ит)) = у'(и(и0)),

у(и) = у'(и) = у'(и(и)) при и Ф и0.

Для того чтобы построить морфизм ф'- Би ^ БУ, посмотрим, каким может быть ф(и).

Случай ф(и0) е У невозможен. Действительно, пусть ф(и0) = V е У. Поскольку ф(и0) ё Ж, согласно лемме 1 существует элемент с е Е0 такой, что в(у(и0)) Ф с при любом в- БЖ^ Б0. Определим а- БУ ^ Б0, положив а^) = с. Значение а на остальных переменных из У зададим произвольно. Тогда при любом в- БЖ^ Б0 имеем в(у(и0)) Ф с = = а^) = а(ф(и0)), т.е. ву Ф аф, что противоречит условию 1, выполненному для ф и у. Следовательно, ф(и0) = £(...), g е О.

Случай g Ф/ также невозможен, ибо в этом случае при любых а, в имеем а(ф(и0)) = g(...), в(у(и0)) =/(...), т.е. опять ву Ф аф.

Остается вариант ф(и0) = /(Ъь Ь2, ..., Ьт). Определим тогда ф'- ¥и' ^ ЕП формулами ф'(и7) = Ъ7, ф'(и) = ф(и) при и е и, и Ф и7, 7 = 1, 2, ..., т. Теперь ф = ф¡. Проверка этого полностью аналогична сделанной ранее проверке равенства у = у'^.

Осталось показать, что Д^') < Ь(цг). Имеем:

т т

¡=1 иеи,иФы0 ¡=1 иеи,иФы0

Ь(У) = Ь(У(и0 )) + £Ь(У(и)) = Ь(1 (а1' °2,---,ат )) +

иеи ,иФи о т

+ Т1Ш) = Т1(аг) +1 + ^Ь(У(и)),

иеП ,иФио ¡=1 иеП ,иФио

откуда Д^') = Д^)-1.

Этим завершено доказательство теоремы. □

5. Заключение

Предложенный автором в своих исследованиях теоретико-категорный язык, формализующий продукционные системы, позволяет создавать алгоритмы, манипулирующие знаниями, в весьма абстрактном виде, не зависящем от конкретного вида знаний. Однако полной универсальности достичь невозможно. Знания бывают весьма разнообразны, и необходима проверка того, насколько те или иные алгоритмы пригодны для работы с данным видом знаний. В частности, необходимо проверить, насколько точно категорное описание продукций характеризует их действие на ситуации.

Настоящая работа посвящена исследованию первого вопроса, который необходимо решить: насколько точно категорный язык подходит для исследования множеств ситуаций, описываемых образцами. В частности, насколько точно порядок на множестве образцов, описанный в категорных терминах, соответствует упорядоченности этих множеств по включению. В статье этот вопрос решен для частного случая категорий, соответствующих многообразиям универсальных алгебр с пустым множеством тождеств, но даже этот случай представляется важным, ибо такие категории встречаются в реальных системах представления знаний.

Литература

1. ЖОЖИКАШВИЛИ А.В. Монады для формализации процедуры сопоставления с образцом // Программирование. -2014. - №3. - С. 15-29.

2. ЖОЖИКАШВИЛИ А.В. Категорная технология создания и развития интеллектуальных систем, основанных на знании // Информационные процессы. - 2016. - Том 16, №4. -С.312-332.

3. МАКЛЕИН С. Категории для работающего математика. -М.: Физматлит, 2004.

4. BAADER F. Unification Properties of Commutative Theories: A Categorical Treatment // Proc. of the Conference on Category Theory and Computer Science - 1989. Lecture Notes in Computer Science. - Vol. 389. - P. 273-299.

5. BAADER F., MORAWSKA B. Unification in the Description Logic EL// Logical Methods in Computer Science. - 2010. -Vol. 6 (3:17). - P. 1-31.

6. BAADER F., NUTT W. Basic description logics. The description logic handbook. - Cambridge Univ. Press, Cambridge, 2003. - P. 43-100

7. BAADER F., SERTKAYA B., TURHAN A.-Y. Computing the least common subsumer w.r.t. a background terminology // J. Appl. Log. - 2007. - Vol. 5, No. 3. - P. 392-420.

8. BAADER F., SNYDER W. Unification Theory // In: Handbook of Automated Reasoning / Eds.: J.A. Robinson, A.Voronkov. -Vol. I. - Elsevier Science Publishers, 2001. - P. 447-533.

9. EDER E. Properties of substitutions and unifications // J. of Symbolic Computations. - 1985. - Vol. 1. - P. 31-46.

10. GRÀTZER G. Universal Algebra. 2nd edition. - Springer, 2008. - 585 p.

11. STEFANUK V.L., ZHOZHIKASHVILI A.V. Productions and rules in artificial intelligence // KYBERNETES, The International Journal of Systems & Cybernetics. - MCB University Press, 2002. - P. 817-826.

THE EQUIVALENCE OF THE TWO ORDERINGS OF A SET OF MORPHISMS WITH A COMMON DOMAIN

Alexander Zhozhikashvili, Institute for Information Transmission Problem of RAS, Moscow, Cand.Sc. (zhozhik@iitp.ru).

Abstract: In previous works, the author proposed a mathematical language for describing the rules in artificial intelligence. A single production acts over a set of situation, taking one situation as a source and generating the another situation as the result of its application. The concept of pattern for a generalized description of similar situations is important in this theory. Both the situation and the pattern are coded in the proposed language by morphisms of the appropriately chosen category. Samples can be ordered by a degree of generality. Two methods of such ordering could be considered. We can assume that the first pattern is more general than the second one if the second can be obtained by specifying the first. We also can assume that the first pattern is more general than the second if each situation, suitable for the first pattern, is suitable for the second one. These two ways of ordering are close but not identical. The reformulation of these two definitions in the language of a category theory leads to the mathematical problem of comparing of two ways of ordering a certain set of morphisms. An article is devoted to an investigation of this problem.

Keywords: pattern matching, production system, category theory, universal algebra.

Статья представлена к публикации членом редакционной коллегии Э.Ю. Калимулиной.

Поступила в редакцию 18.01.2017.

Опубликована 31.03.2018.

i Надоели баннеры? Вы всегда можете отключить рекламу.