УДК 004.82
ЛОГИКИ С ВЕКТОРНОЙ СЕМАНТИКОЙ КАК СРЕДСТВО ВЕРИФИКАЦИИ БАЗ ЗНАНИЙ
12 3
Л.В. Аршинский , А.А. Ермаков , М.С. Нитежук
Иркутский государственный университет путей сообщения, Иркутск, Россия 1 [email protected], 2 [email protected], 3 [email protected]
Аннотация
Обсуждаются общие вопросы автоматизированного поиска артефактов в продукционных базах знаний на основе логик с векторной семантикой в варианте К^-логик. Рассматриваются случаи ложности антецедента продукции при всех допустимых значениях истинности входных посылок, наличие нигде не используемых терминов и генерирование неопределённых значений истинности, появление противоречий. Алгоритмизация рассматривается как организация прямого присоединённого логического вывода, вскрывающего артефакты баз знаний. Первые два случая выявляются подсчётом числа срабатываний каждой продукции и выявлением терминов, не привязанных к продукциям. Противоречие обнаруживается выводом с проверкой истинности заключений-гипотез. Наличие заключения с истинностью (1; 1) (полное противоречие) сигнализирует о противоречии на одном из этапов рассуждений, который устанавливается обратной трассировкой логической цепочки. Необходимым этапом вывода является объединение свидетельств с использованием 11-композиции (второй формы дизъюнкции в многозначной К^-логике). Приведены: принцип расчёта истинности заключения на основе истинности посылок, стратегии объединения свидетельств, числовые меры, которые могут использоваться в ходе вывода.
Ключевые слова: база знаний, верификация, противоречия, логики с векторной семантикой.
Цитирование: Аршинский, Л.В. Логики с векторной семантикой как средство верификации баз знаний / Л.В. Аршинский, А.А. Ермаков, М.С. Нитежук // Онтология проектирования. - 2019. -Т. 9, №4 (34). - С.510-521. - DOI: 10.18287/2223-9537-2019-9-4-510-521.
Введение
Знаниевое моделирование сегодня - один из основных способов описания трудноформа-лизуемых предметных областей (ПрО). Не обладая сопоставимой с традиционным математическим моделированием предсказательной силой, неся в себе существенную долю субъективизма, оно, тем не менее, применимо всюду, где возможно человеческое суждение. Это делает его универсальным, хотя и ограниченным по возможностям инструментом описания любых выразимых словами сущностей. Несмотря на известную критику (см. напр. [1, 2]), альтернативы им пока не видно. Если традиционные математические (и не только) модели отражают свойства и отношения непосредственно ПрО, знаниевые модели отражают представление эксперта о ней. Это отдаляет их от исходного предмета, но позволяет использовать там, где другие подходы невозможны или малопригодны.
Сегодня известно несколько основных подходов к знаниевому моделированию. Каждый из них опирается на соответствующую модель знаний: сетевой, логический, продукционный, фреймовый [3]. Продукционный подход наиболее удобен в силу своей внешней простоты, модульности, «понятности» для человека. Он позволяет гибко перенастраивать модель, вводить в неё новые сущности и единицы знаний, хорошо подходит для организации (логического) вывода. Продукционное моделирование по своим выразительным возможностям со-
поставимо с универсальными алгоритмическими моделями [4]. В то же время знаниевые модели, имеющие вид баз знаний (БЗ), особенно логические и продукционные, могут нести в себе артефакты, снижающие или вовсе обнуляющие их ценность [5]. Появление таких артефактов может быть обусловлено субъективным характером моделей, результатом технических ошибок, иными причинами. В любом случае необходимо предусматривать проверки соответствующих БЗ на полноту, достоверность, непротиворечивость и иные «не-факторы» [6, 7], или хотя бы уверенно учитывать их с помощью соответствующих процедур. Причём, принимая во внимание большие размеры возможных БЗ, такие проверки должны по возможности проходить в автоматическом или автоматизированном режиме.
На сегодняшний день используются два основных подхода к продукционным моделям: на основе классической логики и на основе нечётких логик и множеств. Классическая логика плохо приспособлена для работы с указанными артефактами. Используемые в ней знания и факты должны быть строгими, точными, достоверными. Работая в категориях Истины и Лжи, она не допускает неполноты и противоречивости данных и знаний. Источникам данных приходится доверять или отвергать их, что затрудняет её использование в реальных ПрО.
Нечёткая логика лучше приспособлена для работы в реальной обстановке, когда сведения поступают из разных источников, могут противоречить друг другу, быть недостаточными, иметь разную степень достоверности и т.п. Последнее обусловлено более сложным представлением истинности. Вместо множества {0, 1} - {Ложь, Истина}, здесь используются её степени от 0 до 1 в виде рациональных дробей, лингвистических термов или просто отрезка [0, 1], либо его аналогов: [-1, 1], [-100, 100], [0, 100] и т.п. Это позволяет выразить сомнение в тех или иных сведениях, учитывать их неполноту, работать с противоречиями. Но и такая формализация ограничена и не позволяет, например, отличить неполноту сведений от их противоречивости. В обоих случаях истинность представляется числом 0.5 (всюду далее пользуемся отрезком [0, 1]), что обусловлено известным соотношением:
(1) |И + M = 1,
где a - некоторое суждение, ||.. .|| - его истинность, «—i» - символ отрицания.
Та же ситуация и при использовании теории вероятности - ещё одного популярного способа формализации правдоподобных рассуждений [8, 9].
Несколько лучше обстоят дела, когда точка заменяется отрезком [ 10] или строгое равенство (1) неравенством:
||a|| + |—a|| < 1,
как в теории свидетельств Г. Шафера [11].
В работах [12, 13], благодаря использованию теории логик с векторной семантикой, истинность представлена вектором с произвольным (в общем случае) числом компонентов: ||a|| = (a1; a2;...; a"), a1 g [0, 1]. Значение каждого компонента определяется своим комплексом свидетельств (истинность в этом смысле здесь конструктивна). Позиции компонентов в векторе называются аспектами истинности, а их значения - значениями этих аспектов. Главная особенность таких логик - в полном снятии требований непротиворечивости и исключенного "-го: компоненты принимают значения независимо друг от друга, и сколько бы ни было аспектов, всегда можно предполагать наличие (" + 1)-го, который проецируется в начало координат.
Наиболее изученным подклассом данных логик стала К^-логика, в которой вектор истинности произвольного суждения a имеет два компонента: (a+; a~). Значение первого компонента (Истина) - определяется свидетельствами подтверждающими, а второго (Ложь) -опровергающими a [12]. Именно этот вид логик предлагается использовать для верификации знаниевых моделей.
1 Логики с векторной семантикой как основа верификации
В логиках с векторными семантиками отсутствие сведений об изучаемых объектах формализуется вектором <0;...; 0), а противоречие есть ситуация, когда компоненты логически исключают друг друга и при этом хотя бы два из них отличны от нуля. Каждый компонент формируется свидетельствами в его пользу. Недоверие к источникам, их ненадёжность приводят к значениям компонентов меньше единицы. Единица означает абсолютное доверие. С абсолютным доверием можно отнестись, в том числе, и к противоречащим друг другу источникам, что порождает вектор вида <1;.; 1). То есть источник противоречия видится в разноречивости свидетельств.
В К1Р-логиках предельные случаи выражаются векторами <0; 0) и <1; 1). В [14] представлен интервальный вариант таких логик, когда значения компонентов являются подынтервалами отрезка [0, 1]. Компоненты в векторе делятся на позитивные и негативные. В частно-
TF
сти, для V аспект Истина позитивный, аспект Ложь - негативный. Рост позитивного аспекта означает рост уверенности суждения реальности, рост негативного - её снижение.
Верификация означает организацию логического вывода, выявляющего ситуации, близкие к неопределённости <0;.; 0) или полному противоречию <1;.; 1) при тех или иных сочетаниях истинности входных фактов. Самое полезное здесь - это способность таких логик работать с ситуациями, близкими к неопределённости или полному противоречию, так же естественно, как со строгой истиной или строгой ложью. Под последними понимаются суждения, в которых все позитивные компоненты равны единице, а все негативные - нулю: строгая истина <1; 0) и строгая ложь <0; 1 ).
Вывод в подобных логиках носит присоединённый характер, когда каждый шаг вывода сопровождается расчётом истинности заключения на основе истинности посылок [8, 15] и осуществляется на основе правила modus ponens с шагом в виде [12]:
(2) a, a^b |- b: ||b|| = ||a &/||^||—av/||,
где ||...|| - истинность суждения, через двоеточие указана схема расчёта истинности заключения на основе истинности посылок, i = a^b - импликация «если a, то b», «&» - конъюнкция (01-композиция), «v» - дизъюнкция (10-композиция); знак « |-» отделяет посылки от заключения, знак «^» использован для обозначения диапазона векторов истинности:
(3) ||b|| = <[a+*i'+, a~®i+]; [а*Г, а®Г\).
Здесь для VTF-логик истинность конъюнкции и дизъюнкции (точнее, первых форм конъюнкции и дизъюнкции, которые в случае строгой истины и строгой лжи совпадают с конъюнкцией и дизъюнкцией в обычном смысле [12]) определяются как
||a&b|| = <a+*b+; a"®b"), ||avb|| = <a+®b+; a"*b"),
где • - триангулированная норма (t-норма), а ® - триангулированная ко-норма (s-норма) в инфиксной записи. Данные нормы определяются аксиомами [16, 17] (x, y е [0, 1]):
1) x*y = y*x;
2) x*(y*z) = (y*x)*z;
3) x*y1 < x*y2 если и только если y1< y2;
4) x* 1 = x. Аналогично:
1) x®y = y®x;
2) x®(y®z) = (y®x)®z;
3) x®y1 < x®y2 если и только если y1< y2;
4) x®0 = x.
ТР
Для перехода от V к классической логике при строго истинных и строго ложных суждениях от них дополнительно требуется выполнимость свойств [12]:
1) х.у = 1-(1-х)Ф(1-у);
2) хФу = 1-(1-х).(1-у).
Из аксиом вытекает, в частности, что:
(4) х*0 = 0 и хФ1 = 1.
Известными примерами норм выступают х*у = ху и хФу = х+у-ху, а также х*у = ш7п(х,у) и хФу = шах(х,у) [17, 18].
В случае логик с произвольным числом компонентов ¿-норма для первой формы конъюнкции используется для позитивных, ¿-норма - для негативных компонентов. Для первой формы дизъюнкции - наоборот [13].
Поскольку для верификации, как правило, достаточно пользоваться категориями Истины
ТР
и Лжи, далее применяются только V -логики.
В антецедентах больших посылок естественно-языковые связки И, ИЛИ формализуются, соответственно, первыми формами конъюнкции и дизъюнкции, а связка НЕ - отрицанием в форме перестановки: ||—а|| = <а"; а+).
2 Логический вывод и верификация
В качестве основы верификации принят логический вывод в ^Р-логиках.
Если обе посылки строго истинны или близки к этому, то позитивный компонент близок к 1, негативный к 0. Согласно (2), (3) это условие формирует множество значений вектора истинности в прямоугольнике [а+*7+,а~Ф7+]х[а+*7~,а~Ф7~], который при стремлении истинности посылок к <1; 0) (строгая истинность) стягивается в точку [1, 1]х[0, 0]. То есть истинные посылки влекут истинное заключение. Если БЗ не содержит внутренних дефектов, эта ситуация должна наблюдаться для любых допустимых значений истинности входных данных.
Ситуация меняется, когда знаниевая модель содержит артефакты. В данном случае это означает попадание на вход логического вывода (2) ложных, неопределённых или противоречивых утверждений. Возможны следующие варианты ситуации.
I. Одна из посылок ложная или строго ложная: <0; 1). При строго ложной малой посылке согласно (2) и (3) получаем: ||6|| = <[0*7+, 1Ф7+]; [0*Г, 1ФГ]) = <[0, 1]; [0, 1]).
Областью возможных значений вектора истинности заключения становится весь квадрат [0,1]х[0,1], что делает значение ||6|| максимально размытым и неточным. В этом смысле энтропия истинности здесь максимальна.
При строго ложной большой посылке значение истинности заключения попадает в область, близкую строгой лжи: ||6|| = <[а+*0, а~Ф0]; [а+*1, а"Ф1]) = <[0, а"]; [а+, 1]).
Таким образом, если ложность малой посылки делает истинность заключения неизвестной, ложность большой порождает ложь в заключении.
II. Одна из посылок неопределённа: <0; 0). Также рассмотрим неопределённость отдельно малой и большой посылок. Для малой посылки получается:
||6|| = <[0*7+, 0Ф7+]; [0*Г, 0ФГ]) = <[0, /+]; [0, 7-]). Неопределённость малой посылки помещает вектор истинности заключения в область [0, 7]х[0, 7~]. Размер и границы этой области задаются вектором ||7||.
При неопределённости в импликации получаем:
||6|| = <[а+*0, а"Ф0]; [а+*0, а"Ф0]) = <[0, а"]; [0, а"]).
Иначе говоря, областью истинности вектора ||6|| оказывается квадрат со сторонами [0, а~]х[0, сГ]. Если малая посылка строго истинная или близка к таковой, неопределённость большой посылки порождает неопределённость заключения (вектор ||6|| расположен около точки <0; 0)). Если же она строго ложная, приходим к уже известному квадрату [0, 1]х[0, 1] (рисунки 1 и 2).
Неопределённость и малой, и большой посылок приводит к неопределённости в заключении. При этом при высокой степени правдоподобия малой посылки неопределённость, порождаемая большой посылкой, существенна.
0
1
0
1
Рисунок 1 - Области неопределённости (А) и противоречивости (В) при неопределённости и противоречивости малой посылки
Рисунок 2 - Области неопределённости (А) и противоречивости (В) при неопределённости и противоречивости большой посылки
III. Одна из посылок противоречива: (1; 1). Если это малая посылка, то: ||Ъ|| = ([1./+, 10/'+]; [1./-, 10/-]) = ([/+,1]; [/-,1]). Это область [/'+, 1]х[Г, 1] - относительно близкая к (1; 1) (точнее, к [1, 1]х[0, 1]).
Если противоречива посылка большая: ||Ъ|| = ([a+, 1]; [a+, 1]). То есть при достаточно достоверной малой посылке вновь получается область, близкая к (1; 1) (рисунки 1 и 2). Если же она строго ложная или близкая к таковой - весь или почти весь квадрат [0, 1]х[0, 1].
Таким образом, противоречивость как малой, так и большой посылок приводит к противоречивости заключения.
Для количественного определения величины определённости, противоречивости, неопределённости, строгости и т.д. разработаны соответствующие числовые меры [12, 18].
Мера определённости (определённость): /(Ъ) = Ъ+ 0 Ъ- где /(Ъ)е[0, 1]. Данный показатель характеризует степень «удалённости» ||Ъ|| от (0; 0). Он равен 0, если ||Ъ|| = (0; 0) и равен 1, когда хотя бы один из компонентов вектора истинности есть 1.
Мера противоречия (противоречивость): /п(Ъ) = Ъ+ • Ъ~, где /п(Ъ)е[0, 1]. Данный показатель характеризует близость Ъ к (1; 1). Он равен единице для (1; 1) и нулю, когда хотя бы один из компонентов вектора ||Ъ|| есть ноль.
Мера строгости (строгость): /(Ъ) = /(Ъ) - /п(Ъ) = Ъ+0Ъ~ - Ъ+*Ъ", где /(Ъ)е[0, 1]. Назначение этого показателя - оценивать, насколько ||Ъ|| близко к (1; 0) или (0; 1). Он достигает максимума 1, когда ||Ъ|| = (1; 0), или ||Ъ|| = (0; 1) и минимума 0, когда ||Ъ|| = (0; 0), или ||Ъ|| = (1; 1).
+
+
a
Мера достоверности (достоверность): /д(Ъ) = Ъ+ - Ъ~, где /д(Ъ)е[-1, 1]. Показатель принимает значение 1 для строго истинных и -1 для строго ложных суждений. Содержательно данный показатель близок к предыдущему, однако позволяет определить не просто близость ||Ъ|| к <1; 0) или <0; 1), но уточнить конкретный случай. На его основе можно сформировать ещё один вариант меры строгости: /(Ъ) = |/д (Ъ)| = |Ъ+ - Ъ"|.
Мера избыточности (избыточность): /и(Ъ) = Ъ+ + Ъ~ - 1. Показатель равен -1 для неопределённости и 1 для полного противоречия. Это - своеобразный аналог показателя достоверности для оси «Неопределённость-Противоречие». Равенство 0 здесь означает выполнение соотношения Ъ~ = 1 - Ъ+, характерного для нечётких логик. Позитивные и негативные свидетельства в этом случае «сбалансированы». Нулевой баланс существует, в частности, когда отсутствие свидетельств «за» рассматривается как свидетельство «против», а отсутствие свидетельств «против» - как свидетельство «за». Это типично для нечётких логик.
Абсолютное значение избыточности рассматривается как мера логического дисбаланса суждения Ъ (степень нарушения соотношения «логического баланса» Ъ+ + Ъ~ = 1):
/дис(Ъ) = |Ъ+ + Ъ~ - 1|.
Показатель равен 0 для классической и нечёткой логик и стремится к единице, если суждение становится в значительной степени противоречивым или неопределённым.
При интервальном представлении вектора истинности показатели можно рассчитывать относительно центра прямоугольной фигуры как репрезентативного значения вектора ||Ъ||. Причём для прямоугольника [Ъ\; Ъ 2]х[Ъ_1; Ъ~2] можно ввести меру точности определения вектора согласно формуле:
/Ъ) = 1 - sqrt([(Ъ+2 - Ъ+1)2 + (Ъ"2 - Ъ"02] / 2).
Когда область возможных значений вектора охватывает весь квадрат [0, 1]х[0, 1], эта мера равна нулю, когда стягивается в точку - единице. Величину:
^Ъ) = sqrt([(Ъ+2 - Ъ+1)2 + (Ъ~2 - Ъ"02] / 2) можно рассматривать как своеобразный показатель энтропии истинности суждения Ъ при интервальных значениях ||Ъ||.
3 Методы верификации
Главное предположение - артефакты знаниевой модели есть результат её структуры, но не истинностных значений посылок; последствия артефактов проявятся при любых допустимых значениях истинности стартовых (входных) посылок, вовлекших артефакт в процесс логического вывода.
К последствиям артефактов относятся:
I. Неучастие единицы знаний в выводе при всех (допустимых) значениях истинности входных посылок.
II. Неопределённость заключения при некоторых (допустимых) значениях истинности входных посылок и наличие нигде не используемых терминов.
III. Противоречивость заключения при некоторых (допустимых) значениях истинности входных посылок.
Верифицировать в данном случае - это установить, что при допустимых значениях истинности входных посылок ситуации I-III не возникают.
В разделе 2 показано, что ложь, неопределённость и противоречие импликаций порождают аналогичные последствия в заключениях. Можно сразу исключить такие единицы зна-
ний из обсуждения, тем более, что разработчики БЗ вряд ли станут их вводить1. Источником проблем будут конфликты единиц знаний и входных данных, приводящие к ложным, неопределённым, противоречивым или близким к этому заключениям на разных этапах вывода. Вопрос верификации есть вопрос организации вывода, который вскроет артефакты.
Если активизировать только продукции со строго истинным антецедентом, «плохие» продукции никогда не активизируются. Следовательно, соответствующие артефакты можно выявить простым подсчётом числа активаций продукций при переборе всех допустимых значений входных посылок. Продукции с нулевым числом срабатываний могут быть исключены из БЗ как дефектные либо избыточные.
Появление неопределённости <0; 0) в ходе вывода в первую очередь связывается с обрывом цепочек рассуждений. В условиях, когда на вход подаются только строго истинные или строго ложные суждения, обрыв возникает исключительно тогда, когда антецедент правила строго ложен. Это возвращает к предыдущему случаю. Соответствующая продукция не срабатывает, и её консеквент остаётся неопределённым. Вывод при этом можно не останавливать, на выходе получается та же неопределённость, после чего обратной трассировкой можно выяснить источник проблемы. Однако представляется, что эффективнее будет его остановить по условию низкого значения меры определённости /ло(Ъ). Если такое же требование ввести и для достоверности - останов при малом значении меры достоверности /лд(Ъ), - то оба случая укладываются в следующую схему:
1) объявить все продукции строго истинными (запомнив, при необходимости, первоначальные значения их истинности, выставленные экспертами);
2) выставить значения истинности входных посылок в одну из допустимых комбинаций <1; 0) или <0; 1 ), а истинность промежуточных и терминальных заключений в <0; 0);
3) возвращаясь к шагу 2, выполнить прямой логический вывод, перебирая все допустимые значения истинности входных посылок в виде комбинаций строгой истины и строгой лжи и подсчитывая число срабатываний каждой продукции;
4) при обнаружении продукций с нулевым числом срабатываний переработать их или удалить из БЗ;
5) вернуть исходные значения истинности оставшихся продукций;
6) КОНЕЦ.
Сложнее ситуация с противоречиями. Выявление противоречий опирается на отмеченное в разделе 2 свойство вывода в V -логиках: перенос противоречия из посылки в заключение. Это означает, что если в ходе рассуждений истинность некоторого промежуточного заключения примет противоречивое значение, эта особенность пройдёт через весь последующий вывод и проявится в истинности терминальных утверждений - гипотез. Появление этих особенностей - сигнал о неблагополучии в БЗ. Обратной трассировкой вывода можно найти и его источник - артефакт. Алгоритм может выглядеть так:
1) объявить продукции строго истинными (запомнив значения истинности, выставленные экспертами);
2) выставить значения истинности входных посылок в одну из допустимых комбинаций <1; 0) или <0; 1 ), а истинность промежуточных и терминальных заключений (гипотез) в
<0; 0);
3) выполнить прямой логический вывод, получив истинность заключений (гипотез);
4) проверить истинность заключений на допустимость;
5) если заключение недопустимо (вектор истинности равен <1; 1 )), то:
1 На практике подобные единицы знаний могут быть введены в БЗ как непреднамеренно, так и преднамеренно. Прим. ред.
5.1) выполнить обратную трассировку вывода для выяснения источника проблемы -артефакта БЗ;
5.2) устранить артефакт (или внести его в соответствующий список);
5.3) вернуться к шагу 2;
6) если не все возможные входные значения посылок проверены, то вернуться к шагу 2;
7) вернуть исходные значения истинности продукций;
8) КОНЕЦ.
Противоречивость того или другого утверждения формируется, когда, например, две цепочки вывода приходят к двум взаимоисключающим результатам: Ь и —Ь. Противоречие <1; 1) в этом случае - результат обязательной для такого вывода процедуры объединения свидетельств. Нигде не используемые термины обнаруживаются отсутствием привязки к продукциям. Данное обстоятельство вскрывается также обратной трассировкой от гипотез к входным фактам. Не используемые термины не попадают ни в одну из потенциальных цепочек вывода.
4 Объединение свидетельств как часть логического вывода
Объединение свидетельств - важнейшая составляющая присоединённого правдоподобного вывода [19]. Его цель - объединение истинностных значений суждения, полученного по разным цепочкам вывода. В том числе, когда по одной из цепочек получено заключение Ь, а по другой — Ь (противоречие). Рассматриваются понятия 10-, 01-, 11- и 00-композиций в V -логиках.
10-композицией называется суждение, образованное из Ь1 и Ь2 с вектором истинности <Ь1ФЬ2+; Ь1*Ь2). Своими свойствами она повторяет классическую дизъюнкцию и потому называется также первой формой дизъюнкции: ||Ь^Ь2|| = <Ь1+ФЬ2+; Ь1+*Ь2+).
01-композицией называется суждение, образованное из Ь1 и Ь2 с вектором истинности <Ь1*Ь2+; Ь1ФЬ2 ). Она соответствует классической конъюнкции и названа первой формой конъюнкции: ||Ь1&Ь2|| = <Ь1+*Ь2+; Ь1+ФЬ2+).
11-композицией называется суждение, образованное из Ь1 и Ь2 с вектором истинности <Ь1ФЬ2+; Ь1ФЬ2). Аналогов в классической и нечёткой логике эта связка не имеет. Она названа второй формой дизъюнкции: ||Ь^2Ь2|| = <Ь1+ФЬ2+; Ь1+ФЬ2+).
00-композицией называется суждение, образованное из Ь1 и Ь2 с вектором истинности <Ь1*Ь2+; Ь1*Ь2). В классической и нечёткой логике данная связка тоже не имеет аналогов. Она названа второй формой конъюнкции: ||Ь1&2Ь2|| = <Ь1+*Ь2+; Ь1+*Ь2+).
Если первые формы дизъюнкции и конъюнкции соответствуют связкам ИЛИ и И в обычном смысле, то вторые формы - это связки ИЛИ и И в информационном смысле: они дают рост как позитивного, так и негативного компонентов для ИЛИ и некое минимальное гарантированное значение этих компонентов для И.
В случае и-мерного вектора истинности вторая форма дизъюнкции - это ¿-норма Ф для всех компонентов вектора, в случае второй формы конъюнкции - ¿-норма • также для всех компонентов вектора истинности. С учётом этих особенностей ^Р-логики имеют богатый арсенал способов объединения. В частности, рассматриваются следующие стратегии [20]: 1) объединение по схеме 10/11 -композиции - стратегия нарастающего доверия. Векторы ||Ь|| и ||—Ь|| объединяются по-отдельности по правилу 10-композиции (дизъюнкции). После того, как объединены все свидетельства в пользу Ь и все свидетельства в пользу —Ь, векторы ||Ь|| и ||—Ь|| складываются в единый вектор по правилу 11-композиции. Доверие к Ь возрастает по мере получения утвердительных доказательств факта, доверие к —Ь - по
мере вывода его отрицаний. Наличие «сильных» доказательств того и другого ведёт к противоречию в Ъ.
2) объединение по схеме 01/00-композиции - стратегия нарастания недоверия. Свидетельства в пользу Ъ и свидетельства в пользу —I Ъ объединяются по-отдельности на основе 01-композиции (конъюнкции). После объединения всех свидетельств оба результирующих вектора объединяются по правилу 00-композиции. В результате доверие и к Ъ, и к — Ъ будет тем меньше, чем менее убедительны соответствующие свидетельства. Общий результат даёт гарантированный минимум доверия к факту и его отрицанию, определяемый худшими из подтверждающих и опровергающих свидетельств.
3) объединение по схеме 11-композиции - стратегия полного доверия. Доверяют «без разора» и подтверждающим, и опровергающим свидетельствам. Вариант стратегии нарастающего доверия, но здесь быстрее растёт степень противоречивости факта.
4) объединение по схеме 00-композиции - стратегия полного недоверия. Доверяют «худшим» из подтверждающих и опровергающих свидетельств. Вариант стратегии нарастающего недоверия, но здесь быстрее растёт степень неопределённости факта. В итоге это может привести к неопределённому <0; 0) восприятию факта: «не верю ни чему».
5) объединение по схеме 10-композиции - стратегия безудержного оптимизма. Всё решают свидетельства в пользу Ъ.
6) объединение по схеме 01 -композиции - стратегия безудержного пессимизма. Всё решают свидетельства в пользу —Ъ.
7) объединение по правилу среднего (арифметического, геометрического и т.д.) - стратегия осторожной веры. Свидетельства «за» и «против» усредняются.
Для заявленной цели наиболее подходящими являются стратегии «нарастающего доверия» - 1 и «полного доверия» - 3. И тот и другой подходы при получении заключений Ъ и —Ъ генерируют вектор истинности <1; 1 ). Например, если по некоторой ветви вывода получено заключение Ъ с истинностью ||Ъ|| = <1; 0), а по другой — Ъ также с истинностью ||—Ъ|| = <1; 0), то объединение на основе 11-композиции даёт (с учётом, что ||—Ъ|| = <Ъ- Ъ)) полное противоречие: ||Ъ|| = <100; 001) = <1; 1).
Принимая во внимание свойство противоречия в посылке генерировать противоречие в заключении, следует сделать вывод, что противоречивым оказывается и терминальное утверждение - гипотеза. Это - сигнал о противоречии в БЗ, и необходимо обратиться к алгоритму, приведённому в разделе 3.
Заключение
В работе рассмотрены общие вопросы формализации поиска артефактов в продукцион-
TF
ных БЗ на основе логик с векторной семантикой в варианте V -логики. Алгоритмизация рассматривается как организация прямого присоединенного логического вывода, вскрывающего артефакты БЗ. Рассмотрены три случая обнаружения артефактов БЗ.
I. Ложность антецедента какой-либо продукции при всех допустимых значениях истинности входных посылок, что приводит к обрыву цепочки вывода и неиспользованию соответствующей продукции.
II. Неопределённое значение истинности <0; 0) консеквента продукции при тех или иных допустимых значениях истинности входных посылок, что также влечёт неиспользованием продукции.
III. Появление противоречия в выводе в виде вектора истинности <1; 1) на одном из шагов рассуждений.
Первые два случая предложено обнаруживать подсчётом числа срабатываний каждой продукции. Продукция с нулевым количеством срабатываний является подозрительной на артефакт. Для выявления неактивных единиц знаний рекомендуется останавливать вывод не только по условию ложности, но и по условию неопределённости антецедента продукции, для чего использовать меры достоверности и определённости.
Третий случай выявляется выводом с проверкой истинности заключений - гипотез. Наличие заключения с истинностью <1; 1) (полное противоречие) сигнализирует о противоречии на одном из этапов рассуждений. Так как противоречие в посылках порождает противоречие в заключении, обратная трассировка вывода позволяет обнаружить момент и причину появления противоречия, указывая артефакт. Необходимым этапом такого вывода является объединение свидетельств с использованием 11-композиции (второй формы дизъюнкции).
Список источников
[1] Макаренко, С.И. Интеллектуальные информационные системы: учеб. пособие / С.И. Макаренко. - Ставрополь: СФ МГТУ им М.А. Шолохова, 2009. - 206 с.
[2] Marcot, B. Testing your knowledge base / B. Marcot // AI Expert. - 1987. - August. - P. 43-47.
[3] Гаврилова, ТА. Базы знаний интеллектуальных систем / Т.А. Гаврилова, В.Ф. Хорошевский. - СПб: Питер, 2000. -384 с.
[4] Post, E.L. Formal Reductions of the General Combination Decision Problem / E.L. Post // American Journal of Mathematics. - 1943. - V. 65. - P. 197-215.
[5] Рыбина, Г.В. Основы построения интеллектуальных информационных систем / Г.В. Рыбина. - М.: Финансы и статистика, ИНФРА-М, 2010. - 432 с.
[6] Нариньяни, А.С. Недоопределённые модели и операции с недоопределёнными значениями / А.С. Нариньяни. - Препринт ВЦ СО АН СССР № 400, 1982.
[7] Нариньяни, А.С. Недоопределённость в системах представления и обработки знаний / А.С. Нариньяни // Изв. АН СССР. Техн. кибернетика/ - 1986. - № 5. - С. 3-28.
[8] Искусственный интеллект. В 3-х кн. Кн. 2 Модели и методы: Справочник / Под ред. Д.А. Поспелова. - М.: Радио и связь, 1990. - 304 с.
[9] Giarratano, J.C. Expert Systems: Principles and Programming / J.C. Giarratano, G.D. Riley. 4th ed. Course Technology. Boston: PWS Publ. Co, 2004 (Russ. ed.: Moscow, Williams Publ., 2007. - 1152 p.
[10] Quinlan, J.R. INFERNO: a causations approach to uncertain inference / J.R. Quinlan // The computer J. - 1983. -V. 26, No. 3. - P.255-269.
[11] Shafer, G. A Mathematical Theory of Evidence / G. Shafer. - Princeton and London: Princeton University Press, 1976. - 297 p.
[12] Аршинский, Л.В. Методы обработки нестрогих высказываний / Л.В. Аршинский. - Иркутск. Изд-во Восточно-Сибирского института МВД России, 1998. - 40 с.
[13] Аршинский, Л.В. Векторные логики: основания, концепции, модели / Л.В. Аршинский. - Иркутск: Иркут. гос. ун-т, 2007. - 228 с.
[14] Аршинский, Л.В. Интервальное оценивание истинности в системах автоматизированных рассуждений на основе К^-логик / Л.В. Аршинский // Идентификация систем и задачи управления: Труды IV международной конференции SICPR0'05. - М.: ИПУ РАН им. В.А. Трапезникова, 2005. - С. 1061-1074.
[15] Хачатрян, А.Р. Анализ классических методов объединения свидетельств в экспертных системах / А.Р. Хачатрян // Изв. АН СССР. Техн. кибернетика. - 1987. - № 5. - С. 67-73.
[16] Menger, K. Statistical metrics / K. Menger // Proc. Nat. Acad. Sci. USA. - 1942. - No. 8. - P. 535-537.
[17] Gottwald, S. Treatise on Many-Valued Logics / S. Gottwald. - Leipzig, 2000. - 604 p.
[18] Аршинский, Л.В. Содержательный и формальный вывод в логиках с векторной семантикой / Л.В. Аршинский // Автоматика и телемеханика. - 2007. - № 1. - С. 153-162.
[19] Нечёткая логика в моделях управления и искусственного интеллекта / Под ред. Д.А. Поспелова. М.: Наука. Гл. ред. физ.-мат. лит., 1986. - 312 с.
[20] Аршинский, Л.В. Особенности работы машины вывода системы моделирования правдоподобных рассуждений «Гераклит» / Л.В. Аршинский // Информационные и математические технологии в науке и управлении. - 2016. - №2. - С.18-29.
LOGIC WITH VECTOR SEMANTIC
AS A MEANS OF KNOWLEDGE BASES VERIFICATION
L.V. Arshinskiy1, A.A. Ermakov2, M.S. Nitezhuk3
Irkutsk State Transport University, Irkutsk, Russia
1 [email protected], 2 [email protected], 3 [email protected] Abstract
The paper discusses the general issues of automated search of artifacts in rule-based knowledge bases (KB) based on logic with vector semantics in the VTF-logic variant. Cases of falsity of antecedent of rules at all admissible values of truth of input premises, existence of terms which are not used anywhere and generation of uncertain values of truth, emergence of contradictions are considered. Automation is considered as the organization of the direct attached logical inference opening artifacts of KB. The first two cases are identified by counting the number of each rule triggering and identifying terms that are not tied to the rules. The contradiction is revealed by the verification of the truth of the conclusions-hypotheses. The presence of a conclusion with truth (1; 1) (complete contradiction) signals a contradiction at one of the stages of reasoning, which is set by the back trace of the logical chain. A necessary stage of inference is to combine the evidence using 11-composition (the second form of disjunction). The paper also presents the principle of calculating the truth of the conclusion based on the truth of the premises, the strategy of combining evidence, numerical measures that can be used in the conclusion.
Key words: knowledge base, verification, contradictions, logic with vector semantics
Citation: Arshinskiy LV, Ermakov AA, Nitezhuk MS. Logic with vector semantic as a means of knowledge bases verification [In Russian]. Ontology of designing. 2019; 9(4): 510-521. - DOI: 10.18287/2223-9537-2019-9-4-510-521.
References
[1] Makarenko SI. Intellektualnyye informatsionnyye sistemy: ucheb. posobiye [Intelligent information systems: textbook] [In Russian]. Stavropol: SF MGTU im M.A. Sholokhova. 2009. - 206 p.
[2] MarcotB. Testing your knowledge base / AI Expert. August. 1987. - P.43-47.
[3] Gavrilova TA, Khoroshevskiy VF. Bazy znaniy intellektualnykh system [Knowledge bases of intelligent systems] [In Russian]. - SPb: Piter. 2000. - 384 p.
[4] Post EL. Formal Reductions of the General Combination Decision Problem / American Journal of Mathematics. 1943; 65: 197-215.
[5] Rybina GV. Osnovy postroyeniya intellektualnykh informatsionnykh sistem: ucheb. posob [Fundamentals of building intelligent information systems] [In Russian]. - M.: Finansy i statistika, INFRA-M, 2010. - 432 p.
[6] Nariniani AS. Nedoopredelennyye modeli i operatsii s nedoopredelennymi znacheniyami [Undefined models and operations with undefined values] [In Rusian]. - Preprint VTs SO AS USSR. № 400. 1982.
[7] Nariniani AS. Nedoopredelennost v sistemakh predstavleniya i obrabotki znaniy [Underdeterminacy in knowledge representation and processing systems] [In Russian]. Izv. AN SSSR. Tekhn. kibernetika. 1986; 5: 3-28.
[8] Iskusstvennyy intellekt. - V 3-kh kn. Kn. 2 Modeli i metody: Spravochnik / pod red. D.A.Pospelova [Artificial intelligence. - In 3 books. Book 2 Models and methods: Handbook / ed. D.A. Pospelov]. [In Russian] - M.: Radio i svyaz. 1990. - 304 p.
[9] Giarratano JC, Riley GD. Expert Systems: Principles and Programming / 4th ed. Course Technology. Boston: PWS Publ. Co, 2004 (Russ. ed.: Moscow, Williams Publ., 2007, 1152 p.)
[10] Quinlan JR. INFERNO: a causations approach to uncertain inference / The computer J. 1983; 26(3): 255-269.
[11] Shafer G. A Mathematical Theory of Evidence / Princeton and London: Princeton University Press, 1976. 297 p.
[12] Arshinskiy LV. Metody obrabotki nestrogih vyskazyvanij [Methods of processing of nonstrict propositions] [In Russian]. - Irkutsk: East-Siberian Institute of MIA of Russia, 1998. - 40 p.
[13] Arshinskiy LV. Vektornye logiki: osnovanija, koncepcii, modeli [Vector logic: foundations, concepts, models] [In Russian]. Irkutsk: Irkutsk state university, 2007. - 228 p.
[14] Arshinskiy LV. Intervalnoye otsenivaniye istinnosti v sistemakh avtomatizirovannykh rassuzhdeniy na osnove VTF-logik [Interval truth estimation in automated reasoning systems based on VTF-logic] [In Russian]. - Identif-
ikatsiya sistem i zadachi upravleniya: Trudy IV mezhdunarodnoy konferentsii SICPRO'05 [Elektronnyy resurs]. Moskva: IPU RAN im. V.A. Trapeznikova. 2005. 1 elektron. opt. disk (CD-ROM). pp. 1061-1074.
[15] Khachatryan AR. Analiz klassicheskikh metodov obyedineniya svidetelstv v ekspertnykh sistemakh [Analysis of classical methods of combining evidence in expert systems] [In Russian]. Izv. AS USSR. Tekhn. kibernetika. 1987; 5: 67-73.
[16] Menger K. Statistical metrics / Proc. Nat. Acad. Sci. USA, 1942. 8. - P.535-537.
[17] Gottwald S. Treatise on Many-Valued Logics. - Leipzig, 2000. - 604 p.
[18] Arshinskii LV. Substantial and formal deductions in logics with vector semantics [In Russian]. Automation and remote control, 2007; 68(1): 139-148.
[19] Nechetkaya logika v modelyakh upravleniya i iskusstvennogo intellekta / pod red. D.A. Pospelova [Fuzzy logic in control and artificial intelligence models / ed. D.A. Pospelov] [In Russian]. - M.: Nauka. Gl. red. fiz.-mat. lit. 1986. - 312 p.
[20] Arshinskiy LV. Osobennosti raboty mashiny vyvoda sistemy modelirovaniya pravdopodobnykh rassuzhdeniy «Geraklit» [Features of the inference engine of system modeling plausible reasoning "Heraclitus"] /[In Russian]. Informatsionnyye i matematicheskiye tekhnologii v nauke i upravlenii. 2016; 2: 18-29.
Сведения об авторах
Аршинский Леонид Вадимович, 1957 г. рождения. Окончил Иркутский государственный университет в 1979 г., д.т.н. (2008). Заведующий кафедрой «Информационные системы и защита информации» Иркутского государственного университета путей сообщения. В списке научных трудов более 200 работ в области околоэкранной аэродинамики, распознавания образов, моделирования правдоподобных рассуждений, агрегированного оценивания систем и др.
Leonid Vadimovich Arshinskiy (b.1957) graduated from the Irkutsk State University in 1979, Dr of Tech. Sc. (2008). He is the Head of the Department "Information Systems and Information Protection" at the Irkutsk State Transport University. He is the author of more than 200 scientific articles and abstracts in the field of aircraft with ground effect wings, image recognizing, plausible inference, aggregate evaluation of systems, etc.
Ермаков Анатолий Анатольевич, 1951 г. рождения. Окончил Киевское высшее военное авиационное инженерное училище в 1976 г., к.т.н. (1982). Профессор кафедры «Информационные системы и защита информации» Иркутского государственного университета путей сообщения. В списке научных трудов около 70 работ в области технической диагностики, надёжности и эксплуатации сложных систем, распознавания образов др. Anatoly Anatolyevich Ermakov (b. 1951) graduated from the Kiev Higher Military Aviation Engineering School in 1976, Ph.D. (1982). He is a Professor in the Department of Information Systems and Information Protection at the Irkutsk State Transport University. The list of scientific papers includes about 70 works in the field of technical diagnostics, reliability and operation of complex systems, pattern recognition, etc.
Нитежук Марина Сергеевна, 1984 г. рождения. Окончила Иркутский государственный университет путей сообщения в 2010 г. Старший преподаватель и аспирант кафедры «Информационные системы и защита информации» Иркутского государственного университета путей сообщения. В списке научных трудов 7 работ в области информационных систем и технологий.
Marina Sergeevna Nitezhuk (b. 1984) graduated from the Irkutsk State Transport University in 2010. Senior lecturer and graduate student of the Information Systems and Information Protection department at Irkutsk State Transport University. The list of scientific works includes 7 works in the field of information systems and technologies.