Раздел 1
Искусственный интеллект и нечеткие системы
УДК 007.52:681.518.2;681.327.12
А.Н. Кузоваткин, А.Е. Янковская1
ИНТЕЛЛЕКТУАЛЬНАЯ ПОДСИСТЕМА ПРИНЯТИЯ РЕШЕНИЙ НА ОСНОВЕ СМЕШАННЫХ ДИАГНОСТИЧЕСКИХ ТЕСТОВ
Введение. Использование условных и безусловных логических тестов в задачах распознавания образов не ново и восходит к работам [1].
Актуальность применения методов тестового распознавания к разработке интеллектуальных систем принятия решений стимулировала развитие теории тестового распознавания. Применение при тестовом распознавании логических тестов, являющихся по своей сути диагностическими, позволяет отнести распознаваемый объект к одному из образов.
Известные нам интеллектуальные распознающие тестовые системы основаны либо на безусловных, либо на условных диагностических тестах с использованием для распознавания одного механизма классификации (классификационного признака). Однако для решения широкого круга задач из многих проблемных областей целесообразно использовать нетрадиционное матричное представление знаний
[2,3], , -
, , -
вательности действий, и смешанные диагностические тесты [4].
Термин и понятие смешанного диагностического теста, представляющего собой оптимальное сочетание безусловных и условных составляющих, впервые введены в 1996 г. в работе [4], а в последующих работах [5-7] предложен ряд алгоритмов построения смешанных тестов. Заметим, что при дальнейшем изложении термин "диагностический" может быть опущен.
Принятие решения осуществляется путем распознавания предъявляемого описания объекта на основе использования смешанного диагностического теста. Итоговое решение принимается путем использования специальной процедуры голосования на множестве тестов.
,
тестов связана с возможностью последовательного извлечения информации об исследуемом объекте для условной составляющей смешанного теста, преимуществами использования безусловных составляющих смешанных тестов при формировании решающих правил, а также с возможностью применения смешанных тестов для построения интеллектуального пользовательского интерфейса.
В настоящей работе излагаются два оригинальных алгоритма построения смешанных тестов и принятия решений на их основе, приводятся сравнительные характеристики этих алгоритмов, описывается программная реализация интеллек-
1 Работа выполнена при поддержке РФФИ гранты № 01-01-00772, 01-01-01050
туальной подсистемы принятия решений и обсуждаются пути дальнейшего совершенствования алгоритмов.
1.Представление знаний,основные понятия и определения,обоснование использования смешанных тестов.Во всех создаваемых нами интеллектуальных системах принятия решений, основанных на тестовых методах распознавания образов, используется нетрадиционный способ представления знаний в виде матриц описаний (Р) и различений (Я) [2-9].
Строки матрицы Р сопоставляются объектам из обучающей выборки, столбцы — характеристическим признакам (двоичные, троичные) г2, описывающим в совокупности каждый объект. Элемент матрицы Q задает значение данного признака для соответствующего объекта. В случае, если у какого либо объек-
«-», ,
что этот признак может принимать как нулевое, так и единичное значение.
Строки целочисленной матрицы К сопоставляются одноименным строкам матрицы Р, столбцы — классификационным признакам, определяющим различные механизмы разбиения объектов на классы эквивалентности (механизмы классификации). Элемент матрицы Я, задает принадлежность данного объекта одному из выделенных классов при соответствующем механизме классификации. Для указания факта принадлежности объекта классу используется номер этого класса. Множество неповторяющихся строк матрицы различений сопоставлено множеству вы. , -ми матрицы описаний, сопоставленными одинаковым строкам матрицы различе-.
Строка матрицы различений задает обобщенный класс. Если имеется единственный механизм классификации, то матрица различений вырождается в столбец, а обобщенный класс превращается в класс, что соответствует традиционному представлению знаний в задачах распознавания образов. С содержательной точки зрения матрицы различений могут быть любого из следующих трех типов. Первый тип характеризуется вложенностью механизмов классификации, когда каждый последующий столбец задает более подробное разбиение объектов на классы эквивалентности. Второй тип может интерпретироваться как совокупность действий, которые необходимо выполнить для данного объекта. Третий тип служит для представления независимых механизмов классификации, где столбцы отражают, например, мнения различных экспертов. Наличие 1-го или 3-го типа матрицы разли-.
Данная модель позволяет представлять не только данные, но и знания экспертов, поскольку одной строкой матрицы Р можно задавать в интервальной форме подмножество объектов, для которых характерны одни и те же решения, задаваемые строкой матрицы Я.
При обнаружении пересечения описаний образов, матрица Р должна быть .
[2,4,7,8].
Под закономерностями понимаются подмножества признаков с определенными легко интерпретируемыми свойствами, влияющими на различимость объектов из разных образов, устойчиво наблюдаемыми для объектов из обучающей выборки и проявляющимися на других объектах той же природы, а также весовые
, -
.
К упомянутым подмножествам будем относить константные, устойчивые 1-го 2- ( , ), -
ные (не различающие ни одной пары объектов), альтернативные (в смысле включения в диагностический тест), зависимые (в смысле включения подмножеств раз), (
), ( ) ,
минимальные и безызбыточные различающие подмножества признаков, являющиеся по сути соответственно минимальными и безызбыточными безусловными диагностическими тестами.
Множества обязательных признаков назовем ядром всех диагностических , -
го из тестов быть тестом.
Реакция матрицы описаний на тест есть совокупность строк матрицы описаний, в которых значение признаков, входящих в тест, совпадает со значениями аналогичных признаков исследуемого объекта.
Смешанным тестом называется тест, являющийся оптимальным сочетанием безусловной и условной составляющей. В безусловную составляющую включаются элементы ядра, т.е. обязательные признаки.
Смешанный тест может быть представлен в виде дерева, ярусы которого (за ) , -
условный тест, ребра - значениям этих признаков, а вершинам (за исключением корня и концевых вершин) сопоставлена пара (Ь,ф, где Ь — реакция матрицы описаний, q-нoмep признака. Корень дерева сопоставляется паре (8,в), где 8 - совокупность всех строк матрицы описаний, в - совокупность обязательных призна-.
обязательных признаков. Каждая реакция, соответствующая вершине дерева, однозначно определяется значениями признаков на пути к этой вершине. Реакция, сопоставленная каждой концевой вершине, содержит множество строк матрицы описаний, описывающих объекты обучающей выборки, принадлежащих одному образу. Концевой вершине сопоставляется и номер образа, которому она соответствует.
Две вершины дерева смешанного теста называются альтернативными, если они соединяются с одной вершиной предыдущего яруса.
Два ребра дерева смешанного теста называются альтернативными, если они выходят из одной вершины предыдущего яруса.
Дерево теста считается полным, если для любой его вершины, за исключени-, , . Степень неполноты дерева условного диагностического теста - это сумма вкладов в степень неполноты каждого из его ярусов (число концевых вершин, под-
( ) ). Введем также несколько дополнительных определений.
Признак, который в данной реакции принимает только одно значение, назы-.
Концевая вершина дерева смешанного диагностического теста соответствует
, , , -
тов из этого образа.
, , -
, .
Смешанный диагностический тест отдает условный голос одному из образов, если в дереве смешанного диагностического теста существует концевая вершина, соответствующая этому образу.
Вес теста вычисляется по следующей формуле:
к
V = £ w1 , (1.1)
1=0
где wi — вес ьго признака, входящего в безусловный тест,
k — количество признаков в безусловном тесте.
Вес голоса, обозначаемый через ^ отражает степень принадлежности объекта к образу по применяемому смешанному тесту с учетом его веса.
Обоснованием применения смешанных тестов в интеллектуальной системе принятия решения служат следующие соображения, связанные с особенностями . -ческих тестов в некоторых областях знаний (медицина, экстремальные ситуации и .) , , -ных диагностических тестов требуется указать одновременно значения всех необходимых признаков до принятия решения. Получение же значения некоторых признаков может быть связанно с большими трудностями (необходимо проводить
), . -чае целесообразно последовательное извлечение значений признаков. При этом использование условных или смешанных диагностических тестов [4,6.7] является .
При использовании условных диагностических тестов значения признаков исследуемого объекта извлекаются по мере необходимости и для некоторых объектов возможно сокращение количества признаков, участвующих в принятии ре.
целях сокращения затрат целесообразно при построении тестов выделить их в от,
теста. Кроме того, при принятии решения относительно исследуемого объекта значения обязательных признаков эффективнее получать заранее, так как они используются во всех тестах.
Ниже приводятся два алгоритма приятия решений.
Первый алгоритм состоит из двух частей. В 1-й части по каждому безызбыточному (минимальному) безусловному тесту и выявленным закономерностям строится дерево смешанного диагностического теста. Во 2-й части решение по каждому из построенных смешанных тестов принимается при предъявлении описания исследуемого объекта и прохождения по соответствующему дереву смешанного теста от корня к одной или нескольким концевым вершинам.
Во втором алгоритме принятие решения осуществляется одновременно с построением на основе безызбыточного (минимального) безусловного теста и выявленных закономерностей только необходимой для принятия решения части дерева теста по предъявлению описания исследуемого объекта.
2. Алгоритм 1. В целях построения более короткого дерева введем для каждого признака, входящего в безусловный тест, дополнительный коэффициент, который будем называть коэффициентом разделения и обозначать через С.
Коэффициент разделения для всех допустимых (входащих в соответствую) . -фициент отражает степень непересечения подмножеств образов, соответствующих
различным значениям признака. Для его вычисления предлагается следующая :
С =-К-, (2.1)
К 0 + К1
где К0 — количество образов, входящих в реакцию, соответствующую 0-у значению признака; К1 — количество образов, входящих в реакцию, соответствующую 1-у значению признака; К — количество образов, входящих в реакцию предыду-.
Алгоритм построения дерева смешанного диагностического теста по каждому из безусловных тестов состоит из следующих шагов:
3. Удаление из матрицы описаний столбцов, соответствующих константным,
, .
4. Выделение множества обязательных признаков и разбиение строк матрицы р на множество реакций по значениям обязательных признаков.
Далее используется следующая рекурсивная процедура по каждому из безус.
Пусть Ь — реакция матрицы описаний, сопоставленная вершине находящейся на ьом ярусе. Если Ь состоит из множества строк, описывающих один образ, то вершина ) - концевая. Иначе вычисление коэффициентов разделения при, -
фициентом разделения и разбиение Ь на реакции относительно значений выбранного признака на 1+1-ом ярусе.
Во второй части алгоритма осуществляется непосредственно принятие решения по построенным деревьям, которое осуществляется при помощи прохода от корня дерева к одной или нескольким концевым вершинам по следующему алго-.
3. Формирование списка голосов, отданных за каждый из образов (первона-
).
4. Формирование списка деревьев смешанных тестов (в начальный момент в
).
5. Формирование списка указателей на вершины дерева тестов (в начальный
).
6. Запрос значений всех обязательных признаков.
7. Выбор первого дерева из списка деревьев смешанных диагностических тестов. Создание и занесение в список указателей на вершины первого яруса, соответствующие совокупности значений всех обязательных признаков. Весу голоса g:=W/2 где 1 -количество неизвестных обязательных признаков.
8. Выбор первого указателя из списка.
9. Запрос признака, соответствующего указанной вершине.
10. Если значение признака не удается определить (неизвестно), то перемещение указателя на вершину следующего яруса, соответствующую нулевому значению запрашиваемого признака. Кроме того, создание и занесение в список указателя на вершину следующего яруса, соответствующую единичному значению признака. g:=g/2. Иначе перемещение указателя на соответствующую вершину следующего яруса.
11. Если новая указанная вершина концевая, то увеличение голоса, отданного за соответствующий этой вершине образ, на величину, равную весу голоса, и
. . 7.
12. Если список указателей не пуст, то переход к пункту 6. Иначе удаление рассмотренного дерева из списка деревьев смешанных тестов и, если список не пуст, то переход к пункту 5, иначе конец работы алгоритма.
3. Алгоритм 2. Процедура принятия решения осуществляется с одновременным построением необходимой части дерева смешанных тестов при предъявления описания исследуемого объекта по следующему алгоритму.
3. Запрос у пользователя значений всех обязательных признаков (выполняется
).
4. Построение реакции матрицы описаний на множество обязательных призна-
.
5. Упорядочивание множества столбцов матрицы описаний по неубыванию ко-
.
6. Выбор признака с максимальным коэффициентом разделения и не нулевым весовым коэффициентом из безусловного диагностического теста (в случае, если существует несколько признаков с равными коэффициентами разделе, ).
7. Если значение выбранного признака известно (равно 0 или 1), то построение
реакции с учетом этого признака. После этого удаление признака из множе-, -
. ,
коэффициент этого признака приравнивается 0 и производится пересчет ко.
8. Выполнение пунктов 4-5 до тех пор, пока в множестве признаков, участвующих в принятии решения, остаются признаки, весовые коэффициенты кото-
0, , . При получении реакции, состоящей из одного образа, производится увеличе-, , . невозможности получения реакции, состоящей из одного образа, переход к .7.
9. Выбор первого из оставшихся (неизвестных) признаков и деление реакции, сопоставленной вершине предыдущего уровня, на 2 части (в первой части со, "0",
второй — "1"). Повтор этой операции для каждой непустой части, пока не исчерпаются признаки или не получим реакцию со строками из одного образа. После этого увеличение голоса, отданного каждому образу, имеющему соответствующую концевую вершину, на вес теста, деленный на количество кон.
,
, . 2k (k — количество неопределенных признаков) объектов, у которых все обязательные .
каждого объекта из полученной группы, но величина условного голоса за каждый образ уменьшается в 2 k раз.
Данный алгоритм позволяет значительно экономить оперативную память ПЭВМ за счет того, что не нужно хранить большое количество матриц, содержа. .
ЛИТЕРАТУРА
1. Журавлев Ю.К Об алгебраических методах в задачах распознавания и классификации //Распознавание и классификация, прогнозирование / Математические методы и их применение. М.: Наука, 1989. Вып.1.
2. Янковская А.Е. Оптимизирующие преобразования в процессе синтеза асинхронного автомата и их приложения. MtA SZTAKI TANULMANYOK, BUDAPEST, 99/1980.
3. Янковская А.Е. Представление знаний и алгоритмическое обеспечение для медицины экстремальных ситуаций // Вестник Всесоюзного Общества информатики и вычислительной техники. № 1. 1991.
4. Янковская А.Е. Об оптимальном сочетании условных и безусловных диагностических тестов в интеллектуальных системах // Искусственный интеллект — 96 / Сб. научных трудов V Национальной конференции с международным участием. Том I. Казань, 1996.
5. Янковская А.Е. Построение k-значных диагностических тестов в интеллектуальной системе с матричным представлением знаний // КИИ'98. Сб. научных трудов VI националь-
. I.
Пущино, 1998.
6. . .
// . Доклады 3-ей всероссийской конференции с международным участием. Изд. СО РАН. Томск, 2000.
7. Янковская А.Е. Основы построения и применения смешанных диагностических тестов в
// -2001. М.: изд-во Московского государственного инженерно-физического института, 2000.
8. Yankovskaya A.E. Design of Optimal Mixed Diagnostic Test With Reference to the Problems of Evolutionary Computation// Proceeding of the First International Conference on Evolutionary Computation and Its Applications. EVCA'96. M, 1996.
9. . ., . . -
// : задачах управления. Труды. межд. конф. Переславль-Задесский, 1999.
УДК 007:681.518.
ОХ. Берестнева1, О.М. Гергет2, Е.В. Михалев3, А.Е.Янковская4
ПРИМЕНЕНИЕ ЛОГИКО-ВЕРОЯТНОСТНОГО ПОДХОДА В ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЕ ДИАГНОСТИКИ СОСТОЯНИЯ ДЕТЕЙ РАННЕГО ВОЗРАСТА
.
является сохранение и укрепление здоровья детей. Для решения данной задачи особенно актуальным является возможность создания интеллектуальной системы для проведения ранней диагностики и осуществления прогноза уровня здоровья детей раннего возраста.
Одним из перспективных направлений в области создания интеллектуальных систем, основанных на мягких вычислениях, является применение логико-вероятностного принятия решения.
Использование логико-вероятностного принятия решения [5,12-15] в интеллектуальных медицинских системах [13] с целью постановки диагнозов, оценки и прогнозирования состояния организма человека обусловлено тем, что определение значений части признаков возможно только с некоторой вероятностью (степенью
1 Томский политехнический университет. г.Томск ул. Советская, 84, [email protected]
2 Томский политехнический университет. г.Томск ул. Советская, 84, [email protected]
3 . . - , 4, evg3 @,post.tomica.ru
4 Томский архитектурно-строительный университет. г.Томск пл. Соляная, 2, [email protected]. т