Таблица 2 Оценка перспективности известных методов распознавания образов для решения рассматриваемой задачи
Наименование метода Оценка перспективности
Метод построения эталонов перспективен
Метод дробящихся эталонов малоперспективен ввиду сложности
Метод ближайших соседей неперспективен
Метод потенциальных функций неперспективен
Методы выявления кластеров и алгоритмы таксономии неперспективны
Статистические методы неперспективны
Лингвистические методы неперспективны
Нейросетевые методы перспективны
Нечеткие методы перспективны для задачи распознавания интерполяционного типа
Регрессионные методы перспективны
Методы локальной аппроксимации перспективны
Метод коллективного распознавания перспективен
п - размерность признакового пространства (количество признаков, характеризующих распознаваемые объекты);
Б(х) - множество решающих правил, по которым осуществляется отнесение распознаваемого объекта к тому или иному образу;
К - риск потерь при распознавании.
Отсутствие в этой четверке одного из первых трех элементов определяет тип задачи распознавания:
1) задано множество классов или образов 8 (это множество обычно задается обучающей выборкой) и пространство признаков X; требуется найти решающее правило Б(х), минимизирующее риск К;
2) заданы множество классов 8 и тип решающего правила Б(х); требуется найти такую систему признаков X, которая минимизировала бы величину К;
3) задано пространство признаков X; требуется найти множество 8 и решающее правило Б(х) - это задача классификации или обучения без учителя.
С учетом временной изменчивости образов ясно, что решающее правило должно быть функцией не только признаков, но и времени, то есть Б = Б(х,1;).
Обзор основных известных методов распознавания образов [2-6] позволил выделить наиболее перспективные для возможного решения этой задачи подходы (см. табл. 2).
Следующим шагом в данном направлении, очевидно, должна стать разработка новых или адаптация известных методов таким образом, чтобы они могли использоваться для распознавания образов, изменяющихся во времени.
Список литературы
1. Дьяконов В.П. Компьютер в быту. - Смоленск: Русич,
1996.
2. Айзерман М.А., Браверман Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучающих машин. - М.: Наука, 1970.
3. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. - Новосибирск: Изд-во ин-та математики, 1999.
4. Фукунага К. Введение в статистическую теорию распознавания образов. - М.: Наука, 1979.
5. Дли М.И., Круглов В.В., Осокин М.В. Локально-аппроксимационные модели социально-экономических систем. - М.: Физматлит, 2000.
6. Круглов В.В., Дли М.И., Голунов Р.Ю. Нечеткая логика и гибридные нейронные сети. - М.: Физматлит, 2001.
ОБНОВЛЕНИЕ БАЗЫ ЗНАНИЙ В ДИНАМИЧЕСКИХ СИСТЕМАХ ПРИНЯТИЯ РЕШЕНИЙ
Т.А. Стефанюк
Развитие современной науки привело к появлению на стыке двух дисциплин (теории автоматического управления и теории искусственного интеллекта) принципиально нового направления. Это - теория интеллектуального управления. В последние годы за рубежом, а с недавнего времени и в нашей стране, возрос интерес к разработке прикладных интеллектуальных управляющих систем и к их внедрению в различные сферы жизни.
Однако применение интеллектуальных систем на практике часто требует создания весьма боль-
шой динамической базы знаний, на основании которой будут приниматься управляющие решения. В этом случае исчерпывающая проверка базы знаний на наличие ошибок на этапе разработки требует серьезных временных и вычислительных затрат, а постоянное обновление базы знаний в эволюционирующей среде приводит к уменьшению компетентности системы со временем. Таким образом, становится необходимой периодическая проверка базы знаний системы с целью выяснения, является ли она свободной от ошибок и спо-
собной принимать адекватные решения с достаточной точностью.
То, что таблицы принятия решений довольно легко могут быть проверены на наличие аномалий, делает их удобным инструментом для работы с базами знаний.
В статье обобщены материалы, касающиеся различных аспектов верификации баз знаний систем принятия решений, и предложена блок-схема, лежащая в основе построения системы фильтрации.
Интеллектуальные системы управления
Управляющие системы традиционно делятся на два класса: интеллектуальные «в малом» и интеллектуальные в большом. Интеллектуальными в малом называют управляющие системы, использующие знания для преодоления неопределенности входной информации, модели управляемого объекта или его поведения. Примером таких систем являются нечеткие системы управления.
Интеллектуальными в большом называются системы, соответствующие следующим пяти принципам:
- наличие тесного информационного взаимодействия интеллектуальной системы управления с реальным внешним миром с использованием специально организованных информационных каналов связи;
- принципиальная открытость систем с целью повышения интеллектуальности и совершенствования собственного поведения;
- наличие механизмов прогноза изменений внешнего мира и собственного поведения системы в динамически меняющемся внешнем мире;
- наличие у управляющей системы многоуровневой иерархической структуры, построенной в соответствии с правилом: повышение интеллектуальности и снижение требований к точности по мере повышения ранга иерархии в системе (и наоборот);
- сохраняемость функционирования (возможно, с некоторой потерей качества или эффективности, иначе, с некоторой деградацией) при разрыве связей или потере управляющих воздействий от высших уровней иерархии управляющих систем.
Основным различием между этими двумя классами систем является организация используемых ими баз знаний. В случае управляющей системы, интеллектуальной в малом, база знаний является закрытой, то есть однажды созданная на основании каких-либо знаний об управляемом объекте, к примеру экспертных, она уже не изменяется в процессе эксплуатации. База же знаний системы, интеллектуальной в большом, открыта, она все время обновляется новыми знаниями, поступающими из внешнего мира, что необходимо
для успешного функционирования системы в эволюционирующей среде. В связи с этим требуется некоторая постоянная поддержка системы с тем, чтобы убедиться, что система свободна от ошибок и работает выше некоторого уровня приемлемости в течение всего жизненного цикла. Три основных задачи, входящих в этот процесс, представляют собой тестирование, фильтрацию и ведение базы знаний.
Фильтрация баз знаний
Цели фильтрации базы знаний заключаются в улучшении и поддержке деятельности системы принятия решений. Очевидно, что ни на одном из этапов проектирования или эксплуатации баз знаний ни одной системой не может быть достигнуто совершенное представление (за исключением приложений небольшого масштаба, в которых может быть проведена исчерпывающая проверка на стадии разработки). Следовательно, фильтрация базы знаний должна проходить постоянно в процессе построения системы и периодически в процессе ее эксплуатации.
Во время разработки системы фильтрация базы знаний имеет дело с корректировкой и реструктуризацией базы знаний.
1. Корректировка базы знаний требуется в случае, если в теории базы знаний обнаружена структурная или функциональная ошибка, и заключается в привлечении подходящего обобщения и/или конкретизации в теории базы знаний для исправления множества заключений, порожденных системой.
Корректировка базы знаний проводится с целью увеличить логичность выводов теории базы знаний и необходима, когда обнаруживается противоречивость и/или неполнота в процессе работы системы.
В процессе корректировки базы знаний остается необходимым проведение некоторой фильтрации, даже если отсутствуют какие-либо тестовые случаи (что является обычной ситуацией на ранней стадии разработки систем баз данных). Среди ошибок, выявление и исправление которых не зависит от тестовых случаев, есть ошибки излишнего обобщения, приводящие к логической либо семантической несовместности, а также те ошибки излишней конкретизации, которые могут быть выявлены определением избыточных знаний (аксиом, гипотез или правил).
2. Реструктуризация базы знаний. Здесь целью является улучшение характеристик системы путем распознания и удаления источников потенциальной неэффективности представления. Типичные случаи такой неэффективности - цикличные и избыточные правила, являющиеся частью других правил (так называемые включенные правила). Теория реструктуризации баз знаний предназначена для ликвидации таких правил. Она не
меняет множества заключений, генерируемых системой, но может изменить способ вывода этих результатов.
В процессе эксплуатации системы баз знаний фильтрация базы заключается в обновлении базы знаний и в увеличении вычислительных возможностей базы знаний (модернизации). Целью обновления является сохранение точности системы на приемлемом уровне в течение всего ее жизненного цикла. Необходимость в обновлении появляется тогда, когда новые тестовые случаи несовместимы со старыми либо когда решения, сводящиеся к старым тестовым случаям (включая решения, порождаемые самой системой), больше неприемлемы.
Обновление базы знаний требуется, когда система баз знаний работает в эволюционирующей среде. В отличие от корректировки, которая улучшает базу знаний изнутри, обновление базы знаний рассматривает внешние изменения, где новые знания должны приниматься во внимание с целью поддержания системы на достаточном уровне информированности об эволюции проблемной области.
Модернизация должна повысить адекватность (то есть степень покрытия проблемной области) теории базы знаний с появлением новых знаний. В больших приложениях нельзя ожидать, что на этапе проектирования будет достигнута стопроцентная адекватность. Следовательно, в процессе эксплуатации системы может возникнуть необходимость в модернизации базы знаний.
В принципе, это изменение может быть представлено как простое монотонное расширение существующей теории, поэтому модернизация не должна создавать новых логических либо семантических противоречий. Однако возможно появление новых избыточностей и включений, если в этот процесс вовлекаются существующие правила. Следовательно, может потребоваться последующая реструктуризация усовершенствованной базы знаний.
Таблицы принятия решений:
определение и классификация аномалий
Таблица принятия решений БТ есть функция, отображающая декартово произведение состояний условий на декартово произведение значений действий, причем каждая комбинация условий отображается в одну (критерий полноты) и только одну (критерий единственности) конфигурацию действий.
Это может быть сформулировано следующим образом. Пусть:
С8 = {081} (1 = 1 ... спит): множество объектов-условий;
СБ = {СБ1} (1 = 1 ... спит): множество наборов условий, где СБ1 есть множество возможных значений, принимаемых С81;
CT = {CTj} (i = 1 ... cnum): множество множеств состояний условий, где CTi = {Sik} (k = 1 ... ni) - упорядоченный набор ni состояний Sik. Каждое состояние Sik есть логическое выражение, содержащее элементы CDi, что определяет подмножество CDi таким образом, что множество всех таких подмножеств составляет разбиение CDi;
AS = {ASj} (j = 1 ... anum): множество объектов-действий;
AV = {AVj} (j = 1 ... anum): множество множеств значений действий, где AVj = {true(x), false(-), null(.)} - множество всех возможных значений действия ASj, которое в начальный момент равно null для любого j.
Тогда определение таблицы принятия решений запишется в виде:
DT: CT1 X CT2 X ... X CT cnum ^ ^ AV1 X AV2 X ... X AV anum. Отметим, что в этом определении понятие таблицы принятия решений преднамеренно ограничено так называемыми таблицами единственного действия, где столбцы взаимно исключающие. Только такой тип таблицы допускает более легкую верификацию и оптимально поддерживает моделирование.
Графически таблица принятия решений изображается в виде таблицы, разделенной на четыре квадранта (рис. 1). Горизонтальная линия делит таблицу на условия (сверху) и действия (снизу). Вертикальная линия разделяет объекты и элементы на «заголовок» (слева) и введенные данные (справа).
«заголовок» условий (объекты-условия) введенные условия (состоянжя_условий)
1. Приоритет Высокий Обычный
2. Свободные ресурсы - Да Нет
3. Наличие очереди Да Нет Да Нет -
1. Принять заявку - X - X -
2. Отклонить заявку - - - - X
3. Поставить в очередь X - X - -
«заголовок» действий (объекты-действия) введенные действия (значения действий)
Рис.1. Вид таблицы принятия решений
Для облегчения работы с большими таблицами баз знаний необходимо разбиение их на модули. Подтаблица может быть привязана к части условий (подтаблица условий) или к части действий (подтаблица действий) определенной таблицы. Каждая (под)таблица может опять же быть связана с другими подтаблицами действий и условий, таким образом создается более сложная структура.
В процессе получения новых знаний необходимо дополнение уже существующих таблиц принятия решений либо создание новых под-
таблиц базы знаний. В процессе их формирования могут возникнуть определенные аномалии таблиц.
При проверке системы таблиц принятия решений на наличие аномалий недостаточно рассмотреть каждую из таблиц по отдельности. Также необходимо выяснить, нет ли в системе межтабличных аномалий (которые происходят из взаимодействия между несколькими таблицами). Эти аномалии обычно могут быть обнаружены путем сравнения различных частей системы, поскольку они происходят из-за взаимодействий между двумя или более таблицами (будем считать, что внутритабличная проверка проведена и каждая таблица сама по себе свободна от ошибок). На рисунке 2 изображена классификация межтабличных аномалий.
Первый тип межтабличной избыточности -избыточность описания, или включенность действий возникает, если некоторые действия описаны более чем в одной таблице.
В первую очередь, чтобы определить аномалию, необходимо проверить включенные таблицы, то есть необходимо сравнить условные части двух столбцов в разных таблицах.
Однако такая проверка не гарантирует, что все найденные случаи действительно связаны с избыточностью знаний. Они могут быть связаны еще и с тем, что таблицы являются частью большой иерархической структуры и на самом деле применяются в различных условиях. Тогда найденное отнесение этих столбцов к разным категориям не имеет отношения к избыточности с точки зрения динамического развития, поскольку выполняемые столбцы инициируются в разных случаях.
С другой стороны, избыточность определений действий может возникать в случае, который в продукционных системах называют избыточно-
стью цепочек вывода. В этой ситуации, к примеру, столбцы главной таблицы выполняются в разных условиях, в то время как подтаблица условий показывает, что одно из этих условий является следствием другого, одновременно определяя то же значение действия.
Следовательно, чтобы удостовериться, что найденная аномалия действительно является случаем избыточности с точки зрения динамического развития, система должна выполнить полную проверку и выяснить наличие избыточности между совокупностями столбцов, особо учитывая пути вывода между ними. Другими словами, следует проследить пути вывода через всю табличную структуру и проверить, возможно ли хотя бы еще одной комбинации, кроме исследуемой, принять то же самое истинное значение более чем в одной таблице.
Наличие избыточных определений действий в базе знаний обычно не означает, что в представлении знаний есть ошибки, но может осложнить проблему поддержки, например, при связывании частей базы знаний.
Второй тип межтабличной избыточности - строка неиспользованного действия. В структурах условных подтаблиц эта аномалия может возникнуть либо когда действие не является частью конечного состояния и не используется в качестве условия другой таблицей, либо если связывающее условие в условной подтабли-це не выполняется. Как следствие, действие оказывается неиспользованным. При этом удаление только внутритабличной аномалии (неуместное условие) в главной таблице не устраняет межтабличной аномалии (ряд неиспользованного действия) в подтаблице условий.
Этот тип аномалий может также проистекать из связей действий в подтаблицах, если связывающее действие либо ссылается на несуществующую таблицу, либо вообще не указывает на подходящую подтаблицу действий. В последнем случае вся подтаблица действий может стать излишней.
Однако такая аномалия может быть не только избыточностью, но и указанием на неполноту, поскольку решение, приводящее к неиспользованной части, может в силу различных причин отсутствовать.
С целью нахождения строк неиспользованных действий системе необходимо проверить, есть ли в структуре подтаблицы условий (действий) неуместные связи с главной таблицей. Если эта под-таблица не может быть достигнута из другой таблицы, то это действие является неиспользуемым. Третий тип межтабличной избыточности, который может иметь место, - неинициируемый стол-
У Избыточность
У
Избыточность в описании действий
I—т,
Избыточность в цепочках вывода Неиспользуемая строка действия —Неинициируемый столбец У Противоречивость
) Противоречивость в описании действий
^—Противоречивость в цепочках вывода Цикличность —Недостаточность
Рис. 2. Одна из классификаций межтабличных аномалий
L
Тестирование
Проектирование
противоречивость недостаточность
избыточность цикличность
бец. Этот тип аномалий возникает в структуре подтаблицы действий или условий. Обычно это происходит, когда одно и то же условие (несколько условий) используются в двух или более таблицах. И если исследуемая таблица - это подтаб-лица действий какой-либо другой таблицы (или нескольких таблиц), необходимо пройти через все предшествующие таблицы в этой иерархии, проверяя, может ли каждое их условие (комбинации условий), появляющееся в исследуемой таблице, хотя бы одним путем привести к этой таблице.
Неинициируемость может быть следствием того, что элементы действия ошибочно принимают значение ложь в подтаблице условий, привязанной к той, в которой возникают эти столбцы.
Помимо этого, существует мнение, что элементы действия в неини-циируемых столбцах следует оставлять неопределенными, поскольку они не относятся ни к одной из входных комбинаций.
Противоречивые элементы действий встречаются в табличных системах, если некоторые действия определены более чем один раз.
Один из частных случаев противоречивости в табличных системах - противоречивость в цепочках вывода. Опять же эта аномалия очень похожа на избыточность в цепочках вывода.
Используемые здесь тесты похожи на те, что используются при проверке избыточности элементов действия.
Межтабличная недостаточность приводит к ситуации, когда система в целом не способна сделать вывод в конкретном случае комбинации входных условий, в то время как каждая таблица по отдельности не выглядит неполной. Однако если каждая таблица принятия решений удовлетворяет критерию полноты (условная часть) и «не недостаточна» со своей стороны (часть действий), не может быть никакой межтабличной недостаточности. Другими словами, проблема полноты успешно разрешается на уровне отдельных таблиц.
Поскольку внутритабличная цикличность невозможна в силу строгого разделения между условиями и действиями в отдельной таблице, то следует опасаться лишь межтабличной цикличности. По отношению к этому виду аномалии может быть использована превентивная стратегия:
строится граф по всем межтабличным связям и разработчик предупреждается о появлении циклов в этом графе. Вообще в табличной структуре появление циклов обычно нежелательно, хотя и допустимо.
Описанные здесь принципы поддержки баз знаний можно обобщить в виде представленной на рисунке 3 схемы, обрисовывающей основные этапы проверки базы знаний в соответствии с возможно возникающими на этих этапах аномалиями.
Поддержка баз знаний
Фильтрация
I
1
Ведение
Корректировка
Эксплуатация
Обновление
Модернизация
Реструктуризация
Рис. 3. Принципиальная схема проведения фильтрации базы знаний
Таблицы принятия решений действительно оказываются удобным средством для представления иерархической структуры интеллектуальных в большом систем управления, поскольку позволяют провести достаточно полный анализ базы знаний на наличие различных ошибок. Таким образом, инструмент, позволяющий проводить анализ базы знаний системы принятия решений в соответствии с данной схемой, мог бы оказаться весьма полезным как разработчикам, так и пользователям системы, помогая поддерживать ее точность и адекватность на высоком уровне, тем самым продлевая сроки жизни системы.
В настоящее время ведется работа над конкретной программой, реализующей данную функцию. Предполагается, что впоследствии это явится частью более крупной разработки по организации систем баз знаний.
Список литературы
1. Захаров В.Н. Интеллектуальные системы управления: основные понятия и определения. //Изв. РАН. Теория и системы управления, 1997. - №3.
2. Vanthienen J. et al. A tool-supported approach to intertabular verification. (Программный подход к межтабличной верификации)// Expert Systems with Applications 15, 1998, 277285.
3. Zlatareva N. P. A refinement framework to support validation and maintenance of knowledge-based systems. (Основы фильтрации для обеспечения проверки достоверности и ведения систем баз знаний) //Expert Systems with Applications 15, 1998, 245-252.
4. Zakharov V.N., Stefanyuk T.A. Knowledge Base Update in the Decision Making Process. (Обновление базы знаний в процессе принятия решений) //Abstracts of 3rd Moscow International Conference On Operations Research (ORM 2001), Moscow, 2001, p.128.
КОМПЛЕКС АВТОМАТИЗИРОВАННОГО ПРОЕКТИРОВАНИЯ ГЕОТЕХНИЧЕСКИХ СООРУЖЕНИЙ "КАППА"
A.B. Осокин
Автоматизированному проектированию стало уделяться заслуженно больше внимания, нежели ранее. Причиной тому неподдельная заинтересованность в росте производительности труда проектировщиков.
Сегодня речь пойдет о комплексе "КАППА" -российском продукте, созданном в Уфимском государственном нефтяном техническом университете. Комплекс предназначен для расчета широкого диапазона геотехнических сооружений: автодорог, каналов, причалов, дамб, набережных, береговых опор мостов, дорожных насыпей и хранилищ, в которых используются геосинтетические (ГС) материалы.
Необходимость разработки комплекса обоснованна тем, что российские строительные САПР не имеют возможности моделирования подобного анизотропного материала, а приобретение зарубежных универсальных комплексов не всегда оправдывается экономически.
В основу комплекса положен анализ геотехнических сооружений методом конечных элементов. Времена, когда инженер-геотехник занимался составлением малопонятных таблиц чисел, безвозвратно миновали, как и времена диалогового режима, когда после заполнения многочисленных окон и диалогов на экране отображалось совсем не то, что надо, и все приходилось делать заново. Настала эра графического интерфейса с простым и легким использованием мыши. Но поскольку комплекс носит утилитарный характер, в процессе разработки концепции САПР решено было использовать огромные графические возможности AutoCAD2000 фирмы Autodesk Inc. (США).
Метод конечных элементов предполагает нанесение на все сооружение конечно-элементной сети. Хорошо известно, что от качества ее нанесения зависит точность проводимой аппроксимации. Теоретически конечный элемент (КЭ) может быть любой формы, однако поскольку слои ГС располагаются строго горизонтально или вертикально, был разработан изопараметрический четырехугольный КЭ произвольной формы. Изопарамет-
рическим он называется по причине равенства узловых точек и сторон КЭ, а следовательно, функций формы этих сторон.
Практически дифференцирование уравнений функций формы и вывод матрицы жесткости может быть выполнен вручную, но автором для этой цели был использован пакет Maple V Release 4 фирмы Waterloo Maple (Канада). Преимущества использования пакета символьной математики становятся очевидными, когда встает вопрос о выборе между моно- и полиэлементным типом конечно-элементной модели (КЭМ). Кроме того, в процессе работы было неоспоримо доказано, что удобства разработки КЭ по СОМ-технологии толкают к созданию новой комбинированной КЭМ. В действительности КЭМ удобнее составлять из одинаковых элементов, имеющих идентичные порядки матриц жесткости. И хотя грунт и геоткань должны быть представлены моделями сплошного тела и стержня соответственно, решено было разработать комбинированный КЭ. У такой КЭМ появляются задатки моноэлементной КЭМ, но она остается полиэлементной. В случае отсутствия ГС материала в возможных положениях в КЭ производится суммирование нулевой матрицы с общей матрицей жесткости КЭ и, следовательно, жесткость ГС не учитывается.
Следующее преимущество СОМ-технологии было выявлено при разработке интерфейса графического ввода/вывода. Так, оказалось нерационально хранить данные о свойствах грунта, заделках, внутренних и внешних усилиях, действующих на сооружение, в графической базе данных (ГБД) AutoCAD разрозненно. В самом деле, для отыскания необходимого параметра потребуется ввести отдельные циклы по нумерации степеней свободы для каждого элемента расчетной схемы, что увеличивает затраты времени при работе с системой. При использовании единого объекта (под объектом в программировании понимается совокупность данных и методов манипулирования этими данными) прочностные, фильтрационные свойства грунта, данные о четырех координатах