МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ ЭКСПЕРТНЫХ СИСТЕМ
М.В. Барышев, И.Ю. Гатчин Научный руководитель - доктор технических наук, профессор Ю.А. Гатчин
В статье рассматриваются типичные модели представления знаний экспертных систем. При рассмотрении их положительных и отрицательных сторон, а также их возможного применения на практике, делается вывод, что в дальнейшем будет отдаваться предпочтение экспертным системам с комбинированным способом представления знаний.
Введение
В начале 80-х гг. в рамках искусственного интеллекта окончательно сформировалось новое направление - «инженерия знаний», целью которого является разработка и исследование экспертных систем. Отличительной особенностью экспертных систем по сравнению с ранее существовавшими системами искусственного интеллекта является то, что экспертные системы способны решать не модельные, а вполне реальные задачи, при этом получая результаты, сравнимые с теми, которые способен получить эксперт. Кроме того, экспертные системы применяются в неформализованных или слабоформа-лизованных областях знаний, которые до этого были мало доступны средствам вычислительной техники. И, наконец, экспертные системы ориентируются на общение с пользователями, мало знакомыми с программированием, что позволяет резко расширить круг людей, способных решать свои прикладные задачи с помощью компьютера на достаточно высоком профессиональном уровне. Все это вызывает на протяжении последнего десятилетия повышенный интерес к проблематике экспертных систем как со стороны специалистов в области вычислительной техники и искусственного интеллекта, так и со стороны конечных пользователей.
Но, несмотря на огромное количество фактов, подталкивающих к разработкам новых экспертных систем, одной из наиболее важных проблем, характерных для систем, основанных на знаниях, является проблема представления знаний. Это объясняется тем, что форма представления знаний оказывает существенное влияние на характеристики и свойства системы. Чтобы манипулировать всевозможными знаниями из реального мира с помощью компьютера, необходимо осуществлять их моделирование. В таких случаях необходимо отличать знания, предназначенные для обработки компьютером, от знаний, используемых человеком. Кроме того, при большом объеме знаний желательно упростить последовательное управление отдельными элементами знаний.
Целью статьи является рассмотрение уже созданных моделей представления знаний, констатация их положительных и отрицательных сторон, и сравнительная оценка применимости той или иной модели знаний для разработок экспертных систем.
Модели представления знаний
При проектировании модели представления знаний следует учитывать такие факторы, как однородность представления и простота понимания. Однородное представление приводит к упрощению механизма управления логическим выводом и упрощению управления знаниями. Представление знаний должно быть понятным экспертам и пользователям системы. В противном случае затрудняются приобретение знаний и их оценка. Однако выполнить это требование в равной степени для простых и для сложных задач трудно. Обычно для несложных задач останавливаются на некотором среднем (компромиссном) представлении, но для решения сложных и больших задач необходимы структурирование и модульное представление.
Типичными моделями представления знаний являются: • логическая модель;
• продукционная модель;
• фреймовая модель;
• семантическая модель.
Во всех разработанных в прошлом системах с базами знаний, помимо этих моделей, использовались специализированные средства, поэтому представление знаний получалось сложным. Тем не менее, классификация моделей оставалась неизменной. Язык, используемый для разработки систем, спроектированных на основе этих моделей, называется языком представления знаний [1].
Логическая модель представления знаний
Логическая модель используется для представления знаний в системе логики предикатов первого порядка и логики высказываний.
Формальная дедуктивная система, лежащая в основе логической модели представления знаний, может быть представлена в виде четверки: ф = {Б, S, А, р , где В -
множество базовых элементов (алфавит); £ - множество синтаксических правил, на основе которых из Б строятся правильно построенные формулы; А - множество аксиом (правильно построенных формул); Р - множество правил вывода (семантических правил), которые из множества аксиом позволят получать новые правильно построенные формулы - теоремы [2].
Основные преимущества использования логики предикатов для представления знаний заключаются в том, что обладающий хорошо понятными математическими свойствами мощный механизм вывода может быть непосредственно запрограммирован; имеется возможность контроля логической целостности базы знаний, т. е. ее непротиворечивости и полноты; весьма просто реализуется запись фактов, следствием чего является простота и компактность базы знаний. Главным недостатком логической модели является отсутствие четких принципов организации фактов в базе знаний. В связи с этим достаточно большие базы трудно поддаются анализу и обработке.
Таким образом, логические модели представления знаний целесообразно использовать в тех предметных областях, где база знаний невелика по объему и относительно проста по структуре.
Продукционная модель представления знаний
Продукционная модель наиболее адекватно соответствует процедурному характеру знаний. Эта модель описывает знания с помощью так называемых правил продукции, которые, по существу, являются программами, состоящими из одного оператора вида «ЕСЛИ <условие>, ТО<действие>».
Системы с базами знаний, основанные на этой модели, называются продукционными системами. Эти системы бывают двух диаметрально противоположных типов - с прямыми и обратными выводами.
В системе продукций с обратными выводами с помощью правил строится дерево И/ИЛИ, связывающее в единое целое факты и заключения; оценка этого дерева на основании фактов, имеющихся в базе данных, и есть логический вывод. Логические выводы бывают прямыми, обратными и двунаправленными. При прямом выводе отправной точкой служат предоставленные данные, процесс оценки приостанавливается в узлах с отрицанием, причем в качестве заключения (если не все дерево пройдено) используется гипотеза, соответствующая самому верхнему уровню дерева (корню). Однако для такого вывода характерно большое количество данных, а также оценок дерева, не имеющих прямого отношения к заключению, что излишне. Преимущество обратных выводов - в том, что оцениваются только те части дерева, которые имеют отношение к заключению,
однако, если отрицание или утверждение невозможны, то порождение дерева лишено смысла. В двунаправленных выводах сначала оценивается небольшой объем полученных данных и выбирается гипотеза (по примеру прямых выводов), а затем запрашиваются данные, необходимые для принятия решения о пригодности данной гипотезы. На основе этих выводов можно реализовать более мощную и гибкую систему.
Системы продукций с прямыми выводами среди систем, основанных на использовании знаний, имеют наиболее давнюю историю, поэтому они являются в некотором смысле основополагающими. Эти системы включают три компонента: базу правил, состоящую из набора продукций (правил вывода), базу данных, содержащую множество фактов, и интерпретатор для получения логического вывода на основании этих знаний. База правил и база данных образуют базу знаний, а интерпретатор соответствует механизму логического вывода. Вывод выполняется в виде цикла «понимание - выполнение», причем в каждом цикле выполняемая часть выбранного правила обновляет базу данных. В результате содержимое базы данных преобразуется от первоначального к целевому, т. е. целевая система синтезируется в базе данных. Иначе говоря, для системы продукций характерен простой цикл выбора и выполнения (или оценки) правил, однако из-за необходимости периодического сопоставления с образцом в базе правил (отождествлением) с увеличением числа последних (правил) существенно замедляется скорость вывода. Следовательно, такие системы не годятся для решения крупномасштабных задач. Упорядочим слабые и сильные стороны хорошо известных систем продукций. Сильные стороны:
• простота создания и понимания, отдельных правил;
• простота модификаций и расширения базы знаний;
• простота механизма логического вывода;
• естественная модульность организации баз знаний.
Слабые стороны:
• неясность взаимных отношений правил;
• сложность оценки целостного образа знаний;
• крайне низкая эффективность обработки;
• отличие от человеческой структуры знаний;
• отсутствие гибкости в логическом выводе.
Фреймовая модель представления знаний
Фреймовый подход к представлению знаний является частным случаем моделей представления знаний с помощью семантических сетей. Здесь единицей представления является объект, называемый фреймом. Формально под фреймом понимают обычно следующую структуру: /[[1,ёД £2),...,{ук,ёк)], где/ - имя фрейма; V,ё^ - 1-й слот; V - имя слота; ё^ - его значение.
Таким образом, фрейм представляет собой некоторую законченную структуру, которая при заполнении слотов значениями описывает вполне конкретный факт, событие, явление или процесс.
Фреймы можно разделить на две группы: фреймы-описания; ролевые фреймы. Фрейм-описание:
[<программное обеспечение>, <программа 1С бухгалтерия, версия 7.7>, программа 1С торговля, версия 7.7>, <правовая программа «Консультант +» проф.>]. Ролевой фрейм:
[<заявка на продажу>, <что, установка и покупка программы 1С торговля, версия 7.7>, <откуда, фирма Рим>, <куда, фирма «Эл Ти Хелскеа»>, <кто, курьер Сидоров>, <когда, 18 февраля 2006г.>].
Во фрейме-описании в качестве имен слотов задан вид программного обеспечения, а значение слота характеризует массу и производителя конкретного вида продукции. В ролевом фрейме в качестве имен слотов выступают вопросительные слова, ответы на которые являются значениями слотов. Для данного примера представлены уже описания конкретных фреймов, которые могут называться либо фреймами-примерами, либо фреймами-экземплярами. Если в приведенном примере убрать значения слотов, оставив только имена, то получим так называемый фрейм-прототип.
Достоинство фрейма-представления во многом основываются на включении в него предположений и ожиданий. Это достигается за счет присвоения по умолчанию слотам фрейма стандартных ситуаций. В процессе поиска решений эти значения могут быть заменены более достоверными. Некоторые переменные выделены таким образом, что об их значениях система должна спросить пользователя. Часть переменных определяется посредством встроенных процедур, называемых внутренними. По мере присвоения переменным определенных значений осуществляется вызов других процедур. Этот тип представления комбинирует декларативные и процедурные знания.
Фреймовые модели обеспечивают требования структурированности и связанности. Это достигается за счет свойств наследования и вложенности, которыми обладают фреймы, т.е. в качестве слотов может выступать система имен слотов более низкого уровня, а также слоты могут быть использованы как вызовы каких-либо процедур для выполнения.
Для многих предметных областей фреймовые модели являются основным способом формализации знаний.
Семантическая модель представления знаний
Основная идея данного подхода к представлению знаний состоит в том, что предметная область рассматривается как совокупность объектов и связей между ними. Семантическая сеть, представляющая некоторую предметную область, есть граф, в котором множеству вершин сопоставимы объекты(понятия, события, процессы), а множеству дуг - отношения на множестве объектов. Вершины и дуги семантической сети помечаются именами соответствующих объектов и отношений предметной области.
Базовым функциональным элементом семантической сети служит структура из двух компонентов: дуги и инцидентных ей пары вершин. Можно считать, что каждый такой элемент представляет собой простой факт или высказывание предметной области. Например, высказывание: «Сидоров учится в школе» можно представить в виде элемента семантической сети, изображенного на рис.
Сидоров учится школа
Рис. Пример базового функционального элемента семантической сети
Как видно из рисунка, дуга в сети имеет направленность, благодаря чему между понятиями в рамках определенного факта выражается отношение «субъект/объект». Очевидно, что каждая вершина графа может быть соединена с любым числом других вершин. Таким образом, осуществляется формирование сети фактов.
Базовую структуру семантической сети, с точки зрения логики, можно рассматривать как эквивалент бинарного предиката. Тогда предикат соответствует направленной
дуге, а два его аргумента - двум инцидентным этой дуге вершинам. Пример на рисунке можно описать предикатом «учиться (Сидоров, школа)».
В семантических представлениях используются три основных типа объектов: понятия, события и свойства. Понятия обычно соответствуют предметам или абстракциям. Под событием понимают действия, приводящие к изменению ситуации. Свойства используются для уточнения или модификации понятий, событий или других свойств.
При представлении знаний семантическими сетями особый практический интерес имеют связи следующих видов: «является», «имеет», «есть». Связь вида «является» отражает принадлежность к некоторому классу объектов. Связь вида «имеет» и «есть» указывают, соответственно, на то, что одно понятие служит атрибутом другого. Используя эти отношения, можно достаточно просто представить сложные совокупности фактов [3].
Достоинствами моделей представления знаний с помощью семантических сетей являются большие выразительные возможности, наглядность, близость структуры сети семантической структуре предметной области.
Основные недостатком подобных моделей является слабое развитие теоретических основ логического вывода, в связи с чем усиливается элемент произвольности, вводимый разработчиком конкретной системы обработки знаний на основе семантической сети. Поэтому процедуры вывода в таких системах часто таят в себе угрозу противоречий, а, следовательно, процедурам анализа противоречивости в семантических сетях необходимо уделять больше внимания, чем, например, в продукционных системах. Очень часто эта функция в семантических моделях возлагается на человека. Таким образом, при достаточно большом объеме знаний решение этой задачи резко усложняется, что ограничивает круг предметных областей, описываемых семантическими сетями, сравнительно небольшими проблемами.
Заключение
При рассмотрении типичных моделей знаний были выявлены достоинства и недостатки каждой из перечисленных моделей представления. Этот факт объясняет, почему в последнее время разработчики интеллектуальных систем все шире используют комбинированные способы представления знаний, что позволяет компенсировать недостатки одного представления достоинствами другого. Например, такой недостаток продукционной системы, как отсутствие явного структурирования правил предметной области, можно устранить с помощью сети фреймов, обеспечивающих группирование правил по ситуациям. Отмечается, что использование комбинированных подходов предоставляет новые возможности для создания интеллектуальных систем, обладающих уникальными свойствами [4].
Литература
1. Убейко В.Н. Экспертные системы. М.: Май, 1992. 246 с.
2. Поспелова Д.А. Логика рассуждений и ее моделирование. М.: Науч. совет по комплекс. проб. «Кибернетика», 1983. 180 с.
3. Элти Дж., Кумбс М. Экспертные системы: концепции и примеры. М.: Финансы и статистика, 1987. 191 с.
4. Попов Э.В. Экспертные системы: Решение неформализованных задач в диалоге с ЭВМ. М.: Наука, 1987. 288 с.