Pogibelskiy Alexander Yurevich
Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education «Southern Federal University».
Е-mail: [email protected].
44, Nekrasovskiy, Taganrog, 347928, Russia.
Phone: +79085149537.
УДК 519.712.2
М.Д. Сеченов, С.Н. Щеглов
АНАЛИЗ НЕФОРМАЛЬНЫХ МОДЕЛЕЙ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ В СИСТЕМАХ ПРИНЯТИЯ РЕШЕНИЙ*
Показан анализ неформальных моделей представления знаний в системах принятия решений. В настоящее время применяются семь классов неформальных моделей знаний: логические, продукционные, фреймовые, сетевые, объектно-ориентированные, специальные и комплексные. Коротко рассматривается каждый из перечисленных классов. Показаны их преимущества и недостатки.
Данные, знания; предметная область; естественный язык; сетевые модели; базы общих знаний (common knowledge); экспертные системы; системы управления; интеллектуальные системы.
M.D. Setchenov, S.N. Stoheglov
THE ANALYSIS OF INFORMAL MODELS OF REPRESENTATION OF KNOWLEDGE IN DECISION-MAKING SYSTEMS
In article the analysis of informal models of representation of knowledge in decision-making systems is shown. Now seven classes of informal models of knowledge are applied: logic, prodack-cion, frame, network, object-oriented, special and complex. Each of the listed classes is shortly considered. Their advantages and lacks are shown.
Data; knowledge; a subject domain; a natural language; network models; bases of the general knowledge (common knowledge); expert systems; control systems; intellectual systems.
Введение. Понятие «знания» неоднозначно, но оно принимает вполне конкретное значение в системах искусственного интеллекта: «знания - это формализованная информация, на которую ссылаются или используют в процессе логического вывода» [1]. В данном случае знания это информация, которую используют для вывода решения на основании имеющихся данных с помощью логических выводов.
Знания, применяемые как в СППР, так и в других предметных областях, обычно существуют в двух видах: общедоступные и индивидуальные [2]. Общедоступные знания - это факты, определения, теории. Эти личные знания основываются на собственном опыте эксперта, накопленном в результате многолетней практики, и в значительной степени состоят из эмпирических правил, которые принято называть эвристиками. Эвристики позволяют экспертам при необходимости выдвигать разумные предложения, находить перспективные подходы к задачам и эффективно работать при зашумленных или неполных данных СППР [3-5].
Также знания можно классифицировать по следующим категориям [6]:
*
Работа выполнена при поддержке: РФФИ (гранты № 08-01-00473, № 10-07-00538), г/б № 2.1.2.1652.
1. Поверхностные - знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области.
2. Глубинные - абстракции, аналогии, схемы, отображающие структуру и природу процессов, протекающих в предметной области. Эти знания объясняют явления и могут использоваться для прогнозирования поведения объектов.
Важно при создании интеллектуальных систем дать возможность системе извлекать и накапливать индивидуальные знания экспертов, которые представляют наибольшую ценность.
Существуют два типа методов представления знаний (ПЗ):
1. Формальные модели ПЗ.
2. Неформальные (семантические, реляционные) модели ПЗ.
В отличие от формальных моделей, в основе которых лежит строгая математическая теория, неформальные модели такой теории не придерживаются. Каждая неформальная модель годится только для конкретной предметной области и поэтому не обладает универсальностью, которая присуща моделям формальным. Логический вывод в формальных системах строг и корректен, поскольку подчинен жестким аксиоматическим правилам. Вывод в неформальных системах во многом определяется самим исследователем, который и отвечает за его корректность. Каждому из методов ПЗ соответствует свой способ описания знаний.
В настоящее время применяются семь классов моделей знаний (рис. 1): логические, продукционные, фреймовые, сетевые, объектно-ориентированные, специальные и комплексные [1,7-10]. Коротко остановимся на каждом из перечисленных классов.
Модели знаний
Логические
Исчисление
высказываний
Исчисление
предикатов
Продукционные (основанные на правилах)
Фреймовые
Сетевые(включая онтологии)
Объектно-ориентированные
Специальные
Комплексные
Рис. 1. Классы моделей знаний
В логических моделях знания представляются в виде совокупности правильно построенных формул какой-либо формальной системы (ФС), которая задается четверкой
(Г, P, А, Ю, (1)
где Т - множество базовых (терминальных) элементов, из которых формируются все выражения ФС, например слов из некоторого ограниченного словаря, деталей детского конструктора, входящих в состав некоторого набора и т.п.; Р - есть множество синтаксических правил, с помощью которых из терминальных элементов ФС (элементов множества Г) образуют синтаксически правильные совокупности (в множестве синтаксически правильных совокупностей выделяется некоторое подмножество А, элементы которого называются аксиомами); А - множество аксиом ФС, соответствующих синтаксически правильным выражениям, которые в рамках данной ФС априорно считаются истинными; К - конечное множество правил вывода, позволяющих получать из одних синтаксически правильных выражений другие, применяя которые к элементам А , можно получать новые синтаксически правильные совокупности, к которым снова можно применять правила из В (так формируется множество выводимых в данной формальной системе совокупностей).
Для знаний, входящих в базу знаний, можно считать, что множество А образуют все информационные единицы, которые введены в базу знаний извне, а с помощью правил вывода из них выводятся новые производные знания. Другими словами формальная система представляет собой генератор порождения новых знаний, образующих множество выводимых в данной системе знаний. Данное свойство логических моделей широко используется в базах знаний. Оно позволяет хранить в базе лишь те знания, которые образуют множество А, а все остальные знания получать из них по правилам вывода.
Простейшей логической моделью является исчисление высказываний. Аксиоматический базис исчисления высказываний составляет совокупность правильно построенных формул, являющихся тождественно истинными. К системе аксиом предъявляют требования непротиворечивости, независимости и полноты. Названным требованиям удовлетворяет система из четырех аксиом, предложенная Д. Гильбертом [9].
Представление знаний в рамках логики предикатов служит основой направления ИИ, называемого логическим программированием [10,11]. Методы логического программирования в настоящее время широко используются на практике при создании ИС в ряде ПрО.
Положительными чертами логических моделей знаний в целом являются:
♦ высокий уровень формализации, обеспечивающий возможность реализации системы формально точных определений и выводов;
♦ согласованность знаний как единого целого, облегчающая решение проблем верификации БЗ, оценки независимости и полноты системы аксиом и т.д.;
♦ единые средства описания как знаний о ПрО, так и способов решения задач в этой ПрО, что позволяет любую задачу свести к поиску логического вывода некоторой формулы в той или иной ФС.
Можно отметить следующие недостатки логических моделей. Во-первых, представление знаний в таких моделях ненаглядно: логические формулы трудно читаются и воспринимаются. Во-вторых, ограничения исчисления предикатов первого порядка не допускают квантификации предикатов и использовании их в качестве переменных. В-третьих, обоснованность обозначения свойств и отношений однотипными пропозиционными функциями вызывает сомнения. Анализ данного вопроса изложен в [6,11]. Наконец, в-четвертых, описание знаний в виде логических формул не позволяет проявиться преимуществам, которые имеются при автоматизированной обработке структур данных.
Центральным звеном продукционной модели является множество продукций или правил вывода. Каждая такая продукция в общем виде может быть представлена выражением
(Щ, и,, Р,, А, ^ В,, С,), (2)
где Щ, - сфера применения /-й продукции, определяющая класс ситуаций в некоторой ПрО (или фрагменте рабочей ПрО), в которых применение данной продукции правомерно; и, - предусловие /-й продукции, содержащее информацию об истинности данной продукции, ее значимости относительно прочих продукций и т.п.; Р/ - условие /-й продукции, определяемое факторами, непосредственно не входящими в А/ истинностное значение которого разрешает применять данную продукцию; А, ^ В, - ядро /-й продукции, соответствующее правилу «если..., то...»; С, - постусловие /-й продукции, определяющее изменения, которые необходимо внести в систему продукций после выполнения данной продукции.
В моделях этого типа используются некоторые элементы логических и сетевых моделей. Из логических моделей заимствована идея правил вывода, которые здесь называются продукциями, а из сетевых моделей - описание знаний в виде семантической сети. В результате применения правил вывода к фрагментам сетевого описания происходит трансформация семантической сети за счет смены ее фрагментов, наращивания сети и исключения из нее ненужных фрагментов. Таким образом, в продукционных моделях процедурная информация явно выделена и описывается иными средствами, чем декларативная информация. Вместо логического вывода, характерного для логических моделей, в продукционных моделях появляется вывод на знаниях.
Системы, основанные на продукционной модели, состоят из трех типовых компонентов: базы правил (продукций), базы фактов, содержащей декларативные знания о ПрО, используемые в качестве аргументов в условиях применимости продукций, и интерпретатора продукций, реализующего функции анализа условий применимости продукций, выполнения продукций и управления выбором продукций (управления выводом в продукционной системе).
Реализация логических и продукционных моделей знаний базируется на языках типа ПРОЛОГа.
Положительные стороны продукционной модели знаний состоят в ясности и наглядности интерпретации отдельных правил, а также простоте механизмов вывода (выполнения продукций) и модификации БЗ. Недостатками продукционной модели являются:
♦ сложность управления выводом, неоднозначность выбора конкурирующих правил;
♦ низкая эффективность вывода в целом, негибкость механизмов вывода;
♦ неоднозначность учета взаимосвязи отдельных продукций;
♦ несоответствие психологическим аспектам представления и обработки знаний человеком;
♦ сложность оценки целостного представления ПрО.
Продукционная модель чаще всего применяется в промышленных экспертных системах. Она обладает наглядностью, высокой модульностью, простотой механизма логического вывода, легкостью внесения дополнений и изменений.
Основой фреймовой модели знаний служит понятие фрейма — структуры данных, представляющей некоторый концептуальный объект или типовую ситуацию. Фрейм идентифицируется уникальным именем и включает в себя множество слотов. В свою очередь, каждому слоту соответствует определенная структура данных. В слотах описывается информация о фрейме: его свойства, характеристики, относящиеся к нему факты и т.д. Кроме того, слоты могут содержать ссылки на другие фреймы или указания на ассоциируемые с ними присоединенные процеду-
ры. Представление ПрО в виде иерархической системы фреймов хорошо отражает внутреннюю и внешнюю структуры объектов этой ПрО [3].
Реализация фреймовой модели знаний базируется на языках линии LISP, FRL, KRL.
Положительными чертами фреймовой модели являются ее наглядность, гибкость, однородность, высокая степень структуризации знаний, соответствие принципам представления знаний человеком в долговременной памяти, а также интеграция декларативных и процедурных знаний. Вместе с тем, для фреймовой модели характерны сложность управления выводом и низкая эффективность его процедур.
Наиболее общий способ представления знаний, при котором ПрО рассматривается как совокупность объектов и связывающих их отношений, реализован в сетевой модели знаний. В качестве носителя знаний в этой модели выступает семантическая сеть, вершины которой соответствуют объектам (понятиям), а дуги - отношениям между понятиями. Кроме того, и вершинам, и дугам присваиваются имена (идентификаторы) и описания, характеризующие семантику объектов и отношений ПрО.
Семантические сети - наиболее мощный класс математических моделей для представления знаний о ПрО, одно из важнейших направлений ИИ. В общем случае под семантической сетью понимается структура
S = (О, R), (3)
где О = {О, i= 1, n } - множество объектов ПрО; R = {Rj, j= 1, k } - множество отношений между объектами.
Семантическая сеть - это ориентированный граф, вершины которого - понятия, а дуги - отношения между ними [6]. В качестве понятий обычно выступают абстрактные или конкретные объекты, а отношения - это связи.
Среди моделей семантических сетей, разработанных в России в последние десятилетия, наибольшую известность получили следующие [4-11]:
♦ расширенные семантические сети И.П. Кузнецова;
♦ неоднородные семантические сети Г. С. Осипова;
♦ нечеткие семантические сети И. А. Перминова;
♦ обобщенная модель представления знаний о ПрО А.И. Башмакова.
Разновидностью сетевой модели является онтология. Быстрое развитие онтологического подхода в последние годы обусловлено распространением Intemet-технологий, использующих онтологические модели.
Объектно-ориентированная модель знаний получила широкое применение в современных технологиях проектирования разнообразных программных и информационных систем. В настоящее время существуют два основных подхода к моделированию знаний, базирующихся на объектной парадигме. Это модель MDA (Model Driven Architecture) [12] консорциума Object Management Group (OMG) и модель ODP (Model of Open Distributed Processing), зафиксированная в стандарте ISO/ITU [9-12].
Класс специальных моделей знаний объединяет модели, отражающие особенности представления знаний и решения задач в отдельных, относительно узких ПрО. Характеристики ряда специальных моделей даны в [6,8,11]. В качестве примера подобного способа формализации знаний можно привести модель представления ПрО «объект-признак», используемую в автоматизированных системах поиска аналогов и построения классификаций [11].
Применение на практике того или иного способа формализации обусловливается спецификой задачи, для решения которой планируется использовать БЗ. По мнению специалистов [4-10] наиболее перспективны смешанные или комплексные модели, интегрирующие преимущества рассмотренных выше базовых моделей представления ПрО. Примером комплексной модели может служить представление, использующее для описания знаний ленемы [9].
Подводя итоги анализа проблемы представления знаний, выделим девять ключевых требований к моделям знаний:
1) общность (универсальность);
2) «психологичность», наглядность представления знаний;
3) однородность;
4) реализация в модели свойства активности знаний;
5) открытость БЗ;
6) возможность отражения в БЗ структурных отношений объектов ПрО;
7) наличие механизма «проецирования» знаний на систему семантических шкал;
8) возможность оперирования нечеткими знаниями;
9) использование многоуровневых представлений (данные, модели, метамодели, метаметамодели и т. д.).
Отдельно ни одна из рассмотренных моделей знаний не удовлетворяет всем девяти требованиям. Это подтверждает актуальность разработки комплексных многоуровневых моделей представления ПрО, обеспечивающих возможность реализации свойств, соответствующих указанным требованиям.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. УэноХ., Исудзука М. Представление и использование знаний. - М.: Мир, 1989. - 220 с.
2. Хейес-Рот Ф., Уотерман Д., Ленат Д. Построение экспертных систем. - М.: Мир, 1987.
- 430с.
3. Гаврилова Т.А. Хорошевский В.Ф. Базы знаний интеллектуальны систем. - СПб.: Питер, 2000. - 384 с.
4. Поспелов Д.А. Данные и знания. Искусственный интеллект. В 3 кн. Кн. 1. - М.: Радио и связь, 1990. - 464 с.
5. Кандрашина Е.Ю., Литвинцева Л.В., Поспелов Д.А. Представление знаний о времени и пространстве в интеллектуальных системах / Под ред. Д.А. Поспелова. - М.: Наука, 1989. - 328 с.
6. Джексон П. Введение в экспертные системы. - М.: Издательский дом «Вильямс», 2001.
- 624 с.
7. Щеглов С.Н. Современные технологии построения систем поддержки принятия решений // Известия ЮФУ. Технические науки. - 2008. - № 4 (81). - С. 106-111.
8. Кузнецов И.Л. Расширенные семантические сети для представления и обработки знаний // Системы и средства информатики: Ежегод. Вып. 4 / РАН. Институт проблем информатики. - М., 1993. - С. 70-83.
9. Осипов Г.С. Построение моделей предметных областей. Ч. I. Неоднородные семантические сети // Известия РАН. Техническая кибернетика. - 1990. - № 5. - С. 32-35.
10. Городецкий В.И., Самойлов В.В., Малов О.А. Современное состояние технологии извлечения знаний из баз и хранилищ данных. Ч. I // Новости искусственного интеллекта.
- 2002. - № 3. - С. 3-12.
11. Городецкий В.И., Самойлов В.В., Малов О.А. Современное состояние технологии извлечения знаний из баз и хранилищ данных. Ч.П // Новости искусственного интеллекта.
- 2002. - № 4. - С. 3-9.
12. Щеглов С.Н. Анализ процесса подготовки и принятия решений в условиях «нечеткой» определенности информационного потока // Труды конгресса по интеллектуальным системам и информационным технологиям «АК- ГГ’09». Научное издание в 4-х томах.
- М.: Физматлит, 2009, Т.1. - С. 225-233.
Сеченов Михаил Дмитриевич
Технологический институт федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге.
E-mail: [email protected].
З47928, г. Таганрог, пер. Некрасовский, 44.
Тел.: 88бЗ4З71б25.
Щеглов Сергей Николаевич
E-mail: [email protected].
Setchenov Mixail Dmitrievich
Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education “Southern Federal University”.
E-mail: [email protected].
44, Nekrasovskiy, Taganrog, З47928, Russia.
Phone: 88бЗ4З71б25.
Shcheglov Sergej Nikolaevich
E-mail: [email protected].
УДК 004.827
С.В. Скороход
К ВОПРОСУ О ПРИМЕНЕНИИ ЛИНГВИСТИЧЕСКИХ ПЕРЕМЕННЫХ ДЛЯ ПОСТРОЕНИЯ ЭКСПЕРТНЫХ ОЦЕНОК*
Рассматривается задача построения значения нечёткой переменной методом экспертного опроса. Анализируется подход, основанный на использовании лингвистической переменной. Продемонстрированы недостатки существующих методов, использующих нечёткие множества второго уровня. Предлагается подход, позволяющий осуществить переход от нечёткого множества второго уровня к значению нечёткой переменной, лишенный указанных недостатков.
Нечёткая переменная лингвистическая переменная экспертная оценка.
S.V. Skorokhod
APPLICATION OF LINGUISTIC VARIABLES FOR EXPERT ESTIMATIONS
CONSTRUCTION
The problem of a fuzzy variable value construction is considered by a method of expert inquiry The approach based on use by a linguistic variable is analyzed. Lacks of the existing methods using fuzzy sets of the second level are shown. The approach, permitting to realize passage from an fuzzy set of the second level to a value of the indistinct variable, deprived the indicated shortages is offered.
Fuzzy variable linguistic variable expert estimation.
Постановка задачи. В системах принятия решений, основанных на обработке нечёткой информации, часто решается следующая задача. Имеется некоторая нечёткая переменная [1] K , заданная на числовой базовой шкале B. Требуется при помощи опроса нескольких экспертов построить её значение. Данная задача сводится к построению функции принадлежности Цк(х) нечёткого множества (НМ):
* Работа выполнена при финансовой поддержке Международного научного фонда экономических исследований академика Н.П. Федоренко. Проект № 2009-103