УДК 004.424
СОВРЕМЕННЫЕ МОДЕЛИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ В ОБУЧАЮЩИХ СИСТЕМАХ
© 2010 Е. С. Белоус1, В. А. Кудинов2, М. Э. Желнин3
1 аспирант каф. программного обеспечения и администрирования информационных систем e-mail: [email protected] 2 канд. пед. наук, проректор по НИР e-mail: [email protected] 3 аспирант каф. программного обеспечения и администрирования информационных систем e-mail: [email protected]
Курский государственный университет
Поскольку логический вывод и действия над знаниями производятся программным путем, знания не могут быть представлены непосредственно в том виде, в котором они используются человеком. В связи с этим для представления знаний разрабатываются различные модели представления знаний. В статье кратко освещены математические, логические, продукционные, сетевые и фреймовые модели, проанализированы преимущества и недостатки каждой из моделей, что позволяет сделать правильный выбор необходимой модели для решения поставленной задачи.
Ключевые слова: представление знаний, модели представления знаний,
математические модели, логические модели, продукционные модели, сетевые модели, фреймовые модели.
Как известно, знания в базе знаний представлены в определенной форме. Форма представления знаний оказывает существенное влияние на характеристики и свойства системы, поэтому представление знаний является одной из наиболее важных проблем, характерных для систем, основанных на знаниях.
Представление знаний - это формализация и структурирование (в целях облегчения решения задачи) знаний, с помощью которых отражаются основные характерные признаки [Олкконен 1997: 168-182]:
^ внутренняя интерпретируемость. Данные, хранящиеся в памяти или на
внешних носителях, лишены имен, таким образом, отсутствует возможность их однозначной идентификации системой. Данные может идентифицировать лишь программа, извлекающая их по определенному алгоритму;
^ структурированность. Информационные единицы должны обладать
гибкой структурой. Для них может выполняться рекурсия — вложимость одних информационных единиц в другие. Иначе говоря, должна существовать возможность произвольного установления между отдельными информационными единицами отношений типа «часть — целое», «род — вид» или «элемент — класс»;
^ связность. Между информационными единицами должна быть
предусмотрена возможность установления связей различного типа. Семантика отношений может носить декларативный или процедурный характер. Например, две и более информационные единицы могут быть связаны отношением «одновременно»,
две информационные единицы — отношением «причина — следствие» или «быть рядом»;
^ семантическая метрика. На множестве информационных единиц в
некоторых случаях полезно задавать отношение, характеризующее их ситуационную близость, то есть силу ассоциативной связи. Его можно было бы назвать отношением релевантности для информационных единиц. Оно дает возможность выделять в информационной базе некоторые типовые ситуации. Отношение релевантности при работе с информационными единицами позволяет находить знания, близкие к уже найденным;
^ активность. Все вычислительные процессы инициируются командами, а
данные используются этими командами лишь в случае необходимости. Иначе говоря, данные пассивны, а команды активны. Для информационных систем эта ситуация неприемлема. Выполнение программ должно инициироваться текущим состоянием информационной базы.
Проблема представления знаний заключается в несоответствии между сведениями о зависимостях данной предметной области, имеющимися у специалиста, методами, используемыми им при решении задач, и возможностями формального (однозначно-ограниченного) представления такой информации в ЭВМ. Часто проблема осложняется трудностями для эксперта по формулированию в явном виде имеющихся у него знаний.
Выделяется ряд моделей для решения поставленной проблемы, связанной с формализацией и представлением знаний в памяти информационных систем.
Модели представления знаний относятся к прагматическому направлению (основано на предположении о том, что мыслительная деятельность человека -«черный ящик») в исследованиях по искусственному интеллекту. При этом в системах, основанных на знаниях, информационные структуры представляются в форме декларативных (описательных) знаний, а алгоритмы и эвристики - в форме процедурных знаний.
На основе проведенного нами обзора были выявлены наиболее часто используемые и популярные на сегодняшний день модели представления знаний:
1) логические модели;
2) продукционные модели;
3) сетевые модели;
4) фреймовые модели;
5) математические модели.
Рассмотрим данные модели более подробно.
Основная идея при построении логических моделей знаний заключается в том, что вся информация, необходимая для решения прикладных задач, рассматривается как совокупность фактов и утверждений, которые представляются как формулы в некоторой логике. Знания отображаются совокупностью таких формул, а получение новых знаний сводится к реализации процедур логического вывода. В основе логических моделей знаний лежит понятие формальной теории, задаваемое картежем
Б=<Л, Б, Ах, Я>,
где Л - счетное множество базовых символов (алфавит);
Б - множество, называемое формулами;
Лх - выделенное подмножество априори истинных формул (аксиом);
Я - конечное множество отношений между формулами, называемое правилами вывода.
В основе сетевых моделей лежит конструкция, названная ранее семантической сетью. Сетевые модели формально можно задать в виде Н = <1, С1, С2,..., Сп, Г>. Здесь
I есть множество информационных единиц; С1, С2,..., Сп - множество типов связей между информационными единицами. Отображение Г задает между информационными единицами, входящими в I, связи из заданного набора типов связей.
Продукционные модели можно считать наиболее распространенными моделями представления знаний. Продукционная модель - это модель, основанная на правилах, позволяющая представить знание в виде предложений типа: «Если условие, то действие».
Продукционная модель обладает тем недостатком, что при накоплении достаточно большого числа (порядка нескольких сотен) продукций они начинают противоречить друг другу.
В общем случае продукционную модель можно представить в следующем виде:
К=<Л, и ,С ,1 ,я>,
где N - имя продукции;
Л - сфера применения продукции;
и - условие применимости продукции;
С - ядро продукции;
I - постусловия продукции, актуализирующиеся при положительной реализации продукции;
Я - комментарий, неформальное пояснение (обоснование) продукции, время введения в базу знаний и т. д.
В отличие от моделей других типов, во фреймовых моделях фиксируется жесткая структура информационных единиц, которая называется протофреймом. В общем виде она выглядит следующим образом:
(Имя фрейма:
Имя слота 1 (значение слота 1)
Имя слота 2 (значение слота 2)
Имя слота К (значение слота К)).
При конкретизации фрейма ему и слотам присваиваются конкретные имена и происходит заполнение слотов. Таким образом, из протофреймов получаются фреймы-экземпляры. Переход от исходного протофрейма к фрейму-экземпляру может быть многошаговым, за счет постепенного уточнения значений слотов [Берштейн 1994].
Среди математических моделей приведем следующие.
^ Математическая модель предметных знаний на основе теории нечетких множеств и отношений. Математической моделью представления предметных знаний в реляционной базе данных ИОС является нечеткий ориентированный граф (рис. 1). Данный способ формализованного описания предметных знаний позволяет, в отличие от других способов, учесть лингвистическую неопределенность знаний эксперта о качественных характеристиках учебного материала, благодаря чему целостное представление о составе и структуре предметных знаний формируется как у разработчиков, так и у пользователей ИОС [Беспалько 1977: 303].
-М'])
Мб« 2
М§С(СЫ 2> ©
Р
^п)
1Г> (п)
№%■'«)
'ч,) КГЯ
о о
ф(ЄГ-
@сеС-
изложение
©©
(5) ^ Є0* вопрос £ ає А - ответ
Ш<МгнК
рє 1}- подсказка
■ 5, с. Г х Т - подтема темы —►- c.Q'xQ-под&опрос вопроса
■ 5и с С ж Т - изложение темы --► Бл с .4 х отает на вопрос
► Ь' С Р xQ- подсказка на вопрос
Рис. 1
^ Математическая модель персональных знаний на основе теории нечетких множеств и отношений. Математической моделью представления персональных знаний в реляционной базе данных информационных обучающих систем (ИОС) является нечеткий ориентированный граф (рис. 2).
мгМ
Мп(Чі)у %^і); \
О О
- 8
й ■
Р$(ат>Чр\\! \Р5'(ак’Ч/+1>
\
Рис. 2
Такое модельное представление позволяет, в отличие от известных способов, учесть семантическую неопределенность оценивания педагогом степени подготовки обучаемого и адаптировать систему навигации электронного учебного курса адекватно
качественной и лингвистически неточной характеристике уровня знаний обучаемого. Применение теории нечетких множеств и отношений при формировании персональных знаний позволяет значительно повысить степень полноты и достоверности оценки степени подготовки учащегося благодаря учету различных факторов, влияющих на ответ учащегося при компьютерном контроле знаний, и, что самое важное, степени их влияния [Борисов 1989: 304].
^ Математическая модель методических знаний на основе теории
нечеткой логики. Математической моделью представления методических знаний в реляционной базе данных ИОС является конечное множество правил нечетких продукций. Данное представление позволяет учесть лингвистическую неопределенность знаний эксперта о методике проведения учебных занятий. Модельное представление обусловливает естественный способ переноса стратегий преподавания, сформированных педагогом на основе имеющегося практического опыта при личных контактах с учащимися, в образовательную среду компьютерного обучения, что позволяет максимально приблизить процесс автоматизированного обучения к традиционному обучению и, следовательно, значительно повысить дидактическую эффективность процесса обучения с помощью ИОС [Сарвилина 2003: 36-37].
При глубоком анализе каждой из представленных моделей представления знаний можно увидеть достоинства и недостатки каждой из них.
Достоинствами логической модели представления знаний являются единственность теоретического обоснования и возможность реализации системы формально точных определений и выводов.
Однако при решении сложных задач попытка представить неформализованные знания эксперта, среди которых преобладают эвристики, в системе строгой логики наталкивается на серьезные препятствия. Это связано с тем, что, в отличие от строгой логики, так называемая «человеческая логика» обладает нечеткой структурой. Поэтому большая часть достижений в области систем с базами знаний до настоящего момента была связана с применением нелогических моделей.
Что касается сетевых моделей, то основным их преимуществом является в большей степени соответствие относительно других моделей современным представлениям об организации долговременной памяти человека, а недостатком -сложность организации процедуры поиска вывода на семантической сети.
Преимуществами продукционных моделей являются простота создания и понимания отдельных правил, простота пополнения и модификации, простота механизма логического вывода; недостатками - неясность взаимных отношений правил, сложность оценки целостного образа знаний, крайне низкая эффективность обработки, отличие от человеческой структуры знаний, отсутствие гибкости в логическом выводе.
Основным преимуществом фреймовой модели представления знаний является то, что она отражает концептуальную основу организации памяти человека, а также ее гибкость и наглядность. Язык представления знаний, основанных на фреймовой модели, особенно эффективен для структурного описания сложных понятий и решения задач, в которых в соответствии с ситуацией желательно применять различные способы вывода. В то же время на таком языке затрудняется управление завершенностью и постоянством целостного образа. В частности, по этой причине существует большая опасность нарушения присоединенной процедуры. Следует отметить, что фреймовую систему без механизма присоединенных процедур (а следовательно, и механизма пересылки сообщений) часто используют как базу данных системы продукций.
Преимущества математических моделей состоят в том, что они точны, абстрактны и передают информацию логически однозначным образом. Модели точны, поскольку позволяют делать предсказания, которые можно сравнить с реальными данными, поставив эксперимент или проведя необходимые наблюдения. Модели абстрактны, так как символическая логика математики извлекает те и только те элементы, которые важны для дедуктивной логики рассуждения, исключая все посторонние значения. Недостатки математических моделей заключаются часто в сложности математического аппарата. Возникают трудности перевода результатов с языка математики на язык реальной жизни. Пожалуй, самый большой недостаток математической модели связан с теми искажениями, которые можно привнести в саму проблему, упорно отстаивая конкретную модель, даже если в действительности она не соответствует новым фактам.
На сегодняшний день разработано большое количество моделей. Каждая из них обладает своими преимуществами и недостатками, и поэтому для каждой конкретной задачи выбирается определенная модель. Такое количество моделей позволяет не только увеличить эффективность поставленной задачи, но и расширить ее возможности при решении.
Библиографический список
Берштейн Л. С., Коровин С. Я., Мелихов А. Н., Серяев И. Е. Функциональноструктурное исследование ситуационно-фреймовой сети эксплуатационной системы с нечеткой логикой // Изв. АН. Серия: Техническая кибернетика. 1994. №2. С. 120-124.
Беспалько В. П. Основы теории педагогических систем. Воронеж: Изд-во Воронеж. ун-та, 1977. С. 303.
Борисов А. Н., Алексеев А. В., Меркурьева Г. В., Слядзь Н. Н., Глушков В. И. Обработка нечеткой информации в системах принятия решений. М.: Радио и связь, 1989. С. 304.
Олкконен Е. А. Модели представления знаний в языковых интеллектуальных обучающих системах // Прикладная математика и информатика: труды
Петрозаводского государственного университета. 1997. №6. С. 168-182.
Сарвилина И. Ю. Моделирование процесса обучения на основе нечеткой логики // Университетское образование: тр. науч.-методической конф. Пенза: Поволжский Дом знаний, 2003. С. 36-37.