Научная статья на тему 'Использование интеллектуальных систем в гуманитарных отраслях знания'

Использование интеллектуальных систем в гуманитарных отраслях знания Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
268
53
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гущина О. А.

В статье рассматриваются основные принципы непосредственной и удаленной форм образования и контроля усвоения знаний по программам школьных и вузовских курсов естественно-технической и общественной направленности на примере модели обучающей экспертной системы. Особое внимание в представленной модели уделено техническим особенностям фреймовой структуры и соответствующей ей структуры обработки информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Use of Intellectual Knowledge Systems in Humanitarian Field of Knowledge

The article views the main principles of direct and distant forms of education and control of knowledge being mastered within the programmes of school and university natural, technical and social courses by the example of the model of the teaching expert system. Special emphasis in the given model is paid to the technical peculiarities of the frame structure and corresponding structure of information processing.

Текст научной работы на тему «Использование интеллектуальных систем в гуманитарных отраслях знания»

ной работе. Проблемы, возникающие при воплощении системы: трудоемкость, необходимость обширной предварительной (в том числе правовой) подготовки и т. п., — разрешимы и не предполагают значительных затрат. Интеграция системы знаний в сеть российских образо-

вательных порталов подчеркнет ее сущность как элемента единой образовательной среды.

Наличие фактора системы знаний приведет в перспективе к перестройке системы образования в соответствии с принципами информационного общества.

Поступила 27.11.06.

ИСПОЛЬЗОВАНИЕ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ В ГУМАНИТАРНЫХ ОТРАСЛЯХ ЗНАНИЯ

О. А. Гущина, доцент кафедры систем автоматизированного проектирования МГУ им. 77. 77. Огарева

В статье рассматриваются основные принципы непосредственной и удаленной форм образования и контроля усвоения знаний по программам школьных и вузовских курсов естественно-технической и общественной направленности на примере модели обучающей экспертной системы. Особое внимание в представленной модели уделено техническим особенностям фреймовой структуры и соответствующей ей структуры обработки информации.

Активное развитие в последнее время систем искусственного интеллекта (СИИ) обусловлено множеством факторов, которые разделяются на блоки — в зависимости от технических, экономических и социальных аспектов.

Блок технических факторов составляют следующие особенности СИИ:

— возможность решения задач, требующих интеллектуальных навыков;

— возможность решения задач, не решаемых традиционными вычислительными методами или решаемых со значительными затратами либо человеческих, либо временных, либо денежных ресурсов;

— использование при решении задач не столько алгоритмических, сколько эвристических методов и/или символьных рассуждений;

— отсутствие существенных вычислительных погрешностей всех десяти видов (благодаря использованию нетрадиционных методов);

— получение приемлемых решений сложных, но понятных человеку задач;

— возможность решения задач, требующих не только общедоступных, но и узких специфических либо глобальных

разносторонних знаний из различных проблемных областей;

— хорошо структурированная проблемная (или хотя бы предметная) область;

— одновременное подключение данных и методов нескольких людей-экспер-тов (даже имеющих противоположные точки зрения);

— доступ больше чем к одному человеку-эксперту в рассматриваемой специфичной проблемной области (причем люди-эксперты должны быть способны четко формулировать свои данные, знания) и взаимодействие между ними;

— приемлемые для решения размеры поставленной специфичной задачи в проблемной области.

К социально-экономическим факторам целесообразности применения, а следовательно, и развития СИИ отнесем то, что:

— результаты работы таких систем высокорентабельны;

— получаемые решения оправдывают затраты и усилия по разработке и поддержке экспертной системы;

— информационные блоки СИИ позволяют приумножать при обучении си-

© О. А. Гущина, 2007

стемы, а также хранить данные и знания людей-экспертов, не доступных по каким-либо причинам (например, в связи со смертью и др.);

— системы помогают получать приемлемые решения при отсутствии человеческого опыта решения проблемы;

— они позволяют получать экспертные решения в условиях, неблагоприятных для людей (в частности, при работе в ядерных реакторах, на космических станциях и пр.), или при недопустимости задержек и помех в консультации (например, при консультировании в труднодоступных районах).

Наиболее актуально использование СИИ в плохо формализуемых областях знаний, при неполноте, недостоверности, многозначности исходной информации и качественных оценок процессов. К таковым относятся и педагогика, и экономика, и медицина, и геология, и многие другие важные области знаний, в которых приходится решать проблемы, по сути представляющие собой творческие задачи. Творческими будем считать задачи, не имеющие стандартного алгоритма решения и/или имеющие неоднозначные решения (т. е. или не имеющие решения, или имеющие счетное/несчетное количество решений, или имеющие нестандартное решение)1.

Широкое распространение в педагогике СИИ получили благодаря возможностям их использования при осуществлении общего развития, обучения, тренинга, а также при тестировании промежуточных и остаточных знаний обучаемых.

Одним из ярких и быстро прогрессирующих направлений в области создания искусственного интеллекта является разработка экспертных систем (ЭС). В последнее десятилетие экспертные системы возродились в виде интеллектуальных систем с базами знаний. ЭС тесно переплетаются с существующими деловыми системами и используются в здравоохранении, банковском деле и других областях для того, чтобы с помощью

правил и объектов накапливать опыт, повышать качество принимаемых решений. Базы знаний встроены сегодня в наиболее современные крупные системы поддержки принятия решений (СА8Е-системы, управленческие системы) и находятся в самой сердцевине программ-агентов, осуществляющих поиск в сети Интернет, помогая коллективам пользователей справиться с потоком информации.

Г1о словам Эдварда Фейгенбаума (Стэнфордский университет), «Основным принципом инженерии знаний является то, что возможности решателя задач интеллектуального агента в первую очередь определяются его информационной базой и лишь во вторую — используемым методом вывода. Экспертные системы должны быть сильны знаниями, даже если они слабы методами. Это важный вывод, который лишь недавно по достоинству оценили исследователи искусственного интеллекта. Долгое время они занимались почти исключительно разработкой различных методов вывода. Но можно использовать почти любой метод. Сила заключается в знаниях»2,

В данной статье рассматривается проект региональной системы поддержки образования «Кпоэд'Ме!;» (РСПО «КподуМе!;»), позволяющей как через Интернет, так и «напрямую» получать знания и контролировать их усвоение по программам школьных и вузовских курсов. На данном этапе в систему включены модули по гуманитарным (в частности, истории) и точным (в частности, физике) дисциплинам. Каждый из модулей автономен. Указанный программный продукт предназначен для школьников, студентов различных форм обучения, аспирантов и всех, интересующихся информацией по предмету вне зависимости от своего местонахождения. Пользователь сам устанавливает приоритетность тем и выбирает уровни сложности и объем отображаемого материала.

Применение экспертных систем обусловлено потребностью в получении

качественных, быстрых и разнообразных консультаций в обширных проблемных областях человеческого знания. Основными отличиями ЭС от других систем искусственного интеллекта являются возможность их создания и функционирования в проблемных областях с богатым накопленным опытом, а также возможность структурирования знаний. К таким областям знаний относятся заложенные в системе курсы дисциплин. Поэтому для технической реализации проекта создания РСГ10 «Кпо\уМеЪ> была выбрана именно экспертная система.

Хотелось бы напомнить, что классическая структура экспертной системы как системы искусственного интеллекта представляет собой совокупность базы знаний, машины логического вывода и объединяющего их в единое целое интерфейса пользователя.

Знания — это совокупность данных, способов их применения и коэффициентов доверия различного рода (в зависимости от приоритетов, устанавливаемых интеллектуальной системой). Соответственно база знаний — это информационная база, включающая упорядоченную совокупность данных и методов их обработки в некоторой проблемной области. На основе информации, хранящейся в базе знаний, осуществляется функционирование машины логического вывода.

Машина логического вывода (МЛВ, машина вывода, машина принятия решений) представляет собой механизм, который определяет, каким образом и в какой последовательности должна применяться информация базы знаний для решения поставленной задачи. МЛВ состоит из интерпретатора и диспетчера. Интерпретатор определяет, каким образом применять правила для вывода новых знаний. Диспетчер устанавливает порядок применения правил.

Интерфейс пользователя является прикладной программой, которая организует обмен информацией между пользователем и МЛВ.

В основе функционирования РСПО «Кпо^^Че!;» лежат следующие принципы:

1) у пользователя запрашиваются начальные параметры и интересующая его тема. При отсутствии начальных параметров система «Кпо^уМе!;» задает минимальные параметры;

2) возможно изменение каких-либо параметров в процессе работы;

3) система информационной поддержки «Кпо\уМе1;» отображает информацию с выделением в виде гиперссылок на дополнительную информацию;

4) вся дополнительная информация отображается в отдельно открытых окнах при сохранении начального текста;

5) в программе предусмотрена возможность сохранения информации в текстовом формате и/или вывода его на печать.

Опираясь на вышеперечисленные принципы, сформулируем технические характеристики РСПО «Кпо\уМеЪ> (на примере модуля по истории):

— история как проблемная область (проблемной областью считается совокупность предметной области и всех задач, решаемых в ней) является статической',

— база знаний системы статическая, так как любые программные процессы системы не влияют на содержание самих знаний;

— на основании предыдущего пункта ЭС в целом также является статической',

— исходя из специфики проблемной области и самой региональной системы информационной поддержки образования пополнение базы знаний осуществляется непосредственным вводом в нее знаний. Все вводимые знания представляются людьми-экспертами, территориально находящимися в различных местах, после чего обрабатываются модератором и инженером знания для придания им необходимой для программы формы;

— интерпретатор МЛВ системы «КполуМе!;» представляет собой независимый программный продукт, который

можно использовать отдельно от основной системы. Это позволяет распараллелить процессы ввода новой информации и ее использования;

— диспетчер МЛВ является основной ее частью в пользовательской версии. Интерпретатор и диспетчер РСПО «Кпоэд1Че1;» могут использоваться по отдельности и в других независимых проектах;

— все возможные выводы МЛВ (т. е. все возможные цепочки выводов, которые могут быть получены при использовании правил) объединяются в сеть вывода;

— в зависимости от особенностей проблемной области знания можно классифицировать как истинные (т. е. не ошибочные), точные (т. е. не приблизительные), однозначные (т. е. не многозначные), полные или неполные (в зависимости от заданных начальных параметров).

Для программной реализации проекта региональной системы поддержки образования «Кпо\уМеЪ> с вышеописанными принципами была разработана специальная модель представления знаний с соответствующими машиной логического вывода и интерфейсом пользователя.

Начальные параметры модели обусловливают индивидуальные требования к качеству и составу представляемой информации. Они показывают:

1) полноту информации (сокращенная/стандартная/расширенная);

2) уровень сложности изложения информации (конспективный/научный/научно-популярный);

3) степень изначальной осведомленности пользователя (учащийся/студент/ профессионал);

4) наличие вопросов для проверки усвоения изложенного материала (да/ нет).

Все вышеперечисленные параметры могут быть изменены в процессе получения информации. Каждому из выбранных параметров система ставит в соот-

ветствие информацию по одному из четырех систем индексации.

В качестве модели представления знаний были использованы фреймы-сценарии. Выбор фреймового представления знаний объясняется потребностью в информации нужной конфигурации, позволяющей пользователю адекватно решать возникающие лингвистические проблемы, обучать систему и решать возложенные на нее задачи. А так как данными служит только символьная информация, вид представления которой подчиняется нескольким неоднозначным параметрам, то из всего многообразия видов фреймов (фреймы визуальных образов; семантические; определяющие рассуждения; задающие повествование и пр.) были выделены те, что обусловливают действия, т. е. фреймы-сценарии. Основоположник теории фреймов М. Минский определяет фреймы-сценарии «как типовые структуры для некоторого действия, понятия, события и т. п., включающие характерные элементы этого действия, понятия, события»3.

Выбор фреймовой модели при разработке РСПО «Кпоау^!;» основывается на особенностях истории (как предметной области), предоставляемом системой многообразии отображения информации, актуальности множественного использования гиперссылок (например, на биографии или какие-либо события). Притом гиперссылки можно описать в соответствующих слотах фреймов как дополнительные ссылки. Слотом называется любая ограниченная и законченная часть фрейма. Необходимо отметить, что слотом может быть и сам фрейм. Одной из значительных особенностей систем организации знаний в виде фреймов является возможность задавать в слотах указатель на другие фреймы (например, гиперссылки). Визуально фрейм можно представить в виде сети (т. е. узлов и связей между ними).

Верхние уровни фрейма четко определены, поскольку образованы такими понятиями, которые всегда справедливы

по отношению к предполагаемой ситуации. На более низких уровнях располагаются особые вершины — терминалы. Терминалы должны быть заполнены характерными для данной ситуации данными. Каждым терминалом могут устанавливаться условия, которым должны удовлетворять его значения, называемые заданиями. Простые условия определяются значениями -маркерами (например, в виде требования, чтобы заданием терминала был какой-либо слот, или лексема, или указатель на фрейм определенного типа). Более сложными условиями задаются отношения между понятиями, включенными в различные терминальные вершины. Это дает неограниченные возможности для применения как всей системы, так и данных или знаний вне зависимости от системы.

Группы семантически близких друг другу фреймов можно объединить в систему фреймов. Результаты существенных преобразований представляются в виде трансформаций между фреймами, входящими в систему фреймов. Это, в частности, позволяет моделировать понятия коэффициента внимания и ценности информации (в нашем случае — четыре указанных выше параметра), сделать более экономичными некоторые типы логических вычислений, а также показать эффективность использования фреймовой системы представления знаний.

Теория фреймов дает возможность использовать такую структуру, как субфрейм (т. е. фрейм, представляющий более частную ситуацию). В нашем случае с помощью субфреймов описываются исключения. Это, в свою очередь, дает возможность организовывать ссылки на группы фреймов.

Базу знаний можем рассматривать как совокупность систем фреймов по темам. В первом фрейме содержится основная информация из каждой определенной системы фреймов. В дополняющих его субфреймах записывается информация, являющаяся исключением в первом, более раннем, фрейме той же

группы. Таким образом, появляются несколько групп фреймов, количество которых зависит от количества тем, включенных в РСПО «Кпо'\уМе1;».

Теоретически в представлении знаний в виде фреймов-сценариев последние показывают различные позиции наблюдателя, анализирующего одну и ту же сцену; трансформация — это результат перемещения наблюдателя из одного места в другое. Для систем иных фреймовых типов различия между фреймами могут соответствовать результатам выполнения каких-либо действий, определенным причинно-следственным связям между объектами внешнего мира или различным точкам зрения по одним и тем же вопросам. К числу центральных моментов теории фреймов относится тог что одни и те же терминалы могут входить в состав нескольких фреймов системы, позволяя согласовывать информацию, поступившую из различных источников. Для этого необходима постоянная, кропотливая и точная работа модератора и инженера знаний.

Теория фреймов выигрывает благодаря возможности использования в ней ожиданий других видов гипотез. Терминалы фрейма в обычном состоянии заполнены так называемыми заданиями отсутствия, т. е. заранее заготовленными значениями. Задания отсутствия — это сведения о частях фрейма, которые не обязательно должны выполняться в какой-либо конкретной ситуации. Связь заданий отсутствия со своими терминалами не является жесткой и неизменной, поэтому они могут быть легко заменены другими данными, более подходящими в текущей ситуации. Таким образом, задания отсутствия выполняют роль как временных, так и постоянных переменных. В общем случае они служат для представления информации общего вида и поиска наиболее вероятностных ссылок, указывают на способы проведения полезных обобщений и пр.

Системы фреймов связаны сетью поиска информации. Если рассматриваемый фрейм не удается соотнести с ре-

альной ситуацией, т. е. нельзя подобрать такие значения терминалов, которые удовлетворяют условиям соответствующих маркеров, то сеть поиска информации позволяет подобрать другой фрейм, более подходящий для данной ситуации. Подобные структуры дают возможность использовать в системах фреймов различные методы представления информации, что имеет особое значение для разработки механизмов «понимания».

После выбора фрейма в процессе согласования ранее не определенным терминалам присваиваются значения, удовлетворяющие всем значениям соответствующих маркеров. Выполнение процесса согласования частично контролируется информацией, связанной с самим фреймом (включая указания на то, как необходимо реагировать на непредвиденные обстоятельства). Если согласование внешних данных с маркерами терминалов является неудовлетворительным, то данные, полученные на его основе, могут быть применены при выборе альтернативного фрейма.

РСПО «К.по\\^еЪ» работает с большими потоками информации, т. е. большими последовательностями объектов данных. Эта информация достаточно хорошо структурирована как по фреймовым структурам, так и по историческим темам. Целесообразно использовать каждый фрейм в виде отдельного файла, который хранит не только системную, но и дополнительную структурную информацию, включенную в текст.

Машина логического вывода включает в себя процедуры и функции, которые позволяют обрабатывать правила, входящие в фреймы базы знаний. МЛВ тесно связана со структурой базы знаний и в своих «вычислениях» опирается на нее. Обычно машина принятия решений — это алгоритмы, которые выполняют заранее заданные процедуры и функции над фреймами базы знаний. Она способна программно расширяться, что позволяет системе «История» в дальнейшем

совершенствоваться. Причем возможность дополнения МЛВ обусловлена функциями и качеством базы знаний.

При рассмотрении любого из методов представления знаний обязательно будут затронуты методы их обработки, т. е. правила. Для извлечения данных в нашей фреймовой модели необходимы различные типы правил, соответствующие определенному уровню работы с информацией:

— изначальный уровень правил (необходим для изначального запуска системы, т. е. перевода системы в режим ввода, обработки, извлечения или удаления информации; окончания работы системы; перехода между этапами);

— общий уровень правил, или уровень метаправил (содержит непосредственно общие правила ввода, обработки, извлечения или удаления информации);

— первый уровень правил (включает конкретный набор для вышеперечисленных манипуляций с информацией);

— второй уровень правил (содержит правила для обработки исключительных ситуаций).

Правила могут по-разному располагаться в системе в зависимости от уровня данных, с которыми они работают:

1) полностью или частично входить в фреймы;

2) находиться отдельно в базе правил или машине логического вывода;

3) представлять собой логические процедуры или функции внутри системы.

В связи со спецификой региональной системы информационной поддержки образования «Кпо^¥^1» к первому случаю относятся, например, метки всех четырех вышеупомянутых систем индексации. Эти правила закодированы с помощью специальных лексем (т. е. последовательности символов, имеющих смысл) и индексов, что позволяет, не воздействуя на отображаемый текст, влиять на его состав и последовательность воспроизведения.

Ко второму уровню отнесены правила обработки фреймовых структур.

В основном это правила использования лексем, индексов и ссылок. Изменение и дополнение правил именно данного типа позволяют развивать и совершенствовать систему, включать в нее новые возможности. Также исключительно эти правила позволяют применять текстовые данные РСГЮ «Кпо\\'Л'сЧ» в других независимых проектах.

В третью группу попали правила, которые представляют собой программную реализацию процедур и функций обработки данных и правил предыдущих типов. Эти правила сконцентрированы преимущественно в интерфейсе пользователя. Их коррекция и дополнение существенно влияют на «дружелюбность», быстродействие и качество работы системы «Кпо^уМеЪ). Интерфейс пользователя, а соответственно правила третьей группы, могут применяться для проектов в других точных и гуманитарных областях знаний со сходной структурой информации (в экономике, биологии и пр.).

Фреймы и системы фреймов дают большие перспективы как для экономии памяти при хранении данных, так и для сокращения времени при манипуляциях (ввод, вывод и пр.) с информацией. Это обусловливается тем, что при заранее частично/полностью заданных терминалах определенных фреймов или заранее заготовленной одной/нескольких системе фреймов ссылки на нужную информацию уже предварительно расставлены, а перемещение по таким ссылкам занимает гораздо меньше времени, чем изначальное их создание.

Для повседневной классной и внеклассной работы школьников, студентов

различных форм и видов обучения разработаны обучающие, развивающие и тестирующие ЭС по различным точным (математике, физике, химии и пр.) и общеразвивающим (музыкальному образованию и изобразительному искусству и пр.) дисциплинам. В практике профессионального образования ЭС используются не только для тестирования, но и для повышения мастерства, приобретения необходимых знаний и навыков по специальным дисциплинам (черчению, дизайну ландшафтов и пр.). В вузах тестирующие ЭС применяются на всех этапах обучения: при поступлении, подготовке и сдаче зачетов и экзаменов. Особое внимание необходимо уделить внедряющимся в настоящее время обучающими тестирующим ЭС для студентов вечерней и заочной форм обучения, а также студентов с удаленным обучением. Они являются хорошим подспорьем как для самого студента, так и для контролирующего и оценивающего его преподавателя. Многие вузы и организации, осуществляющие образовательную деятельность, внедряют подобную практику для повышения квалификации или переподготовки кадров.

ПРИМЕЧАНИЯ

1 Интеллектуальные системы принятия решений / А. В. Алексеев, А. Н. Борисов, Э. Г. Вилюмс и др. Рига, 1997.

2 Цит. по: Люггер Джордж Ф. Искусственный интеллект: стратегия и методы решения сложных проблем : пер. с англ. / Ф. Люггер Джордж. 4-е год. М., 2003. С, 273.

3 Минский М. Фреймы для представления знаний : пер. с англ. / М. Минский. М., 1979. С. 67.

Поступила 29.11.06.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.