НАУЧНЫЕ СТАТЬИ И ДОКЛАДЫ • ВЫСШЕЕ ОБРАЗОВАНИЕ
УДК 378
Н. И. ЮСУПОВА, М.М.ГАЯНОВА
СЕМАНТИЧЕСКИЕ СЕТИ И ПРОДУКЦИОННЫЕ МОДЕЛИ ДЛЯ АНАЛИЗА УНИВЕРСИТЕТСКИХ ОБРАЗОВАТЕЛЬНЫХ ПРОГРАММ
В ИНФОРМАЦИОННОЙ СИСТЕМЕ
Рассматривается возможность использования семантической сети и продукционных моделей для структурирования и формализации знаний и представления их в экспертной системе для сопоставительного анализа и сравнения планов по информатике университетов разных стран. Рассмотрена структура модели и онтология предметной области, приведен фрагмент онтологии представления знаний о структуре учебных планов. Для наглядного представления последовательности проведения сопоставительного анализа образовательных программ построена функциональная модель. Образовательная программа; онтология представления знаний; экспертная система
ВВЕДЕНИЕ
С начала возникновения первого университета в Европе (Болонья, 1088 г.) и до середины ХХ века высшие учебные заведения в различных странах Европы развивались независимо друг от друга в соответствии с принятыми в каждой стране традициями. В настоящее время насчитывается более 10 различных моделей высшего образования. В связи с началом процесса интеграции в Европе возник вопрос создания общеевропейского пространства высшего образования с целью гармонизации национальных систем. В июне 1999 г. в Болонье министры образования 29 европейских стран подписали «Декларацию о Европейском пространстве для высшего образования», цель которой — «создание общеевропейского пространства высшего образования с целью повышения мобильности граждан на рынке труда и усиления конкурентоспособности европейского высшего образования» [1].
Вхождение российских университетов в общеевропейское пространство высшего образования может быть осуществлено переводом наших вузов на европейскую систему зачетных кредитов, к которой легко приводится и система кредитов, используемая в Америке. Система зачетных кредитов обеспечит способ измерения и сравнения результатов обучения при переходе из одного вуза в другой.
Для признания зарубежными университетами образовательных программ российских учебных заведений и для привлечения зарубежных студентов на обучение в Россию необходимо разрабатывать конкурентоспособные образовательные программы и правильно представлять их на рынке. Поэтому представляет интерес сопоставительный анализ образовательных программ с соответствующими программами зарубежных университетов.
Предварительное согласование содержания программы обучения между родным университетом студента и принимающим университетом возможно на основе анализа образовательных программ вузов. При решении задачи сравнения двух учебных планов возникает необходимость сопоставления как общего списка дисциплин, наименования отдельных дисциплин, а также количественных (нагрузка дисциплины) и качественных (содержание дисциплины) параметров. Задача сопоставления образовательных программ и содержания дисциплин не является формализуемой, поэтому возникает вопрос о возможности разработки информационной системы для сопоставительного анализа университетских образовательных программ с применением технологий экспертных систем [2].
В данной статье рассматриваются вопросы, связанные с разработкой информацион-
Исследования частично поддерживались грантом РФФИ 06-07-89228-а «Система поддержки коммуникативных процессов при выполнении проектов фундаментальных исследований сложных систем на основе интеллектуальных мультиагентов» (2006-2008), а также НИР по теме ИФ-ВК-01-06-03 «Исследования и разработка интеллектуальных технологий поддержки принятия решений и управления на основе инженерии знаний».
ной системы для сравнения образовательных программ.
1. ФУНКЦИОНАЛЬНАЯ МОДЕЛЬ СОПОСТАВИТЕЛЬНОГО АНАЛИЗА ОБРАЗОВАТЕЛЬНЫХ ПРОГРАММ
Для наглядного представления последовательности проведения сопоставительного анализа образовательных программ построена функциональная модель и проведена ее декомпозиция. Разработанная функциональная модель верхнего уровня содержит три блока. Первый уровень декомпозиции представлен четырьмя блоками, отражающими последовательность действий или шагов, для решения поставленной задачи сравнения.
1. Провести выявление дисциплин, близких по смыслу. На вход данного блока поступают данные, предназначенные для сравнения. Из базы данных, в которую предварительно заносятся учебные планы университетов, последовательно выбираются дисциплины анализируемых образовательных программ. При этом одна из образовательных программ выбирается в качестве базовой, вторая является сравниваемой. По умолчанию базовой считается образовательная программа подготовки бакалавров 230100 «Информатика и вычислительная техника». В качестве базовой может быть выбрана иная образовательная программа. Затем проводится проверка базы фактов и тезауруса с целью выявления дисциплин, совпадающих по наименованию или связанных по смыслу посредствам ключевых слов. Сравнение осуществляется при помощи правил-продукций и семантической сети. Результатом выполнения данного блока является два списка:
дисциплины, сходные по наименованию или смысловому содержанию;
дисциплины, для которых не найдено соответствия с помощью правил продукции или семантической сети.
2. Провести интерактивное сопоставление дисциплин. В этом блоке обрабатывается второй список дисциплин, для которых система в силу тех или иных причин не нашла соответствия. Список последовательно обрабатывается экспертом следующим образом:
а) сопоставляются дисциплины по их наименованиям. В этом случае дисциплина автоматически соотносится к блокам дисциплин;
б) провести сопоставление ключевых слов, описывающих дисциплину, к дисциплинам из
базового учебного плана. В этом случае дисциплина также оказывается связанной по наименованию;
в) провести сопоставление наименований дисциплин к блокам. Такой вариант имеет смысл, когда эксперт не знает, к какой дисциплине провести соотношение, но знает, к какому примерно блоку она может относиться;
г) если эксперт не может соотнести дисциплину ни к блоку, ни к другой дисциплине, то такая дисциплина выделяется в отдельный блок дисциплин, для которых не было найдено соответствия. В этом случае система в результатах выдает предположение о том, что существуют дисциплины, которые возможно могут быть куда-либо отнесены. Результатом выполнения блока являются два списка:
- сопоставленные экспертом дисциплины;
- дисциплины, которым не было найдено соответствия.
3. Сравнить нагрузки схожих дисциплин.
По спискам схожих дисциплин проводится сравнение их учебных нагрузок с учетом предположения, что нагрузка дисциплины делится поровну на количество связей.
Следующим этапом полученные данные представляются в виде графиков или диаграмм, и выдается словесное описание полученных результатов.
На рис. 1 приведен первый уровень декомпозиции.
2. МОДЕЛИ ЗНАНИЙ ДЛЯ ЭКСПЕРТНОЙ СИСТЕМЫ СРАВНЕНИЯ УЧЕБНЫХ ПЛАНОВ
Экспертный анализ образовательных программ университетов различных государств позволяет выявить связи и закономерности рассматриваемой предметной области или, иначе, знания.
Для хранения данных используются базы данных (для них характерны большой объем и относительно небольшая удельная стоимость информации), для хранения знаний — базы знаний (небольшого объема, но с очень дорогим информационным массивом).
База знаний — основа любой интеллектуальной системы, где знания описаны на некотором языке представления знаний, приближенном к естественному.
Существует множество моделей представления знаний для различных предметных областей.
Учебный план российского университета, по направлению 552800
Список
схожих
дисциплин
Учебный
план
зарубежного
ВУЗа
Промес ІИ выявление дисциплин, близких по смыслу
Экспертная
система
Список
дисциплин, для которых не было найдено соответствия в автоматическом режиме
Провести интерактивное сопосіавление дисциплин
Пользователь
Данные об
учебных
нагрузках,
с гру пп ир ованн ые
по блокам
дисциплин
2 Варианты представления отчетов (диаграммы, сводные таблицы, графики и т.п.)
Список
сопоставленных
экспертом
дисциплин
Список дисциплин, которым не было найдено никакого соответствия
[ ] Эксперт, или группа экспертов
4 *
Представить результаты в виде диаграмм
Выводы по
результатам
сравнения
3
Рис. 1. Первый уровень декомпозиции процесса сравнения университетских образовательных программ
Большинство из них может быть сведено к следующим классам:
- продукционные модели;
- семантические сети;
- фреймы;
- формальные логические модели [3].
В ряде моделей ЭС используют комбинации сетевых и продукционных моделей представлений знаний. В таких моделях декларативные знания описываются в сетевом компоненте знаний, а процедурные знания - в продукционном. В этом случае говорят о работе продукционной системы над семантической сетью.
Сетевые модели. В основе моделей этого типа лежит конструкция, названная ранее семантической сетью. Сетевые модели формально можно задать в виде
н = {/; С-1, С-2, С;,. Г).
где — есть множество информационных единиц; , , ... , — множество типов связей
между информационными единицами.
В классифицирующих сетях используются отношения структуризации. Такие сети позволяют в базах знаний вводить разные иерархические отношения между информационными единицами.
Если в сетевой модели допускаются связи различного типа, то ее обычно называют семантической сетью. Здесь семантическая сеть
выступает в качестве носителя знаний, вершины которой соответствуют объектам (понятиям), а дуги — отношениям между понятиями [3].
В данном случае семантическая сеть, построенная по учебному плану (эталонному), предназначена для фильтрации дисциплин из учебного плана другого университета.
2.1. Семантическая сеть
Семантическая сеть — это множество понятий (слов и словосочетаний), связанных между собой. В семантическую сеть включаются наиболее часто встречающиеся слова текста, которые несут основную смысловую нагрузку. Для каждого понятия формируется набор ассоциативных (смысловых) связей, т. е. список других понятий, в сочетании с которыми оно встречалось в предложениях текста [3].Онтология отражает семантику предметной области. Тезаурус используется как инструмент семантического анализа на общелингвистическом уровне.
Пример фрагмента онтологии после семантического анализа следующего текста представлен на рис. 2: «Учебная дисциплина должна входить в определенный блок дисциплин, который является частью учебного плана, а также имеет свойство — учебную нагрузку, и завершается отчетностью определенного вида. Дисциплина читается
преподавателем некоторого подразделения, и изучается на определенном этапе обучения. Также учебная дисциплина описывается набором ключевых слов. Наименование учебной дисциплины и ключевые слова мо-гутиметь синонимы».
Рис. 2. Фрагмент онтологии предметной области
При анализе текста можно воспользоваться семантической сетью, построенной на базе других учебных планов (эталонных). Например, семантическую сеть учебного плана подготовки бакалавров по направлению 230100 «Информатика и вычислительная техника», можно использовать для фильтрации информации учебных планов зарубежных университетов. В учебных планах выявляются только дисциплины, которые содержатся в базовой сети, и резюме строятся только по этим дисциплинам. Сравнение семантических сетей различных учебных планов позволяет установить степень их смысловой близости, что может использоваться при автоматической структуризации [3].
При рассмотрении структуры любого учебного плана можно выделить следующие пять основных понятий и отношений между ними:
Понятия: «Дисциплина»; «Учебная на-
грузка»; «Ключевые слова»; «Блок дисциплин»; «Область дисциплин»; «Область знаний».
Поскольку речь идет о сравнении учебных планов между университетами России и зарубежья, то также следует выделить и такое важное понятие в учебных планах российских университетов, как направление, поскольку во многих зарубежных странах, такого понятия не существует.
Отношения: «Например» (пример эле-
мента класса); «Значение» (значение свойства); «Характеризуется» (атрибутивная
связь); «Имеет свойство» (атрибутивная связь); «Подразумевает»; «Содержит» («часть-целое»); «Может содержать» («часть-целое»); «Относится» («часть-целое»); «Регламентируется»; «Описывается» («функциональная связь»);
На основе выявленных понятий и отношений строится модель семантической сети для учебного плана по направлению 230100 «Информатика и вычислительная техника». Поскольку учебный план содержит в себе наряду с федеральным компонентом, содержимое которого регламентируется ГОС, также национально-региональный компонент (содержимое регламентируется вузом) и дисциплины по выбору, то такая модель будет называться метамоделью семантической сети учебного плана. На рис. 3 приведен фрагмент семантической сети для блока математических и естественно-научных дисциплин (МЕНД).
В процессе сравнения дисциплин авторы столкнулись с проблемой несовпадения названий дисциплин в университетах. В данном случае можно сравнивать такие дисциплины либо по областям дисциплин, либо по ключевым словам, характеризующим ту или иную дисциплину. В табл. 1 представлен фрагмент таблицы разделения дисциплин российского учебного плана по областям знаний.
2.2. Продукционная модель
Языки представления знаний, основанные на правилах, являются наиболее распространенными.
Продукционная модель или модель, основанная на правилах, позволяет представить знания в виде предложений типа «Если А, то », например:
если наименования дисциплин = аналогичны «и» часовые ставки = совпадают, то дисциплины = сопоставимы.
В общем виде под продукцией понимается выражение следующего вида:
где г — имя продукции, с помощью которого данная продукция выделяется из всего множества продукций. В качестве имени может выступать порядковый номер продукций в их множестве, хранящийся в памяти системы.
Продукционная модель представляет собой алгоритм поиска решения с нелинейным развитием, т. е. цель может быть достигнута различными путями, или не быть достигнутой вообще.
Рис. 3. Фрагмент семантической сети учебного плана по направлению 230100 «Информатика и вычислительная техника» для блока математических дисциплин
Алгоритм сравнения учебных планов отражает последовательность действий эксперта в области образовательного процесса, который проводит эвристический и лингвистический анализ содержимого двух образовательных программ.
В табл. 2 представлены известные системе факты по блоку математических и естественно-научных дисциплин. Внутри блока выделены федеральный, национально-региональный компоненты и дисциплины по выбору.
Т аблица1
Фрагмент таблицы разбиения дисциплин по областям знаний
ОПД Области охватываемые дисциплинами Наименование областей
Федеральный компонент НРК ДВ
Р18 Р19 Р20 Р21 Р22 Р23 Р24 Р25 Р26 Р27 Р28 Р29 Р30 Р31 Р32 Р33 Р34 Р35 Р36 Р37
Компьютерная графика Электротехника и электроника Безопасность жизнедеятельности $ ои р с е 1 о р ла с я О Прогр-е на языке высокого уровня Основы теории управления Организация ЭВМ и систем ы м се ы но ци ар е п О Базы данных Сети ЭВМ и телекоммуникации Методы и средства защиты комп.информации аки § агр нр е 1 1 о і е я ир о а о Ос Лингвистическое обеспечение САПР Информационные технологии Интерфейсы пользователя Геометрическое моделирование в САПР Сетевые технологии Организация вычислительных процессов
Электротехника аки но р ртк е Эле
О1 Математика
О2 Физика
+ + О3 Работа с графикой
+ + О4 Проектирование программных продуктов
О5 Системы искусственного интеллекта
+ О6 Проектирование аппаратные средства вычислительной техники
+ О7 Моделирование процессов и явлений
+ О8 Понятие компьютерных сетей
+ + О9 Информация, методы, средства ее обработки, хранения и защиты
+ + 010 Электротехническая подготовка
+ О11 Теория управления
+ О12 Надежность
+ О13 Системы реального времени
Таблица2
Фрагмент таблицы фактов для блока МЕНД
МЕНД
Федеральный компонент НРК ДВ
R2 | R3 | R41 R51 R6 | R7 | R81 R9 R10 R11 R12 R13 R14 R15 R16 R17
Математика Информатика Физика Экология й и ц а р е п о е и н а в о д е л с с и и з и л а н а й ы н м е т с и С Основы теории кодирования Теоретические основы автоматизированного управления Теория автоматов Модели и методы анализа проектных решений
Алгебра и геометрия Математический анализ Дискретная математика Мат. Логика и теория алгоритмов Вычислительная математика Теория вероятностей, мат. Статистика и случ. Процессы Методы оптимизации Теория принятия решений
+ A1 Introduction to Computer Science 1
+ ENGR101
+ A2 Differential Equations
+ Calculus of Several Variables 1
+ Calculus of Several Variables 2
+ Integration and Infinite Series
+ Differential Calculus
+ MATH 115. Calculus 1
+ MATH 116. Calculus 2
+ + MATH 215. Calculus 3
+ MATH 216. Introduction to Differential Equations
+ A3 Introduction to Discrete Structures
+ Introduction to Computer Science II
+ EECS 203. Discrete Mathematics
+ A4 Electricity and Magnetism Laboratory
+ Mechanics Laboratory
+ Oscillations, Waves, Electric and Magnetic Fields
+ Mechanics
+ Physics 140
+ Physics 141(Lab)
+ Physics 240
+ Physics 241(Lab)
+ A5 Linear Algebra and Applications
+ Hohere Mathematik I
В правом столбце таблицы представлены предметы из учебных планов Калифорнийского университета Лос-Анжелеса, университета Мичигана, Латвийского университета Транспорта и Связи. Каждая из дисциплин учебного плана по направлению 230100 Российского вуза имеет указатель Ихх. Дисциплины учебных планов зарубежных университетов объединены в группы по тематике (Ахх).
Например, А1 — охватывает круг вопросов, изучаемых в дисциплине информатика, А2 — математический анализ + линейная алгебра и геометрия.
В процессе проведения сравнительного анализа университетских образовательных программ эксперт руководствуется некоторыми положениями, которые позволяют ему принимать решение о степени схожести двух объектов: дисциплины учебного плана зарубежного университета и дисциплины базо-
вого (российского) учебного плана (области знаний, блока дисциплин).
На основе анализа заключений эксперта была определена совокупность правил логического вывода (21 правило). В табл. 3 приведен фрагмент этих правил.
ТаблицаЗ База правил логического вывода (фрагмент)
№ Правила логического вывода
Яиіеі Если дисциплина_р = область О1 И Дисциплина з = область О1 То схожесть = да, КД= 1 /9
Яи1е2 Если дисциплина_р = область О2 И Дисциплина з = область О2 То схожесть = да, КД= 0,5
ЯиІеІБ Если дисциплина_р = блок МЕНД И Дисциплина з = блок МЕНД То схожесть = да, КД= 1/17
Яи1е18 Если % совпадений <=20%, То совпадение = не достаточное
Яи1е19 Если % совпадений >20% и <=60%, То совпадение = норма, КО = % совпадений
Яи1е20 Если % совпадений >60% и <80%, То совпадение = высокое, КО = % совпадений
Яи1е21 Если % совпадений >80%, То совпадение = полное, KD = 100%
ПРАКТИЧЕСКИЕ РЕЗУЛЬТАТЫ
Для проверки работы предлагаемого подхода и моделей представления знаний в были рассмотрены: учебный план по направлению подготовки бакалавров 230100 «Информатика и вычислительная техника» Уфимского государственного авиационного технического университета и учебный план Калифорнийского университета, Лос-Анжелес по бакалаврской подготовке информатиков. Полученные результаты подтверждают работоспособность предложенного подхода.
ЗАКЛЮЧЕНИЕ
Рассмотрена возможность использования технологии экспертных систем для анализа предметной области, разработана функциональная модель процесса сравнения учебных планов. Выделены основные понятия в предметной области и отношения между ними, на основании которого составлена семантическая модель учебного плана по направлению 230100 «Информатика и вычис-
лительная техника». По результатам исследования университетских образовательных программ сформулированы правила логического вывода. Разработанные модели знаний служат основой для базы знаний экспертной системы.
Авторы продолжают накапливать статистику сравнения зарубежных образовательных программ с образовательными программами российских университетов. Автоматизированную информационную систему сравнения учебных планов предполагается дополнить функцией оценки качества освоения перезачитываемых дисциплин, изученных в другом университете.
1.
2.
СПИСОК ЛИТЕРАТУРЫ
Адаптация российского высшего образования к Болонскому процессу : раздаточн. материал / Уфимск. ин-т Рос. гос. торг.-экон. ун-та ; сост. Е. В. Шевченко // Интенсивный учебн.-информ. сем.-тренинг. Уфа, 13-16 апреля 2006.
Юсупова, Н. И. Представление знаний информационной системе для сравнения учебных планов университетов разных стран / Н. И. Юсупова, О. Н. Сметанина, М. М. Гаянова, А. М. Буторин // Технология и организация обучения. Уфа : УГАТУ, 2006. С. 48-57.
3. Башмаков, А. И. Интеллектуальные информационные технологии / А. И. Башмаков, И. А. Башмаков. М. : МГТУ, 2005. 302 с.
ОБ АВТОРАХ
Юсупова Нафиса Исламовна, проф., зав. кафедрой выч. математики и кибернетики, декан ФИРТ УГАТУ. Дипл. радиофизик (Воронежск. гос. ун-т, 1975). Д-р техн. наук в обл. упр-я техн. системами (УГАТУ, 1998). Иссл. в обл. ситуационного управления, информатики.
Гаянова Майя Марсовна,
аспирант, ассистент той же каф. Дипл. математик (БГУ, 1997). Исслед. в обл. анализа образоват. программ.