УДК 007.681.5:519.714:519.766
ВОЗМОЖНОСТИ ПРОГНОЗИРОВАНИЯ УЧЕБНЫХ ДОСТИЖЕНИЙ СТУДЕНТОВ НА ОСНОВЕ АСК-АНАЛИЗА ИХ ИМЕДЖЕВЫХ ФОТОРОБОТОВ
Луценко Е.В., - д.э.н., профессор Кубанский государственный аграрный университет
В статье подробно описывается конкретная реализация методики прогнозирования учебных достижений студентов на основе применения математического метода автоматизированного системно-когнитивного анализа и его инструментария -универсальной когнитивной аналитической системы «Эйдос». Изложенная технология может быть применена как для реального прогнозирования учебных достижений студентов и оценки их профессиональных способностей в различных предметных областях, так и в качестве лабораторной работы при преподавании дисциплины: «Интеллектуальные информационные системы» для студентов специальностей: «Прикладная информатика в экономике» и «Прикладная информатика в юриспруденции». Изложение адаптировано для использования данной статьи в качестве руководства к лабораторной работе по данной дисциплине.
Краткая теория
Автоматизированный системно когнитивный анализ является новым математическим методом, который оснащен реализующим его программным инструментарием и обеспечивает решение задач мониторинга, анализа, прогнозирования и управления в самых различных предметных областях [1, 2, 3]. Универсальность метода обеспечивается тем, что он частично или полностью автоматизирует базовые когнитивные операции, к которым сводятся процессы познания.
Задачами данной работы являются:
1. Продемонстрировать студентам возможность выявления причинноследственных связей между признаками внешнего вида (описательные шкалы и градации), и их полом, успеваемостью, тем, откуда они родом, обучением в той или иной группе (классификационные шкалы и градации).
2. Сформировать у студентов навыки формализации предметной области, подготовки и ввода обучающей выборки, синтеза информационной семантической модели и проверки ее адекватности, анализа модели (информационные портреты, кластерно-конструктивный анализ, семантические сети и когнитивные диаграммы, графическое отображение векторов классов и признаков).
Задание
1. Формализовать задачу:
- создать классификационные и описательные шкалы;
- собрать исходную фактографическую информацию и ввести в систему обучающую выборку.
2. Осуществить синтез и верификацию модели.
3. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.
4. Провести анализ модели, дав ответы на следующие вопросы:
- как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?
- как сказывается пол на посещаемости?
- как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"?
- какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью;
Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов. Пример решения задания 1
Пример решения задания 1.1: Формализовать задачу: создать классификационные и описательные шкалы
Один из вариантов классификационных шкал и градаций представлен в таблице 1, а описательных - в таблице 2:
Таблица 1 - КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ
Код Наименов ание Код Наименов ание
1 ПОЛ - мужской 28 Нагапетян ПИ-51
2 ПОЛ - женский 29 Полонская ПИ-51
3 ОТКУДА РОДОМ - город-краевой центр 30 Трунина ПИ-51
4 ОТКУДА РОДОМ - город-районный центр 31 Черкашина ПИ-51
5 ОТКУДА РОДОМ - поселок городского типа 32 Чепурченко ПИ-51
33 Чушкин ПИ-51
6 ОТКУДА РОДОМ - село 34 Шульгин ПИ-51
7 УСПЕВАЕМОСТЬ - "5" более 75% 35 Арушанян ПИ-52
8 УСПЕВАЕМОСТЬ - "Б" более 5 0% но меньше 7 5 % 36 Быченок ПИ-52
37 Веревкина ПИ-52
9 УСПЕВАЕМОСТЬ - "5" более 25% но меньше 5 0 %
38 Григорьева ПИ-52
10 УСПЕВАЕМОСТЬ - "5" менее 25% 39 Давыдич ПИ-52
11 ФОРМА ОБУЧЕНИЯ - бюджетная 40 Дронова ПИ-52
12 ФОРМА ОБУЧЕНИЯ - платная 41 Еременко ПИ-52
13 ГРУППА ПИ-51 42 Жмурко ПИ-52
14 ГРУППА ПИ-52 43 Иванова ПИ-52
15 Бабенко ПИ-51 44 Костенко ПИ-52
16 Воробьева ПИ-51 45 Крейс ПИ-52
17 Гура ПИ-51 46 Куркина ПИ-52
18 Головнев ПИ-51 47 Люлик ПИ-52
19 Дыбова ПИ-51 48 Максимов ПИ-52
20 Жеребятьев ПИ-51 49 Мануйлов ПИ-52
21 Заяц ПИ-51 50 Нарижний ПИ-52
22 Иванова ПИ-51 51 Ольховская ПИ-52
23 Котенко ПИ-51 52 Паржакова ПИ-52
24 Кузина О. ПИ-51 53 Силенко ПИ-52
25 Кузина Я. ПИ-51 54 Соколова ПИ-52
26 Лях ПИ-51 55 Турбин ПИ-52
27 Мясников ПИ-51 56 Цисарь ПИ-52
Таблица 2 - ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ
— II II II II II II II II II II II II II II II II II II II II II II II II II II м 1 «V «V «V Л/
1 N | Код Наименование | 1 1 [ 5] |ОДЕЖДА: |
1 171 17 | Пиджак |
1 1 [ 1] ДЛИНА ВОЛОС: | 1 181 18 | Брюки или джинсы |
1 1 1 1 Короткие | 1 191 19 | Юбка |
1 2 | 2 Средние 1 | 1
1 3 | 3 Длинные 1 1 1 [ 6] |МАКИЯЖ, МАНИКЮР, ПЕДИКЮР:|
| 1 1 201 20 [Отсутствует 1
1 1 [ 2] ЦВЕТ ВОЛОС: | 1 21| 21 I Незаметный |
1 41 4 Очень темные | 1 22| 22 I Заметный |
1 51 5 Русые | 1 231 23 | Вызывающий |
1 б | 6 Каштановые | | 1
1 71 7 Крашеные | 1 1 [ 7] |ДОСТАТОК: |
1 81 8 Очень светлые | 1 241 24 | Есть своя квартира |
| | 1 25| 25 I Есть автомобиль |
1 1 [ 3] ЦВЕТ ГЛАЗ: | 1 26| 26 I Есть компьютер |
1 91 9 Серые | 1 27| 27 |Есть мобильный телефон...|
1 ЮI 10 Голубые | 1 28| 28 I Ничего нет |
1 111 11 Карие | | 1
1 121 12 Зеленые | 1 1 [ 8] |ПОСЕЩАЕМОСТЬ: |
| 1 1 29| 29 | Очень плохая |
1 1 [ 4] НАЛИЧИЕ УКРАШЕНИИ: | 1 301 30 | Плохая |
1 13 | 13 Цепочка | 1 311 31 | Средняя |
1 141 14 Перстень | 1 32| 32 I Хорошая |
1 151 15 Серьги | 1 331 33 | Очень хорошая |
1 161 16 Браслет |
Пример решения задания 1.2: Формализовать задачу: собрать исходную фактографическую информацию и ввести в систему обучающую выборку
С точки зрения методики организации занятия возможны различные варианты сбора и ввода информации обучающей выборки. Опыт проведения занятий по данной лабораторной работе показал, что с точки зрения экономии времени и обеспечения качества и единого вида обучающей выборки наиболее рациональным является вариант, приведенный ниже.
1. На доске чертится таблица вида 3. Это делается с таким расчетом, чтобы каждому присутствующему студенту группы соответствовала строка.
Таблица 3 - ШАБЛОН ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ
Код Наименование Классы Признаки
1 2 3 4 5 6 1 2 3 4 5 6 7 8 9 10 11
1
2
3
4
5
6
7
2. Студентам дается задание с использованием классификационных и описательных шкал (таблицы 1 и 2) описать каждому самого себя и занести эту информацию в таблицу на доске. В результате на доске появляется таблица вида 4:
Таблица 4 - ПРИМЕР ЗАПОЛНЕННОГО ШАБЛОНА ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ
Код Наименов ание Классы Признаки
1 2 3 4 5 6 1 2 3 4 5 6 7 8 9 10 11
1 Бабенко ПИ-51 1 4 10 12 13 15 1 5 10 18 27 31
2 Воробьева ПИ-51 2 5 10 12 13 16 3 7 12 13 18 20 25 26 27 32
3 Гура ПИ-51 1 13 17
4 Гловнев ПИ-51 1 13 18
5 Дыбова ПИ-51 2 13 19
6 Жеребятьев ПИ51 1 5 8 12 13 20 2 8 10 18 21 27 30
7 Заяц ПИ-51 2 4 10 12 13 21 3 6 12 15 18 21 26 27 31
8 Иванова ПИ-51 2 3 7 12 13 22 2 5 12 13 14 15 18 21 26 32
9 Котенко ПИ-51 2 4 7 12 13 23 1 6 11 13 15 18 21 26 27 32
10 Кузина О. ПИ-51 2 3 8 12 13 24 1 7 11 14 18 22 26 27 32
11 Кузина Я. ПИ-51 2 3 8 12 13 25 1 7 14 17 22 32
12 Лях ПИ-51 1 3 8 12 13 26 1 5 9 13 17 18 20 24 26 27 31
13 Мясников ПИ-51 1 3 9 12 13 27 1 5 10 13 16 18 20 24 27 32 0
14 Нагапетян ПИ-51 1 4 9 12 13 28 1 6 11 15 18 21 24 26 27 30 0
15 Полонская ПИ-51 2 13 29
16 Трунина ПИ-51 2 13 30
17 Черкашина ПИ-51 2 4 10 12 13 31 3 6 11 13 18 21 24 26 27 30
18 Чепурченко ПИ51 1 13 32
19 Чушкин ПИ-51 1 13 33
20 Шульгин ПИ-51 1 5 8 12 13 34 1 5 9 17 20 26 30
21 Арушунян ПИ-52 1 14 35
22 Быченок ПИ-52 1 14 36
23 Веревкина ПИ-52 2 3 9 12 14 37 1 8 9 15 18 21 28 33
24 Григорьева ПИ52 2 4 8 12 14 38 2 5 9 13 18 22 28 33
25 Давыдич ПИ-52 2 14 39
26 Дронова ПИ-52 2 14 40
27 Еременко ПИ-52 2 4 8 12 14 41 2 5 12 9 13 15 18 21 26 27 31
28 Жмурко ПИ-52 1 14 42
29 Иванова ПИ-52 2 3 9 12 14 43 2 4 10 14 15 17 18 20 28 33
30 Костенко ПИ-52 2 14 44
31 Крейс ПИ-52 2 4 8 12 14 45 1 5 9 15 19 21 28 32
32 Куркина ПИ-52 2 3 8 12 14 46 3 6 11 13 15 18 19 22 26 27 32
33 Люлик ПИ-52 2 5 8 12 14 47 2 7 12 15 18 22 24 26 32
34 Максимов ПИ-52 1 14 48
35 Мануйлов ПИ-52 1 3 7 12 14 49 1 5 9 14 18 20 24 25 26 27 30
36 Нарижний ПИ-52 1 3 7 12 14 50 1 5 9 14 18 20 24 25 26 27 31
37 Ольховская ПИ52 2 14 51
38 Паршакова ПИ-52 2 6 8 12 14 52 2 6 11 13 19 22 26 32
39 Силенко ПИ-52 1 3 7 12 14 53 1 6 12 13 18 20 28 32
40 Соколова ПИ-52 2 4 8 12 14 54 1 5 12 17 18 22 24 26 27 32
41 Турбин ПИ-52 1 14 55
42 Цисарь ПИ-52 2 5 9 12 14 56 2 7 11 13 18 22 27 33
Видно, что по ряду студентов нет описательной информации, а классификационная - минимальна. Это связано с тем, что они отсутствовали на занятиях, когда проводилась данная лабораторная работа и не участвовали в формализации предметной области и подготовке обучающей выборки.
При этом для удобства кодирования информации о себе студентами с помощью Блокнота открываются файлы:
Object.txt и Priz_per.txt из поддиректории TXT, содержащие ту же информацию, что и таблицы 1, 2.
Для правильного отображения этих файлов задается шрифт Courier New (при Windows-98) Terminal (при Windows-2000)
3. Студентам дается задание переписать эту таблицу себе в тетради и затем ввести в систему "Эйдос" в подсистеме "F2 Обучение" в режиме "Ввод-корректировка обучающей выборки".
Пример решения задания 2: Осуществить синтез и верификацию модели
Верификацию модели предлагается проверить путем расчета внутренней дифференциальной и интегральной валидности.
Для этого студентам необходимо выполнить следующие действия:
1. Скопировать обучающую выборку в распознаваемую в подсистеме: "F2 Обучение - ввод корректировка обучающей информации - F5 Об.инф.->Расп.анк. - F2 Перезапись БД распознаваемых анкет - F1 Копировать всю БД".
2. Выполнить пакетное распознавание в подсистеме: "F4 Распознавание
- Пакетное распознавание - Критерий сходства [1] корреляция".
3. Измерить внутреннюю интегральную и дифференциальную валидность информационной модели в подсистеме: "F6 Анализ".
Пример решения задания 3: Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.
В подсистеме: "F3 Оптимизация" выбрать режим: "Исключение признаков с низкой селективной силой". В результате появится экранная форма, представленная на рисунке 1:
Г
Авто
ja|d| ВВІ нІГІб1! А |
Универсальная когнитивная аналитическая система Обоб.призн:ОДЕВДЯ:
Перв.призн:Юбка
16:18 (с) НПП -ЭЙДОС»
Код Наименование пе|
шш Юбка
10 Г опубые
30 Плохая
33 Очень хорошая
8 Очень светлые
3 Длинные
7 Крашеные
2 Средние
28 Ничего нет
17 Пиджак
25 Есть автомобиль
16 Браслет
31 Средняя
22 Заметный
11 Карие
4 Очень темные
6 Каштановые
Всего признаков: 33. Порядковый №текущего: 1. % от общ.кол-ва: 3 1
Р1Справка по БДР2СортировкаРЗПечатьР4ПоискР50птимизацияР7ПерекодированиеР8Грэфи
Рисунок 1. Экранная форма "Селективная сила признаков
Количественные значения селективной силы можно просмотреть, прокручивания экранную форму по горизонтали.
Более подробно эта информация представлена в таблице 5:
Таблица 5 - ПРИЗНАКИ (ГРАДАЦИИ ШКАЛ)
В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ (ИНТ.ИНФ.)
10-10- 04 1ь:1Ь:ЬЬ г.Краснодар
| № 1 Код Код Наименование Наименование |Интегр. Сумм.ИНТ |Сумм.ин|
1 1 к. шк град классификационной шкалы гр ад ации |инф-ть инф. Бит 1 в % |
1 1 5 19 ОДЕЖДА: Юбка | 0.470 0 . 470 | 4.147|
1 2 3 10 тткт г.гтая - Голубые | 0.467 0 . 938 | 8.2711
1 з 8 30 п ОГТТ^Ш АТГМО гт к Плохая | 0.456 1. 393 | 12.2901
1 4 8 33 погтт^шатгмогть Очень хорошая | 0.438 1. 831 | 16.1501
1 5 2 8 І ІКТ^Т ИОЛ-ЮГ ■ Очень С1=8егР.ТТЬТе | 0.437 2 . 268 | 20.002|
1 6 1 3 ДЛИНА ВОЛОС: Длинные | 0.429 2 . 697 | 23.7881
1 7 2 7 і ікт^т я;о.пог: ■ Крашеные | 0.421 3 .118 | 27.502|
1 8 1 2 ДЛИНА ВОЛОС: Пр*=“,тртт/т*=» | 0.418 3 . 536 | 31.192|
1 9 7 28 ДОСТАТОК: Ничего нет | 0.413 3 . 949 | 34.836|
| 10 5 17 ОДЕЖДА: Пиджак | 0.408 4 . 357 | 38.432|
| 11 7 25 ДОСТАТОК: Есть автомобиль | 0.408 4 . 765 | 42.027 1
| 12 4 16 НАЛИЧИЕ УКРАШЕНИИ: Браслет | 0.404 5 .169 | 45.5901
| 13 8 31 ПОГТТ^ШАТГМОГТЬ | 0.400 5 . 569 | 49.122|
| 14 6 22 МАКИЯЖ, МАНИКЮР, ПЕДИКЮР: Я а мет ттый | 0.399 5 . 968 | 52.638 1
1 15 3 11 тткт г.гтая - Карие | 0.398 6 . 365 | 56.1471
1 16 2 4 І ІКТ^Т ИОЛ-ЮГ ■ Очень темные | 0.391 6 . 757 | 59.5991
| 17 2 6 І ІКТ^Т ио.пог ■ Каштановые | 0.389 7 .146 | 63.032|
| 18 4 14 НАЛИЧИЕ УКРАШЕНИИ: Перстень | 0.381 7 . 52 7 | 66.3951
| 19 3 12 тткт г.гтая - Зеленые | 0.367 7 . 894 | 69.629|
| 20 6 20 МАКИЯЖ, МАНИКЮР, ПЕДИКЮР: Отсутствует | 0.361 8 . 255 | 72.817 1
| 21 3 9 тткт г.гтая - Серые | 0.356 8 . 611 | 75.9581
| 22 6 21 МАКИЯЖ, МАНИКЮР, ПЕДИКЮР: Неддметнътй | 0.352 8 . 963 | 79.062|
| 23 4 15 НАЛИЧИЕ УКРАШЕНИИ: Серьги | 0.337 9 . 300 | 82.035|
| 24 8 32 ПОГТТ^ШАТГМОГТЬ Хорошая | 0.324 9 . 625 | 84.897|
1 25 2 5 І ІКТ^Т ИО.ПОГ ■ Русые | 0.322 9 . 947 | 87.739|
| 26 7 24 ДОСТАТОК: Есть своя квартира | 0.318 10.265 | 90.5451
| 27 1 1 ДЛИНА ВОЛОС: Короткие | 0.293 10.558 | 93.1301
| 28 4 13 НАЛИЧИЕ УКРАШЕНИИ: Цепочка | 0.264 10.822 | 95.4581
| 29 7 26 ДОСТАТОК: Есть компьютер | 0.218 11.041 | 97.384|
| 30 7 27 ДОСТАТОК: Есть мобильный телефон. | 0.194 11.235 | 99.097|
| 31 5 18 ОДЕЖДА: Брюки или джинсы | 0.102 11.337 |100.000|
| 32 6 23 МАКИЯЖ, МАНИКЮР, ПЕДИКЮР: И-кг-Ч ил я Ю1ТГ7/ТТЛ | 0.000 11.337 |100.000|
| 33 8 29 ПОСЕЩАЕМОСТЬ: Очень плохая | 0.000 11.337 | 100.000|
Универсальная когнитивная аналитическая система НПП +ЭЙДОС*
Соответствующую логистическую кривую (накопительную селективной силы) можно получит в графической форме нажав на клавишу 'Т8 График".
Пример решения задания 4: Провести анализ модели
Анализ модели позволяет дать обоснованные ответы, например, на следующие вопросы:
1. Как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?
2. Как сказывается пол на посещаемости?
3. Как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", " Посещаемость" ?
4. Какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью?
Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов.
Пример решения задания 4.1: Как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?
Для ответа на этот вопрос войдем в подсистему: "Типология" режим: "Типологический анализ первичных признаков - Информационные (ранговые) портреты" и установив курсор на строке с кодом 30 "Посещаемость плохая" нажмем Enter. В результате в экранной форме отобразиться информационный портер признака, т.е. состояния студентов, расположенные в порядке убывания значимости данного признака для их наступления. Однако в этой экранной форме приведены все состояния, а нас интересует только успеваемость. Успеваемость - это классификационная шкала, с кодами градаций от 7 до 10. Поэтому, чтобы отобразить только эти классы, нажмем клавиши: "F6 Фильтрация", затем "F1 Диапазон кодов" и зададим коды 7 - 10. В результате получим экранную форму, приведенную на рисунке 2:
■V RASP.EXE
| Авто 3 jj|gBi|(l| Jg] Aj
Универсальная когнитивная анапитическая система.
17:11 (с) НПП «ЭИДОО
Типологический анализ. Информационный (ранговый) портрет признака: 8П0СЕЩПЕМ0СТЬ:
30Плохая
Рисунок 2. Информационный портрет признака:
30 "Посещаемость плохая”, фильтр по успеваемости.
Аналогично получим экранную форму для информационного портера признака: 32 "Посещаемость хорошая", представленную на рисунке 3.
■V RASP.EXE
Авто
_IJ І..І
ml ш\ jflal a]
Универсальная когнитивная аналитическая система.
9:29 (с) НПП «ЭЙДОС*
Типологический анализ. Информационный (ранговый) портрет признака:
8П0СЕЩНЕМ0СТЬ:
32Корошая
УСПЕВАЕМОСТЬ - "й" более 50% но меньше 75%
Наименование класса распознавания
2 4/ 14 Т
Инф-ть
(Бит)
УСПЕВАЕМОСТЬ - "5" бопее 50% но меньше /5%
УСПЕВАЕМОСТЬ - V более 75%
УСПЕВАЕМОСТЬ - "5" менее 25%
УСПЕВАЕМОСТЬ - "5" бопее 25% но меньше 50%
0.21681
0.13248
-0.46137
-0.68011
Р1Еенерация портрета F2 Сортировка F3 Печать F4 Поиск F5 Диаграмма F6 Фильтраци
Рисунок 3. Информационный портрет признака:
32 "Посещаемость хорошая", фильтр по успеваемости.
Из рисунков 3 и 4 видно, что плохой посещаемости соответствует низкая успеваемость, а хорошей - высокая, как и можно было ожидать.
Эту же информацию можно получить и другим способом.
В подсистеме F6 "Анализ" запустить режим "Просмотр профилей классов и признаков" и нажать функциональную клавишу F2 "Выбор статистической матрицы" F3 "Загрузить матрицу информативностей". Затем нажать F5 "Профили 3d", F1 "Трехмерная поверхность" и задать диапазон кодов классов: 7-10 (классификационная шкала: "Успеваемость") и диапазон кодов признаков 29-33 (классификационная шкала: "Посещаемость"). После этого появится возможность настройки ориентации трехмерной системы координат, описанная в Help в системе. Выход из настройки по клавише Esc. После этого в экранных формах в виде трехмерных графиков последовательно отображаются информативности выбранной подматрицы, которые имеется возможность записать в форме PCX-файлов, пропустить или распечатать. Некоторые из этих форм представлены на рисунках 4, 5.
CopuRight Cc) Scientific & industrial enterprise AIDOS, Russia, 19B1-2001. Russian Patent Mo 940217. All Ttights Reserued.
ПРОФИЛИ КЛАССОВ РАСПОЗНАВАНИЯ И ПРИЗНАКОВ
ИнФорматнбностu & Bit
(10}УСПЕВАЕМОСТЬ — "З" менее 25 (ЗЗ)Очень хорошая
CopuRight Cc) Scientific & industrial enterprise AIDOS, Russia, 19B1-2001. Russian Patent Mo 940217. All Ttights Reserued.
ПРОФИЛИ КЛАССОВ РАСПОЗНАВАНИЯ И ПРИЗНАКОВ
ИнФорматн&ности & Bit
С 335 Очень хорошая (10}УСПЕВАЕМОСТЬ — "Э" менее 25Х
CopuRight Cc) Scientific & industrial enterprise AIDBS, Russia, 1981-2001. Russian Patent Mo 940217. All Ttights Reserued.
ПРОФИЛИ КЛАССОВ РАСПОЗНАВАНИЯ И ПРИЗНАКОВ
ИнФорматнбностu & Bit
С 33 5 Очень хорошая С10}УСПЕВАЕМОСТЬ — "Э" менее 25Х
CopuRight Cc) Scientific & industrial enterprise AIDOS, Russia, 19B1-2001. Russian Patent Mo 940217. All Ttights Reserued.
ПРОФИЛИ КЛАССОВ РАСПОЗНАВАНИЯ И ПРИЗНАКОВ
Информативности & Bit
С 33}Очень хорошая С10}УСПЕВАЕМОСТЬ — "Э" менее 25Х
Рисунок 4. Некоторые варианты отображения подматрицы: классификационная шкала "Успеваемость" X описательная шкала "Посещаемость" в системе "Эйдос"
Из анализа этих трехмерных графиков видно, что очень хорошая успеваемость слабо зависит от посещаемости, а низкая - сильно. На основании этого можно сформулировать гипотезу, что хорошая посещаемость может гарантировать от низкой успеваемости, но сама по себе не гарантирует высокой, для достижения которой, видимо, играют важную роль также другие факторы, например, уровень достатка. Чтобы проверить эту гипотезу в подсистеме Бб "Анализ" запустим режим "Просмотр профилей классов и признаков" и поставим курсор на класс: код 7 "Успеваемость - 5 более 75%", а затем нажмем Б4 "Профили 2ё", Б1 "Класс распознавания" и зададим диапазон признаков, градаций описательных шкал: 24-33 (шкалы: "Достаток" и "Посещаемость"). В результате получим графическую форму, представленная на рисунке 5:
Copuftight (с) Scientific & industrial enterprise AIDOS, Russia., Russian Patent Mo 940217. All Rights Reserued.
Профиль класса распознавания:
[7]-УСПЕВАЕМОСТЬ - "5" БОЛЕЕ 75%
I . ■=,
i9Bi-zooi.
□ С
□ с
Пер&нчные признаки Наименования признаков i__________
Признаки: Z4-33|
["7 1-ДОСТПТОК : := [2-^ 1-е-СТЬ СБОЯ КВЭР-ТИРЭ. С? 1 -ЖОСТПТОК : := [25 ] -е-СТЬ автопоё-МЛЬ V? 1 -ДОСТПТОК : := Г27 ] -е-СТЬ ПОСИЛЬНЫЙ тепеФОН С7 ]-AOCTfiTOK : := C2S ] -ничего нет tS ] -ПОСЕЩАЕМОСТЬ : := Г31 ] -СРеэняя tS ] -ПОСЕЩАЕМОСТЬ : := [321-КОРСШЭЯ
Рисунок 5. Профиль влияния описательных шкал: "Достаток" и "Посещаемость" на классификационную шкалу "Успеваемость"
Из этой формы видно, что хорошая посещаемость (код 32) положительно влияет на высокую успеваемость примерно также, как наличие квартиры (код 24) и компьютера (код 26), но все эти факторы вместе взятые уступают влиянию одного фактора: "Есть автомобиль" (код 25).
Пример решения задания 4.2: Как сказывается пол на посещаемости?
В подсистеме: "Типология" зайдем в режим: "Типологический анализ классов распознавания - Информационные (ранговые) портреты" и установив курсор на строке с кодом 1 "ПОЛ - мужской" нажмем Enter. В результате в экранной форме отобразиться информационный портер класса, т.е. признаки студентов, расположенные в порядке убывания характерности признаков для данного класса. Однако в этой экранной форме приведены все признаки, а нас интересует только посещаемость. Посещаемость - это описательная шкала, с кодами градаций от 29 до 33. Поэтому, чтобы отобразить только эти
признаки, нажмем клавиши: 'Тб Фильтрация", затем "Б1 Диапазон кодов" и зададим коды 29 - 33. В результате получим экранную форму, приведенную на рисунке б:
й HASP.EXE
Универсальная когнитивная аналитическая система.
9:40 (с) ИПП -ЭЙДОО
Подсистема типологического анализа. Информационный портрет объекта: 1П0П - ммжской
Рисунок 6. Информационный портрет класса:
1 "ПОЛ - мужской”, фильтр по посещаемости.
Аналогично получим информационный портрет класса: код 2, "ПОЛ женский". Результат представлен на рисунке 7:
1Генерация портретаР2Сорт.РЗПечатьР4ПоискР5ДиаграммаР6ФильтрацияР7Интерпретаци
Рисунок 7. Информационный портрет класса: код 2 "ПОЛ - женский”, фильтр по посещаемости.
Из этих рисунков видно, что для ребят характерны плохая и средняя посещаемость, а для девушек - очень хорошая и хорошая. Как это сказывается на успеваемости мы уже знаем.
Пример решения задания 4.3: Как выглядят конструкты "Пол ",
"Город-деревня", "Учебная группа", "Посещаемость"?
Ответ на первые три вопроса дает анализ, который можно провести в подсистеме Б5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".
После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах:
- количество уровней кластеризации - 1;
- порог модуля сходства - 0;
- диапазон кодов классов: 1-14;
- исключаем кластеры с одним классом;
- не исключаем кластеры с тождественным набором классов.
Результаты кластерно-конструктивного анализа классов можно просмотреть в режиме: "Просмотр и печать кластеров и конструктов классов" (рисунок 8), а также получить в виде ТХТ-файла с именем Klas_obj.txt в поддиректории ТХТ (таблица 6):
-І5ІХ
| Авто Г]|Щ© ЕЗ ^|Э| а|
Универсальная когнитивная аналитическая система. 10:22 (с) НПП «ЭШОО 1
Типология объектов (классов распознавания). Кпастерно-констрцктивный анализ.
Рисунок 8. Конструкт: "Пол"
Ур. № Ур. Код %і
кл. клас Нерп класса Наименование класса сходст
0 1 ПОП - мужской 100.00
0 3 ОТКУДА РОДОМ - город-краевой центр 38.64
0 13 ГРУППА ПИ-51 35.39
0 7 УСПЕВАЕМОСТЬ - "5" более 75% 33.46!
0 9 УСПЕВАЕМОСТЬ - "5" более 25% но меньше 50% 16.24
0 10 УСПЕВАЕМОСТЬ - "5" менее 25% 10.76
0 5 ОТКУДА РОДОМ - поселок городского типа 9.69
0 4 ОТКУДА РОДОМ - город-районный центр -8.19
0 8 УСПЕВАЕМОСТЬ - "5" более 50% но меньше 75% -14.60
0 14 ГРУППА ПИ-52 -28.51
0 6 ОТКУДА РОДОМ - село -38.49
0 2 ПОП - женский -71.70
0 0 0.00
Таблица 6 - КОНСТРУКТЫ И КЛАСТЕРЫ КЛАССОВ РАСПОЗНАВАНИЯ
15-10-04 10:07:48 Фильтр по кодам классов: 1-14 г.Краснодар
№ | Код | Наименование | Сход-
класт|класса | класса распознавания | ство %
1 | 1 | ПОЛ - мужской...................................| 100.00
| 3 | ОТКУДА РОДОМ - город-краевой центр............| 38.64
| 13 | ГРУППА ПИ-51....................................| 35.39
| 7 | УСПЕВАЕМОСТЬ - "5" более 75%..................| 33.46
| 9 | УСПЕВАЕМОСТЬ - "5" более 25% но меньше 50%.| 16.24
| 10 | УСПЕВАЕМОСТЬ - "5" менее 25%..................| 10.76
| 5 | ОТКУДА РОДОМ - поселок городского типа........| 9.69
| 4 | ОТКУДА РОДОМ - город-районный центр...........| -8.19
| 8 | УСПЕВАЕМОСТЬ - "5" более 50% но меньше 75%.| -14.60
| 14 | ГРУППА ПИ-52....................................| -28.51
| 6 | ОТКУДА РОДОМ - село...........................| -38.49
| 2 | ПОЛ - женский...................................| -71.70
3 | 3 | ОТКУДА РОДОМ - город-краевой центр............| 100.00
| 7 | УСПЕВАЕМОСТЬ - "Б” более 75%..................| 45.92
| 1 | ПОЛ - мужской...................................| 38.64
| 9 | УСПЕВАЕМОСТЬ - "Б” более 25% но меньше 50%.| 38.46
| 14 | ГРУППА ПИ-52....................................| 38.29
| 13 | ГРУППА ПИ-51....................................| 0.35
| 8 | УСПЕВАЕМОСТЬ - "5" более 50% но меньше 75%.| -3.78
| 2 | ПОЛ - женский...................................| -12.93
| 5 | ОТКУДА РОДОМ - поселок городского типа.......| -14.76
| 4 | ОТКУДА РОДОМ - город-районный центр...........| -36.40
| 10 | УСПЕВАЕМОСТЬ - "Б” менее 25%..................| -36.68
| 6 | ОТКУДА РОДОМ - село...........................| -36.95
13 | 13 | ГРУППА ПИ-51....................................| 100.00
| 1 | ПОЛ - мужской...................................| 35.39
| 9 | УСПЕВАЕМОСТЬ - "5" более 25% но меньше 50%.| 27.98
| 4 | ОТКУДА РОДОМ - город-районный центр...........| 25.70
| 10 | УСПЕВАЕМОСТЬ - "Б” менее 25%..................| 25.08
| 3 | ОТКУДА РОДОМ - город-краевой центр............| 0.35
| 5 | ОТКУДА РОДОМ - поселок городского типа........| -1.78
| 7 | УСПЕВАЕМОСТЬ - "Б” более 75%..................| -10.67
| 2 | ПОЛ - женский...................................| -21.13
| 6 | ОТКУДА РОДОМ - село...........................| -26.13
| 8 | УСПЕВАЕМОСТЬ - "Б” более 50% но меньше 75%.| -43.88
I 14 I ГРУППА ПИ-52....................................I -64.51
Универсальная когнитивная аналитическая система________________НПП *ЭЙДОС*
Конструкт: "Посещаемость" является конструктом градаций описательных шкал, т.е. признаков. Он генерируется в подсистеме Б5 "Типология", "Типологический анализ признаков", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".
После этого выполним режим: "Генерация кластеров и конструктов признаков", при следующих параметрах:
- количество уровней кластеризации - 1;
- порог модуля сходства - 0;
- диапазон кодов классов: 1-33;
- исключаем кластеры с одним признаком;
- не исключаем кластеры с тождественным набором признаков.
Результаты кластерно-конструктивного анализа признаков можно получить в виде ТХТ-файла с именем Klas_prp.txt в поддиректории ТХТ (таблица 7):
Таблица 7 - КОНСТРУКТ ПРИЗНАКОВ: "ПОСЕЩАЕМОСТЬ"
15-10-04 10 :31:44 Фильтр по кодам: 1-33
| Коды | приз-ов Наименования описательных шкап и градаций (признаков) |Сход- | |СТЕО % 1 | Коды | приз - ов Наименования описательных шкал и градаций (признаков) Сход- | СТЕО % |
1 [ 8] ПОСЕЩАЕМОСТЬ: 1 1 1 [ 2] ЦВЕТ ВОЛОС: 1
| 30 Плохая | 100.001 1 5 15.52|
1 [ 7] ДОСТАТОК: 1 1 1 [ 3] ЦВЕТ ГЛАЗ: 1
| 27 Есть мобильный телефон. . . . | 42.531 1 И Карие 12.191
1 [ 7] ДОСТАТОК: 1 1 1 [ 8] ПОСЕЩАЕМОСТЬ: 1
| 24 Есть своя квартира | 35.491 1 31 3.48|
1 [ 6] МАКИЯЖ г МАНИКЮР Л ПЕДИКЮР: 1 1 1 [ 1] ДЛИНА ВОЛОС: 1
1 21 Незаметный | 33.92 1 1 2 3.15|
1 [ 2] ЦВЕТ ВОЛОС: 1 1 1 [ 4] НАЛИЧИЕ УКРАШЕНИЙ: 1
1 з ОЧЛНЬ ГТВЛТЛЬТР! | 33.72| 1 14 Перстень -1.44|
1 [ 3] ЦВЕТ ГЛАЗ: 1 1 1 [ 4] НАЛИЧИЕ УКРАШЕНИЙ: 1
1 10 Голубые | 32.63| 1 16 Браслет -2.471
1 [ 6] МАКИЯЖ г МАНИКЮР л ПЕДИКЮР: 1 1 1 [ 2] ЦВЕТ ВОЛОС: 1
| 20 Отсутствует | 31.99| 1 7 Краиглнът^ -3.16|
1 [ 7] ДОСТАТОК: 1 1 1 [ 4] НАЛИЧИЕ УКРАШЕНИЙ: 1
1 26 Есть компьютер | 28.63| 1 13 -6.03|
1 [ 1] ДЛИНА ВОЛОС: 1 1 1 [ 3] ЦВЕТ ГЛАЗ: 1
1 з Длинные | 19.72| 1 12 -10.96|
1 [ 2] ЦВЕТ ВОЛОС: 1 1 1 [ 8] ПОСЕЩАЕМОСТЬ: 1
1 б Каштановые | 19.15| | 33 Очень хорошая -13.16|
1 [ 7] ДОСТАТОК: 1 1 1 [ 5] ОДЕЖДА: 1
| 25 Есть автомобиль | 18.43| 1 19 Юбка -13.38|
1 [ 5] ОДЕЖДА: 1 1 1 [ 4] НАЛИЧИЕ УКРАШЕНИЙ: 1
1 18 Брютгтт ШТИ джинсы | 18.27| 1 15 Серьги -13.911
1 [ 3] ЦВЕТ ГЛАЗ: 1 1 1 [ 6] МАКИЯЖ г МАНИКЮР г ПЕДИКЮР: 1
1 9 Серые | 17.53| | 22 Яаттлтный -16.051
1 [ 1] ДЛИНА ВОЛОС: 1 1 1 [ 2] ЦВЕТ ВОЛОС: 1
| 1 Короткие 1 17.11| 1 4 Очень темные -17.52|
1 [ 5] ОДЕЖДА: 1 1 1 [ 7] ДОСТАТОК: 1
1 17 Пиджак | 16.77| | 28 1 [ 8] 1 32 Ничего нет ПОСЕЩАЕМОСТЬ: -18.06| 1 -19.54|
Пример решения задания 4.4: Какие студенты являются "типичными представителями " для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью?
Чтобы ответить на этот вопрос необходимо провести в подсистеме: Б5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".
После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах:
- количество уровней кластеризации - 1;
- порог модуля сходства - 0;
- диапазон кодов классов: 13-56 (коды классов учебных групп и индивидуально студентов);
- исключаем кластеры с одним классом;
- не исключаем кластеры с тождественным набором классов.
Результаты кластерно-конструктивного анализа классов можно получить в виде ТХТ-файла с именем Klas_obj.txt в поддиректории ТХТ (таблица 8):
Таблица 8 - КОНСТРУКТ: "УЧЕБНАЯ ГРУППА"
15-10-04 10:53:27 Фильтр кодов: 13-56
Код | Наименование | Сход-
класса | класса распознавания | ство %
13 | ГРУППА ПИ-51............| 100.00
2 7 | Мясников ПИ-51..........| 4 3.60
31 | Черкащина ПИ-51.........| 40.11
2 8 | Нагапетян ПИ-51.........| 2 7.38
15 | Бабенко ПИ-51...........| 24.17
21 | Заяц ПИ-51..............| 21.70
20 | Жеребяоїьев ПИ-51.......| 16.21
23 | Котенко ПИ-51...........| 13.90
34 | Шульгин ПИ-51...........| 3.78
46 | Куркина ПИ-52...........| 0.98
16 | Воробьева ПИ-51.........| -0.35
53 | Силенко ПИ-52...........| -1.79
4 3 | Иванова ПИ-52...........| -3.81
26 | Лях ПИ-51...............| -3.83
24 | Кузина О. ПИ-51.........| -4.22
25 | Кузина Я. ПИ-51.........| -5.27
37 | Веревкина ПИ-52.........| -13.84
54 | Соколова ПИ-52..........| -14.71
4 9 | Мануйлов ПИ-52..........| -16.14
45 | Крейс ПИ-52.............| -17.43
56 | Цисарь ПИ-52............| -23.11
22 | Иванова ПИ-51...........| -23.42
50 | Нарижний ПИ-52..........| -24.32
52 | Паршакова ПИ-52.........| -26.13
41 | Еременко ПИ-52..........| -30.56
47 | Люлик ПИ-52.............| -36.87
38 | Григорьева ПИ-52........| -52.30
14 | ГРУППА ПИ-52............| -64.51
Из таблицы 8 видно, что:
- студенты: Мясников, Черкашина, Нагапетян, Бабенко являются "типичными представителями" группы ПИ-51;
- студенты: Григорьева, Люлик, Еременко, Паршакова, Нарижний, Иванова, Цисарь являются "типичными представителями" группы ПИ-52;
- студенты: Шульгин, Куркина, Воробьева, Силенко, Иванова, Лях, Кузина О. и Кузина Я. обладают своеобразием и более ярко выраженной индивидуальностью, по сравнению с другими, т.к. они не похожи на типичных представителей ни одной группы (в рассматриваемой системе признаков).
Необходимо также отметить, что в учебной группе ПИ-51 степень разнообразия студентов в рассматриваемой системе признаков выше, чем в группе ПИ-52, что можно объяснить тем, что в 51 группе больше ребят, чем девушек и они в основном из краевого центра, а в 52 группе больше девушек и в основном они из села, как это видно из конструкта "Пол" в таблице 6.
Пример решения задания 4.5: Результаты анализа отобразить в графической форме семантических сетей классов, нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для студентов с различной успеваемостью
Семантические сети классов отображаются на экране и записываются в форме РСХ-файла в поддиректории: PCX/Klas-obj в подсистеме Б5 "Ти-
пология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Вывод 2d семантических сетей классов". На рисунке 9 приведена семантическая сеть классов с кодами от 1 до 14 (обобщенные классы).
Нелокальные нейроны отображаются в подсистеме F6 "Анализ", режиме: "Графическое отображение нелокальных нейронов". Они записываются в форме PCX-файла в поддиректории: РСХ/ЫеигоЫе-Ь. На рисунке 10 приведен нелокальный нейрон: "Успеваемость: очень хорошая".
Семантическая сеть признаков отображается в подсистеме: F6 "Типология", в режиме: "Типологический анализ первичных признаков - Кластерный и конструктивный анализ - Вывод 2d семантических сетей признаков". Семантическая сеть отображается на экране и записывается в виде РСХ-файла в поддиректории: РСХ/К1ав-а-Ь-Ь.
На рисунке 11 приведена семантическая сеть для тех признаков, у которых оказались наибольшие весовые коэффициенты в приведенном на рисунке 10 нейроне (показаны только те связи между признаками, которые оказались больше 30%):
CopuRight Сс) Scientific & industrial enterprise fllDOS, Russia, 19B1-2001. Russian Patent Mo 940217. All Ttights Reserued.
2D - СЕМАНТИЧЕСКАЯ СЕТЬ КЛАССОВ
поп - женский
0ТКУАН ОСЄґіОК типа Р0А0М - п городского
ОТКУДА (10 Р0А0И “ се
УСПЕВАЕМОСТЬ -5" более 75/.
Отношения сходства:
различия:
Сила сбязи - толщина линии
Рисунок 9. Семантическая сеть классов
CopuRight (с) Scientific & industrial enterprise AIDOS, Russia, 1979-2003. Russian Patent Mo 940217. All Rights Reserued.
2D - МОДЕЛЬ НЕЛОКАЛЬНОГО НЕЙРОНА:
[7] - УСПЕВАЕМОСТЬ - ff5ff более 75%
АПИНЙ БОґІОС
Rec сбязи - толщина линии
Рисунок 10. Нелокальный нейрон: "Успеваемость: очень хорошая'
CopuRight (с) Scientific & industrial enterprise AIDOS, Russia, 1981-1997. Russian Patent Mo 940217. All mghts Reserued.
2D - СЕМАНТИЧЕСКАЯ СЕТЬ ПРИЗНАКОВ
ЛПИНЙ ВОЛОС:
Отношения сходства:
различия:
Сила сйязи - толщина линии
Рисунок 11. Семантическая сеть признаков, оказавшихся наиболее значимыми в нелокальном нейроне: "Успеваемость: очень хорошая”
Если дополнить графическое изображение нейрона на рисунке 10 связями между признаками, показанными в семантической сети на рисунке 11, то получим классическую когнитивную карту (рисунок 12).
CopuRight (с) Scientific fi industrial enterprise AIDOS, Russia, 1979-2004. Russian Patent No 940217. All Rights Reserued. ИНТЕГРАЛЬНАЯ КОГНИТИВНАЯ КАРТА:
( СЕМАНТИЧЕСКИЕ СЕТИ НЕЙРОНОВ И РЕЦЕПТОРОВ С НЕЙРОННОЙ СЕТЬЮ ) Коды НЕЙРОНОВ (классов)
Кобы РЕЦЕПТОРОВ (факторо!
сбязь 005:
- сбязь «05:
Сила сбязи - толщина линии
Рисунок 12. Классическая когнитивная карта: "Успеваемость: очень
хорошая", рассчитываемая и отображаемая в системе "Эйдос"
Таким образом, метод, технология и инструментарий АСК-анализа система "Эйдос" обеспечивает автоматизированное получение когнитивных карт.
Судя по литературным данным и информации, размещенной в 1П;ете1;, в настоящее время система "Эйдос" является единственной системой, обеспечивающей автоматизированный расчет и графическое отображение семантических сетей классов и факторов, прямых и инвертированных когнитивных диаграмм, нелокальных нейронов, Паретто-подмножеств нейронных сетей, а теперь и прямых и инвертированных классических когнитивных карт и интегральных когнитивных карт.
Студентам это предлагается получить когнитивные карты для других уровней успеваемости.
Выводы
Имеется техническая возможность прогнозирования учебных достижений студентов на основе применения математического метода автоматизиро-
ванного системно-когнитивного анализа и его инструментария - Универсальной автоматизированной системы «Эйдос».
Изложенная технология может быть применена как для реального прогнозирования учебных достижений студентов и оценки их профессиональных способностей в различных предметных областях, если руководством будет принято соответствующее решение, так и в качестве лабораторной работы при преподавании дисциплины: «Интеллектуальные информационные системы» для студентов специальностей: «Прикладная информатика в экономике» и «Прикладная информатика в юриспруденции».
Список литературы
1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1").
- Краснодар: КЮИ МВД РФ, 1996. - 280с.
2. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). -Краснодар: КубГАУ. 2002. -605 с.
3. Пат. № 2003610986 РФ. Универсальная когнитивная аналитическая система "ЭЙДОС" / Е.В.Луценко (Россия); Заяв. № 2003610510 РФ. Опубл. от 22.04.2003. - 50с.