НАУЧНО-МЕТОДИЧЕСКИ! ВОПРОСЫ ОБРАЗОВАНИЯ В ОБЛАСТИ ЭНЕРГЕТИКИ
УДК 378.126
УНИВЕРСАЛЬНЫЙ ПРОГРАММНЫЙ КОМПЛЕКС КЛАССИФИКАЦИИ ПЕДАГОГИЧЕСКИХ ОБЪЕКТОВ
Г.У. МАТУШАНСКИЙ, В.А. МЕДВЕДЕВ, А.В. ЮСУПОВА.
Казанский государственный энергетический университет
Разработан универсальный программный комплекс, позволяющий проводить автоматизированную классификацию педагогических объектов в многомерном пространстве разнотипных признаков. Научное обоснование программного комплекса существенно обогащает инструментарий педагогических исследований, а его практическое применение позволит решать широкий круг организационнопедагогических задач высшей школы.
Проблемы диагностики и классификации педагогических объектов
Основные проблемы современной педагогической диагностики связаны с измерением. С точки зрения Б.П. Битинаса, проблема измерения и оценки педагогического объекта исследования состоит в количественной оценке информации, заключенной в качественных первичных оценках [1]. Цель измерения предполагает получение информации о признаках объектов. При этом мы измеряем не сам объект, а только его свойства или отличительные признаки. Некоторые признаки не поддаются непосредственному измерению. В этом случае можно применять методы косвенного измерения, то есть наблюдать и измерять величины (индикаты), известным образом связанные с изучаемыми ненаблюдаемыми признаками (коррелятами). Препятствия, связанные с неизмеримостью многих качественных признаков, могут быть частично преодолены путем использования некоторых видов безмасштабного измерения (например, регистрации или упорядочения), для которых не требуется количественно определенной единицы меры [2].
Измерение объектов в педагогике, согласно Л.Б. Ительсону, связано с двумя подходами в моделировании. Первый подход основан на феноменологическом моделировании, который заключается в устранении из модели всех непосредственно неизмеряемых признаков. Второй подход заключается в том, что модель конструируется как формальное описание некоторой теории о внутренней структуре психической деятельности, реализующейся в процессах обучения и поведения человека. В этом случае она включает ряд непосредственно неизмеряемых переменных, связываемых по определенным правилам с теми или иными измеряемыми характеристиками обучения и поведения. Это путь содержательного моделирования. Педагогические явления и процессы, благодаря своей зависимости от непредвиденных сочетаний множества неконтролируемых объективных и субъективных факторов, являются по своей природе чрезвычайно © Г.У. Матушанский, В.А. Медведев, А.В. Юсупова Проблемы энергетики, 2004, № 7-8
сложными, изменчивыми и неоднозначными. Объективные закономерности таких явлений и процессов находят свое выражение в своеобразной статистической форме относительной устойчивости частот появления различных возможных результатов в данных условиях. Математическим понятием, количественно характеризующим эту степень возможности различных результатов, является понятие вероятности. Изложенная интерпретация позволяет охарактеризовать структуру отношений между определенными классами педагогических фактов с помощью таких числовых и функциональных индикаторов, как математическое ожидание, дисперсия, плотность вероятности, закон распределения, корреляции, моменты, характеристические функции и др., то есть получить количественные характеристики определенных аспектов, сторон и отношений психолого-педагогических явлений [2].
Результаты измерения педагогических объектов могут быть с успехом использованы при решении задач классификации. Проблема классификации имеет значение, которое трудно переоценить как в повседневной практике, так и в различных областях науки. Научная классификация фиксирует закономерные связи между классами объектов с целью определения места объекта в системе, которое указывает на его свойства. Классификация содействует движению науки со ступени эмпирического накопления знаний на уровень теоретического синтеза. Особенно это актуально для педагогики, в которой, как было сказано выше, понятийный аппарат еще слабо развит, а определения и описания педагогических явлений нечетки и расплывчаты.
Особенно привлекательной идея автоматизации вычислительных процедур, используемых при создании классификаций, стала с появлением и развитием компьютеров. Так было введено новое понятие «кластерный анализ» (аналогичные термины - таксономия, автоматическая классификация, группировка объектов) как общее название множества вычислительных процедур для создания классификаций. Более точно, кластерный анализ - это многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию
о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. Таким образом, главная цель кластерного анализа -нахождение групп схожих объектов в выборке данных. Эти группы принято называть кластерами (иногда - таксонами). Они обладают некоторыми свойствами, наиболее важными из которых являются плотность, дисперсия, размеры, форма и отделимость. Согласно одному из удачных определений, кластеры - это «непрерывные области (некоторого) пространства с относительно высокой плотностью точек, отделенные от других таких же областей областями с относительно низкой плотностью точек» [3].
Наиболее часто методы кластерного анализа используются в социологии, маркетинговых исследованиях, экономике, биологии, медицине, археологии. Однако до сих пор мало было слышно о применении кластерного анализа в педагогике. Сложность педагогических задач состоит в том, что реальные объекты являются многомерными, то есть описываются не одним, а несколькими параметрами, и объединение объектов в группы проводится в пространстве многих измерений, что весьма нетривиально. Кроме того, различные свойства (признаки) объектов могут носить нечисловой характер, например порядковый или номинальный. Возникает задача получения аппарата (реализованного в виде программного средства), который бы позволял сравнивать между собой объекты (например, обучаемых) по совокупности свойств, измеренных в шкалах различного типа.
Меры близости в многомерном пространстве разнотипных признаков.
Исходная информация, которую нужно обрабатывать, чаще всего имеет вид числовых таблиц (матриц), состоящих из М строк и N столбцов. Строки А1,А2,...,А1,...,Ам отражают информацию об изучаемых объектах (обучаемых), а столбцы Х1,X2,...,Xу,...,XN отражают свойства (признаки, характеристики) этих
объектов или явлений. Понятно, что набор признаков, описывающих эти объекты, будет в каждом случае своим и должен отражать их наиболее важные свойства.
Одной из форм представления результатов может быть матрица расстояний (близостей) между объектами. Эта матрица, задающая отношение "объект -объект”, представляет собой симметричную квадратную матрицу размера М х М с неотрицательными элементами:
В
^11,..., ^1М ^21,..., й2М ^ йМ1,..., йММ
Элемент йу является значением некоторой меры близости (удаленности) между объектами Х^ и Ху .С учетом выполнения условий непрерывности, симметричности, нормированности, инвариантности и свойств треугольника сначала необходимо выбрать меры: й]- - для шкал порядка, йЦ - для
номинальных шкал, й- - для шкал сильного типа (абсолютной, отношений и интервалов), а затем - правило, по которому будет вычисляться итоговая мера
4.
Для шкалы порядка существует канонический способ приписывания чисел (или нормированных рангов) упорядоченному множеству объектов. По данному способу числа строятся по правилу: первому по порядку объекту приписывается число 1, второму - 2 и так до конца. Если встречается Ь объектов с одинаковым порядковым номером (так называемые "серии") то всем этим объектам приписывается номер
Ь
X = (1/+ р),
а=1
где р - количество объектов, предшествовавших серии. После такой канонизации йу находится по правилу
йп = И - х']\/(м -1).
Для шкалы наименований мера йу через числа М; и Му, указывающих
частость встречаемости объектов, имеет одинаковые имена с г-м и у-м объектами соответственно
йг" = (м1 + Му)/ М ; йу = 0, если г = у .
Для сильных шкал можно выбрать меру
Теперь мерами йс, йп, йн можно пользоваться в многомерном случае,
определяя расстояние йр в пространстве разнотипных признаков по типу евклидова расстояния (для трех разнотипных признаков) [5]:
Положительные весовые коэффициенты ас, ап, ан следовало бы задавать как функцию от априорно известной информативности признака, однако последняя зависит от решаемой задачи и становится известной уже после того, как задача решена. В условиях такой неопределенности обычно полагают все а = 1. Однако в случае разнотипных признаков можно, по-видимому, задавать а пропорционально потенциальной информативности шкалы. Известно, что один и тот же признак несет больше информации, если его измерять, например, в шкале отношений, чем в шкале порядка, и, тем более, в шкале наименований. Поэтому при отсутствии априорных данных об актуальной информативности каждого
признака можно было бы считать, что ас > ап > ан [5].
Следовательно, используя итоговую матрицу расстояний (сходства) В между объектами, можно применять алгоритмы кластерного анализа для автоматической классификации объектов.
Алгоритм кластеризации, основанный на гипотезе 1-компактности
Одна из давно используемых эмпирических гипотез, известная в литературе по распознаванию образов под именем гипотезы компактности, состоит в том, что реализации одного и того же образа обычно отражаются в признаковом пространстве в геометрически близкие точки, образуя "компактные" сгустки. Более детальная формулировка данной гипотезы выглядит следующим образом. Предположим, что в многомерном признаковом пространстве уже найдено такое (информативное) подпространство, в котором точки одного класса образуют явно выделяемые компактные сгустки. Назовем п признаков, входящих в информативное подмножество X, описывающими, а номинальный (п+1)-й признак г, указывающий имя образа, целевым. Обозначим множество обучающей выборки через А, а новый распознаваемый объект через д. Тогда, если объекты множества А компактны в пространстве (X, г) и объекты множества (А, д) компактны в пространстве описывающих свойств X, то объекты А ид будут
йр=$с) 2+йп) 2+йн)2
или с учетом весовых коэффициентов различных признаков ас, ап, ан
компактными и в пространстве целевого признака г. Часто эту гипотезу формулируют так: "Объекты, похожие по п - описывающим свойствам X, похожи и по (п+1)-му целевому свойству г" [6].
Однако было замечено, что при ручной классификации человек-эксперт обращает внимание не только на абсолютные расстояния, но и на отношения расстояний между несколькими соседними точками. Зрительный аппарат человека обладает уникальными способностями делать классификацию множества объектов, если они представлены точками на плоскости. Результаты получаемой при этом естественной для человека классификации не могут быть получены и объяснены с позиций традиционно используемых методов кластеризации, базирующихся на гипотезе компактности. На основании вышеприведенной идеи о том, что важную роль при классификации играют не только сами расстояния, но и отношения между ними, была сформулирована базовая гипотеза 1-компактности. Согласно этой гипотезе, глаз человека хорошо улавливает различия в локальной плотности точек на плоскости и при прочих равных условиях предпочитает проводить границу между кластерами по участкам, где наблюдаются заметные изменения ("скачки") этой плотности.
Формулировка гипотезы 1-компактности опирается на понятие 1-расстояния, которое учитывает нормированное расстояние й между элементами множества и характеристику т локальной плотности множества в окрестностях этих элементов. Если определить расстояния между всеми парами точек множества А, то можно построить полный граф, соединяющий все точки со всеми, и найти самое длинное ребро - диаметр графа (В). Выделим две любые точки а и Ь и обозначим длину связывающего их ребра через а(аЬ). Будем считать нормированным расстоянием между этими точками величину й = а/В.
Среди ребер, смежных ребру (аЬ), найдем самое короткое, длину которого обозначим через рт}п. Отношение длин этих смежных отрезков обозначим через
т = а/рт}п. Чтобы сделать эту величину нормированной в диапазоне от 0 до 1,
найдем в полном графе наибольшее значение ттах. Величина т = т /ттах является нормированной характеристикой локальной неоднородности плотности множества в окрестностях точек а и Ь. Величину 1 = /(т,й) назовем 1-расстоянием между точками а и Ь. Для определения степени влияния параметров т и й на 1-расстояние проводились эксперименты, в которых сравнивались результаты кластеризации двумерного множества точек экспертами и программами, использующими разные виды функции /(т, й). Выяснилось, что использование
1-расстояний вместо евклидовых позволяет получать более естественную, с точки зрения экспертов, классификацию, совпадающую с результатами, полученными экспертами. При этом оказалось, что параметр й играет более важную роль по сравнению с параметром т. Наилучшее совпадение экспертных суждений с формальным получалось в том случае, если в качестве меры расстояния
использовалась величина 1 = т й.
Если построить полный граф с элементами множества и вычислить длины всех ребер в 1-расстояниях, то при "ручной" кластеризации человек-эксперт стремится к такому решению, при котором граница между кластерами проходила бы по участку с наибольшим значением характеристики 1. Итоговый критерий,
характеризующий качество кластеризации, выражается величиной Ж = йг т *кд. В итоге такого исследования было установлено, что наилучшие результаты получаются при максимизации функционала Ж качества кластеризации, в © Проблемы энергетики, 2004, № 7-8
котором наибольший вес придается нормированному расстоянию й, затем характеристике скачка плотности т и лишь потом характеристике равномощности кластеров И. Так как все эти величины меняются в пределах от 0 до 1, то уменьшение значения того или иного параметра можно добиться возведением его в степень, большую 1. С учетом этого, значения параметров
2 4
оказались такими: V = 1, я = 2, д = 4. То есть Ж = йт И [6].
Можно отметить, что за гипотезой компактности - многолетние традиции и большое количество алгоритмов и программ, построенных на ее основе. Но если в задачах разделения множества на кластеры простой формы, гипотезы компактности и 1-компактности приводят к одинаковым результатам, то для более сложных случаев, а именно для случаев с "расплывчатыми" педагогическими объектами, гипотеза 1-компактности зачастую может обеспечить получение результата, более естественного по сравнению с гипотезой компактности.
В связи с вышеописанной базовой гипотезой 1-компактности нами был реализован следующий алгоритм кластеризации, основанный на данной гипотезе. Для всех расстояний между объектами (из результирующей матрицы сходства) находим их 1 -характеристики, отображая тем самым множество объектов из евклидова пространства в новое 1-пространство. При этом каждое 1-расстояние
равно т й . Стоит заметить, что предварительно для нахождения т-характеристик необходимо в полном графе множества объектов определить наибольшее значение т - ттах. Затем в этом 1-пространстве по новому полному графу строится граф без петель, который связывает между собой все точки и имеет минимальную суммарную 1-длину своих ребер. Такой граф в евклидовом пространстве называется кратчайшим незамкнутым путем (КНП). По аналогии с ним, КНП в 1-пространстве обозначается 1-КНП.
Так, работа алгоритма начинается с нахождения пары точек с минимальным значением 1-расстояния между ними. Эти точки соединяются ребром графа. Затем соединяются следующие, самые 1-близкие точки из числа неприсоединенных, к уже построенной части графа. Эта процедура повторяется до тех пор, пока все точки не окажутся соединенными ребрами этого графа. Данный граф будет являться 1-КНП.
Теперь для разбиения всего множества на 2 кластера необходимо разорвать
одно ребро из ребер данного 1-КНП. Выберем ребро у с 1-длиной Xу = т2йу. Оставшимися ребрами 1-КНП соединяются 2 подмножества по ші точек в каждом. Эта информация позволяет для данного варианта разбиения вычислить характеристику равномощности кластеров Иу. Общая оценка качества Жу этого
у-го варианта равна XуИ4. Вычисление величины Жу для всех (ш-1) ребер графа
позволяет найти такой вариант кластеризации, при котором достигается максимум критерия Ж. Инвариантность характеристики Ж по отношению к количеству объектов ш и абсолютным значениям длин графа 1-КНП позволяет сравнивать между собой качество классификации различных множеств при разных количествах объектов ш и разном среднем 1-расстоянии между объектами. Данный критерий является результатом попытки выявить интуитивные человеческие критерии качества классификации.
Универсальный программный комплекс
Для проведения психолого-педагогических исследований, в частности решения задачи психолого-педагогической диагностики, нами был разработан "Универсальный программный комплекс", реализованный на языке программирования Турбо-Паскаль-7.0. Комплекс состоит из трех модулей: "УНИ-ТЕСТ", "СИНТЕЗ" и "АНАЛИЗ" и позволяет проводить поэтапное исследование психолого-педагогических объектов (например, обучаемых) по их характеристикам, измеренным в шкалах разного типа. Последний модуль дает возможность применить один из алгоритмов кластеризации, построенной на основе гипотезы 1-компактности.
На первом этапе с помощью модуля "УНИ-ТЕСТ" исследователь создает пакет необходимых психолого-педагогических тестов. Модуль работает в четырех режимах: создания теста, тестирования, обработки ответов и просмотра
результатов. Режим создания позволяет вводить как хорошо известные, так и свои "авторские" методики и контролирующие тесты. В удобном для восприятия диалоговом режиме исследователю, неспециалисту в программировании, предоставляется возможность сформировать тест из заданий разного типа: "закрытых", "открытых", "на соответствие" и "на установление правильной последовательности". Формирование любого теста начинается с ввода инструкций: общей, выводящейся один раз в самом начале тестирования, и
вспомогательной, выводящейся (для напоминания чего-либо) перед каждым заданием. Если исследователю требуются от обучаемых уже полученные ранее измерения или информация справочного (анкетного) характера, он заранее по простым правилам формирует отдельный файл, что обеспечит в дальнейшем сбор требуемой информации. При этом предполагается возможность в каждом задании указать максимальный интервал времени, отводящийся на поиск решения. Отдельно вводится "ключ" теста (правила для обработки ответов) и комментарий результатов. Таким образом, каждый тест состоит из двух файлов: файла заданий и файла "ключа". Разные преподаватели имеют возможность независимо друг от друга создавать тесты, необходимые для своей работы, формируя, тем самым, пакет тестов психолого-педагогической лаборатории.
В режиме тестирования исследователь организует тестирование обучаемых, перед которым им предлагается выбрать свою дальнейшую идентификацию - по Ф.И.О. либо по коду (анонимно). Если обучаемый тестируется в первый раз, то перед тестом он будет вынужден ввести дополнительно некоторые характеристики, в частности справочные сведения о себе, поступающие в файл персональных данных. В процессе тестирования все ответы обучаемого, (а также интервалы времени ответов) автоматически сохраняются, соответственно, в файле ответов и файле времени ответов. Самому обучаемому в процессе тестирования на табло предоставляется информация об остатке времени, данного ему на ответ задания. Наконец, в случае с большими или "затянувшимися" тестами имеется возможность прервать тестирование и продолжить его позже.
В режиме обработки сохраненные ответы тестируемых автоматически обрабатываются в соответствии с файлом ключа данного теста. Отдельно выдаются количество и имена обучаемых, с которыми тестирование не было завершено. В режиме просмотра с предварительным заданием имени обучаемого полученные результаты теста отображаются на экране, при этом дается расширенное толкование результатов теста в объеме, предусмотренном исследователем в режиме создания. На этом этап индивидуальной работы с обучаемым завершен.
На втором этапе исследователь с помощью модуля "СИНТЕЗ" отбирает и объединяет данные с характеристиками обучаемых для дальнейших исследований. Выходные данные различных тестов формируются в одну матрицу исходных данных, содержащую имена объектов (обучаемых) и их характеристики, измеренные в шкалах разного типа. При необходимости извлекаются любые характеристики из файла персональных данных. Кроме того, данный модуль снабжен многими вспомогательными функциями, полезными для практических исследований. Например, сортировка строк (в матрице данных) производится по именам объектов (в алфавитном порядке) в порядке возрастания или убывания для любой числовой характеристики либо в алфавитном порядке для номинальных признаков. Имеется возможность объединить нескольких файлов данных в один как с разными характеристиками для одинаковых объектов, так и с разными объектами и одними и теми же характеристиками. Одна из функций -разделение файла данных на несколько, например для получения нескольких матриц данных (с выделением групп по каким-либо критериям) из общей, с целью дальнейшего сравнительного исследования по группам.
Отдельная группа функций - преобразование характеристик. Имеется возможность удалить отдельные характеристики, умножить или увеличить (уменьшить) величины отдельных числовых характеристик (для сопоставимости с другими). Номинальные характеристики можно объединить в одну путем объединения их значений. Наконец, можно автоматически создать новую номинальную характеристику из нескольких числовых. Для этого исследователь в процессе диалога создает специальный файл, в котором будут сохранены границы интервалов (левые и правые границы значений) числовых характеристик и соответствующее им значение номинального признака. По существу это функция распознавания, позволяющая относить объекты к различным классам по значениям числовых характеристик. При этом объекты, величины характеристик которых не попали в заданные интервалы, получают номинальный признак НЕОПР (неопределенного класса). Кроме того, в режиме просмотра можно, выбрав отдельные характеристики, просмотреть их на экране, заказать вычисление некоторых статистик, сохранить их с целью вывода на печать. Вместе с тем, автоматически сформированные в процессе тестирования файлы интервалов времени ответов также несут в себе большой объём интересной скрытой информации. Например, три одинаково правильных ответа, данных разными обучаемыми за 5, 15 и 33 сек., уже дают информацию для анализа. Время может служить собственно диагностическим параметром, который ранее слабо использовался либо совсем не анализировался в "ручных" версиях диагностических методик. Модуль даёт возможность преобразовать, а затем использовать временные характеристики наравне с другими для дальнейших исследований. При желании исследователя воспользоваться результатами каких-либо невербальных методик, имеется возможность автоматически создать шаблон файла данных с именами всех тестируемых и ввести уже полученные результаты вручную.
На третьем завершающем этапе исследователь с помощью модуля "АНАЛИЗ" проводит комплексные исследования по сформированной матрице характеристик разного типа. В рамках конкретной задачи в соответствии с матрицей исходных данных, сформированной модулем "СИНТЕЗ", исследователь формирует файл структуры данных, включая в него названия выбранных признаков (характеристик) объектов, их типы (учитываются три типа: сильный, порядковый и номинальный) и соответствующие величины весовых
коэффициентов признаков. При необходимости на любом этапе можно откорректировать как элементы структуры, так и отдельные элементы матрицы данных. Затем модуль дает возможность войти в режим решения, где исследователь выбирает и задает пространство (совокупность) признаков для построения матрицы расстояний (близостей) между объектами в данном пространстве. Метод и формула для каждого признака выбирается в соответствии с его типом, который указан в файле структуры. Модуль вычисляет и сохраняет для дальнейших исследований все матрицы расстояний (близостей) между объектами по каждому выбранному признаку, а также итоговую матрицу расстояний между объектами в многомерном пространстве признаков. Перед вычислением итоговой матрицы имеется возможность выбрать меру для расчета расстояния - евклидово, квадратичное евклидово или манхеттенское расстояние.
После получения итоговой матрицы у исследователя есть возможность получить полную картину распределения вокруг любого объекта других объектов (начиная с самых близких) с выводом величин расстояний. Для этого необходимо выбрать один из объектов (это может быть и ранее сформированный "идеальный" объект) и заказать вывод списка объектов (всех или конкретного числа), упорядоченного по удаленности от выбранного. Все результаты (матрицы расстояний между объектами по отдельным признакам, итоговая матрица расстояний в многомерном пространстве, проранжированный список распределения объектов вокруг выбранного объекта) для учета и детального анализа сохраняются в форме простых для восприятия таблиц в отдельных текстовых файлах.
Для исследования влияния признаков на распределение объектов в пространстве можно изменять само пространство признаков, включая или исключая из исследования отдельные признаки, а также величины весовых коэффициентов различных признаков, чтобы ослабить или усилить вклад того или иного признака в общий результат распределения объектов. По сформированной матрице расстояний преподаватель может провести автоматическую классификацию, разбив всё множество на определённое число классов из обучаемых, близких между собой по выбранной совокупности признаков.
Модуль последовательно отображает все шаги работы алгоритма. Сначала для каждых двух вершин (объектов) полного графа вычисляются т -характеристики локальной неоднородности плотности множества в окрестности этих точек, которые сохраняются в виде квадратной матрицы в отдельном текстовом файле. В данной матрице т - характеристик отыскивается ттах и данная матрица нормируется. По двум матрицам (расстояний и т - характеристик)
строится матрица 1-расстояний (Х = т й), которая также сохраняется с возможностью просмотра в отдельном текстовом файле. Тем самым осуществляется перевод итоговой матрицы расстояний в 1-пространство. Затем по полному графу в 1-пространстве происходит построение 1-КНП, который сохраняется в табличном виде в текстовом файле. В процессе построения модуль выводит на экран каждую новую дугу пока весь 1-КНП не будет построен.
Наконец, осуществляется разбиение 1-КНП на К кластеров с вычислением критерия качества кластеризации Ж. Требуемое количество кластеров (нижнюю и верхнюю границы) задает исследователь. Он же выбирает тип поиска: задание рёбер КНП для разбиения вручную; автоматический - поиск лучшего деления на К кластеров либо частично автоматический - с заданием некоторых из К рёбер
КНП вручную. Лучшие варианты кластеризации вместе с величиной критерия качества Ж сохраняются в отдельном файле. Режим просмотра дает возможность внимательно изучить их, чтобы выбрать подходящий вариант и с помощью отдельного пункта меню внести его в данные по объектам. Тем самым создается новый номинальный признак, разбивающий обучаемых на разные классы.
Пример классификации педагогических объектов в многомерном пространстве разнотипных признаков
Рассмотрим пример классификации педагогических объектов в многомерном пространстве разнотипных признаков и реализации его с помощью программного комплекса. Большой интерес представляет оценка уровня научного творчества преподавателя. Это будет целевой исследуемый признак. Например, в работе Есаревой З.Ф. [8] были предложены следующие критерии для оценки уровня научного творчества преподавателя:
1) количество опубликованных работ (сильная шкала);
2) наличие среди публикаций монографий, учебников, учебных пособий (сильная шкала);
3) формирование нового направления исследований (номинальная шкала);
4) формирование нового метода для решения научных проблем (номинальная шкала);
5) организация научной школы (номинальная шкала);
6) количество ссылок на данное исследование в работах других авторов (сильная шкала);
7) частота использования студентами в своей самостоятельной работе публикаций преподавателя (сильная шкала);
8) количество дипломных и аспирантских работ, выполненных под руководством преподавателя (сильная шкала);
9) награждение преподавателя почетными грамотами, премиями за успешную научную деятельность (номинальная шкала);
10) присуждение преподавателю звания доцента, профессора (номинальная шкала).
Можно включить в исследуемую модель и другие критерии, влияющие на целевой признак, например:
-"потребность в познании" (порядковая шкала) - данные
"самоактуализационного теста" кафедры социальной психологии МГУ;
- "креативность" (порядковая шкала) - данные тестирования по предыдущей методике;
- "организаторские склонности" (порядковая шкала) - данные тестирования по "методике выявления коммуникативных и организаторских склонностей";
- "коммуникативные склонности" (порядковая шкала) - данные тестирования по предыдущей методике;
- "тип направленности личности" (номинальная шкала) - данные теста Басса с итоговыми значениями: "на задачу", "на общение" и "на себя";
После измерения и ввода в систему значений указанных признаков с помощью модуля "УНИ-ТЕСТ" переходим к следующему этапу и объединяем в модуле "СИНТЕЗ" полученные характеристики в общую матрицу для исследования. В нее же можно включить объект "Идеальный преподаватель" с максимальными значениями для всех признаков сильной и порядковой шкал и выборочными значениями для признаков номинальной шкалы.
Сформированный файл структуры данных с указанием наименования признака, типа шкалы и соответствующего весового коэффициента в нашем случае имеет вид: публикации, учебники, направление, метод, школа, ссылки, частота, дипломные и аспирантские работы, награждение, звание, познание, креативность, организаторские склонности, коммуникативные склонности, направленность.
Модуль "АНАЛИЗ" дает возможность получить проранжированный список распределения вокруг объекта "Идеальный преподаватель" всех остальных исследуемых в 15-мерном пространстве разнотипных признаков. Для получения более адекватной картины распределения можно менять весовые коэффициенты признаков, а также включать или исключать из рассмотрения отдельные признаки. С помощью кластеризации модуля "АНАЛИЗ" в данном многомерном пространстве можно получить два или три различных класса исследуемых преподавателей, близких по совокупности выбранных критериев (признаков). Можно предположить, что молодые преподаватели, оказавшиеся в одном классе с большинством докторов и кандидатов наук, окажутся близки к ним по уровню научного творчества и столь же успешны в будущей научной деятельности.
Определенное эмпирическим путем то или иное пространство (модель) признаков с конкретными весовыми коэффициентами информативности могут подвести исследователя к созданию нового комплексного психологопедагогического признака, не поддающегося простым измерениям и определениям (комплексного латентного качества).
Заключение
В заключение выделим основные достоинства предложенного программного комплекса. За последние десятилетия накоплено большое количество добротных проверенных методик, разработанных психологами и педагогами. Однако все эти методики дают результаты в шкалах разного типа, чаще всего порядковых и номинальных. В шкалах одного и того же типа (порядкового) также наблюдается множество различий. В одних предлагаются оценки (1, 2, 3, 4, 5), в других - (1, 2, 3, ... , 9, 10), в третьих - (-2, -1, 0, 1, 2). Наш комплекс позволяет исследователю выбрать любой набор подходящих методик и провести диагностику по совокупности критериев (признаков), не заботясь о типах шкал. Другим достоинством является обеспечение сопоставимости признаков, поскольку предусмотрена процедура нормирования. С другой стороны, наличие весовых коэффициентов каждого признака дает возможность учитывать разное влияние (вклад) выбранных критериев (признаков) на итоговый результат. Кроме того, практики-диагносты хорошо знакомы с трудоемкостью и сложностью обработки результатов методик (работы с "ключами"), в процессе которой им приходится сталкиваться с многообразием таблиц, трафаретов и правил. Предлагаемый комплекс включает универсальный механизм построения "ключей", позволяющий неспециалисту в программировании по набору несложных формальных правил формировать "ключи" к методикам. Помимо использования готовых методик исследователь имеет возможность формировать свои "авторские" методики и контролирующие тесты, используя в построении все основные типы вербальных заданий. Если же перед исследователем встает необходимость включить в процесс исследования результаты невербальных методик, он организует их вне комплекса, а результаты вводит в комплекс в специальном режиме ввода готовых результатов. Имеется возможность использовать временные характеристики реакций испытуемых. При анализе
протокола ответов исследователь может выделить те вопросы, ответы на которые потребовали наибольшего времени, что потенциально может свидетельствовать об их большом личностном значении для испытуемых. Некоторые апробированные вербальные методики "интеллекта" уже используют ограничение по времени реакций. Наконец, в результате (после построения матрицы близости) исследователь может автоматически провести сравнение, отбор и классификацию всех тестируемых, причем используемый механизм (основанный на гипотезе 1-компактности) позволит провести классификацию более адекватно.
Предложенный универсальный программный комплекс, разработанный для организации психолого-педагогических исследований, продолжает дорабатываться и расширять свои функциональные возможности. Наличие собственного комплекса программных средств, открытого для внедрения любых изменений и усовершенствований, несомненно, является одним из атрибутов современной психолого-педагогической лаборатории.
Summary
There has been worked out a programme complex, allowing to make automated pedagogical object classification in multimeasured space of different features. Scientific justification of programme complex substantially enriches pedagogical research methods, and its practical use allows solving wide variety of organizational pedagogical high school problems.
Литература
1. Битинас В.П. Методологические вопросы измерения свойств личности учащихся //Тезисы докладов сессии - семинара по методологической педагогики и методике педагогических исследований. -М., 1973.
2. Ительсон Л.Е. Математические методы в педагогике и педагогической психологии: Автореф. дис... д-ра пед. наук:13.00.01. - М.,1965.
3. Ким О., Мюллер Ч.У., Клекк У.Р. Факторный, дискриминантный и кластерный анализ. - М.: Финансы и статистика, 1989.
4. Михеев В.И. Моделирование и методы теории измерений в педагогике. - М.: Высшая школа, 1987.
5. Матушанский Г.У., Медведев В.А. Согласование психолого-педагогических
измерений в многомерном пространстве разнотипных признаков. //
Педагогическая информатика. - 2002. - №2.
6. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. -Новосибирск: Издательство института математики, 1999.
7. Есарева З.Ф. Особенности деятельности преподавателя высшей школы. - Л.: ЛГУ, 1974.
Поступила 02.04.2004