УДК 681.142.2:159.922.77
Е.В. Славутская, Л.А. Славутский СЕЛЕКТИВНАЯ ОЦЕНКА ДАННЫХ ПСИХОДИАГНОСТИКИ ПРИ ПОМОЩИ НЕЙРОННОЙ СЕТИ
Предлагается использование нейронной сети для обработки данных психодиагностики. Построена простая нейросеть с прямой передачей сигнала и обратным распространением ошибки. Структура нейросети жестко связана с исходными анализируемыми данными, а ее обучение производится с их же использованием. Обучение сети и проверка ее работы производятся на примере данных тестирования младших подростков. Показано, что предложенный алгоритм позволяет эффективно выделять психологические признаки, значимые для оценки гендерных различий испытуемых.
Нейронные сети, обработка данных, психологическое тестирование E.V. Slavutskaya, L.A. Slavutskiy
SELECTIVE EVALUATION OF THE PSYCHODIAGNOSTIC DATA BY THE NEURAL NETWORK
The neural networks for the psychodiagnostic data processing are proposed. The network type is «Feed-forward backprop». The structure of the neural network is directly connected with the being analyzed data, and its training is made with their use. The networks training and its work testing are performed by the example of younger teenager’s psychodiagnostic data. It is shown, that the proposed algorithm can effectively allocate psychological traits that are important to assess the gender differences of the children.
Neural networks, data processing, psychological testing
Нейронные сети в последние десятилетия находят все более широкое применение в задачах идентификации, прогнозирования, классификации данных [5], в том числе статистических [1]. В настоящей работе описан нейросетевой алгоритм обработки данных психологического тестирования на основе сети с очень простой архитектурой.
Результаты психодиагностики чаще всего имеют целочисленные значения и бывают неполными (отсутствует часть результатов тестирования некоторых испытуемых). Во многих случаях интерпретировать результаты приходится при большом числе исходных психологических признаков и недостаточном для полноценного статистического анализа числе испытуемых. В таких условиях анализ взаимосвязей между психологическими признаками и оценка их значимости, которым посвящена настоящая работа, оказываются непростой задачей.
Главной особенностью предлагаемого алгоритма являются его наглядность и максимальная определенность в процессе обучения и использования нейронной сети. Для этого структура нейросети жестко связана с исходными анализируемыми данными, а ее обучение производится с их же использованием.
На рис. 1 приведен пример результатов психологического тестирования школьников 10-11 лет (5 класс) с использованием 12-факторного опросника Р. Б. Кеттелла и Р. В. Коэна CPQ (Childrens Personality Questionnaire) для детей 8-12 лет [6]. Он предназначен для исследования личностных особенностей школьников и содержит 12 шкал для измерения степени выраженности черт личности, которые Р. Б. Кеттелл называет конституциональными. На этом же рисунке приведена структура нейронной сети.
Пол Личностные качества IQ
А В С D Е F G Н I О Q3 04
ж 3 2 5 5 1 2 7 1 7 7 7 7 142
м 6 4 2 3 9 5 5 6 10 7 9 5 133
і І і
М Ж
Рис. 1. Пример данных психодиагностики и структура нейросети. Интерпретация личностных качеств в 12-факторном опроснике Р.Б. Кеттелла и Р.В. Коана (CPQ): A - общительность-замкнутость;
B - абстрактное-конкретное мышление; C - эмоциональная стабильность-неустойчивость;
D - возбудимость-уравновешенность; E - независимость-покорность; F - беспечность-озабоченность;
G - высокая-низкая дисциплинированность; H - смелость-робость; I - мягкость-твердость;
O - тревожность-спокойствие; Q3 - высокий-низкий самоконтроль; Q4 - напряженность-расслабленность
Структура используемой нейросети, реализованной в среде MatLab [2], соответствует анализируемым данным. Тип сети - двухслойная сеть с прямой передачей сигнала и обратным распространением ошибки (feed-forward backprop). Сеть с двумя слоями (12 нейронов в первом слое и 1 нейрон в выходном слое) имеет последовательную структуру, когда выход первого слоя служит входом второго слоя. Такая архитектура может воспроизводить сложные нелинейные зависимости между входными и выходными данными сети. Каждый слой сети имеет свою матрицу весов W , которая состоит из весовых функций нейронов. Количество нейронов в первом слое 12 - по количеству исходных психологических признаков, а на выходе 2-го слоя получаем два целочисленных значения «-1» и «+1» в соответствии с гендерной принадлежностью тестируемого (мальчик или девочка).
Данные, аналогичные показанным на рис. 1, были получены при тестировании 86 школьников (4б девочек и 40 мальчиков). В основу обработки данных были положены гендерные различия в результатах тестирования, и оценивалась значимость каждого из 12 признаков для мальчиков и девочек. Учащиеся пятых классов были разделены на три группы: К-1 (16 мальчиков и 19 девочек с высоким и выше среднего уровнем интеллектуального развития), К-2 (11 мальчиков и 11 девочек со средним и низким уровнем интеллектуального развития), Э (13 мальчиков и 1б девочек - экспериментальная группа учащихся с различным уровнем интеллектуального развития). Оценка коэффициента интеллекта IQ проводилась по методике «Культурно-независимый тест интеллекта Р. Б. Кеттелла».
В соответствии со структурой нейросети проводился процесс ее обучения. При этом обучение проводилось как по данным всех 86 тестируемых, так и отдельно, по каждой из групп К1, К2, Э. На рис. 2 показаны графики обучения сети для всех четырех случаев. Обучение с желаемыми (целевыми) реакциями сети на входные сигналы (такой процесс называется «обучением с учителем»). Алгоритм обучения пошаговый, и эти шаги принято называть эпохами или циклами. На каждом цикле на вход сети последовательно подаются все элементы обучающей последовательности, затем вычисляются выходные значения сети, сравниваются с целевыми реакциями, вычисляется функционал ошибки А. Процесс обучения прекращается, когда ошибка достигает некоторого малого значения или перестает уменьшаться.
Наибольшее количество шагов для обучения потребовала группа Э, результаты тестирования которой наиболее неоднородны с психологической точки зрения [3]. Кроме того, графики рис. 2 показывают, что скорость обучения не зависит от числа тестируемых.
Рис. 2. Обучение нейросети. Зависимость ошибки А от числа циклов обучения N :
1 - группа Э (40 циклов); 2 - группа К1 (21 цикл); 3 - все дети (37 циклов); 4 - группа К2 (23 цикла)
Для оценки значимости каждого из 12 психологических качеств (рис. 1) для гендерных особенностей тестируемых каждый из факторов на входе сети последовательно обнулялся. При этом фиксировалось изменение выходных признаков. Суммировалось количество случаев, когда сеть выдавала ошибку в половой принадлежности ребенка. Соответствующие гистограммы приведены на рис. 3. Как видно из рисунка, полученные результаты крайне неоднородны как по 12 исходным качествам, так и по гендерной принадлежности. Обнуление некоторых признаков не влечет за собой ошибок в определении пола ребенка (нулевая высота столбцов гистограмм рис. 3). С другой стороны, для некоторых из 12 качеств ошибка в определении пола ребенка при исключении (обнулении) входных данных по одному признаку влечет 100%-ю ошибку в определении половой принадлежности. Примером может служить качество «О» в обработке данных тестирования по группе К2. В этом случае сеть выдала ошибку в определении пола всех 11 девочек. Согласно результатам обработки (рис. 3), для девочек наиболее значимыми могут считаться качества «С» и <^4», для мальчиков - «Е» и «Н». Такая интерпретация согласуется с результатами психологических исследований, проведенных при помощи факторного анализа [4].
Описанный нейросетевой алгоритм не вызывает традиционных проблем с недостаточным (или избыточным) обучением сети, что подтверждается эффективной работой схемы с разными группами респондентов.
15
10
20
11
і 1 1
п 1 и 1 1п 1 1 1 г
А=0 В=0 С=0 Б=0 Е=0 Г=0 0=0 Н=0 1=0 0=0 03=0 <24=0
п ■
I
::....п I: І: I:
и
й
я
I .
о
©
А=0 В=0 С=0 0=0 Е=0 Г=0 0=0 Н=0 1=0 0=0 р3=0 04=0
— — -1
ип л ■ 1 - _ ■ и-п ^
©
А=0 В=0 С=0 В=0 Е=0 Г=0 0=0 Н=0 1=0 0=0 03=0 04=0
©
А=0 В-0 С=0 Р=0 Е=0 Г=0 0=0 Н=0 1=0 0=0 03=0 04=0
мальчики | | девочки I
Рис. 3. Число ошибок в определении гендерной принадлежности испытуемых при последовательном обнулении входных признаков:1 - по всем детям, 2 - по группе К1, 3 - по группе Э, 4 - по группе К2
Таким образом, предложенный нейросетевой алгоритм позволяет достаточно эффективно выделять наиболее значимые психологические признаки, определяющие гендерные различия испытуемых. При этом данные рис. 3 могут быть персонифицированы. Приведенная схема обработки психодиагностических данных обладает селективностью не только по исходным психологическим признакам, но и по индивидуальным характеристикам испытуемых. С ее помощью может осуществляться, например, разделение респондентов по тому, насколько значимыми для каждого из них являются те или иные психологические качества. Такая процедура может осуществляться по малой выборке данных, в разные моменты времени, и, соответственно, описывать временные изменения значимости психологических признаков в динамике (например, в переходные или кризисные для испытуемых периоды). Исключающая неопределенность схема обучения сети и обработки данных в этом случае будет определять высокую достоверность результатов.
ЛИТЕРАТУРА
1. Боровиков В.П. Нейронные сети. Методология и технологии современного анализа данных / В.П. Боровиков [под ред. В.П. Боровикова]. М.: Горячая линия-Телеком, 2008. 392 с.
2. Медведев В.С. Нейронные сети. MATLAB 6 / В. С. Медведев, В. Г. Потемкин [под ред. В.Г. Потемкина]. М.: ДИАЛОГ-МИФИ, 2002. 496 с.
3. Славутская Е.В. Факторный анализ психологических качеств, определяющих «дезадапта-ционный синдром пятого класса» / Е.В. Славутская // Психология обучения. 2008. № 12. С. 103-112.
4. Славутская Е.В. Экспериментальное изучение гендерных различий в развитии эмоционально-волевых и интеллектуальных свойств младших подростков / Е.В. Славутская // Вестник ТГПУ. 2009. Вып. 9 (87). C. 127-129.
5. Хайкин С. Нейронные сети: полный курс: пер. с англ. / С. Хайкин. 2-е изд. М.: Вильямс, 2006. 1104 с.
6. Cattell R.B. Advanced in Cattelian Personality Theory. Handbook of Personality. Theory and Research / R. B. Cattell. N.Y.: The Guilford Press, 1990.
Славутская Елена Владимировна -
кандидат психологических наук, доцент кафедры психологии и социальной педагогики Чувашского государственного педагогического университета имени И. Я. Яковлева, г. Чебоксары
Славутский Леонид Анатольевич -
доктор физико-математических наук, старший научный сотрудник, профессор кафедры «Управление и информатика» Чувашского государственного университета, Чебоксары
Статья поступила в редакцию 10.11.11, принята к опубликованию 04.06.12
Elena V. Slavutskaya -
PhD, Associated Professor
Department of Psychology and Social Pedagogic
I.Ya. Yakovlev Chuvash State Pedagogical University,
Cheboksary
Slavutskiy Leonid Anatolyevich -
Dr. Sc., Professor
Department of management and informatics, Chuvash State University, Cheboksary