Научная статья на тему 'Обучение нейросети как инструмент системного анализа многомерных данных психодиагностики'

Обучение нейросети как инструмент системного анализа многомерных данных психодиагностики Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
357
55
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / ARTIFICIAL NEURAL NETWORKS / СИСТЕМНЫЙ АНАЛИЗ / SYSTEMS ANALYSIS / МНОГОМЕРНЫЕ ДАННЫЕ / MULTIDIMENSIONAL DATA / ПСИХОДИАГНОСТИКА / PSYCHODIAGNOSTICS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Петров Андрей Николаевич, Иванова Гульнара Фархадовна, Славутская Елена Владимировна

Предлагается использование аппарата искусственных нейронных сетей (ИНС) для анализа внутрисистемных связей многомерных случайных данных. В основу положены статистические оценки качества обучения нейросетевых моделей: распределение среднеквадратичной ошибки и процент распознавания связей. На примере многомерных данных психодиагностики с использованием нейросети прямого распространения и простой архитектуры показаны возможности предлагаемого подхода. Иерархический анализ опосредованных, нелинейных связей экспериментальных данных строится на последовательном исключении данных из процедуры обучения нейросети. Обсуждаются его преимущества по сравнению с традиционным факторным и кластерным анализом.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Петров Андрей Николаевич, Иванова Гульнара Фархадовна, Славутская Елена Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NEURO NET TRAINING AS INSTRUMENT OF SYSTEM ANALYSIS OF MULTIDIMENSIONAL PSYCHODYAGNOSTIC DATA

The use of the apparatus of artificial neural networks (ANN) for the analysis of intra-system links of multidimensional random data is proposed. The approach is based on statistical assessments of the quality to train neural network models: the distribution of the mean square error and the percentage of links recognition. On the example of multidimensional psycho diagnostic data using a direct distribution neural network with a simple architecture, the possibilities of the proposed approach are shown. Hierarchical analysis of the indirect, non-linear links of the experimental data is based on the consistent exclusion of data from the procedure of the neural network training. Advantages over traditional factor and cluster analysis are discussed.

Текст научной работы на тему «Обучение нейросети как инструмент системного анализа многомерных данных психодиагностики»

УДК 004.8.032.26:159.922.7.016.2 ББК З97:Ю983.402

АН. ПЕТРОВ, Г.Ф. ИВАНОВА, ЕВ. СЛАВУТСКАЯ

ОБУЧЕНИЕ НЕЙРОСЕТИ КАК ИНСТРУМЕНТ СИСТЕМНОГО АНАЛИЗА МНОГОМЕРНЫХ ДАННЫХ ПСИХОДИАГНОСТИКИ

Ключевые слова: искусственные нейронные сети, системный анализ, многомерные данные, психодиагностика.

Предлагается использование аппарата искусственных нейронных сетей (ИНС) для анализа внутрисистемных связей многомерных случайных данных. В основу положены статистические оценки качества обучения нейросетевых моделей: распределение среднеквадратичной ошибки и процент распознавания связей. На примере многомерных данных психодиагностики с использованием нейросети прямого распространения и простой архитектуры показаны возможности предлагаемого подхода. Иерархический анализ опосредованных, нелинейных связей экспериментальных данных строится на последовательном исключении данных из процедуры обучения нейросети. Обсуждаются его преимущества по сравнению с традиционным факторным и кластерным анализом.

Нейросетевые алгоритмы основаны на когнитивных принципах [12] и получили достаточно широкое распространение [1, 8, 10]. Аппарат искусственных нейронных сетей (ИНС) чаще всего используется при анализе случайных данных и процессов в том случае, когда создание аналитической или детерминированной численной модели затруднительно в принципе или требует больших вычислительных ресурсов. После обучения ИНС-модель позволяет быстро установить связь между входными данными и целевой функцией [1, 10]. Выбор структуры ИНС и условий ее обучения основывается на эмпирически установленных правилах [5, 9].

Одними из главных условий успешного обучения и использования ИНС являются наличие и определенная устойчивость связей между входными и выходными данными, даже если эти связи носят сильно нелинейный и опосредованный (латентный) характер. При системном анализе многомерных случайных данных наличие и структура таких связей сами по себе могут являться предметом исследования. Результат обучения ИНС, как решение задачи многопараметрической нелинейной оптимизации [5, 8], может описываться такими статистическими критериями, как среднеквадратичное отклонение от целевых значений или их случайное распределение [6].

В настоящей работе на примере анализа результатов психодиагностики показано, что статистические оценки качества нейросетевых моделей могут служить для анализа системных связей многомерных случайных данных.

Выборка и методика анализа данных. Для обработки данных использованы результаты психодиагностики 56 подростков в возрасте 14-15 лет, полученные при помощи 14-факторного опросника Р.Б. Кеттелла [11]. Этот стандартизированный, широко используемый психодиагностический тест

выявляет личностные черты испытуемых, которые можно дифференцировать по группам с определенными свойствами: группа коммуникативных свойств, группа интеллектуальных свойств, группа эмоциональных свойств, группа поведенческих регуляторных свойств.

Каждой личностной черте соответствует целочисленное значение от 0 до 10. Таким образом, исходными данными для анализа служила таблица из 14 столбцов и 56 очищенных от дублирующих комбинаций строк. Использована простейшая двухслойная нейронная сеть с двумя нейронами в скрытом слое (рис. 1). Обучение ИНС прямого распространения с обратным распространением ошибки осуществлялось в аналитической программе «БеёиСог» [2]. Число циклов (эпох) обучения - 10 000, 5-10% общей выборки использовалось для тестирования.

А В С Э

Е ?

в Н I

О

0.2 "/./<■••■"

03 V.-""

04

Рис. 1. Структура ИНС: группа коммуникативных свойств: А - общительность (аффектомия - шизотимия); Н - (смелость - робость в контактах); Е - (стремление к доминированию - пассивность); Q2 - самостоятельность (степень групповой зависимости); группа интеллектуальных свойств: В - вербальный интеллект; группа эмоциональных свойств: С -(степень эмоциональной устойчивости); Б - (возбудимость - флегматичность); Г -(легкомыслие - осторожность); I - эмоциональная чувствительность (сензитивность -реализм); ] - (неврастения, фактор Гамлета - интерес к участию в общих делах); О -тревожность (склонность к чувству вины - самоуверенность); Q4 - (степень внутреннего напряжения); группа поведенческих регуляторных свойств: Q3 - (степень самоконтроля); О - моральная нормативность (степень принятия моральных норм)

На рис. 2 показан пример диаграммы рассеяния и распределения ошибок при обучении ИНС рис. 1. Как видно из рис. 2, максимальная ошибка ^макс < 5%, среднеквадратичная ошибка < 1%, при этом уровень распознавания связей при обучении сети £ = 100% (все целевые значения на диаграмме рассеяния попадают в обозначенные границы).

Для того чтобы оценить, насколько каждый из признаков (столбцы в исходной матрице данных) связан с остальными 13 признаками, при обучении ИНС этот признак подавался на выход, а остальные 13 признаков - на вход (аналогично рис. 1). Соответствующие результаты приведены в табл. 1.

Рис. 2. Структура ИНС, диаграмма рассеяния и гистограмма распределения среднеквадратичной ошибки при обучении сети

Таблица 1

Результаты обучения с разными признаками на выходе ИНС

Признак Максимальная ошибка амакс Средняя ошибка а, Распознавание £

А 3,59х10-1 1,57х10-2 94,64%

В 1,53х10-1 1,44х10-2 89,29%

С 1,12х10-1 9,71 х10-3 96,43%

Б 8,96 х10-2 6,34 х10-3 96,43%

Е 1,39х10-1 1,96х10-2 92,86%

Е 9,46 х10-2 9,16х10-3 94,64%

О 1,02х10-1 5,92 х10-3 96,43%

Н 4,37х10-2 7,04 х10-3 100%

I 1,75х10-1 1,32х10-2 91,07%

I 4,19х10-2 7,29 х10-3 100%

О 1,76х10-1 1,76х10-2 87,50%

7,83 х10-2 1, 15 х 10-2 96,43%

дз 1,13х10-1 9,56 х10-3 96,43%

3,06 х10-1 2,19х10-2 89,29%

Анализ результатов. Три численных критерия качества обучения ИНС из табл. 1 оказываются связанными между собой. Коэффициент корреляции Я12 между смакс и а, равен 0,73, а Л13 Я13 между смакс и равен -0,59. При выборке в

14 значений такие коэффициенты корреляции имеют уровень значимости меньше 0,01 и 0,02. Таким образом, данные табл. 1 позволяют утверждать, что наиболее тесно связанными с остальными признаками являются величины Н, I

(минимальная ошибка и 100% распознавания), а наименее связанными - В, Е, I, О, Q4. Взаимосвязи могут быть опосредованными, поэтому возникает необходимость селективно оценить уровень влияния каждого признака из входных данных ИНС на качество ее обучения. Для этого отдельные признаки на входе ИНС последовательно исключались. В табл. 2 приведены соответствующие результаты для признака I на выходе ИНС, когда обучение проводилось по 12 входным признакам вместо 13. Как следует из таблицы, обучение ИНС в целом улучшилось по сравнению с результатами табл. 1: 100% связей распознано в 4 из 12 случаев (в 2 случаях в табл. 1), среднеквадратичная ошибка больше 1% в одном случае (в 7 случаях в табл. 1).

Таблица 2

Результаты обучения ИНС с J на выходе и последовательным исключением признаков на входе

Признак Максимальная ошибка аМакс Средняя ошибка а Распознавание ^

Без А 1,26х10-1 9,61 х10-3 96,43%

Без В 5,89х10-2 9,22 х 10-3 94,64%

Без С 5,76х10-2 7,59х 10-3 94,64%

Без Б 6,05х10-2 9,35 х10-3 98,21%

Без Е 6,97х10-2 8,59х 10-2 92,86%

Без Б 3,39х10-2 6,34х 10-3 100%

Без О 7,62х10-2 1,07х 10-2 98,21%

Без Н 6,33х10-2 9,95 х10-3 98,21%

Без I 5,62х10-2 7,74 х10-3 94,64%

Без О 3,86х10-2 6,33 х10-3 100%

Без Q2 6,07х10-2 9,33 х10-3 96,43%

Без Q3 4,02х10-2 5,83 х10-2 100%

Без Q4 4,02х10-2 6,69 х10-3 100%

Следующим шагом анализа можно исключить все признаки, без которых наблюдается 100% распознавание связей (Б, О, Q3, Q4). Структура соответствующей нейросети показана на рис. 3. Качество обучения не сильно отличается от ИНС (рис. 1): амакс = 0,064, а = 0,0098, £ = 92,86%.

Таким образом, можно считать, что признак I наиболее тесно связан с признаками, обозначенными на рис. 3. С другой стороны, исключение при-

знаков I, Н, как наиболее связанных с остальными признаками (см. табл. 1), должно нарушать общую структуру связей в системе и «ухудшать» качество обучения ИНС для других признаков. Соответствующие результаты показаны в табл. 3. Исключение I, Н со входа ИНС или увеличивает среднеквадратичную ошибку стж, или уменьшает процент распознавания связей (сравнение табл. 1 и 3). Исключение составляет признак Б, при исключении которого качество обучения несколько «улучшилось». Однако это не противоречит показанным выше результатам, поскольку этот признак мало влияет на связь I с остальными признаками (см. табл. 2 и рис. 3).

Таблица 3

Результаты обучения с разными признаками на выходе ИНС при исключении .1, Н на входе

Признак Максимальная ошибка стмакс Средняя ошибка ст Распознавание

А 1,64x10-1 9,59 х10-3 94,64%

В 2,06х1(Г1 1,91 х10-2 87,50%

С 6,69х10-2 8,67 х10-3 94,64%

Б 1,20x10-1 8,73 х10-3 96,43%

Е 1,45x10-1 1,34х10-2 92,86%

Б 7,11 х 10-2 7,76 х10-3 98,21%

О 2,50х10-1 1,35х10-2 94,64%

I 1,57х10-1 2,10х10-2 85,71%

О 2,04х10-1 2,60 х10-2 82,14%

3,86х10-2 1,56х10-2 91,07%

6,07х10-2 1,78х10-2 89,29%

1,75х10-1 2,16х10-2 85,71%

Выводы. Системный анализ прикладного объекта подразумевает определенную иерархию и классификацию связей между элементами системы [3]. Для многомерных случайных данных такая иерархическая классификация может проводиться традиционными методами факторного [4] или кластерного [13] анализа. Предлагаемый в настоящей работе подход, основанный на статистических критериях оценки качества обучения нейросетевых моделей, имеет значительно меньше ограничений:

1) позволяет оценить сильно нелинейные связи, которые невозможно выявить корреляционным или факторным анализом;

2) не накладывает ограничений на числовую размерность данных;

3) не требует априорного задания меры связей (метрика Чебышева, евклидово расстояние, коэффициент корреляции и т.д.).

Использование статистических критериев при обучении и оценке структуры ИНС позволяет проводить анализ по достаточно ограниченной выборке, что является принципиальным для значительного числа практических задач, где ИНС до настоящего времени не используются. Предлагаемый подход может быть программно автоматизирован и продолжен для селективной оценки внутрисистемных связей. Можно провести общую аналогию между предлагаемым алгоритмом и многократной (последовательной) факторизацией данных [4, 7].

Литература

1. Абруков В.С., Николаева Я.Г. Количественные и качественные методы: соединяем и властвуем! // Социологические исследования. 2010. № 1. С. 142-145.

2. Абруков В.С., Ефремов Л.Г., Кощеев И.Г. Возможности создания системы поддержки принятия решений и управления вузом с помощью аналитической платформы deductor // Интеграция образования. 2013. № 1(70). C. 17-23.

3. Волкова В.Н., Денисов А.А. Основы теории систем и системного анализа. СПб.: СПбГТУ, 1997. 510 с.

4. Иберла К. Факторный анализ. М.: Статистика, 1980. 308 с.

5. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия - Телеком, 2002. 382 с.

6. Славутская Е.В., Славутский Л.А. Использование искусственных нейронных сетей для анализа гендерных различий младших подростков // Психологические исследования. 2012. Т. 5, № 23. С. 4. URL: http://psystudy.ru.

7. Славутская Е.В., Славутский Л.А. Факторный анализ взаимосвязи индивидуально-психологических и личностных характеристик младших подростков с уровнем школьной дезадаптации // Экспериментальная психология. 2013. Т. 6, № 4. С. 40-51.

8. Славутская Е.В., Славутский Л.А. Нейросетевой анализ взаимосвязи вербального и невербального интеллекта младших подростков // Психологический журнал. 2014. Т. 35, №5. С. 48-56.

9. Хайкин С. Нейронные сети: полный курс: пер. с англ. 2-е изд. М.: Вильямс, 2006. 1104 с.

10. Baxt W.G. Complexity, chaos and human physiology: the justification for non-linear neural computational analysis. Cancer Lett, 1994, vol. 77, no. 2-3, pp. 85-93.

11. Cattell R.B. Advanced in Cattelian Personality Theory. Handbook of Personality. Theory and Research. New York, The Guilford Press, 1990.

12. Hebb D. Organization of behavior. New York, Science Edition, 1961.

13. Slonim N., Atwal G.S., Tkachic G., Bialek W. Information-based clustering. Proceedings of the National Academy of Sciences, 2005, vol. 102, pp. 18297-18302.

ПЕТРОВ АНДРЕЙ НИКОЛАЕВИЧ - студент IV курса факультета радиоэлектроники и автоматики, Чувашский государственный университет, Чебоксары, Россия (petrov_rea-11-14@mail.ru).

ИВАНОВА ГУЛЬНАРА ФАРХАДОВНА - аспирантка кафедры психологии и социальной педагогики, Чувашский государственный педагогический университет, Чебоксары, Россия (gulnara_biametov@mail.ru).

СЛАВУТСКАЯ ЕЛЕНА ВЛАДИМИРОВНА - доктор психологических наук, профессор кафедры психологии и социальной педагогики, Чувашский государственный педагогический университет, Чебоксары, Россия (elena@slavutskii.ru).

A. PETROV, G. IVANOVA, E. SLAVUTSKAYA NEURO NET TRAINING AS INSTRUMENT OF SYSTEM ANALYSIS OF MULTIDIMENSIONAL PSYCHODYAGNOSTIC DATA

Key words: artificial neural networks, systems analysis, multidimensional data, psychodiagnostics.

The use of the apparatus of artificial neural networks (ANN) for the analysis of intrasystem links of multidimensional random data is proposed. The approach is based on statistical assessments of the quality to train neural network models: the distribution of the mean square error and the percentage of links recognition. On the example of multidimensional psycho diagnostic data using a direct distribution neural network with a simple architecture, the possibilities of the proposed approach are shown. Hierarchical analysis of the indirect, non-linear links of the experimental data is based on the consistent exclusion of data from the procedure of the neural network training. Advantages over traditional factor and cluster analysis are discussed.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

References

1. Abrukov V.S., Nikolaeva Y.G. Kolichestvennii i kachestvennii metodi: soedinayem I vlastvyem [Quantitative and qualitative methods: we unite and rule]. Sotsiologicheskie issledovania [Sociological research], 2010, no. 1, pp. 142-145.

2. Abrukov V.S., Efremov L.G., Kosheev I.G. Vozmoznosti sozdania sistemiprinyatia reshenii i upravlenia vuzom s pomoshiu platformi deductor [Opportunities to create a decision support and management system with the help of the analytic platform deductor]. Integratsia obrazovania [Integration of education], 2013, no. 1(70), pp. 17-23.

3. Volkova V.N., Denisov A.A. Osnovi teorii system i sistemnogo analiza [Fundamentals of systems theory and systems analysis]. St. Petersburg, 1997, 510 p.

4. Iberla K. Factorny analiz [Factor analysis]. M.: «Statistics», 1980. 308 p.

5. Kruglov V.V., Borisov V.V. Iskustvennii neironnii seti. Teoria i praktica [Artificial neural networks. Theory and practice]. Moscow, Goryachaiya liniya - Telecom Publ., 2002, 382 p.

6. Slavutskaya E.V., Slavutskii L.A. Ispolzovanie iskysstvennih neironnih setei dlya analiza gendernih razlishii mladchih podrostkov [The use of artificial neural networks for the analysis of gender differences in younger adolescents]. Psichologicheskie issledovania [Psychological research], 2012, vol. 5, no. 23, p. 4.

7. Slavutskaya E.V., Slavutskii L.A. Factornii analiz vzaimosvyazi individyalno-psihologi-cheskih i lichnostnih haracteristik mladchih podrostkov s yrovnem shkolnoi dezadaptatsii [Factor analysis of the relationship between the individual psychological and personal characteristics of younger adolescents with the level of school disadaptation]. Eksperimentalnaya psihologiya [Experimental Psychology], 2013, vol. 6, no. 4, pp. 40-51.

8. Slavutskaya E.V., Slavutskii L.A. Neirosetevoi analiz vzaimosvyazi verbalnogo i neverbalnogo intellekta mladchih podrostkov [Neural network analysis of the interrelation between verbal and nonverbal intelligence of younger adolescents]. Psihologicheskii jurnal [Psychological journal], 2014, vol. 35, no. 5, pp. 48-56.

9. Haykin S. Neural Networks: A Comprehensive Foundation. 2nd ed. Delhi, Publ. by Pearson Education, 2001 (Russ. ed.: Neironnii seti: polniy kurs: 2-e izd. Moscow, Williams Publ., 2006, 1104 p.).

10. Baxt W.G. Complexity, chaos and human physiology: the justification for non-linear neural computational analysis. Cancer Lett, 1994, vol. 77, no. 2-3, pp. 85-93.

11. Cattell R.B. Advanced in Cattelian Personality Theory. Handbook of Personality. Theory and Research. New York, The Guilford Press, 1990.

12. Hebb D. Organization of behavior. New York, Science Edition, 1961.

13. Slonim N., Atwal G.S., Tkachic G., Bialek W. Information-based clustering. Proceedings of the National Academy of Sciences, 2005, vol. 102, pp. 18297-18302.

PETROV ANDREY - 4th year Student, Radioelectronics and Automation Faculty, Chuvash State University, Russia, Cheboksary (petrov_rea-11-14@mail.ru).

IVANOVA GULNARA - Post-Graduated Student of Psychology and Social Pedagogic Department, Chuvash State Pedagogical University, Russia, Cheboksary (gulnara_biametov@mail.ru).

SLAVUTSKAYA ELENA - Doctor of Psychological Sciences, Professor of Psychology and Social Pedagogic Department, Chuvash State Pedagogical University, Russia, Cheboksary (elena@slavutskii.ru).

Ссылка на статью: Петров А.Н., Иванова Г. Ф., Славутская Е.В. Обучение нейросети как инструмент системного анализа многомерных данных психодиагностики // Вестник Чувашского университета. - 2018. - № 1. - С. 162-168.

i Надоели баннеры? Вы всегда можете отключить рекламу.