Научная статья на тему 'Нейронная сеть: селективная и статистическая оценка внутрисистемных связей неоднородных психодиагностических данных'

Нейронная сеть: селективная и статистическая оценка внутрисистемных связей неоднородных психодиагностических данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
195
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / СИСТЕМНЫЙ АНАЛИЗ / НЕОДНОРОДНЫЕ МНОГОМЕРНЫЕ ДАННЫЕ / ПСИХОДИАГНОСТИКА / ARTIFICIAL NEURAL NETWORKS / SYSTEM ANALYSIS / INHOMOGENEOUS MULTIDIMENSIONAL DATA / PSYCHODIAGNOSTICS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Федорова Полина Николаевна, Иванова Гульнара Фархадовна, Славутская Елена Владимировна

Предлагается алгоритм обработки и системного анализа неоднородных случайных данных с использованием аппарата искусственных нейронных сетей (ИНС). Для обработки применяется нейронная сеть прямого распространения с простой архитектурой. В качестве исходного статистически неоднородного массива данных для анализа используются результаты психодиагностики, полученные при помощи тестов с разными числовыми шкалами. Распределение данных в выборке отлично от нормального (гауссова). ИНС позволяет количественно оценить связи между отдельными частями общего массива данных (значениями признаков) вне зависимости от их размерности. Контроль результатов обучения и тестирования нейронной сети позволяет сразу оценить наличие и степень структурирования связей между входными данными и целевой функцией. Показано, что использование нейросетевых моделей для системного анализа неоднородных многомерных данных позволяет делать выводы о наличии внутрисистемных связей и провести их количественную оценку как на основе статистических критериев, так и селективно между отдельными элементами и группами внутри массива исходных данных. Обучение ИНС, как результат решения задачи многопараметрической нелинейной оптимизации, не накладывает ограничений, характерных для традиционных статистических методов анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Федорова Полина Николаевна, Иванова Гульнара Фархадовна, Славутская Елена Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NEURAL NETWORK: SELECTIVE AND STATISTICAL ASSESSMENT OF INTRA SYSTEMIC LINKS OF INHOMOGENEOUS PSYCHODIAGNOSTIC DATA

The algorithm of processing and system analysis of heterogeneous random data, using the apparatus of artificial neural networks (ANN), is proposed. A neural network of forward propagation with a simple architecture is used. As the initial statistically inhomogeneous matrix of data for analysis, the results of psycho-diagnostics obtained, using tests with different numerical scales, are used. The data distribution in the sample is different from the normal (Gaussian). ANN allows to quantify the relationships between different parts of a general data set (characteristic’s values), regardless of their dimensionality. Monitoring the learning and testing results of a neural network allows to immediately evaluate presence and the degree of structuring of the links between the input data and the objective function. It is shown that the use of neural network models for system analysis of inhomogeneous multidimensional data allows to draw conclusions about the presence of intra systemic links and make their quantitative assessment, both on the basis of statistical criteria and selectively between individual elements and groups within an array of initial data. Training ANN, as a result of solving the problem of multiparametric nonlinear optimization, does not impose restrictions which are typical for traditional statistical methods of analysis.

Текст научной работы на тему «Нейронная сеть: селективная и статистическая оценка внутрисистемных связей неоднородных психодиагностических данных»

УДК 004.8.032.26:159.922.7.016.2 ББК З97:Ю983.402

П.Н. ФЕДОРОВА, Г.Ф. ИВАНОВА, ЕВ. СЛАВУТСКАЯ

НЕЙРОННАЯ СЕТЬ: СЕЛЕКТИВНАЯ И СТАТИСТИЧЕСКАЯ ОЦЕНКА ВНУТРИСИСТЕМНЫХ СВЯЗЕЙ НЕОДНОРОДНЫХ ПСИХОДИАГНОСТИЧЕСКИХ ДАННЫХ

Ключевые слова: искусственные нейронные сети, системный анализ, неоднородные многомерные данные, психодиагностика.

Предлагается алгоритм обработки и системного анализа неоднородных случайных данных с использованием аппарата искусственных нейронных сетей (ИНС). Для обработки применяется нейронная сеть прямого распространения с простой архитектурой. В качестве исходного статистически неоднородного массива данных для анализа используются результаты психодиагностики, полученные при помощи тестов с разными числовыми шкалами. Распределение данных в выборке отлично от нормального (гауссова). ИНС позволяет количественно оценить связи между отдельными частями общего массива данных (значениями признаков) вне зависимости от их размерности. Контроль результатов обучения и тестирования нейронной сети позволяет сразу оценить наличие и степень структурирования связей между входными данными и целевой функцией. Показано, что использование ней-росетевых моделей для системного анализа неоднородных многомерных данных позволяет делать выводы о наличии внутрисистемных связей и провести их количественную оценку как на основе статистических критериев, так и селективно -между отдельными элементами и группами внутри массива исходных данных. Обучение ИНС, как результат решения задачи многопараметрической нелинейной оптимизации, не накладывает ограничений, характерных для традиционных статистических методов анализа.

Для исследования структуры и взаимосвязей многомерных случайных данных широко используются факторный, кластерный, регрессионный анализ, многомерное шкалирование и т.д. [3, 7, 17]. Наряду с этими (статистическими) методами быстро развиваются так называемые методы интеллектуального анализа данных (Data Mining) [4, 14], основанные на нечеткой логике и использовании аппарата искусственных нейронных сетей (ИНС) [8, 13, 18]. Оценка связей, в том числе латентных, внутри массива многомерных данных как единой системы является актуальной задачей для самых разных областей. Использование для этих целей перечисленных выше статистических методов связано с рядом ограничений: необходимостью задания меры связей (кластерный анализ) [19], требованиями к размерности данных и размерам статистической выборки. Классическим примером идентификации латентных связей и группировки данных на их основе является факторный анализ [6], однако он основан на корреляционных связях и позволяет идентифицировать только линейные взаимозависимости случайных величин. Это относится в большинстве случаев и к регрессионному анализу.

В настоящей работе показана возможность селективной оценки внутрисистемных нелинейных связей неоднородного по размерности многомерного

массива данных при помощи аппарата ИНС. В качестве исходных данных использованы результаты психодиагностики респондентов при помощи тестов с различными числовыми шкалами. Нормировка данных и приведение их к единой размерности [10] ведут к возникновению погрешностей и не позволяют выбрать единую меру связей для использования кластерного анализа, адекватно применить для обработки данных факторный и регрессионный анализ. Обучение ИНС, как результат решения задачи многопараметрической нелинейной оптимизации [15, 18], не накладывает таких ограничений при оценке внутрисистемных связей [2].

ИНС позволяет количественно оценить связи между отдельными частями общего массива данных (значениями признаков) вне зависимости от их размерности. Такие зависимости могут быть построены для каждого респондента, т.е. селективно. При этом статистические показатели таких связей могут быть получены уже при обучении и тестировании нейронной сети [8, 9].

Выборка и методика анализа данных. В качестве программного обеспечения использовалась платформа БеёиСюг [1]. Исходными данными для анализа служили результаты психологического тестирования респондентов по трём разным методикам с разными числовыми шкалами:

1. 14-факторный опросник Р.Б. Кеттелла [16], который выявляет личностные черты. Их дифференцируют по группам: группа коммуникативных свойств, группа интеллектуальных свойств, группа эмоциональных свойств, группа поведенческих и регуляторных свойств. Значения соответствующих признаков принимают целочисленные значения от 0 до 10.

2. Диагностика социально-психологической адаптации проводилась на основе теста К. Роджерса, Р. Даймонд [12]. Обобщенные результаты представлялись в виде двух признаков - адаптивность и дезадаптивность, принимающих целочисленные значения в диапазоне 50-180 и 35-130, соответственно.

3. Мотивационные характеристики выявлялись при помощи теста Ю.М. Орлова «Потребность в достижении» [5] (диапазон целочисленных значений 0-15).

Респондентами выступали подростки 14-15 лет. После предварительной обработки и очистки исходных данных от аномальных значений и дублирующих комбинаций была получена матрица размером 17 х 57, которая использовалась для анализа связей между результатами разных тестов. Применялась ИНС прямого распространения с одним скрытым слоем, на вход которой подавались значения личностных чёрт, а в качестве целевой функции последовательно использовались признаки с другими числовыми шкалами - адаптация АО, дезадаптация О2 и потребность в достижении РО (см. рис. 1, 2).

Гистограммы исходных значений трех выходных признаков показаны на рис. 2. Статистическое распределение несимметрично (негауссово), значения признаков распределены в разных числовых диапазонах.

ао, ог, ро

Рис. 1. Структура ИНС: группа коммуникативных черт: А - общительность (аффектомия - шизотимия); Н - (смелость - робость в контактах); Е - (стремление к доминированию - пассивность); Q2 - самостоятельность (степень групповой зависимости); группа интеллектуальных черт: В - вербальный интеллект; группа эмоциональных черт: С - (степень эмоциональной устойчивости); Б - (возбудимость - флегматичность); Б - (легкомыслие - осторожность); I - эмоциональная чувствительность (сензитивность - реализм); I - (неврастения, фактор Гамлета - интерес к участию в общих делах); О - тревожность (склонность к чувству вины - самоуверенность); Q4 - (степень внутреннего напряжения); группа поведенческих ре-гуляторных черт: Q3 - (степень самоконтроля); О - моральная нормативность (степень принятия моральных норм); адаптация - ЛБ, дезадаптация - (тест К. Роджерса, Р. Даймонд); потребность в достижении - РБ

25 20 1Ь 10

5 О

1

I.

20 40 00 80 100 120 140 100 180 200

N Ю

20 40 60 80 100 120 140 160 180 200

ог

?п

15 N 10

5

Р0

Рис. 2. Гистограммы значений признаков на выходе ИНС

Результаты и обсуждение. Контроль результатов обучения и тестирования нейронной сети позволяет сразу оценить наличие и степень структурирования связей между входными данными и целевой функцией. В таблице приведены соответствующие результаты для ИНС-модели, представленной на рис. 1. Максимальная смакс и среднеквадратичная о ошибка обучения могут служить основанием для предварительного вывода о том, что исходные данные действительно являются сильно неоднородными не только по размерности, но и по уровню внутрисистемных связей. Если первые два признака АО и О2 оказываются по результатам обучения ИНС практически не связанными с входными данными ИНС (неприемлемо высокий уровень ошибок смакс, о и очень низкий процент распознавания связей), то третий признак РО демонстрирует 100%-ное распознавание связей с входными данными и приемлемый для такой небольшой выборки уровень ошибок. Для некоторых практических задач в психологии даже такие качественные (сравнительные) выводы, сопровождающиеся количественными оценками, бывают востребованы.

Результаты обучения ИНС (рис. 1)

Признак на выходе Максимальная ошибка (СТмакс) Среднеквадратичная ошибка ) Распознавание связей (8)

АО 2,67х10-1 1,29х 10-2 91,23%

О1 1,13х10-1 9,37х10-3 92,98%

РО 4,68х10-2 5,07х10-3 100%

Результаты, полученные при обучении ИНС по признаку РО, при распознавании 100% связей позволяют проводить дальнейший селективный анализ данных для каждого респондента. ИНС даёт возможность построить вычислительные модели (зависимости) РО(х), где х - значения каждого из входных признаков. Соответствующие кривые (рис. 3) носят самый разнообразный характер в зависимости от индивидуального набора показателей (комбинации чисел в строках исходной матрицы данных).

Рис. 3. Примеры зависимостей РО(К) для разных респондентов

В данном случае информативным является диапазон изменения зависимости по вертикальной оси [11]. Величина этого диапазона А определяет сте-

пень влияния соответствующего входного признака на целевую функцию для каждого респондента. Диапазон меняется для разных признаков и респондентов от 0 до 14. Обнаружено, что максимальный диапазон А соответствует признакам ^ и О.

На рис. 4 показаны гистограммы распределение диапазона А по признакам на входе ИНС. Как видно из рисунка, ИНС-модели РВ в статистическом смысле имеют существенно разное поведение для разных входных признаков. По гистограмме рис. 4 можно определить признаки, наиболее и наименее связанные с РВ. Например, максимум гистограмм для признаков С, В, ¥, смещённый в область больших диапазонов А, позволяет оценить общее количество респондентов из выборки, для которых характерна устойчивая связь мотивационных характеристик РВ с этими личностными чертами.

■ А

■ в

■ с

■ а

■ Е

■ ^

■ Б

■ н

■ [

Ш ■ □

0.2 ■ ЦЗ

си

Рис. 4. Гистограммы распределения диапазона изменения А для зависимостей РВ(х) от значений признаков на входе ИНС

Выводы. Таким образом, использование нейросетевых моделей для системного анализа неоднородных многомерных данных позволяет делать выводы о наличии внутрисистемных связей и провести их количественную оценку как на основе статистических критериев, так и селективно - между отдельными элементами и группами внутри массива исходных данных. При этом использование аппарата искусственных нейронных сетей позволяет избежать априорного задания меры латентных связей и не накладывает ограничений на степень нелинейности этих связей.

Литература

1. Абруков В.С., Ефремов Л.Г., Кощеев И.Г. Возможности создания системы поддержки принятия решений и управления вузом с помощью аналитической платформы deductor // Интеграция образования. 2013. № 1(70). C. 17-23.

2. Волкова В.Н., Денисов А.А. Основы теории систем и системного анализа. СПб.: СПбГТУ, 1997. 510 с.

3. Воробьев А.В. Обзор применения математических методов при проведении психологических исследований // Психологические исследования. 2010. № 2(10).

4. ДюкВ.А., СамойленкоА.П. Data Mining. СПб.: Питер, 2001. 370 с.

5. Елисеев О.П. Практикум по психологии личности. СПб.: Питер, 2003. С. 427-428.

6. Иберла К. Факторный анализ. М.: Статистика, 1980. 308 с.

7. Ким Дж., Мюллер Ч., Клекка У., ОлдендерферМ, Блэшфилд Р. Факторный, дискрими-нантный и кластерный анализ. М.: Финансы и статистика, 1989. 216 с.

8. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия - Телеком, 2002. 382 с.

9. Славутская Е.В., Абруков В.С., Славутский Л.А. Нейросетевой системный анализ уров-невых психологических характеристик // Вестник Чувашского университета. 2016. № 1. С. 164-173.

10. Славутская Е.В. Гендерные различия в личностных качествах, определяющих дезадапта-циию младших подростков // Психологическая наука и образование. 2011. № 3. С. 151-160.

11. Славутская Е.В., Славутский Л.А. Нейросетевой анализ взаимосвязи вербального и невербального интеллекта младших подростков // Психологический журнал. 2014. Т. 35, № 5. С. 28-36.

12. Фетискин Н.П., Козлов В.В., Мануйлов Г.М. Социально-психологическая диагностика развития личности и малых групп. М.: Изд-во Ин-та психотерапии. 2002. C. 193-197.

13. Хайкин С. Нейронные сети: полный курс. 2-е изд.: пер. с англ. М.: И.Д. Вильямс, 2006. 1104 с.

14. Abrukov V.S., Karlovich E.V., Afanasyev V.N., Semenov Y.V., Abrukov S. V. Geation of pro-pellant combustion models by means of data mining tools. International Journal of Energetic Materials and Chemical Propulsion, 2010, vol. 9, no. 5, pp. 385-394.

15. Baxt W.G. Complexity, chaos and human physiology: the justification for non-linear neural computational analysis. Cancer Lett., 1994, vol. 77, no. 2-3, pp. 85-93.

16. Cattell R.B. Advanced in Cattelian Personality Theory. Handbook of Personality. Theory and Research. New York, The Guilford Press, 1990.

17. Esbensen K. Multivariate Data Analysis - in Practice. 5th ed. Oslo, Norway, CAMO Process AS, 2002.

18. Hebb D. Organization of behavior: New York, Science Edition, 1961.

19. Slonim N., Atwal G.S., Tkachic G., Bialek W. Information-based clustering. Proc. of the National Academy of Sciences, 2005, vol. 102, pp. 18297-18302.

ФЕДОРОВА ПОЛИНА НИКОЛАЕВНА - студентка IV курса факультета радиоэлектроники и автоматики, Чувашский государственный университет, Чебоксары, Россия (feodorowa.polya@yandex.ru).

ИВАНОВА ГУЛЬНАРА ФАРХАДОВНА - аспирантка кафедры психологии и социальной педагогики, Чувашский государственный педагогический университет, Чебоксары, Россия (gulnara_biametov@mail.ru).

СЛАВУТСКАЯ ЕЛЕНА ВЛАДИМИРОВНА - доктор психологических наук, профессор кафедры психологии и социальной педагогики, Чувашский государственный педагогический университет, Чебоксары, Россия (elena@slavutskii.ru).

P. FEDOROVA, G. IVANOVA, E. SLAVUTSKAYA NEURAL NETWORK: SELECTIVE AND STATISTICAL ASSESSMENT OF INTRA SYSTEMIC LINKS

OF INHOMOGENEOUS PSYCHODIAGNOSTIC DATA Key words: artificial neural networks, system analysis, inhomogeneous multidimensional data, psycho-diagnostics.

The algorithm of processing and system analysis of heterogeneous random data, using the apparatus of artificial neural networks (ANN), is proposed. A neural network of forward propagation with a simple architecture is used. As the initial statistically inhomogeneous matrix of data for analysis, the results of psycho-diagnostics obtained, using tests with different numerical scales, are used. The data distribution in the sample is different from the normal (Gaussian). ANN allows to quantify the relationships between different parts of a general data set (characteristic's values), regardless of their dimensionality. Monitoring the learning and testing results of a neural network allows to immediately evaluate presence and the degree of structuring of the links between the input data and the objective function. It is shown that the use of neural network models for system analysis of inhomogeneous multidimensional data allows to draw conclusions about the presence of intra systemic links and make their quantitative assessment, both on the basis of statistical criteria and selectively -between individual elements and groups within an array of initial data. Training ANN, as a result of solving the problem of multiparametric nonlinear optimization, does not impose restrictions which are typical for traditional statistical methods of analysis.

References

1. Abrukov V.S., Efremov L.G., Kosheev I.G. Vozmoznosti sozdania sistemiprinyatia reshenii i upravlenia vuzom s pomoshiu platformi deductor [Opportunities to create a decision support and management system with the help of the analytic platform deductor]. Integratsia obrazovania [Integration of education], 2013, no. 1(70), pp. 17-23.

2. Volkova V.N., Denisov A.A. Osnovi teorii system i sistemnogo analiza [Fundamentals of systems theory and systems analysis]. St. Petersburg, 1997, 510 p.

3. Vorobev A.V. Obzor primenenia matematicheskix metodov pri provedenii psihologicheskih issledovanii [The review of mathematical methods application in psychological researches]. Psichologicheskie issledovania [Psychological research], 2010, no. 2(10).

4. Diuk V.A., Samoilenko A.P. Data Mining [Data Mining]. St. Petersburg, Piter Publ., 2001, 370 p.

5. Eliseev O.P. Praktikum popsihologii lichnosti [Practicum on psychology of personality]. St. Petersburg, 2003, pp. 427-428.

6. Iberla K. Factorny analiz [Factor analysis]. Moscow, Statistica Publ., 1980, 308 p.

7. Kim J., Mueller W. et al. Factor Analysis: Statistical Methods and Practical Issues. Eleventh Printing, 1986 (Russ. ed.: Factornii, diskriminantii i klasternii analiz. Moscow, Finansi i statistika Publ., 1989, 216 p.).

8. Kruglov V.V., Borisov V.V. Iskustvennii neironnii seti. Teoria i praktica [Artificial neural networks. Theory and practice]. Moscow, Goryachaiya liniya - Telecom Publ., 2002, 382 p.

9. Slavutskaya E.V., Abrukov V.S., Slavutskii L.A. Neirosetevoi sistemny analiz urovnevix psihologicheskih xarakteristik [Neural network systems analysis of the split level psychologicak characteristics]. Vestnik Chuvashskogo universiteta., 2016, no. 1, pp. 164-173.

10. Slavutskaya E.V. Gendernie razlishia v lichnostnix kachestvax, opredelayiushix dezadap-tatsiiu mladchih podrostkov [Gender differences in personal qualities which define maladaptation of younger adolescents]. Psixologicheskaya nauka i obrazovanie, 2011, no. 3, pp. 151-160.

11. Slavutskaya E.V., Slavutskii L.A. Neirosetevoi analiz vzaimosvyazi verbalnogo i neverbal'-nogo intellekta mladchih podrostkov [Neural network analysis of the interrelation between verbal and nonverbal intelligence of younger adolescents]. Psihologicheskii zhurnal [Psychological journal], 2014, vol. 35, no. 5, pp. 28-36.

12. Fetiskin N.P., Kozlov V.V., Manuylov G.M. Sotsialno-psixologicheskaya diagnostika razvitiya lichnosti i malix grupp [Social-psychological diagnosis of personality development and small groups]. Moscow, 2002, pp. 193-197.

13. Haykin S. Neural Networks: A Comprehensive Foundation. 2nd ed. Upper Saddle River, New Jersy, Prentice Hall, 1999 (Russ. ed.: Neironnii seti: polniy kurs. 2nd ed. Moscow, Williams Publ., 2006, 1104 p.).

14. Abrukov V.S., Karlovich E.V., Afanasyev V.N., Semenov Y.V., Abrukov S.V. Creation of propellant combustion models by means of data mining tools. International Journal of Energetic Materials and Chemical Propulsion, 2010, vol. 9, no. 5, pp. 385-394.

15. Baxt W.G. Complexity, chaos and human physiology: the justification for non-linear neural computational analysis. Cancer Lett., 1994, vol. 77, no. 2-3, pp. 85-93.

16. Cattell R.B. Advanced in Cattelian Personality Theory. Handbook of Personality. Theory and Research. New York, The Guilford Press, 1990.

17. Esbensen K. Multivariate Data Analysis - in Practice. 5th ed. Oslo, Norway, CAMO Process AS, 2002.

18. Hebb D. Organization of behavior: New York, Science Edition, 1961.

19. Slonim N., Atwal G.S., Tkachic G., Bialek W. Information-based clustering. Proc. of the National Academy of Sciences, 2005, vol. 102, pp. 18297-18302.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

FEDOROVA POLINA- 4th year Student, Radioelectronics and Automation Faculty, Chuvash State University, Russia, Cheboksary (feodorowa.polya@yandex.ru).

IVANOVA GULNARA - Post-Graduate Student of Psychology and Social Pedagogic Department, Chuvash State Pedagogical University, Russia, Cheboksary (gulnara_biametov@mail.ru).

SLAVUTSKAYA ELENA - Doctor of Psychological Sciences, Professor of Psychology and Social Pedagogic Department, Chuvash State Pedagogical University, Cheboksary, Russia (elena@slavutskii.ru).

Формат цитирования: Федорова П.Н., Иванова Г.Ф., Славутская Е.В. Нейронная сеть: селективная и статистическая оценка внутрисистемных связей неоднородных психодиагностических данных // Вестник Чувашского университета. - 2018. - № 3. - С. 235-242.

i Надоели баннеры? Вы всегда можете отключить рекламу.