Научная статья на тему 'Иерархический анализ данных психодиагностики подростков на основе корреляционных связей'

Иерархический анализ данных психодиагностики подростков на основе корреляционных связей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
241
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОМЕРНЫЕ ДАННЫЕ / ФАКТОРНЫЙ И КЛАСТЕРНЫЙ АНАЛИЗ / КЛАССИФИКАЦИЯ / ПСИХОДИАГНОСТИКА / ПОДРОСТКИ / MULTIDIMENSIONAL DATA / FACTOR AND CLUSTER ANALYSIS / CLASSIFICATION / PSYCHO-DIAGNOSTICS / TEENAGERS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иванова Гульнара Фархадовна, Славутская Елена Владимировна, Славутский Леонид Анатольевич

Приводятся результаты иерархической классификации как элемента системного анализа многомерных данных психодиагностики подростков, полученных при помощи тестов с разными числовыми шкалами. Предлагается совместное использование факторного и кластерного анализа. В кластерном анализе группировка данных производится на основе коэффициента корреляции Пирсона. Показано, что такой подход позволяет анализировать и классифицировать данные в том случае, когда выборка респондентов достаточно ограниченна, а количество диагностируемых признаков велико и сопоставимо с размером выборки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Иванова Гульнара Фархадовна, Славутская Елена Владимировна, Славутский Леонид Анатольевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

HIERARCHICAL DATA ANALYSIS OF TEENAGER’S PSYCHODIAGNOSTICS BASED ON THE CORRELATION LINKS

The results of hierarchical classification as the part of a system analysis of the multidimensional psycho-diagnostic data are presented. The tests with different numeric scales for the teenagers are used. The research suggests the combination of factor and cluster analysis. The cluster analysis of the data grouping is based on the Pearson correlation coefficient. It is shown that this approach allows us to analyze and classify the data in case where a respondents sample is rather limited, and the number of diagnosed signs is high and comparable to the size of the sample.

Текст научной работы на тему «Иерархический анализ данных психодиагностики подростков на основе корреляционных связей»

УДК 004.8.032.26:159.922.7.016.2 ББК З97:Ю983.402

Г.Ф. ИВАНОВА, Е В. СЛАВУТСКАЯ, Л.А. СЛАВУТСКИЙ

ИЕРАРХИЧЕСКИЙ АНАЛИЗ ДАННЫХ ПСИХОДИАГНОСТИКИ ПОДРОСТКОВ НА ОСНОВЕ КОРРЕЛЯЦИОННЫХ СВЯЗЕЙ

Ключевые слова: многомерные данные, факторный и кластерный анализ, классификация, психодиагностика, подростки.

Приводятся результаты иерархической классификации как элемента системного анализа многомерных данных психодиагностики подростков, полученных при помощи тестов с разными числовыми шкалами. Предлагается совместное использование факторного и кластерного анализа. В кластерном анализе группировка данных производится на основе коэффициента корреляции Пирсона. Показано, что такой подход позволяет анализировать и классифицировать данные в том случае, когда выборка респондентов достаточно ограниченна, а количество диагностируемых признаков велико и сопоставимо с размером выборки.

Для оценки связей и группировки психодиагностических данных широко применяются корреляционный и факторный анализ. Основатель структурной теории личности Р.Б. Кеттелл считается родоначальником факторного анализа [6]. Факторный анализ как инструмент, основанный на матрице взаимных корреляционных коэффициентов, позволяет группировать признаки по их вкладу в отдельные факторы. Однако классификация и интерпретация значений факторов в психологии является отдельной, иногда очень сложной задачей [3, 5]. Иерархическая классификация психологических признаков в факторном анализе может строиться на вкладе каждого из факторов в общую дисперсию [2, 3].

В настоящей работе показана возможность совместного использования факторного и кластерного анализа для иерархической классификация данных. Иерархическая кластеризация является распространённым методом классификации данных [1, 7, 8]. В данном случае в качестве меры сходства или уровней связей между исходными признаками удобнее всего использовать коэффициент корреляции Пирсона. Это позволяет избежать предварительной нормировки результатов различных тестов и совместить результаты корреляционного, факторного и кластерного анализа.

Методики психодиагностики. Возможности комплексного подхода к иерархической классификации исследовались на данных психодиагностики подростков в возрасте 14 лет. Выборка респондентов составляла 40 человек. Максимальное значение коэффициента корреляции между взаимосвязанными признаками достигало 0,87, что соответствует уровню значимости коэффициента корреляции Пирсона менее 0,1%. Таким образом, выборка, с одной стороны, позволяет проводить факторный анализ, с другой - иерархическая кластеризация не накладывает жестких ограничений на ее размер. Для каждого респондента были получены 28 числовых показателей, состоящих из результатов трех стандартизированных тестовых методик:

- личностные черты подростков определялись при помощи 14-фактор-ного личностного опросника Р. Б. Кеттелла [6], данные по замыслу автора теста, рассчитаны на обработку при помощи факторного анализа;

- методика диагностики социально-психологической адаптации (авторы К. Роджерс, Р. Даймонд) выявляет уровень адаптированности подростков в социальной группе;

- тест «Потребность в достижениях» Ю.М. Орлова позволяет оценить мотивационные характеристики.

Такой психодиагностический срез позволяет оценить в целом уровень психосоциального развития подростка [4, 5].

Обработка и классификация данных. В таблице приведены данные факторного анализа личностных черт подростков по результатам 14-фактор-ного опросника Р.Б. Кеттелла. По критерию Кайзера [3] выделены 5 факторов, собственные значения которых X оказываются больше единицы. Суммарный вклад этих факторов S в общую дисперсию составляет более 70%. Такой вклад пяти факторов из четырнадцати исходных признаков может считаться значительным и говорит об определенной структурированности личностных качеств. Вращение матрицы факторных нагрузок осуществлялась методом Varimax normalized. Полужирным шрифтом выделены факторные нагрузки, соответствующие наиболее значимым для каждого фактора признакам. Такая группировка личностных черт по факторам является характерной для подростков этого возраста и допускает психологическую интерпретацию в прикладных целях [4, 5].

Результаты факторного анализа

Показатель Фактор 1 Фактор 2 Фактор 3 Фактор 4 Фактор 5

A 0,031094 0,818745 0,005779 0,042272 -0,133145

B -0,151718 0,014224 0,046977 -0,014738 0,900779

C 0,066115 0,131601 -0,014142 0,856416 0,094596

D 0,675784 0,022023 0,438054 0,299381 -0,204646

E 0,048273 0,653652 0,310507 0,230963 0,382934

F 0,142058 0,314086 0,718016 0,233530 0,012252

G -0,881432 -0,108612 -0,063874 -0,040236 -0,061795

H 0,572364 0,611227 -0,236523 -0,115971 0,054891

I -0,392986 -0,434233 -0,128042 0,638057 -0,228576

J 0,835059 -0,114588 0,140343 -0,267554 -0,287611

O -0,179662 -0,253594 -0,509661 0,233255 0,325625

О2 -0,100513 -0,484000 0,467414 -0,045146 -0,325854

Q3 -0,095065 0,112148 -0,773961 0,190610 -0,255796

Q4 0,034564 -0,745919 -0,140338 0,066965 0,011529

X 2,516458 2,668882 1,999347 1,523994 1,446322

S, % 17,9747 19,0634 14,2810 10,8857 10,3309

Примечание. Группа коммуникативных свойств: А - общительность (аффектомия - шизотимия); Н - (смелость - робость в контактах); Е - (стремление к доминированию - пассивность); О2 -самостоятельность (степень групповой зависимости). Группа интеллектуальных свойств: В - вербальный интеллект. Группа эмоциональных свойств: С - (степень эмоциональной устойчивости); Б - (возбудимость - флегматичность); Е - (легкомыслие - осторожность); I - эмоциональная чувствительность (сензитивность - реализм); I - (неврастения, фактор Гамлета - интерес к участию в общих делах); О - тревожность (склонность к чувству вины - самоуверенность); 04 - (степень внутреннего напряжения). Группа поведенческих регуляторных свойств: 03 - (степень самоконтроля); О - моральная нормативность (степень принятия моральных норм).

Однако если факторный анализ проводится сразу для всех диагностируемых 28 психологических признаков, то количество значимых по критерию Кайзера факторов оказывается равным 11. В этом случае факторы мало отличаются по вкладу в общую дисперсию и провести их иерархическую классификацию при помощи факторного анализа оказывается затруднительно. Это связано еще и с тем, что при большом числе приблизительно равнозначных факторов после вращения матрицы факторных нагрузок разными способами они меняются местами в иерархии по вкладу в общую дисперсию. Таблица факторных нагрузок, аналогичная преставленной выше таблице, оказывается перенасыщенной численной информацией и теряет наглядность.

При большом числе исходных признаков удобно использовать иерархический кластерный анализ («дерево», дендрограмма), основанный, как и факторный анализ, на группировке исходных признаков по уровню корреляционных связей. В этом случае на дендрограмме графически отображается величина, обратная коэффициенту корреляции Пирсона [7, 8]. Примеры соответствующей обработки данных по результатам трех тестов показаны на рисунке.

На рисунке (а) приведены результаты кластерного анализа, соответствующие 14-факторному опроснику Р.Б. Кеттелла (см. данные таблицы). На рисунке (б) показана иерархическая кластеризация по всем 28 признакам. Использован невзвешенный центроидный метод группировки (unweighted pair-group centroid method).

При сопоставлении данных рисунке (а) с результатами факторного анализа 14 личностных черт, приведенными в таблице, можно обнаружить, что в целом структура и классификация связей сохраняются. В обоих случаях признаки группируются по уровню корреляции, наиболее тесно связанные признаки оказываются или в одном кластере, или в соответствующей группе иерархической цепочки кластеров.

Построение по аналогичной методике иерархической кластеризации по данным разных тестов позволяет получить значительно более расширенную информацию.

Как видно из рисунка (б), личностные черты по Р.Б. Кеттеллу в дендрограмме оказываются «разбавленными» результатами других тестов. Это дает возможность оценить, какие из личностных черт подростков наиболее тесно связаны с адаптационными особенностями и мотивационными характеристиками. Детальная психологическая интерпретация полученных результатов является отдельной задачей, однако следует обратить внимание на следующие особенности комплексного подхода:

1. Оба метода классификации данных имеют свои особенности. Для факторного анализа необходимо выбирать метод вращения матрицы факторных нагрузок, а для кластерного анализа требуется определить метод кластеризации (группировки) данных (одиночные связи, полные групповые связи, взвешенный и невзвешенный центроидный метод и. д.).

2. В обоих случаях легко выделяются наиболее тесно связанные признаки, но если количество исходных признаков (или значимых факторов) велико, иерархическая модель в факторном анализе не может адекватно учесть влияние признаков, связи которых находятся на границе статистически значимых

величин. Особенно это проявляется после вращения матрицы факторных нагрузок, когда вклад менее значимых признаков несколько меняет иерархическую структуру основных факторов. Некоторые из выделенных факторов по вкладу в общую дисперсию могут поменяться в иерархии местами.

02 В 04 о 03 о I

а

с

к н

Е

А

J

О

о 03 В ПД J 13 12 10 2 с Е 11 7 3 О 04 02 КБ1684НА951

б

Иерархическая кластеризация («дерево»). Уровень связи - величина, обратная коэффициенту корреляции Пирсона. Невзвешенный центроидный метод группировки: ПД - потребность в достижении. Тест К. Роджерсаи Р. Даймонд: 1 - адаптация; 2 - дезадаптация; 3 - принятие себя; 4 - неприятие себя; 5 - принятие других; 6 - конфликт с другими; 7 - эмоциональный комфорт; 8 -эмоциональный дискомфорт; 9 - внутренний контроль; 10 - внешний контроль; 11 - доминирование; 12 - ведомость (зависимость от других); 13 - «уход» от проблем (эскапизм)

3. Кластерный анализ не накладывает ограничений на соотношение между объемом выборки и количеством признаков. Иерархическая модель, получаемая в результате кластерного анализа (дендрограмма), оказывается гораздо более наглядной, чем распределение признаков по вкладу в общую дисперсию.

4. Для оценки значимости отдельных признаков эффективно может использоваться сопоставление результатов факторного и кластерного анализа. Примером может служить вербальный интеллект (B), который не имеет тесной связи ни с одним из диагностируемых признаков, находится в верхней части дендрограммы (рисунок), но при этом составляет отдельный фактор с более чем 10%-ным вкладом в общую дисперсию (таблица).

Выводы. Результаты психодиагностики, полученные при помощи тестов с разными числовыми шкалами, представляют собой сложный прикладной объект. Классификация и системный анализ таких данных чаще всего предполагают их статистическое (вероятностное) описание. Полученные в настоящей работе результаты иерархического анализа многомерных данных психодиагностики позволяют их классифицировать в том случае, если выборка респондентов достаточно ограниченна, количество диагностируемых признаков велико и сопоставимо с размером выборки (ситуация в психологии достаточно распространенная). В этом случае совместное использование факторного и кластерного анализа позволяет выявить некоторые особенности, провести более качественную интерпретацию результатов. Для психологов, не обладающих специальной подготовкой, такой подход может оказаться очень ценным.

Литература

1. Воробьев А.В. Обзор применения математических методов при проведении психологических исследований // Психологические исследования. 2010. № 2(10). URL: http://psy-study .ru/index.php/num/2010n2-10/311-vorobiev10.html.

2. Иберла К. Факторный анализ. М.: Статистика, 1980. 308 с.

3. Левандовский Н.Г. О корректированном применении факторного анализа и критериях факторизации // Вопросы психологии. 1980. № 5. С. 138-142.

4. Славутская Е.В. Экспериментальное изучение гендерных различий в развитии эмоционально-волевых и интеллектуальных свойств младших подростков // Вестник Томского государственного педагогического университета. 2009. Вып. 9(87). C. 127-129.

5. Славутская Е.В., Славутский Л.А. Предподростковый возраст: формирование связей в структуре личности // Психологические исследования. 2014. Т. 7, № 37. URL: http://psystudy.ru/ index.php/num/2014v7n37/1040-slavutskaya37.html.

6. Cattell R. B. Advanced in Cattelian Personality Theory. Handbook of Personality. Theory and Research. New York, The Guilford Press, 1990.

7. GlassJ.V.,Stanly Y.C. Statistical methods in education and psychology. New Jersey, 1970, 495 p.

8. Slonim N., Atwal G.S., Tkachic G., Bialek W. Information-based clustering. Proc. of the National Academy of Sciences, 2005, vol. 102, pp. 18297-18302.

ИВАНОВА ГУЛЬНАРА ФАРХАДОВНА - аспирантка кафедры психологии и социальной педагогики, Чувашский государственный педагогический университет, Чебоксары, Россия (gulnara_biametov@mail.ru).

СЛАВУТСКАЯ ЕЛЕНА ВЛАДИМИРОВНА - доктор психологических наук, профессор кафедры психологии и социальной педагогики, Чувашский государственный педагогический университет, Чебоксары, Россия (las_co@mail.ru).

СЛАВУТСКИЙ ЛЕОНИД АНАТОЛЬЕВИЧ - доктор физико-математических наук, профессор кафедры автоматики и управления в технических системах, Чувашский государственный университет, Россия, Чебоксары (las_co@mail.ru).

G. IVANOVA, E. SLAVUTSKAYA, L. SLAVUTSKII

HIERARCHICAL DATA ANALYSIS OF TEENAGER'S PSYCHODIAGNOSTICS BASED ON THE CORRELATION LINKS

Key words: multidimensional data, factor and cluster analysis, classification, psychodiagnostics, teenagers.

The results of hierarchical classification as the part of a system analysis of the multidimensional psycho-diagnostic data are presented. The tests with different numeric scales for the teenagers are used. The research suggests the combination of factor and cluster analysis. The cluster analysis of the data grouping is based on the Pearson correlation coefficient. It is shown that this approach allows us to analyze and classify the data in case where a respondents sample is rather limited, and the number of diagnosed signs is high and comparable to the size of the sample.

References

1. Vorob'ev A.V. Obzor primeneniya matematicheskikh metodov pri provedenii psikhologi-cheskikh issledovanii [The review of mathematical methods application in psychological researches]. Psikhologicheskie issledovaniya [Psychological Studies], 2010, no. 2(10). URL: http://psystudy.ru/ index.php/num/2010n2-10/311-vorobiev10.html.

2. Iberla K. Factorny analiz [Factor analysis]. Moscow, Statistics Publ., 1980, 308 p.

3. Lewandowski N.G. O korrektirovannom primenenii faktornogo analiza I kriteriah factorizat-sii [About the corrected application of factor analysis and factorization criteria]. Voprosi psihologii [Questions of psychology], 1980. no. 5. pp. 138-142.

4. Slavutskaya E.V. Eksperimental'noe izuchenie gendernykh razlichii v razvitii emo-tsional'no-volevykh i intellektual'nykh svoistv mladshikh podrostkov [Experimental researches of gender features development of younger teenagers emotionally-volitional and intellectual qualities]. Vestnik Vestnik Tomskogo gosudarstvennogo pedagogicheskogo universiteta [Tomsk State Pedagogical University Bulletin], 2009, iss. 9(87), pp. 127-129.

5. Slavutskaya E.V., Slavutskii L.A. Predpodrostkovyi vozrast: formirovanie svyazei v struk-ture lichnosti [Preadolescent age: the formation of the interconnections in the personality structure]. Psikhologicheskie issledovaniya [Psychological Studies], 2014, vol. 7, no. 37. URL: http://psy-study.ru/index.php/num/2014v7n37/1040-slavutskaya37.html.

6. Cattell R. B. Advanced in Cattelian Personality Theory. Handbook of Personality. Theory and Research. New York, The Guilford Press, 1990.

7. Glass J.V., Stanly Y.C. Statistical methods in education and psychology. New Jersey, 1970, 495 p.

8. Slonim N., Atwal G.S., Tkachic G., Bialek W. Information-based clustering. Proc. of the National Academy of Sciences, 2005, vol. 102, pp. 18297-18302.

IVANOVA GULNARA - Post-Graduated Student of Psychology and Social Pedagogic Department, Chuvash State Pedagogical University, Russia, Cheboksary (gulnara_biametov@mail.ru).

SLAVUTSKAYA ELENA - Doctor of Psychological Sciences, Professor of Psychology and Social Pedagogic Department, Chuvash State Pedagogical University, Russia, Cheboksary (las_co@mail.ru).

SLAVUTSKII LEONID - Doctor of Physical and Mathematical Sciences, Professor, Department of Automatics and Control in Technical Systems, Chuvash State University, Russia, Cheboksary (las_co@mail.ru).

Ссылка на статью: Иванова Г.Ф., Славутская Е.В., Славутский Л.А. Иерархический анализ данных психодиагностики подростков на основе корреляционных связей // Вестник Чувашского университета. - 2017. - № 1. - С. 235-240.

i Надоели баннеры? Вы всегда можете отключить рекламу.