УДК 159.9.072.59 ББК Ю93
ОСОБЕННОСТИ ВЫПОЛНЕНИЯ КОНФИРМАТОРНОГО ФАКТОРНОГО АНАЛИЗА В ПРОЦЕССЕ ПСИХОМЕТРИЧЕСКОЙ ХАРАКТЕРИСТИКИ ИЗМЕРИТЕЛЬНЫХ ШКАЛ
А.Л. Загорюев
В целях стандартизации проведения конфирматорного факторного анализа при выполнении психометрической оценки психодиагностических шкал на больших выборках предложено использовать в качестве порогового значения коэффициента парной корреляции Пирсона его величину, соответствующую выборке, минимально репрезентативной в данных условиях. Показано, что в задаче определения согласованности диады «Пункт-Шкала □ целесообразно применять оценку И избытком» с последующим внесением поправки в коэффициенты для СЪвоих» шкал.
Ключевые слова: психометрическая оценка; конфирматорный факторный анализ; репрезентативная выборка; внутренняя валидность.
В настоящее время наличие психометрической характеристики теста в его описании стало необходимым требованием [1], поэтому профессиональному психологическому сообществу настоятельно необходимо согласовать подходы и правила определения психометрических параметров, необходимых для представления методики пользователям.
Одним из распространённых методов определения психометрической характеристики теста является оценка его внутренней валидности методом конфирматорного факторного анализа, заключающегося в определении степени согласованности ответов на каждый пункт шкалы и итоговых баллов по шкале в целом, вычисленных по группе вопросов, ориентированных на выявление одного и того же признака. В качестве показателя согласованности используется парный линейный коэффициент корреляции Пирсона (г-Пирсона).
Требования к объёму выборки, на которой производятся вышеуказанные оценки, обычно не регламентируются, а выборка формируется по принципу «чем больше, тем лучше»] Однако каждому исследователю, имевшему дело с большими выборками, знакомо ощущение «исчезновения опоры С] возникающее в случаях, когда эмпирические значения коэффициента корреляции, с одной стороны, превышают табличные и вполне достаточны для того, чтобы сделать вывод о высочайшей статистической надёжности выявленной связи двух переменных, но с другой
стороны, табличное значение коэффициента неприлично мало, что великолепно иллюстрируется точечной диаграммой связи. Подозрения об искусственности вывода о наличии связи между исследованными переменными у наиболее компетентных исследователей ещё более укрепляются, когда они из большой выборки выбирают парциальные совокупности малого размера и пытаются оценить статистическую значимость связи на них.
В то же время можно предложить подход к определению критического для больших выборок коэффициента корреляции, основанный на адекватном применении понятия «репрезентативная выборка □ Проблема репрезентативности выборок в ходе психологических исследований представляет собой «больное место □ всех экспериментальных планов. Отметим, что эта категория не может определяться исключительно статистически. Огромное значение в практических исследованиях имеет тщательный подбор выборки респондентов, одно из требований к которой □ ее однородность. Только в этом случае можно применять общепринятые статистические подходы. Известно, что главными факторами, определяющими минимальный объём выборки, с достаточной степенью точности характеризующий генеральную совокупность, являются заданная погрешность и уровень вероятности достижения поставленного требования [2]. Обычно для вычисления минимально -необходимого, т. е. репрезентативного, объёма выборки используют формулу
С2 2
п = ~г • * ,
г
где с □ среднее квадратичное отклонение (СКО) результатов отдельного измерения в генеральной совокупности;
г □ половина ширины требуемого доверительного интервала;
t □ коэффициент Стьюдента, равный приближённо 1; 2 или 3 при соответствующих вероятностях 0,68; 0,95 или 0,997.
В процессе выполнения статистических процедур определения психометрических характеристик результатов в выборке (психометрических процедур) исследователь, как уже было отмечено выше, имеет дело с большими (квазигенеральными) выборками. Поэтому у него всегда есть возможность оценить, может ли среднее квадратичное отклонение рассматриваемого параметра выборки быть принятым в качестве СКО генеральной совокупности. В качестве примера рассмотрим результаты определения выраженности ориентаций на ценность «Универсализм« различных категорий респондентов на уровне нормативных идеалов (методика Ш. Шварца [3]), выполненного автором в 2010И011 гг. Объём выборки составил 259 человек. Однородность выборки желает лучшего (рис. 1), однако в качестве примера предлагаемого алгоритма эта выборка вполне пригодна. Среднее значение выраженности ориентаций на ценность «Универсализм« составляет 3,39 балла, среднее квадратичное отклонение равно 2,08 балла.
Зависимость выборочного стандартного отклонения от соответствующего параметра
квазигенеральной совокупности иллюстрируется рис. 2, где пропущен интервал «малых» выборок, под которыми по умолчанию понимаются выборки объёмом менее 30 человек.
Очевидно, что при данном уровне неоднородности рост объёма выборки более чем до 220 человек уже практически не меняет значение СКО (2,08), которое вполне можно принять за СКО генеральной совокупности. Требуемый доверительный интервал в нашем примере целесообразно принять равным одной трети от полученного эмпирического среднего (это условие количественного определения искомого значения), т. е. 1,13 балла. Тогда г =0,565 балла, а минимальнонеобходимый (т. е. репрезентативный) объём выборки для уровня значимости 0,01 составит 122 человека.
Можно предположить, что понятие «репрезентативность» можно распространить и на задачу определения согласованного поведения переменных. Другими словами, если объём выборки существенно превышает репрезентативный объём, то в качестве критического значения коэффициента корреляции r-Пирсона целесообразно пользоваться величиной r(p;120), вычисленной по данным значений коэффициента i-Стьюдента для больших выборок [4] по формуле
t =
К N - 2).
Для удобства пользования критические значения коэффициента г(р;120) приведены в табл. 1.
2
20.0-,
18.0 Г-
16. 0----------------------------- ----------
5? 14.0 ------------------- --- --- ---Г~----
<0
5 12.0 —
& ю.о-------ГП------------- — — — --------------
х
80------------—---- ---- ---- ---- ---- -----
6.0
4.0
2.0 -ГП-- --- --- --- --- --- --- ---_
0.0 И , 1 , , ■ ' I 1,1 I---
-1 01234567
Интервал, баллы
Рис. 1. Распределение ответов по шкале «Универсализма (уровень нормативных идеалов, N=259)
Таблица 1
Критические значения коэффициента корреляции г-Пирсона для разных уровней значимости р и числа степеней свободы d1=120
Второй проблемой, сопровождающей реализацию конфирматорного факторного анализа, является проблема усиления-ослабления вычисленного коэффициента корреляции пункта со шкалой за счёт наличия-отсутствия этого пункта в суммарной оценке балла по шкале в целом [5]. Действительно, если проверяемый пункт участвует в формировании итогового балла, то коэффициент корреляции неизбежно будет завышен. С другой стороны, если этот пункт из расчёта итогового балла устранить, то коэффициент корреляции будет неизбежно занижен (в предположении справедливости исходной конструкции шкалы и, особенно, для шкалы, состоящей из малого количества пунктов). Кроме того, заметно усложняется процедура вычислений.
Представим себе шкалу, состоящую из одного пункта. Тогда, если этот пункт учитывать при проведении конфирматорного факторного анализа, то коэффициент корреляции г оказывается равным 1 (естественно, если его не учитывать, то г=0). Дополним шкалу ещё одним пунктом. Коэффициент корреляции без вычитания первого пункта понизится, а коэф-
фициент корреляции с вычитанием его □ высится. С дальнейшим увеличением количества пунктов различия между коэффициентами корреляции снижаются до полного исчезновения.
В качестве примера снова используем выше представленные результаты определения выраженности ценностных ориентаций (на примере оценок на уровне нормативных идеалов ценности «Универсализм»). Определение выраженности указанной ориентации, согласно методике, осуществляется по восьми пунктам [3].
В табл. 2 показаны результаты расчёта значений парного линейного коэффициента корреляции г-Пирсона между результатами ответа на пункт 1 (равенство) и итоговыми результатами «виртуальных» шкал, составленных последовательно: из пункта 1; из пунктов 1 и 2; из пунктов 1 «3 и т. д. Расчёт эмпирического значения коэффициента корреляции г-Пирсона в этом случае выполнялся дважды □ без вычета пункта 1 из итогового шкального балла и с вычетом его.
На рис. 3 приведена зависимость значений таких двух коэффициентов корреляции от размера шкалы. По мере увеличения количества пунктов значения обоих рассчитанных коэффициентов сближаются друг с другом, стремясь к некоторому пределу, который, видимо, как раз и характеризует внутреннюю валидность теста на рассматриваемой выборке.
Т(120) 1,980 2,617 3,374
Р, % 5 1 0,1
г(120) 0,179 0,236 0,304
Рис. 2. Зависимость отношения средних квадратичных отклонений выборки объёма п и квазигенеральной совокупности объёма N от объёма выборки п
Для определения величины предельного значения коэффициента корреляции распределение точек обоих коэффициентов аппроксимировано теоретическими кривыми, качественно отвечающими психологическому смыслу рассматриваемого явления: кривая без вычета пункта 1 □ степенной функцией, а кривая с вычетом пункта 1 □ логарифмической функцией (см. рис. 3). Обе кривые экстраполирова-
ны до точки их пересечения, которое соответствует размеру шкалы в 14 пунктов (см. табл. 2). «Истинный» коэффициент корреляции пункта 1 со шкалой «Универсализм» оказался близок к 0,400 и обнаружил статистическую значимость на уровне не хуже ^=0,001 (табличное значение коэффициента корреляции г-Пирсона для уровня значимости 0,001 и числа степеней свободы 120 равно 0,304).
Таблица 2
Зависимость значений парных линейных коэффициентов корреляции г Пирсона в паре «Пункт1-Шкалап
от размера (количества пунктов) шкалы
Число пунктов т Номера пунктов виртуальной шкалы гэмпир -^теор
Без вычета пункта 1 С вычетом пункта 1 Без вычета пункта 1 С вычетом пункта 1
1 1 1 0 1 0
2 1 □ 2 0,7915 0,1496 0,7748 0,1216
3 1 □ 3 0,6577 0,1930 0,6747 0,1799
4 1 □ 4 0,5932 0,2254 0,6116 0,2213
5 1 □ 5 0,5375 0,2344 0,5668 0,2534
6 1 □ 6 0,5283 0,2779 0,5326 0,279
7 1 □ 7 0,5245 0,3067 0,5053 0,3018
8 1 □ 8 0,5025 0,3135 0,4828 0,3210
9 0,4638 0,3379
10 0,4474 0,3531
11 0,4331 0,3668
12 0,4205 0,3793
13 0,4091 0,3908
14 0,3989 0,4014
Рис. 3. Графики зависимости значений парных линейных коэффициентов корреляции г-Пирсона в паре «Пункт1-Шкалап от размера (количества пунктов) шкалы
Итак, коэффициент парной линейной корреляции г-Пирсона, вычисленный без исключения оцениваемого пункта, всегда завышен по отношению к «истинному» значению, однако это завышение можно учесть путём введения соответствующей поправки
г = г к
ист эмпир •
Значения поправочных коэффициентов вычислены по данным табл. 2 (столбец гтеор без вычитания пункта 1) и приведены в табл. 3 для разных значений размера (числа пунктов) шкалы.
Отметим, что функция к(т) в практических целях также может быть аппроксимирована степенной функцией (рис. 4)
к = 0,408 т0’341.
Несомненно, алгоритм нахождения наиболее правдоподобной функции к(т) должен пройти дополнительные исследования. Прежде всего, видимо, следует рассмотреть не один вариант компоновки виртуальных шкал, а все возможные, принимая за окончательные значения коэффициентов корреляции в паре «Пункт «Шкала» их средние значения по всем возможным сочетаниям пунктов. Во-вторых, нами рассмотрены связи только одного пунк-
та, тогда как, видимо, надо исследовать и зи по остальным пунктам шкалы. В-третьих, необходимо выяснить, будут ли одинаковы (или хотя бы сходны) итоговые функции к(т) на содержательно различных шкалах. В-четвёртых, нужно выяснить степень влияния особенностей выборки на рассматриваемую функцию.
Тем не менее, в первом приближении, предполагая, что указанные факторы не окажут существенного влияния на результат, можно вычислить «истинные» коэффициенты связи пунктов шкал опросника ценностей Ш. Шварца со своими диагностическими шкалами, используя в качестве исходных данных коэффициенты, определённые «с избытком» (табл. 4).
Одновременно с рассмотрением коэффициентов корреляции пунктов опросника со «своими» шкалами для выявления интерференции шкал весьма полезно вычислять коэффициенты корреляции пунктов со всеми «чужими» шкалами. Здесь нет оснований исключать из итогового шкального показателя какой-либо пункт, поэтому, естественно, для оценки ортогональности шкалы следует, видимо, использовать единый подход в определении коэффициентов корреляции, а именно □ «с избытком».
Таблица 3
Значения поправочных коэффициентов к
Число пунктов т 1 2 3 4 5 6 7 8
к=гист/гэмп □ 0,517 0,593 0,654 0,706 0,751 0,792 0,829
у = 0,4078х°'3411
Число пунктов шкалы т Рис. 4. Зависимость значения поправочного коэффициента к от числа пунктов шкалы т
Таблица 4
Результаты конфирматорного факторного анализа шкал опросника ценностей Ш. Шварца (уровень нормативных идеалов N=259)
Шкала Пункты опросника, входящие в шкалу Шкала Пункты опросника, входящие в шкалу
Кф 11 20 40 47 Тр 18 32 36 44 51
гэмпир 0,581 0,617 0,535 0,620 rэмпир 0,694 0,523 0,630 0,506 0,582
гист 0,380 0,404 0,350 0,406 гист 0,490 0,370 0,445 0,357 0,411
Дж 33 45 49 52 54 Сам 5 16 31 41 53
гэмпир 0,656 0,726 0,552 0,555 0,668 rэмпир 0,569 0,714 0,582 0,613 0,642
гист 0,463 0,513 0,390 0,392 0,472 rист 0,402 0,504 0,411 0,433 0,454
Ст 9 25 37 Гед 4 50 57
гэмпир 0,692 0,778 0,760 гэмпир 0,743 0,830 0,815
гист 0,410 0,461 0,451 гист 0,441 0,492 0,483
Дос 34 39 43 55 Вл 3 12 27 46
гэмпир 0,703 0,756 0,717 0,785 гэмпир 0,568 0,497 0,813 0,543
гист 0,460 0,495 0,469 0,513 гист 0,372 0,325 0,532 0,355
Без 8 13 15 22 56 Кф □ конформизм Тр □ поддержка тра- Дж □ доброжелатель- диций ность Сам □ самоопределе- Ст □ стимуляция ние Дос □ достижение Гед □ гедонизм Без □ безопасность Вл □ социальная Ун □ универсализм власть
гэмпир 0,776 0,722 0,635 0,374 0,481
гист 0,548 0,510 0,448 0,264 0,339
Ун 1 17 24 26 29 30 35 38
гэмпир 0,503 0,530 0,664 0,633 0,710 0,695 0,555 0,726
гист 0,417 0,439 0,550 0,524 0,588 0,576 0,460 0,602
Литература
1. Батурин, H.A. Современная психодиагностика России / H.A. Батурин // Вестник ЮУрГУ. Серия Психология. □ Вып. 2. □ № 32 (132). □2008. □ С. 4^9.
2. Галъянов, A.B. Математическая обработка результатов измерений: учебное пособие / A.B. Галъянов. □ Екатеринбург: УГГУ, 2007. □ Ч. 1. □ 108 с.
3. Карандашев, B.H. Методика Шварца
для изучения ценностей личности / В.Н. Карандашев. □ СПб.: Речь, 2004. —70 с.
4. Константинов, В.В. Экспериментальная психология / В.В. Константинов. □ СПб.: Питер, 2006. □ С. 266.
5. Шмелёв, А.Г. Тест профиля отношений: рецензия / А. Г. Шмелёв // Ежегодник профессиональных рецензий и обзоров. Методики психологической диагностики и измерения. □ Челябинск: Издат. центр, 2010. □ Т. 1. □ С. 198-203.
Поступила в редакцию 11 ноября 2011 г.
Загорюев Анатолий Леонидович. Канд. геол.-мин. наук, чл.-корр. Балтийской педагогической академии, директор, Екатеринбургский филиал АОУ ВПО «Ленинградский государственный университет имени А.С. Пушкина«] E-mail: [email protected], [email protected].
Anatolij L. Zagorjuev. Candidate of geological and mineralogical sciences, corresponding member of The Baltic pedagogic academy, the director, Yekaterinburg branch of Independent Educational Institution of the Higher Professional Education "The Leningrad State University named after A.S. Pushkin«. E-mail: [email protected], [email protected].