УДК 159.9.072
ИССЛЕДОВАНИЕ ПСИХОМЕТРИЧЕСКИХ СВОЙСТВ АНКЕТЫ ПОЛОВЫХ РОЛЕЙ С.БЕМ (BSRI)
НА ОСНОВЕ МОДЕЛЕЙ РАША
Е.Ю.Карданова, А.Г.Сонин*
Институт электронных и информационных систем НовГУ, [email protected] *Московский институт лингвистики, [email protected]
Демонстрируются возможности моделей Раша для разработки психологических методик и исследования их психометрических свойств на примере анализа анкеты половых ролей Сандры Бем.
Ключевые слова: модели Раша, психометрия, статистики согласия, размерность теста
The opportunities of Rasch models for development of psychological tools and investigation of their psychometric properties are demonstrated by the example of Bem Sex-Role Inventory analysis.
Keywords: Rasch models, psychometry, BSRI, fit statistics, test dimensionality
1. Введение
Математическая оценка сбалансированности психологического теста и достоверности получаемых на его основе результатов всегда выступала важнейшим критерием целесообразности применения различных психологических методик. Грамотное математическое обоснование психометрических свойств теста, а также действий специалиста по интерпретации полученных результатов является также непременным условием теоретической апробации теста. В данной статье предлагается для разработки психологических методик и исследования их психометрических свойств использовать математическое моделирование на основе моделей Г.Раша.
Названное семейство моделей выделяется на фоне других в теории моделирования и параметризации тестов (ТМПТ) [1-3], составляющей на протяжении последних десятилетий основу интерпретации и оценки многих психологических тестов. Принципиальная новизна моделей Раша состоит в так называемой инвариантности получаемых данных, позволяющей подойти к оцениванию испытуемых как к процессу объективного измерения [4].
В качестве примера для демонстрации возможностей моделей Раша выбрана известная анкета половых ролей Сандры Беем BSRI (Bem Sex-Role Inventory). В статье исследуется лишь один аспект — размерность указанной анкеты. С другими аспектами исследования BSRI можно ознакомиться в работе [3].
2. Краткая характеристика анкеты половых ролей С.Бем
Анкета BSRI была впервые опубликована в 1974 г. Она создана для оценки маскулинности и фе-мининности индивидов и включает 60 заданий, каждое из которых представляет собой некоторую характеристику личности: 20 заданий относятся к шкале маскулинности, 20 — к шкале фемининности и 20 — к нейтральной шкале. Респондентов просят оценить себя по каждой из названных в ней характеристик с использованием семибалльной шкалы.
BSRI стала первой методикой, в которой маскулинность и фемининность рассматривались как две независимые друг от друга черты личности и, таким образом, допускалось, что существуют индивиды с высокими показателями по каждой из шкал.
Описанная анкета послужила основой для многих гендерных и других психологических исследований и вызвала дискуссию в научном сообществе относительно ее психометрических свойств (см., напр., [58]). Однако авторам настоящей статьи не удалось найти работ, посвященных исследованию BSRI в рамках ТМПТ, которая дает дополнительные возможности исследования психометрических свойств теста.
3. Используемая модель
В настоящей работе используется модель Раша с фиксированными промежуточными категориями выполнения заданий [1,3], специально разработанная для тестов с фиксированной шкалой ответов (например, лайкерт-типа). Согласно рассматриваемой моде-
ли, если при выполнении каждого задания теста испытуемый может получить от 1 до т баллов, вероятность РпОс того, что испытуемый п, п = 1,...,Ж с уровнем способности 0п, отвечая на задание ,, , = 1,...,/ с уровнем трудности 5,, получит k, k = 1,., т баллов, определяется формулой
Pnik = ^eXP
где
l
l(0n - 5г )
j=0
— нормирующий
1=0 |_ ]=0
множитель. Параметр т,, ] = 0,...,т, характеризует трудность выбора ,-й категории в любом задании,
Т0 = °.
Оценки параметров модели находятся на общей метрической (интервальной) шкале и сопровождаются характеристиками точности оценивания. Единицей измерения указанной метрической шкалы является 1 логит. Метричность шкалы обеспечивает возможность непосредственного сравнения результатов, а также позволяет использовать широкий спектр методов математической статистики.
Для анализа согласия экспериментальных данных с моделью измерения в настоящем исследовании используются стандартные статистики согласия [3,9], которые рассматриваются в двух версиях — простой и взвешенной. Данные считаются хорошо согласующимися с моделью, если значения статистик находятся в промежутке (0,8-1,2).
Для исследования размерности теста предлагается использовать факторный анализ нормированных уклонений хп, наблюдаемых ответов ап, испытуемых от их математических ожиданий согласно модели [3,9]
х = ап, -М(ап, )
^ = т/лсош)
Здесь М(ап1), В(ат) — соответственно математическое ожидание и дисперсия случайной величины ап, - ответа испытуемого п на задание ,. Применение факторного анализа к переменной хп, является более обоснованным, чем его традиционное в классической теории тестирования применение к первичным баллам [3]. Если тест одномерен, то значения величины хп, представляют собой случайный шум, так как в этом случае все отклонения наблюдаемых баллов от их математических ожиданий носят случайный характер. В этом случае факторный анализ уклонений хп, покажет отсутствие общих факторов. В противном случае, если тест не одномерен, будут выделены общие факторы. В литературе влияние фактора рекомендуется признать значимым, если на его долю приходится не менее 5% общей дисперсии нормированных уклонений [9].
4. Постановка эксперимента
Для демонстрации возможностей применения моделей Раша в исследовании психометрических свойств теста авторами был проведено анкетирование с использованием BSRI. В анкетировании приняли участие 361 студент младших курсов (129 муж., 232 жен.).
В качестве материала была использована русскоязычная версия анкеты BSRI из [10]. Структурно русскоязычная версия не отличается от англоязычного оригинала.
Для обработки данных в настоящем исследовании использовалась программа Winsteps (http://www.winsteps.com), специально предназначенная для обработки данных тестирования в рамках моделей Раша.
Первоначально все 60 заданий анкеты были откалиброваны совместно, что позволило получить оценки параметров всех заданий на общей шкале. Задания были разбиты на группы в соответствии с их принадлежностью к одной из трех шкал. На втором этапе исследованию подверглись отдельные шкалы BSRI.
На рисунке представлена карта переменных, на которой показано распределение испытуемых и заданий различных шкал относительно друг друга на общей метрической шкале. Слева на рисунке находится шкала логитов. Все параметры испытуемых и заданий помещены на эту шкалу, что позволяет сравнить между собой задания различных шкал.
Те характеристики, которые испытуемые приписывают себе неохотно, находятся в верхней части карты, наиболее часто выбираемые характеристики
— в нижней. Из рисунка видно например, что характеристики 46М (агрессивность), 14F (любит лесть) и 48N (неумелый) наименее «популярны» среди испытуемых. Характеристики 4М (защищает свои убеждения), 17F, 59F, 5F (верный, добрый, веселый) и 2Ш,
45N (надежный, дружелюбный), напротив, наиболее часто выбираются испытуемыми. В целом задания всех шкал достаточно широко распределены по оси (с некоторыми нюансами) и теоретически могут определять соответствующие конструкты.
5. Результаты и их обсуждение
Исследование согласия данных с используемой моделью. В анкете выявлено 14 заданий, для которых статистики согласия превышают правое критическое значение. Известно, что такие задания могут трактоваться как измеряющие конструкт, отличный от того, что измеряют другие задания. Среди этих заданий пять принадлежат фемининной шкале и четыре — маскулинной.
В анкете также обнаружено 16 заданий со статистиками согласия ниже левого критического значения. К таковым относятся семь заданий фемининной шкалы (сочувствующий, сострадательный, ласковый, добрый, сердечный, понимающий, внимательный к потребностям других) и два — маскулинной (сильная личность, сильный). Таким образом, можно предположить, что задания BSRI измеряют более одного конструкта (ожидаемый результат, так как анкета изначально создавалась как многомерная). При этом присутствие в каждом из множеств заданий и маскулинной, и фемининной шкал позволяет предположить, что сами эти шкалы не одномерны.
Исследование размерности BSRI. Применение процедуры факторного анализа нормированных уклонений показало, что выделяемый фактор объяс-
< более >
-1
Каждое '#'
+
|
|
|
+T Я |
|
S| M|
|
|
S| +M |
я . |
. |
|
|
|
+T
< менее равно 5
.#
.#
######
.########
.#########
.#########
.##########
#########
.######
.###
.##
.#
Шкала
маскулинности
4 6M
4 9M 31М 55M 10M 13M 19M 7M 16M
1М
4M
37M
2 5M 2 8M 22M
34M 4 0M 58M
4 3M
52M
Шкала
фемининности
14Е
38Е 8Е 50Е 53Е
2Е
20Е 47Е 26Е
32Е 35Е 56Е
11Е 23Е 41Е 44Е
2 9Е
17Е 59Е 5Е
Нейтральная
шкала
4 8N
54N 3 6N
30N
12N
18N 6N
42N
9N
15N 24N 27N 51N 57N 3 9N
33N 60N
3N 21N 4 5N
Карта переменных (все задания анкеты)
2
1
0
>
няет 12% общей дисперсии нормированных уклонений. Таким образом, тест не может быть признан одномерным. В нижеследующей таблице представлены задания BSR1 с положительными нагрузками по выделенному фактору.
рения. Из 20 маскулинных характеристик, включенных в анкету, 9 имеют значения статистик согласия вне допустимого промежутка (0,8-1,2). Наличие заданий, не находящихся в удовлетворительном согласии с моделью, позволяет предположить, что задания
Задания, оценивающие первую латентную переменную
Номер в анкете Факторная нагрузка Мера Статистики согласия Шкала Характеристика
Взвеш. Простая
49 0,64 0,41 0,83 0,81 М Действует как лидер
37 0,54 0,26 0,95 0,95 М Доминантный
25 0,54 0,15 0,87 0,87 М Имеет способности лидера
16 0,52 -0,29 0,78 0,78 М Сильная личность
13 0,47 -0,02 0,85 0,85 М Напористый
55 0,47 0,23 1,26 1,25 М Любит соревноваться
7 0,46 -0,1 0,97 0,97 М Независимый
46 0,42 0,96 1,25 1,3 М Агрессивный
28 0,42 0,05 1,2 1,2 М Любит риск
19 0,41 -0,11 0,76 0,76 М Сильный
31 0,36 0,31 0,95 0,95 М Легко принимает решения
4 0,36 -0,65 0,91 0,88 М Защищает свои убеждения
10 0,33 0,1 1,41 1,41 М Спортивный
34 0,32 -0,07 1,01 1,03 М Самодостаточный
40 0,31 -0,06 1,12 1,11 М Мужественный
36 0,29 0,85 1,18 1,17 N Тщеславный
22 0,26 0,03 1,24 1,24 М Аналитический ум
52 0,25 -0,08 1,06 1,06 М Индивидуалистический
1 0,22 -0,45 0,88 0,9 М Надеется только на себя
15 заданий фемининной шкалы и 5 заданий нейтральной (таблица не приводится) имеют отрицательные нагрузки по этому фактору, что означает, что эти задания работают на оценивание другой латентной переменной, отличной от той, что оценивается заданиями табл.
Таким образом, BSRI состоит из двух шкал: 18 заданий составляют основу маскулинной шкалы и 15 заданий — фемининной. Дополнительно отметим, что коэффициент корреляции между показателями маскулинности и фемининности испытуемых равен -0,07 (т.е. близок к нулю), что указывает на отсутствие связи между показателями маскулинности и фемининности, а значит — на независимость шкал.
В результате проведенного исследования можно сделать вывод о том, что BSRI способен дифференцировать индивидов по гендерному типу. Однако последнее справедливо лишь в том случае, когда сами шкалы (маскулинная и фемининная) одномерны. Поэтому следующий этап анализа анкеты — исследование отдельных шкал BSRI.
Исследование маскулинной шкалы
Надежность измерения испытуемых для маскулинной шкалы равна 0,79. Анализ карты переменных (см. табл.) позволяет выявить некоторые проблемы маскулинной шкалы для данной совокупности испытуемых — она плохо дифференцирует испытуемых с высоким уровнем маскулинности (подробнее см. [3]).
Следующим шагом стало исследование согласия данных по маскулинной шкале с моделью изме-
маскулинной шкалы могут измерять более одного конструкта.
Для исследования размерности маскулинной шкалы вновь использовалась процедура факторного анализа нормированных уклонений. Ее применение показало, что все задания шкалы распадаются на три подмножества, которые могут быть интерпретированы как различные факторы.
1) Доминирование. Три задания маскулинной шкалы имеют по этому фактору нагрузки, существенно превышающие нагрузки других заданий (действует как лидер, имеет способности лидера, доминантный); факторные нагрузки соответственно равны 0,81; 0,68 и 0,62. Все эти задания имеют значения статистик согласия, меньшие левого критического значения 0,8, что свидетельствует о нарушении принципа локальной независимости. Другими словами, эти задания избыточно дублируют друг друга и не вносят существенный вклад в оценивание испытуемых.
2) Соревновательность. Два задания маскулинной шкалы имеют по этому фактору нагрузки, существенно превышающие нагрузки других заданий (любит соревноваться, спортивный); факторные нагрузки соответственно равны 0,68 и 0,55.
3) Остальные 15 заданий маскулинной шкалы образуют третий фактор, который может быть интерпретирован как собственно маскулинность. Наибольшие нагрузки по этому фактору имеют задания независимый, сильная личность, легко принимает
решения, надеется только на себя, аналитический ум, индивидуалистический, самодостаточный.
Таким образом, маскулинная шкала BSRI имеет сложную структуру и не является одномерной в строгом смысле. В этой ситуации для оценки применимости анкеты важно установить, оказывает ли многомерность шкалы влияние на оценки испытуемых. Если влияние невелико, то маскулинную шкалу можно рассматривать как существенно одномерный тест (с доминантной размерностью). Если же влияние значимо, то маскулинную шкалу необходимо разбивать на более мелкие шкалы.
Для решения возникшей проблемы был проведен анализ корреляции между мерами испытуемых, полученными по результатам выполнения всех 20 заданий маскулинной шкалы, только 18 заданий (с исключенными заданиями, формирующими фактор Соревновательность) и только 15 заданий, образующих главный фактор (собственно Маскулинность). Анализ показал, что все коэффициенты корреляции высоки и статистически значимы (коэффициент корреляции Пирсона колеблется от г = 0,95 до г = 0,98). Это дает основание утверждать, что исключение нескольких заданий не оказывает существенного влияния на меры испытуемых и их порядок при ранжировании.
Для окончательного решения вопроса о размерности маскулинной шкалы меры испытуемых, полученные по результатам выполнения 20, 18 и 15 заданий маскулинной шкалы, были сопоставлены непосредственно, путем перенесения всех показателей на единую шкалу*. Применение этой процедуры показало, что меры испытуемых, полученные по результатам выполнения 20, 18 и 15 заданий маскулинной шкалы, статистически не различаются (различия между ними находятся в пределах ошибки измерения). Таким образом, мы получили доказательство того, что маскулинная шкала BSRI может быть рассмотрена как существенно одномерная, и показатель маскулинности имеет смысл.
Исследование фемининной шкалы. Общий алгоритм исследования фемининной шкалы BSRI аналогичен тому, что был использован для описанного выше исследования маскулинной шкалы. Приведем лишь краткие выводы проведенного исследования.
Все задания фемининной шкалы распадаются на три подмножества, которые могут интерпретироваться как различные факторы (душевная теплота — 5 заданий, чувствительность к межличностным отношениям — 4 задания и пассивность — 11 заданий). Проведенное исследование влияния многомерности шкалы на оценки мер испытуемых показало, что фемининная шкала BSRI является существенно многомерной: задания, входящие в различные подмножества, измеряют различные конструкты и не могут быть рассмотрены как составляющие одной шкалы. Более того, оценка качества измерения испытуемых с помощью различных подмножеств «фемининных» заданий показала, что ни одно подмножество не обра-
* Такая процедура называется выравниванием и может быть осуществлена благодаря метричности шкал [11]. После проведения процедуры выравнивания меры испытуемых можно сравнить непосредственно с учетом их ошибки измерения.
зует самостоятельной шкалы. Таким образом, фемининная шкала BSRI имеет более сложную факторную структуру, чем маскулинная шкала, и не может служить инструментом ни для измерения фемининности, ни для измерения какой-либо другой характеристики личности. Требуется работа по ее совершенствованию с целью улучшения ее свойств.
6. Заключение
Проведение анализа русскоязычной версии BSRI в рамках современной теории тестирования с использованием моделей Раша существенно дополняет результаты традиционного факторного анализа анкеты.
Полагаем, что анализ, построенный на использовании моделей Раша, целесообразно проводить при разработке любой психологической методики, имеющей целью измерение какой-либо латентной черты личности, еще на этапе ее (методики) апробации. По результатам анализа может быть сделан вывод о соответствии методики всем требованиям, которым должен удовлетворять измерительный инструмент. В случае отрицательного результата проверки полученные данные позволяют выработать рекомендации по улучшению психометрических свойств методики.
1. Wright B.D., Masters G.N. Rating Scale Analysis. Rasch Measurement. Chicago: Mesa Press, 1979. 206 p.
2. Нейман Ю.М., Хлебников В.А. Введение в теорию моделирования и параметризации педагогических тестов. М.: Прометей, 2000. 169 с.
3. Карданова Е.Ю. Моделирование и параметризация тестов: основы теории и приложения. М.: Федеральный центр тестирования, 2008. 304 с.
4. Карданова Е.Ю. Преимущества современной теории тестирования по сравнению с классической теорией тестирования // Вопросы тестирования в образовании. 2004. №10. С.7-34.
5. Brems C., Johnson M.E. Reexamination of the Bem Sex-Role Inventory: The Interpersonal BSRI // J. of Personality Assessment. 1990. №55(3&4). Р.484-498.
6. Campbell T., Gillaspy J.A., Thompson B. The Factor Structure of the Bem Sex-Role Inventory (BSRI): Confirmatory Analysis of Long and Short Forms // Educational and Psychological Measurement. 1997. Vol.57. №1. Р.118-124.
7. Choi N., Fuqua D.R. The Structure of the Bem Sex-Role Inventory: a Summary Report of 23 Validation Studies // Educational and Psychological Measurement. 2003. Vol.63. №5. Р.872-887.
8. Ratliff E.S., Conley J. The Structure of Masculinity-Femininity: Multidimensionality and Gender Differences // Social Behavior and Personality. 1981. №9(1). Р.41-47.
9. Smith E.V. Introduction to Rasch Measurement / E.V.Smith, R.M.Smith. Maple Grove, Minnesota: JAM Press, 2004. 687 p.
10. Пайнс Э., Маслач К. Практикум по социальной психологии. СПб.: Питер, 2000. 522 с.
11. Карданова Е.Ю, Нейман Ю.М. Проблема выравнивания в современной теории тестирования // Вопросы тестирования в образовании. 2003. №8. С.21-40.
Bibliography (Translitirated)
1. Wright B.D., Masters G.N. Rating Scale Analysis. Rasch Measurement. Chicago: Mesa Press, 1979. 206 p.
2. Nejjman Ju.M., Khlebnikov V.A. Vvedenie v teoriju mode-lirovanija i parametrizacii pedagogicheskikh testov. M.: Prometejj, 2000. 169 s.
3. Kardanova E.Ju. Modelirovanie i parametrizacija testov: os-novy teorii i prilozhenija. M.: Federal'nyjj centr testirovanija, 2008. 304 s.
4. Kardanova E.Ju. Preimushhestva sovremennojj teorii tes-tirovanija po sravneniju s klassicheskojj teoriejj testirovanija // Voprosy testirovanija v obrazovanii. 2004. №10. S.7-34.
5. Brems C., Johnson M.E. Reexamination of the Bem Sex-Role Inventory: The Interpersonal BSRI // J. of Personality Assessment. 1990. №55(3&4). R.484-498.
6. Campbell T., Gillaspy J.A., Thompson B. The Factor Structure of the Bem Sex-Role Inventory (BSRI): Confirmatory Analysis of Long and Short Forms // Educational and Psychological Measurement. 1997. Vol.57. №1. R.118-124.
7. Choi N., Fuqua D.R. The Structure of the Bem Sex-Role Inventory: a Summary Report of 23 Validation Studies // Edu-
cational and Psychological Measurement. 2003. Vol.63. №5. R.872-887.
8. Ratliff E.S., Conley J. The Structure of Masculinity-Femininity: Multidimensionality and Gender Differences // Social Behavior and Personality. 1981. №9(1). R.41-47.
9. Smith E.V. Introduction to Rasch Measurement / E.V.Smith, R.M.Smith. Maple Grove, Minnesota: JAM Press, 2004. 687 p.
10. Pajjns Eh., Maslach K. Praktikum po social'nojj psikhologii. SPb.: Piter, 2000. 522 s.
11. Kardanova E.Ju, Nejjman Ju.M. Problema vyravnivanija v sovremennojj teorii testirovanija // Voprosy testirovanija v obrazovanii. 2003. №8. S.21-40.