Научная статья на тему 'Критерии статистической значимости как неотъемлемая часть экспериментальной психологии'

Критерии статистической значимости как неотъемлемая часть экспериментальной психологии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
683
70
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КРИТЕРИЙ МАННА-УИТНИ / MANN-WHITNEY TEST / МАТЕМАТИЧЕСКИЕ МЕТОДЫ / КРИТЕРИИ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ / ЗАКОНЫ РАСПРЕДЕЛЕНИЯ / ИНСТРУМЕНТЫ MS EXCEL / T-КРИТЕРИЙ СТЬЮДЕНТА / КРИТЕРИЙ ФИШЕРА / MATHEMATICAL METHODS / CRITERIA OF STATISTICAL SIGNIFICANCE / DISTRIBUTIONS / TOOLS / MS EXCEL / STUDENT''S T-TEST / FISHER TEST

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Слесарева Екатерина Александровна, Задохина Нина Владимировна

Рассмотрены задачи психологических экспериментов, решаемые математическими методами; исследованы способы применения критериев различия двух выборок посредством использования информационных технологий.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Слесарева Екатерина Александровна, Задохина Нина Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Criteria of statistical significance as an integral part of experimental psychology

In the article the authors consider the problem of psychological experiments to be solved by mathematical methods, and also examine ways of using the differences of the two samples, through the use of information technology.

Текст научной работы на тему «Критерии статистической значимости как неотъемлемая часть экспериментальной психологии»

УДК 1/159.9 ББК 88

КРИТЕРИИ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ КАК НЕОТЪЕМЛЕМАЯ ЧАСТЬ ЭКСПЕРИМЕНТАЛЬНОЙ ПСИХОЛОГИИ

ЕКАТЕРИНА АЛЕКСАНДРОВНА СЛЕСАРЕВА,

кандидат психологических наук, старший преподаватель кафедры информатики и математики

Московского университета МВД России имени В.Я. Кикотя E-mail: [email protected]; НИНА ВЛАДИМИРОВНА ЗАДОХИНА, старший преподаватель кафедры информатики и математики Московского университета МВД России имени В.Я. Кикотя Научная специальность 19.00.03 — психология труда, инженерная психология, эргономика

E-mail: [email protected]

Citation-индекс в электронной библиотеке НИИОН

Аннотация. Рассмотрены задачи психологических экспериментов, решаемые математическими методами; исследованы способы применения критериев различия двух выборок посредством использования информационных технологий.

Ключевые слова: математические методы, критерии статистической значимости, законы распределения, инструменты MS Excel, t-критерий Стьюдента, критерий Фишера, U — критерий Манна-Уитни.

Annotation. In the article the authors consider the problem of psychological experiments to be solved by mathematical methods, and also examine ways of using the differences of the two samples, through the use of information technology.

Keywords: mathematical methods, criteria of statistical significance, distributions, tools, MS Excel, student's t-test, Fisher test, U — Mann-Whitney test.

Роль математики в психологии неоспоримо велика. Математические методы позволяют решать следующие задачи:

1) строить и разрабатывать математические графики и всевозможные шкалы, позволяющие делать замеры и выражать психологические данные в точных цифрах;

2) прогнозировать различные эксперименты в психологии, а также обрабатывать результаты этих экспериментов;

3) моделировать психологические методы разного рода с помощью математики;

4) исследовать процессы и явления психологического характера, осуществлять сбор точной информации;

5) моделировать поведение человека с помощью математических расчетов;

6) осуществлять системный анализ.

Критерии статистической значимости делятся на

параметрические (включают в формулу расчета параметры распределения; средние и дисперсии) и непара-

метрические (основаны на оперировании частотами или рангами). Непараметрические критерии гораздо легче в расчетах, для их определения не предполагается проверка распределения «на нормальность», экспериментальные данные не требуется «привязывать» к интервальной шкале. Однако, если выполняются эти условия, параметрические критерии оказываются более мощными. Так же нельзя забывать, что с помощью непараметрических критериев нельзя оценить взаимодействие двух и более факторов, влияющих на изменение признака.

Экспериментальные данные всегда ограничены и носят, в значительной мере, случайный характер. Для анализа таких данных применяется математическая статистика, которая позволяет обобщать закономерности, полученные на выборке, а также распространять их на всю генеральную совокупность. Так как оценка параметров генеральной совокупности, сделанная на основании экспериментальных данных, сопровождается погрешностью, она должна рассматриваться как предположительные, а не как окончатель-

ные утверждения. Подобные предположения называются статистическими гипотезами. Для проверки статистических гипотез принято использовать такие понятия как: нулевая гипотеза (о сходстве Но)), и альтернативная гипотеза (о различии (Н1)). Задача психолога: выявить значимость различий между двумя группами, используя различные критерии, а также определить наличие корреляционной связи между факторами.

Для того чтобы определить какой критерий использовать для установления уровня статистической значимости, нам необходимо установить соответствие данных нормальному закону распределения.

На психологическом факультете в одной из групп был измерен коэффициент развития вербального интеллекта на первом курсе (в начале обучения) и на третьем курсе. Данные представлены в таблице 1.

Психологу необходимо сделать вывод о статистической значимости полученных различий и эффективности обучения.

Представленные выборки являются связанными и характеризуют коэффициент вербального интеллекта курсантов до обучения в университете и спустя три года после поступления.

Необходимо определить, имеют ли сравниваемые данные нормальный закон распределения. Для этого воспользуемся инструментами MS Excel:

♦ отсортируем исходные данные по возрастанию;

♦ найдем средние значения выборок посредством функции СРЗНАЧ.

♦ определим стандартное отклонение, используя функцию СТАНДОТКЛОН.

♦ возвратим нормальное значение данным, применив функцию НОРМАЛИЗАЦИЯ.

♦ возвратим стандартное нормальное интегральное распределение, используя функцию НОРМ.СТ.-РАСП. В графе Z укажем значение, выданное функцией НОРМАЛИЗАЦИЯ. Так как нам необходимо построить функцию плотности вероятности, в графе Интегральная укажем ЛОЖЬ.

На основании полученных данных (столбцы Нормализация и Норм.Ст.Расп.) построим график распределения для первой выборки (рис. 1) и для второй выборки (рис. 2). Данные графики свидетельствуют о том, что обе выборки соответствуют нормальному закону распределения.

Для выявления различий между двумя выборками с известным законом распределения применяют

№ п/п Коэффициент развития вербального интеллекта на первом курсе № п/п Коэффициент развития вербального интеллекта на первом курсе № п/п Коэффициент развития вербального интеллекта на третьем курсе № п/п Коэффициент развития вербального интеллекта на третьем курсе

1 34 14 33 1 38 14 36

2 31 15 32 2 39 15 38

3 27 16 32 3 29 16 37

4 29 17 33 4 36 17 39

5 31 18 35 5 36 18 37

6 35 19 28 6 37 19 37

7 29 20 31 7 34 20 35

8 29 21 30 8 39 21 33

9 31 22 33 9 32 22 37

10 33 23 32 10 35 23 35

11 34 24 28 11 37 24 36

12 26 25 26 12 31 25 32

13 28 13 34

Табл. 1. Коэффициент развития вербального интеллекта на психологическом факультете

Рис. 1. График распределения для первой выборки

^критерий различия Стьюдента и критерий различия Фишера. При этом предполагается, что данные распределены по нормальному закону.

Рассмотрим использование ^критерия Стьюдента для определения наличия различий между двумя выборками. При этом выборки могут быть:

♦ независимыми, несвязными с разным числом значений в выборках — анализируют с помощью инструмента двухвыборочный 1-тест с различными дисперсиями или двухвыборочный 1-тест с одинаковыми дисперсиями;

♦ зависимыми, связанными с равным числом значений в выборках — анализируют с помощью инструмента Парный двухвыборочный 1-тест для средних или двухвыборочный 1-тест с различными дисперсиями.

Так как наши выборки зависимые, воспользуемся инструментом анализа данных двухвыборочный 1-тест с различными дисперсиями. В результате получим следующие данные (табл. 2). Напомним особенности выбора типа 1-теста. В том случае, если выбор не очевиден, то правильным будет применить двухвыборочный 1-тест с разными дисперсиями как общий случай анализа; если выборки зависимы и связаны, то следует применить парный 1-тест.

Как показывает таблица 2 эмпирическое значение ^критерия равно 6,359 и выше критического значения (2,4 и 2,68). Таким образом, на 5% уровне значимости первоначальное предположение подтвердилось, коэффициент вербального интеллекта у курсантов психологического факультета существенно увеличился.

Табл. 2. Результаты анализа двухвыборочного 1-теста с различными дисперсиями

Выборка 1 Выборка 2

Среднее 30,8 35,56

Дисперсия 7,25 6,756666667

Наблюдения 25 25

Гипотетическая разность средних 0

48

^статистика -6,359303618

Р(Т<=1) одностороннее 3,53424Е-08

1 критическое одностороннее 2,406581273

Р(Т<=£) двухстороннее 7,06848Е-08

1 критическое двухстороннее 2,682204027

Табл. 3 Двухвыборочный F-тест для дисперсии

Выборка 1 Выборка 2

Среднее 30,8 35,56

Дисперсия 7,25 6,756666667

Наблюдения 25 25

df 24 24

F 1,073014307

P(F<=f) одностороннее 0,432184938

F критическое одностороннее 1,983759568

Рассмотрим критерий различия Фишера для определения уровня статистической значимости. Данный критерий используется для сравнения дисперсий двух выборок с нормальным распределением (значения критерия должно быть больше или равно 1,0).

Выдвинем гипотезы:

♦ Н0 : Дисперсия выборки 1 не отличается от дисперсии выборки 2;

♦ Н1 : Дисперсия выборки 1 отличается от дисперсии выборки 2.

Данные в выборках должны быть измерены по шкале интервалов или по шкале отношений, а также должны иметь нормальный закон распределения.

Для простоты расчетов воспользуемся инструментом анализа данных двухвыборочный F-тест для дисперсии программы MS Excel. В результате получим данные, представленные в таблице 3.

Как видно из таблицы, эмпирическое значение критерия Фишера равно 1,07 и меньше критического (1,983). Это означает, что гипотеза о различиях отвергается и принимается гипотеза о сходстве; другими словами, существенных изменений в выборках данный критерий не выявил.

Определим уровень статистической значимости, используя непараметрический критерий Манна-Уитни.

Напомним, что данный критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда nrrn > 3 или rn=2, rn > 5.

Описание критерия. Данный метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны.

Эмпирическое значение критерия и отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше Цэмп, тем более вероятно, что различия достоверны.

Гипотезы

Но: Уровень признака в группе 2 не ниже уровня признака в группе 1.

Н1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Существует несколько ограничений критерия Манна-Уитни.

1. В каждой выборке должно быть не менее 3 наблюдений: т,П2 > 3.

2. В каждой выборке должно быть не более 60 наблюдений; т,т < 60.

Алгоритм нахождения критерия и Манна-Уитни.

1. Объединим эмпирические данные из 1 и из 2 выборок.

2. Произведем сортировку по возрастанию.

3. Проранжируем эмпирические данные. Для этого используем функцию РАНГ.СР. В графе Число указываем первое значение первой выборки. В графе Ссылка определяем список чисел (объединенные эмпирические данные 1 и 2 выборок). В графе Порядок указываем 1(ИСТИНА, если сортировка производилась по возрастанию) или 0(ЛОЖЬ, если данные сортировались по убыванию).

Не забываем определить, что ячейки списка абсолютные. Используя функцию автозаполнения, заполним все ячейки 1 и 2 выборок.

4. Найдем сумму рангов 1 и 2 выборок (534,5 и 740,5).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Для проверки правильности ранжирования, определим общую сумму рангов (1275) и сравним ее с расчетной суммой по формуле:

где N — общее количество ранжируемых наблюдений (значений). Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании.

6. Определить большую из двух ранговых сумм.

7. Определить значение и по формуле:

где т — количество испытуемых в выборке 1;

П2 — количество испытуемых в выборке 2;

Тх — большая из двух ранговых сумм;

Пх — количество испытуемых в группе с большей суммой рангов.

8. Определить критические значения и по таблице критических значений. Если иэмп. > икр, Н0 принимается. Если иэмп < икр, Н0 отвергается. Чем меньше значения и, тем достоверность различий выше.

Таким образом, мы показали как, избегая сложных расчетов, применить наиболее часто используемые критерии статистической значимости, а также определить соответствие эмпирических данных нормальному закону распределения.

Литература

1. Кинякин В.Н., Слесарева Е.А. Концепт алгоритма для начинающих // Вестник Московского университета МВД России. 2016. № 7.

2. Печенкова Е.А. Значение теории копинг-пове-дения при профессиональной подготовке специалистов силовых структур России (гендерный аспект) // Подготовка кадров для силовых структур: современные направления и образовательные технологии. Иркутск, 2016.

3. Полозова Т.Ю., Усачева И.В. Изучение влияния эмоциональной устойчивости, гибкости, самоконтроля на выполнение теста «поиск» (реакции на появляющийся движущийся объект) // Вестник Московского университета МВД России. 2016. № 1.

4. Слесарева Е.А. Особенности изучения конфликтности инспекторов ДПС ГИБДД // Вестник Московского гос. областного университета. 2011. № 5.

5. Слесарева Е.А. Социально-психологические тренинги — как эффективный путь развития и повышения профессионализма инспекторов ДПС ГИБДД // Вестник Московского университета МВД России. 2011. № 4.

6. Слесарева Е.А. Профессионально-значимые качества личности инспекторов ДПС ГИБДД // Вестник ГУУ. 20II. № I9.

7. Слесарева Е.А. Роль информационных технологий в деятельности психолога: Сб. науч. тр. XIII науч.-практ. конф. «Технологии информационной безопасности в деятельности органов внутренних дел» (на базе УНК ИТ Московского университета МВД России имени В.Я. Кикотя от 2б ноября 20 IS г.).

8. Слесарева Е.А., Смирнов Д.Е. Информационные технологии как средство решения практических задач в деятельности психолога // Государственная служба и кадры. 20I6. № 4.

References

1. Kiniakin V.N., Slesareva E.A. Kontsept algo-ritma dlia nachinaiushchikh // Vestnik Moskovskogo universiteta MVD Rossii. 20^. № 7.

2. Pechenkova E.A. Znachenie teorii koping-povede-niia pri professionalnoi podgotovke spetsialistov silovykh struktur Rossii (gendernyi aspekt) // Podgotovka kadrov dlia silovykh struktur: sovremennye napravleniia i obra-zovatelnye tekhnologii. Irkutsk, 20 I6.

3. Polozova T.Iu., UsachevaI.V. Izuchenie vliianiia emotsionalnoi ustoichivosti, gibkosti, samokontrolia na vypolnenie testa «poisk» (reaktsii na poiavliaiushchiisia dvizhushchiisia obieekt) // Vestnik Moskovskogo universiteta MVD Rossii. 20^. № I.

4. Slesareva E.A. Osobennosti izucheniia konfliktno-sti inspektorov DPS GIBDD // Vestnik Moskovskogo gos. oblastnogo universiteta. 2011. № S.

5. Slesareva E.A. Sotsialno-psikhologicheskie trenin-gi — kak effektivnyi put razvitiia i povysheniia professio-nalizma inspektorov DPS GIBDD // Vestnik Moskovskogo universiteta MVD Rossii. 2011. № 4.

6. Slesareva E.A. Professionalno-znachimye kache-stva lichnosti inspektorov DPS GIBDD // Vestnik GUU. 20II. № I9.

7. Slesareva E.A. Rol informatsionnykh tekhnologii v deiatelnosti psikhologa: Sb. nauch. tr. XIII nauch.-prakt. konf. «Tekhnologii informatsionnoi bezopasno-sti v deiatelnosti organov vnutrennikh del» (na baze UNK IT Moskovskogo universiteta MVD Rossii imeni V.Ia. Kikotia ot 2б noiabria 20IS g.).

8. Slesareva E.A., Smirnov D.E. Informatsionnye tekhnologii kak sredstvo resheniia prakticheskikh zadach v deiatelnosti psikhologa // Gosudarstvennaia sluzhba i kadry. 20^. № 4.

i Надоели баннеры? Вы всегда можете отключить рекламу.