Использование критерия /2 (хи-квадрат) для проведения статистической обработки
данных педагогического эксперимента Набиулина Л. М.
Набиулина Луиза Махмудовна / Nabiulina Luiza Makhmudovna - кандидат педагогических наук, кафедра
«Информационные технологии»,
Ташкентский государственный педагогический университет имени Низами, г. Ташкент, Узбекистан
Аннотация: в статье рассматриваются основы отбора экспериментальных групп, выдвижение гипотезы, использование критерия у2 (хи-квадрат) для обработки и представления экспериментальных данных и формулирования выводов.
Abstract: the article deals with the basics of screening the experimental groups, the hypothesis was put forward, using the criterion y2 (Chi-square) for the processing and presentation of experimental data and formulation of conclusions.
Ключевые слова: выборка, статистическая гипотеза, нулевая гипотеза, альтернативная гипотеза, критерий у2 (хи-квадрат).
Keywords: sampling, statistical hypothesis, null hypothesis, alternative hypothesis, criterion y2 (Chi-square).
При выполнении выпускных квалификационных работ, студенты педагогических вузов сталкиваются с проблемой оформления результатов педагогического эксперимента, в частности, неумением отбирать группы для проведения эксперимента, выдвигать гипотезы и использовать методы статистической обработки полученных данных на основе применения различных критериев. Одним из таких критериев является критерий хи-квадрат. Данный критерий применяется для сравнения распределений объектов двух совокупностей на основе измерений по шкале наименований в двух независимых выборках.
Прежде чем перейти к изучению критерия, необходимо остановиться на таких понятиях, как выборка и гипотеза.
Выборка или выборочная совокупность — часть генеральной совокупности элементов, которая охватывается наблюдением. Например, вы исследуете возможности применения метода проектов на уроках информатики в 5 классах общеобразовательной школы. Ученики 5 класса всех школ составляют генеральную совокупность, а отобранные для наблюдения ученики конкретной школы и конкретного 5 класса будут являться выборочной совокупностью. Обычно для наблюдения выбирают контрольную и экспериментальную группы. Экспериментальная группа - это группа, которая подвергается экспериментальному воздействию в процессе педагогического исследования, то есть группа, с которой непосредственно работает экспериментатор. Например, ученики класса 5А школы № 42. Контрольная группа (например, ученики класса 5Б школы № 42) помещается в те же условия, что и экспериментальная, но испытуемые в ней не подвергаются экспериментальному воздействию.
Статистика как метод исследования оперирует данными, которые могут быть искажены различными случайными факторами, поэтому статистические вычисления сопровождаются проверкой некоторых предположений или гипотез об источнике этих данных.
Статистическая гипотеза - это предположение о свойствах случайных величин или событий, которое мы хотим проверить по имеющимся данным. Примеры статистических гипотез в педагогических исследованиях:
Гипотеза 1. Усвоение возможностей программы Microsoft Excel не имеет существенных различий у учащихся, начавших их обучение в 5 классе или 6 классе.
Гипотеза 2. Проблемное обучение при обучении информатике эффективнее по сравнению с традиционной методикой обучения.
Нулевая гипотеза - это основное проверяемое предположение, которое обычно формулируется как отсутствие различий, равенство нулю значений выборочных характеристик и т. п. Примером нулевой гипотезы в педагогике является утверждение о том, что различие в результатах выполнения двумя группами учащихся одной и той же контрольной работы вызвано лишь случайными причинами.
Другое проверяемое предположение называется альтернативной гипотезой. Так, для упомянутого выше примера гипотезы Н0 в педагогике одна из возможных альтернатив Hj будет определена так: уровни выполнения работы в двух группах учащихся различны, и это различие определяется влиянием, например, тех или других методов обучения.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость проверить ее. Данная проверка производится статистическими методами и поэтому называется статистической.
Альтернативная гипотеза принимаются тогда и только тогда, когда опровергается нулевая гипотеза. Это бывает в тех случаях, когда различия, например, в средних арифметических экспериментальной и контрольной групп настолько значимы, что риск ошибки отвергнуть нулевую гипотезу и принять альтернативную не превышает одного из трех принятых уровней значимости статистического вывода:
1. первый уровень — 5 % (а = 0 . О 5 ); допускается риск ошибки в выводе в пяти случаях из ста теоретически возможных таких же экспериментов при строго случайном отборе испытуемых для каждого эксперимента;
2. второй уровень — 1 % (а = 0 . О 1 ) , т. е. соответственно допускается риск ошибиться только в одном случае из ста;
3. третий уровень — 0,1 % (а = 0, 0 0 1) , т. е. допускается риск ошибиться только в одном случае из тысячи.
Предположим, вы изучаете выполнение определенного задания, которое измеряется у каждого объекта по шкале наименований, имеющей две взаимоисключающие категории (например: выполнено верно — выполнено неверно). По результатам измерения у объектов двух выборок составляется таблица (см. табл. 1).
Таблица 1. Внесение результатов измерений у объектов двух выборок
Категория 1 Категория 2
Выборка №1 Оц О12 О11+ О12
Выборка №2 О21 О22 О21+ О22
О11+ О21 О12+ О22 ni+n2=N
В этой таблице Оj — число объектов в /-ой выборке, попавших в j-ую категорию по состоянию изучаемого свойства; i=1,2 - число выборок; j=1,2 - число категорий; N= n1+n2 — общее число наблюдений.
На основе данных таблицы 1 можно проверить нулевую гипотезу о равенстве вероятностей попадания объектов первой и второй совокупностей в первую (вторую) категорию шкалы измерения проверяемого свойства, например, гипотезу о равенстве вероятностей верного выполнения некоторого задания учащимися контрольных и экспериментальных классов.
Для проверки рассмотренных нулевых гипотез по данным таблицы 1 подсчитывается значение статистики критерия Т по следующей общей формуле:
N ' (Юн ' 022 — 012 ■ 021\ — -у)2
т =--------------------------— m
Щ'Щ- (0ц + 021) ' (012 + °22)
где n1, n2 — объемы выборок, N = n1 + п2 — общее число наблюдений.
Проводится проверка гипотезы H0: p1=p2 — при альтернативе Н1: р1>р2. Пусть а — принятый уровень значимости. Тогда значение статистики Т, полученное на основе экспериментальных данных, сравнивается с критическим значением статистики Ткрит, которое определяется по таблице X c одной степенью свободы [2, C. 130] с учетом выбранного значения а. Если верно неравенство Т< Ткрит, то нулевая гипотеза принимается на уровне а.
В связи с тем, что замена точного распределения статистики Т распределением X c одной степенью свободы дает достаточно хорошее приближение только для больших выборок, применение критерия ограничено некоторыми условиями. Критерий не рекомендуется использовать, если сумма объемов двух выборок меньше 20 и хотя бы одна из абсолютных частот в таблице 1, составленной на основе экспериментальных данных, меньше 5.
Пример 1. Проводился эксперимент, направленный на выявление лучшего из методов усвоения учащимися определенной темы, разработанных двумя авторами в соответствии с целями обучения информатике и содержанием программы. Для проведения эксперимента методом случайного отбора были выбраны два района. Учителя одного района (20 учителей) обучали по разработанной методике автора № 1, учителя второго района (15 учителей) обучали по другой предложенной методике.
Отношение учителей к предлагаемым методикам обучения измерено по шкале наименований, имеющей две категории (C=2): методика позволила достичь цели урока (да) - методика не позволила достичь цели урока (нет). Обе выборки учителей случайные и независимые.
Ответы 20 учителей первого района и 15 учителей второго района распределим на две категории и запишем в форме таблицы (табл. 2).
Таблица 2. Результаты ответов учителей первого и второго районов
Да Нет
Выборка №1 Оп=14 О12=6 п1=О11+ О12=20
Выборка №2 О ~11 00 °22=7 n—О21+ О22—15
Оц+ О21=22 О12+ О22=13 N=n1+n2=35
Все значения в табл. 2 не меньше 5, поэтому в соответствии с условиями использования критерия X подсчет статистики критерия производится по формуле (1).
35- (|14-7 — 6-8\-Щ-)2
Т =
20-15-(14+ 8)-(6+ 7)
= 0,43
По таблице [2 , С. 130] для одной степени свободы (v=C-1=1) и уровня значимости а=0,05 найдем Ткритич
= 3,84. Отсюда верно неравенство Тнаблюд<Ткритич (0,43<3,84). Согласно правилу принятия решений для 2 ~ ~ критерия х , полученный результат не дает достаточных оснований для отклонения нулевой гипотезы, т. е.
результаты проведенного опроса учителей двух экспериментальных районов не дают достаточных
оснований для отклонения предположения об одинаковом достижении целей урока при применении
предложенных методов обучения.
Применение критерия х2 возможно и в том случае, когда объекты двух выборок из двух совокупностей по состоянию изучаемого свойства распределяются более чем на две категории. Например, учащиеся экспериментальных и контрольных классов распределяются на четыре категории в соответствии с отметками (в баллах: 2, 3, 4, 5), полученными учащимися за выполнение некоторой контрольной работы.
Результаты измерения состояния изучаемого свойства у объектов каждой выборки распределяются на С категорий. На основе этих данных составляется таблица 2хС, в которой два ряда (по числу рассматриваемых совокупностей) и С колонок (по числу различных категорий состояния изучаемого свойства, принятых в исследовании).
Таблица 3. Внесение результатов измерения свойств объектов из С-категорий
Катег . 1 Катег. 2 Катег . i Катег. C
Выборк а 1 Оц O12 Oli O1c П1
Выборк а 2 О21 O22 O2i O2c П2
Оп+ О21 O12 +O22 Oii+ O2i Ole + O2c N= n1+ n2
На основе данных таблицы 3 можно проверить нулевую гипотезу о равенстве вероятностей попадания объектов первой и второй совокупностей в каждую из i (i=l, 2, ..., С) категорий, т. е. проверить выполнение всех следующих равенств: ри= р21, pi2 = p22, ■■■, Pic = p2c. Возможна, например, проверка гипотезы о равенстве вероятностей получения отметок «5», «4», «3» и «2» за выполнение учащимися контрольных и экспериментальных классов некоторого задания.
Для проверки нулевой гипотезы с помощью критерия х2 на основе данных таблицы 2хС подсчитывается значение статистики критерия Т по следующей формуле:
т = —£ f= !(п 102 1~П2° 1 ° 2 (2)
ni'n2 0ii+02;
где п1 и п2 — объемы выборок.
Значение Т, полученное на основе экспериментальных данных, сравнивается с критическим значением Ткритич, которое определяется по таблице х2 с v = С—1 степенью свободы с учетом выбранного уровня значимости а. При выполнении неравенства Т>Ткритич нулевая гипотеза отклоняется на уровне а и принимается альтернативная гипотеза. Это означает, что распределение объектов на С категорий по состоянию изучаемого свойства различно в двух рассматриваемых совокупностях.
Пример 2. Рассмотрим методику сравнения результатов контрольной работы, проверявшей усвоение одного из разделов курса информатики учащимися первого и второго районов на основе выполнения определенного набора заданий.
Методом случайного отбора из учащихся первого района, писавших работу, была составлена выборка объемом 50 человек, из учащихся второго района — выборка объемом 50 человек. В соответствии со специально разработанными критериями оценки выполнения работы каждый ученик мог попасть в одну из четырех категорий: неудовлетворительно, удовлетворительно, хорошо, отлично. Результаты выполнения работы двумя выборками учащихся используем для проверки гипотезы о том, что набор заданий № 1 способствует лучшему усвоению проверяемого раздела курса, т. е. учащиеся первого экспериментального района в среднем будут получать более высокие оценки, чем учащиеся второго района.
Результаты выполнения работы учащимися обеих выборок запишем в виде таблицы 2x4 (табл. 4).
Таблица 4. Результаты контрольной работы, проверявшей усвоение одного из разделов курса информатики учащимися
первого и второго районов
неуд. удовл. хорошо отлично
Выборка 1 On=3 Oi2=19 p 'll 00 O14=10 n1=50
Выборка 2 O2i=9 O22=24 O23=12 O24=5 n2=50
12 43 30 15 N=100
В соответствии с условиями использования критерия х2 подсчет статистики критерия производится по корректированной формуле (2).
= 1 ((.Щ021 - щОц)2 (Щ022 -П2012)2 (П1О23 ~ П2013)2 (щ024 - п2014)2\
П1 ' П2 V 0Ц + ®21 012 + 022 023 + 013 014 + 024 /
1
= ТТ (48 + 9,3 + 19,2 + 26,7) = 6,45 16
В соответствии с условиями применения двустороннего критерия хи-квадрат по таблице [2, C. 130] для одной степени свободы (v = 4-l = 3) и уровня значимости а = 0,05 найдем Ткритич = 7,815. Отсюда верно неравенство Тнаблюд<Ткритич (6,45<7,815). Согласно правилу принятия решений для критерия х2, полученный результат не дает достаточных оснований для отклонения нулевой гипотезы, т. е. набор заданий № 1 способствует лучшему усвоению проверяемого раздела курса.
Литература
1. Введение в научное исследование по педагогике: Учеб. пособие для студентов пед. ин-тов. / Под ред. В. И. Журавлева. - М.: Просвещение, 1988. - 168 с.
2. Грабарь М. И., Краснянская К. А. Применение математической статистики в педагогических исследованиях. Непараметрические методы. М., «Педагогика», 1977. - 136 с.
3. Набиулина Л. М., Тухташев У. Ф. Актуальность изучения современных языков программирования в системе непрерывного образования Республики Узбекистан. // Проблемы современной науки и образования, 2014, № 9 (27), - C. 12-14.