УДК 331
ОБЩАЯ ХАРАКТЕРИСТИКА НЕПАРАМЕТРИЧЕСКИХ МЕТОДОВ ОЦЕНКИ СТАТИСТИЧЕСКОЙ СВЯЗИ
В. А. Андреева, А. В. Будлянская, М. О. Елфимова, О. С. Кошевой
APPLICATION OF NONPARAMETRIC TESTS IN PRACTICE OF SOCIOLOGICAL RESEARCH
V. A. Andreevа, A. V. Budlyanskaya, M. O. Efimova, O. S. Koshevoj
Аннотация. В данной статье рассматриваются непараметрические методы оценки статистической связи зависимых и независимых выборок. В частности, говорится о непараметрических критериях, а также о непараметрическом множественном сравнении.
Ключевые слова: непараметрические методы, связанная выборка, несвязанная выборка.
Abstract. This article discusses the nonparametric methods for estimating the statistical relationship of the dependent and independent samples. In particular states of nonparametric criteria, sign test median criterion, as well as non-parametric multiple comparison.
Key words: non-parametric methods, involving sampling, unrelated sample.
В настоящее время все большее значение приобретает выборочное обследование социально-экономических процессов. Это связано прежде всего с экономией времени и материальных ресурсов статистического исследования того или иного явления. При этом, если заранее известен вероятностный закон распределения наблюдаемой переменной, то можно предсказать, как в повторных выборках равного объема будут «вести себя» используемые переменные. Пример: имеется 100 случайных выборок из одной популяции по 100 взрослых человек в каждой. Нужно вычислить средний рост субъектов в каждой выборке, т.е. построить выборочное среднее. Тогда распределение выборочных средних можно хорошо аппроксимировать нормальным распределением (более точно, t-распределением Стьюдента с 99 степенями свободы) [1].
Однако для множества явлений невозможно сказать с уверенностью, что изучаемая переменная подчиняется нормальному закону распределения. Например, доход не является нормально распределенной величиной. Случаи редких болезней также не являются нормально распределенными в популяции, число автомобильных аварий тоже не является нормально распределенным, как и многие другие переменные, интересующие исследователей. Поэтому применение параметрических критериев не может быть обоснованным для приведенных выше задач.
Следующим фактором, ограничивающим применение критериев, основанных на предположении нормальности, является объем выборки. До тех пор, пока выборка достаточно большая (например, 100 или больше наблюдений), можно считать, что выборочное распределение нормально, и применять параметрические критерии, а для анализа малых выборок - непараметрические тесты [2].
Можно выделить следующие преимущества непараметрических критериев:
1. Могут использоваться для проверки гипотез о параметрах генеральной совокупности, когда переменная не распределена нормально.
2. Могут использоваться для номинальных и порядковых данных.
3. Могут использоваться для проверки гипотез, которые не связаны с параметрами генеральной совокупности.
4. Просты в расчетах [3].
Также очевидны определенные недостатки:
1. Критерии менее точны, чем соответствующие параметрические методы. Следовательно, требуются более значительные отклонения, чтобы отвергнуть нулевую гипотезу.
2. Они менее информативны, чем параметрические критерии.
3. Они менее эффективны, чем параметрические критерии [3].
Перечисленные выше достоинства и недостатки присущи всем непараметрическим критериям, но у каждого в отдельности есть и свои особенности. Стоит обратить внимание на то, что существует разграничение непараметрических критериев на критерии для связанных выборок и критерии для несвязанных выборок. Несвязанными (независимыми) называются выборки, в которых одни и те же признаки измерены на разных испытуемых, а связанными (зависимыми) - выборки, образованные парными (связанными) результатами (с одним испытуемым в разных условиях, например, «до» и «после») [2].
Остановимся на некоторых непараметрических тестах.
I. Критерий рандомизации компонент Фишера (критерий рандомизации Фишера-Питмана) для несвязанных и связанных выборок. Применяется для проверки нулевой гипотезы о том, отобраны ли две независимые выборки из совокупностей с одинаковыми средними значениями [3].
Достоинством критерия является простота в расчетах.
Недостатки критерия следующие:
1. Выборки должны принадлежать количественной шкале.
2. Критерий может применяться только для малых выборок (численность каждой выборки от 5 до 8) [3].
Данные критерии реализованы в статистических пакетах 81ай8йса.
Из изложенного выше следует, что основное ограничение на практическое использование данных критериев является малый объем выборки. Поэтому для больших выборок вместо описанных выше критериев рекомендуется применять Ж-критерий Вилкоксона, критерий Ансари-Брэдли, которые являются критериями ранговой рандомизации.
II. Ж-критерий Вилкоксона для независимых выборок. Применяется для проверки однородности двух независимых совокупностей одинаковой или разной численности. Модифицированным критерием Ж-критерия Вилкоксона считается Г-критерий Вилкоксона для связанных выборок [3].
III. Т-критерий Вилкоксона для связанных выборок. Как правило, он применяется для проверки однородности двух совокупностей с попарно сопряженными вариантами [3].
Достоинствами Ж- и Т-критериев Вилкоксона можно считать следующие:
1. Эти критерии применяются не только для малых выборок (5 < п < 8), но и для выборок размером 5 < п < 50 [2].
2. Выборки могут принадлежать порядковой или количественной шкале [4].
Недостатком является сложность расчетов [2].
Данные критерии также реализованы в программном обеспечении анализа данных Айе81а1;, 8Р88, 81ай8йса.
IV. Критерий Ансари-Брэдли. Этот критерий применяется только для независимых выборок, относится к группе критериев ранговой рандомизации и предназначен для статистической проверки нулевой гипотезы о равенстве дисперсий в двух независимых выборках при дополнительном условии, что медианы известны или равны. Критерий мало применяется отечественными исследователями, но популярен за рубежом [4].
Критерий Ансари-Брэдли рассчитывается с помощью программы 81а1Ба8е.
V. и-критерий Манна-Уитни является наиболее распространенным в практике непараметрического оценивания. Критерий применяется для проверки однородности двух независимых совокупностей одинаковой или разной численности [3].
Достоинства критерия:
1. Выборки могут принадлежать порядковой или количественной шкале [3].
2. Данный критерий прост в применении [2].
Недостатки критерия:
1. Наблюдения должны быть независимыми [3].
2. Сложность расчетов [2].
Методика расчета представлена на рис. 1.
Проранжир оватъ полученный ряд и вновь
Рис. 1. Методика расчета ^/-критерия Манна-Уитни [5]
Данный критерий тестируется в программном обеспечении анализа данных Айе8Ш, 8Р88, 81ай8йса.
VI. Критерий Q Розенбаума применяется для оценки различий между двумя независимыми выборками по уровню какого-либо признака или свойства, измеренного количественно [3].
Данный критерий реализован в программном обеспечении анализа данных SPSS.
VII. Критерий серий Вальда-Вольфовица предназначен для проверки нулевой гипотезы о равенстве ряда параметров двух независимых выборок, включая медианы и коэффициенты асимметрии. Критерий применяется в случае, если исследователя интересует, имеют ли место любые различия между генеральными совокупностями. Серия составляется таким образом. Сначала вычисляется медиана, а затем берется каждое отдельное значение и сравнивается с медианой. Если выбранное значение больше медианы, то ставится, например, плюс, а если меньше - минус. Таким образом данные приводятся к бинарному виду. Определив фактическое количество серий, в специальной таблице необходимо найти критическое значение Лкр (числа серий) для выборок « и n2. При использовании критерия серий для двух выборок нас интересует только нижнее значение Лкр, соответствующее различным значениям выборок. Если полученные фактические значения R не выходят за нижние пределы критического значения R^, т.е. R > Rrf, то нулевая гипотеза Н0 об однородности генеральных совокупностей выборок принимается, а в противном случае - отвергается [4].
Критерий серий Вальда-Вольфовица рассчитывается в программе Statistica и SPSS.
VIII. Критерий Колмогорова-Смирнова - это непараметрическая альтернатива t-критерию Стьюдента для независимых выборок. По критерию Колмогорова-Смирнова (критерию Смирнова) сравнивают функции распределения двух эмпирических рядов. Проверяется нулевая гипотеза о том, являются ли одинаковыми непрерывные функции распределения генеральных совокупностей, из которых взяты выборки, т.е. проверяется принадлежность двух выборок одной и той же генеральной совокупности при условии непрерывности ее функции распределения [4].
Этот критерий рассчитывается в программах Microsoft Exсel, SPSS и Statistica.
IX. Критерий Х2 (хи-квадрат) применяется для сравнения распределений объектов двух совокупностей на основе измерений по шкале наименований в двух независимых выборках. Критерий предназначен для проверки нулевой гипотезы о том, что исследуемые случайные величины имеют одинаковое распределение. Критерий Х 2 можно рассчитать с помощью программы Microsoft Exсel, SPSS и Statistica [2].
X. Критерий знаков (критерий знаков Фишера) предназначен для проверки гипотезы об однородности распределения совокупности, что эквивалентно проверке гипотезы о равенстве функций распределения. Критерий часто используется при сравнении эффективности двух различных способов воздействия на n объектов, и, таким образом, он может применяться и для связанных выборок. Выборки могут принадлежать порядковой или количественной шкале. Требованием является равная численность сравниваемых выборок, в том числе и независимых выборок [2], например, показатели одних и тех же больных до приема препарата и после; показатели роста или
урожайности пары кустов, растущих рядом, при этом один из пары получает дополнительную подкормку или обработку. Иногда такие проверки называют проверкой наличия эффекта обработки [6].
Критерий знаков - простой для проверки однородности критерий, не требующий сложных вычислений. Основным недостатком этого критерия является «неэкономное» использование информации, содержащейся в результатах наблюдений, поэтому его обычно рекомендуют применять только на стадии предварительного анализа. Кроме того, этот критерий можно использовать лишь для выборок одинакового объема [7].
Критерий знаков рассчитывается с помощью программ 81ай8йса, 8Р88.
XI. Критерий медианы (медианный критерий) применяется для проверки однородности двух независимых совокупностей одинаковой или разной численности. Выборки могут принадлежать порядковой или количественной шкале [2].
Медианный критерий имеет низкую эффективность для диапазона выборок от умеренного до большого размера, и в значительной степени расценивается как устаревший. Критерий Вилкоксона-Манна-Уитни для двух выборок лучше работает в этом случае. Считают, что медианному критерию нет никакой альтернативы, когда одно или более наблюдений находятся «за пределами шкалы». Существенное различие между двумя критериями состоит в том, что медианный критерий учитывает только положение каждого наблюдения относительно совокупной медианы, тогда как критерий Вилкоксона-Манна-Уитни принимает во внимание ранг каждого наблюдения и более показателен [8].
Медианный критерий рассчитывается в программе 81ай8йса.
XII. Непараметрические множественные сравнения. Непараметрические критерии могут быть использованы для сравнения двух групп выборок между собой [4].
Иногда задача заключается в том, чтобы сравнить несколько групп с единственной - контрольной. В этом случае лучше всего использовать специальный метод сравнения - критерий Даннета. Критерий Даннета - это вариант критерия Ньюмена-Кейлса, предназначенный для сравнения нескольких групп выборок с одной контрольной [9].
Таким образом, в работе показано, что существует очень много различных непараметрических критериев, выбор которых в основном будет определяться целями и задачами исследования, наличием и качеством эмпирической базы и программных средств обработки данных.
Список литературы
1. Электронный учебник по статистике 81а!8ой. - ШЬ: ШрУ^йой.т/ЬошеЛеХЬоок/ то^ез/БШопраг.Ь^
2. Гайдышев, И. Моделирование стохастических и детерминированных систем: Руководство пользователя программы АйеБОД версия 2013 г. / И. Гайдышев. - иКЬ: http://attestatsoft.narod.ru/download/AtteStat_Manual.pdf
3. Будрейка, Н. Н. Использование непараметрических критериев проверки статистических гипотез / Н. Н. Будрейка. - М., 2008.
4. Гайдышев, И. Анализ и обработка данных: специальный справочник / И. Гайдышев. - СПб. : Питер, 2001.
5. Алгоритмика, статистика и теория вероятностей. - иКЬ: http://matstats.ru
6. Лапач, С. Н. Статистические методы в медико-биологических исследованиях с использованием Excel / С. Н. Лапач, А. В. Чубенко, П. Н. Бабич. - М., 2001.
7. Ивченко, Г. И. Введение в математическую статистику / Г. И. Ивченко, Ю. И. Медведев. - М., 2010.
8. Профессиональный информационно-аналитический ресурс, посвященный анализу данных. - 2012. - URL:http://www.machinelearning.ru
9. Гланц, С. Медико-биологическая статистика / С. Гланц. - М., 1999.
Андреева Виктория Александровна
студентка,
Пензенский государственный университет E-mail: [email protected]
Будлянская Анастасия Валерьевна
Елфимова Мария Олеговна
студентка,
Пензенский государственный университет E-mail: [email protected]
Кошевой Олег Сергеевич доктор технических наук, профессор, кафедра государственного управления и социологии региона,
Пензенский государственный университет E-mail: [email protected]
Andreeva Viktoriya Aleksandrovna student,
Penza State University
Budlyanskaya Anastasiya Valer'evna
student,
Penza State University
Efimova Mariya Olegovna student,
Penza State University
Koshevoy Oleg Sergeevich doctor of technical sciences, professor, department of government and public administration,
Penza State University
студентка,
Пензенский государственный университет E-mail: [email protected]
УДК 331 Андреева, В. А.
Общая характеристика непараметрических методов оценки статистической связи / В. А. Андреева, А. В. Будлянская, М. О. Елфимова, О. С. Кошевой // Модели, системы, сети в экономике, технике, природе и обществе. - 2013. - № 3 (7). - С. 221-226.