Расчёт величины эффекта при применении непараметрических критериев сравнения выборок в психологических исследованиях с
использованием программы R
И.В. Куприянов Южный федеральный университет, Ростов-на-Дону
Аннотация: Рассматривается актуальность применения методов расчёта величины эффекта при проведении статистического анализа результатов психологических исследований и ограниченность применимости уровня статистической значимости; приводятся методики расчёта величины эффекта при использовании распространённых непараметрических критериев сравнения выборок и реализация этих методик с помощью функций для системы статистического анализа R. Отмечаются преимущества системы R по сравнению с другими пакетами для статистической обработки и возможность использования её в образовательном процессе.
Ключевые слова: величина эффекта, непараметрическая статистика, ранговые критерии, критерий Манна-Уитни, критерий Уилкоксона, критерий Краскала-Уоллиса, критерий Фридмана, математическая статистика, система статистического анализа R.
Уровень статистической значимости p, представляющий собой вероятность получить имеющийся или более сильно выраженный результат эмпирического исследования в случае, если верна нулевая гипотеза H0, давно и широко используется для подтверждения достоверности проведённого психологического исследования. Однако в то же время всё более очевидной становится ограниченность этого показателя и невозможность использовать одну лишь статистическую значимость для выводов о таких характеристиках, как воспроизводимость результатов исследования или степень выраженности изучаемого явления. Уделение излишнего внимания статистической значимости и некорректное использование этого показателя в научных, в том числе психологических исследованиях, рассматривалось во многих работах, среди которых можно выделить часто цитируемую статью Дж. Коэна "The Earth Is Round (p<.05)", отмечавшего, в частности, что метод проверки значимости нулевой гипотезы не только не способствовал развитию психологии как науки, но и серьёзно тормозил его[1].
В противовес этому всё большее внимание уделяется практической или научной значимости, которая может быть измерена таким показателем, как величина эффекта, т.е. количественная характеристика степени выраженности наблюдаемого в эксперименте эффекта или силы взаимосвязи изучаемых явлений. С другой стороны, величина эффекта может рассматриваться как характеристика соответствия теоретической модели изучаемого явления данным эксперимента или наблюдения (например, при проведении дисперсионного или регрессионного анализа)[2].
Существуют разные подходы к расчёту величины эффекта в зависимости от выбранной методики статистической обработки результатов исследований. Так, ещё в 1924 году Р. Фишером было предложено использование показателя величины эффекта п (эта-квадрат, отношение объяснённой межгрупповыми различиями дисперсии к общей дисперсии выборки) при дисперсионном анализе[2].
Всё больше научных журналов, в т.ч. и психологических, требуют указания величины эффекта в публикуемых статьях. Методика расчёта величины эффекта является, таким образом, актуальным вопросом психологических исследований.[2,3]. При этом в таких популярных статистических программах, как SPSS и STATISTICA, расчёт величины эффекта для многих методик не предусмотрен.
Для проведения расчёта величины эффекта в связи с этим предлагается использовать свободно распространяемую среду статистической обработки R, имеющую ряд преимуществ по сравнению с другими статистическими программами [4]. К числу таких преимуществ можно отнести лицензию программы, допускающую её свободное и бесплатное распространение, наличие многочисленной литературы, в том числе на русском языке [5, 6]. Ещё одним преимуществом является лёгкость создания и применения пользовательских функций. Всё это делает
возможным выбор компьютерного пакета R в качестве средства для обучения будущих психологов методам статистической обработки данных, что позволит развить их компьютерные навыки и обучить применению на практике современных методов статистического анализа научных данных, в то же время избавив от необходимости ручных математических вычислений, повысить профессиональную компетентность выпускников психологических факультетов [7].
Одной из наиболее обычных задач в психологии является задача сравнения двух или нескольких выборок, для чего широко используются непараметрические или ранговые критерии, не накладывающие ограничений на характер распределения данных [8]. В связи с этим для расчёта величины эффекта при применении этих критериев сравнения выборок нами были созданы следующие пользовательские функции для среды R:
Две независимые выборки. При сравнении двух независимых выборок и использовании критерия Манна-Уитни (известного также как критерий Уилкоксона-Манна-Уитни, критерий суммы рангов Уилкоксона) величина эффекта может быть рассчитана по методу Х. Вендта как показатель рангово-бисериальной корреляции [9]. Для реализации этого метода используется функция:
u.mann.whitney.effect.size <- function (x, y) {
test <- wilcox.test (x, y, paired=FALSE)
attributes (test$statistic) <- NULL
n1 <- length (x); n2 <- length (y)
w2 <- n1*n2-test$statistic
u <- min (test$statistic, w2)
effect <- 1-2*u/(n1*n2)
c (U=u, "Rank-biserial r"=effect) }
Аргументами этой функции являются два числовых вектора (выборки), а результатом вычисления -- значение критерия Манна-Уитни U и величина эффекта r, принимающая значения от 0 (полное отсутствие эффекта) до 1 (максимальная выраженность эффекта).
Две зависимые выборки. Для сравнения двух зависимых выборок используется T-критерий Уилкоксона, а величина эффекта может быть рассчитана по формуле Д. Керби [10]. Реализующая эти вычисления функция:
t.wilcox.effect.size <- function (x, y) {
test <- wilcox.test (x, y, paired=TRUE); diff <- c(x-y)
attributes (test$statistic) <- NULL
diff <- diff [diff!=0]
n <- length (diff)
ranksum <- n*(n+1)/2
statistic2 <- ranksum - test$statistic
W <- test$statistic - statistic2
effect <- test$statistic/ranksum - statistic2/ranksum
c (T=min (test$statistic, statistic2), W=W, "r rank correlation"=effect) }
Аргументы: два числовых вектора (выборки) одинакового размера. Результатом являются значения критерия T и W и величина эффекта r.
Более двух независимых выборок. Используемый в этой ситуации непараметрический критерий Краскала-Уоллиса может быть рассмотрен как непараметрический аналог дисперсионного анализа (ANOVA), и для расчёта
величины эффекта могут быть использованы аналогичные используемым в
22
дисперсионном анализе коэффициенты п и е (эта-квадрат и эпсилон-квадрат)[3]. Функция R:
kruskal.test.effect.size <- function (x, g) {
data.list <- split (x, g) test <- kruskal.test (data.list) k <- length (data.list) n <- length (x)
attributes (test$statistic) <- NULL eta.squared <- (test$statistic-k+1)/(n-k) epsilon.squared <- test$statistic/((nA2-1)/(n+1))
c (H=test$statistic, "Eta squared"=eta.squared, "Epsilon
squared"=epsilon.squared) }
Аргументы: числовой вектор (переменная) x, содержащий данные всех исследуемых выборок; равный ему по длине фактор (группирующая переменная) g, содержащий названия выборок, к которым относятся соответствующие наблюдения. Результаты: значение критерия Краскала-Уоллиса H, значение коэффициентов ц2 и s2.
Более двух зависимых выборок. В качестве критерия сравнения выборок в такой ситуации обычно используется критерий х Фридмана, а в качестве показателя величины эффекта можно использовать коэффициент конкордации W Кендалла [3], что реализовано в функции: friedman.test.w.kendall <- function (x,...) { if (is.matrix(x)) { test.data <- x } else { test.data <- cbind (x,...)} test <- friedman.test (test.data) attributes (test$statistic) <- NULL n <- nrow (test.data); k <- ncol (test.data) w <- test$statistic / (n*(k-1)) c ("Chi squared"=test$statistic, "Kendall's W"=w)
}
Аргументы: матрица, содержащая выборки с данными, либо отдельные числовые векторы (выборки) с данными одинаковой длины. Результат: значение критерия Фридмана и значение коэффициента W Кендалла.
Приведённый код функций может быть непосредственно выполнен в среде R путём простого копирования текста, после чего функции могут быть использованы так же, как и стандартные функции языка R, и применяться как в научной деятельности, так и при обучении студентов.
Литература
1. Cohen, J., 1994. The Earth Is Round (p<.05). American Psychologist, 49(12): pp. 997-1003.
2. Thompson, B., 2013. Overview of Traditional/Classical Statistical Approaches. The Oxford Handbook of Quantitative Methods. Volume 2: Statistical Analysis, New York: Oxford University Press, pp: 7-25.
3. Tomczak, M. and E. Tomczak, 2014. The Need to Report Effect Size Estimates Revisited. An Overview of Some Recommended Measures of Effect Size. Trends in Sport Sciences, 21(1): pp.19-25.
4. Куприянов И.В. Использование свободно распространяемого программного обеспечения при обучении студентов-психологов методам статистической обработки данных // Современные информационные технологии: тенденции и перспективы развития. Материалы конференции. Ростов-на-Дону: 2014. С. 245-247.
5. Мастицкий С.Э., Шитиков В.К. Статистический анализ и визуализация данных с помощью R. - Электронная книга // R: Анализ и визуализация данных URL: r-analytics.blogspot.ru/2014/12/r.html
6. Наглядная статистика. Используем R! / Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г., М.: ДМК Пресс, 2014. 298 с.
7. Нестерова А.В. Применение компьютерных технологий при обучении студентов математике // Инженерный вестник Дона, 2013, №2 URL: ivdon.ru/ru/magazine/archive/n3y2013/1956
8. Власов М.А. Статистический анализ выборок курсов валют с помощью ранговых критериев // Инженерный вестник Дона, 2013, №2 URL: ivdon.ru/ru/magazine/archive/n2y2013/1658
9. Wendt, H.W., 1972. Dealing with a common problem in Social science: A simplified rank-biserial coefficient of correlation based on the U statistic. European Journal of Social Psychology, 2(4): pp. 463-465.
10.Kerby, D.S., 2014. The simple difference formula: An approach to teaching nonparametric correlation. Innovative Teaching, 3(1). Date Views 17.05.2016 URL: amsciepub.com/doi/pdf/10.2466/11.IT.3.1.
References
1. Cohen, J., 1994. The Earth Is Round (p<.05). American Psychologist, 49(12): pp. 997-1003.
2. Thompson, B., 2013. Overview of Traditional.Classical Statistical Approaches. The Oxford Handbook of Quantitative Methods. Volume 2: Statistical Analysis, New York: Oxford University Press, pp: 7-25.
3. Tomczak, M. and E. Tomczak, 2014. The Need to Report Effect Size Estimates Revisited. An Overview of Some Recommended Measures of Effect Size. Trends in Sport Sciences, 21(1): pp. 19-25.
4. Kupriyanov I.V. Sovremennye informatsionnye tekhnologii: tendentsii i perspektivy razvitiya. Materialy konferentsii. Rostov-na-Donu 2014. pp. 245-247.
5. Mastitskiy S.E., Shitikov V.K. Statisticheskiy analiz i vizualizatsiya dannykh s pomoshch'yu R. Elektronnaya kniga. [Statistical analysis and visualization of data with R. - E-book.] R: Analiz i vizualizatsiya dannykh URL: r-analytics.blogspot.ru/2014/12/r.html
6. Naglyadnaya statistika. Ispol'zuem R! [Explicit statistics. Using R!]. Shipunov A.B., Baldin E.M., Volkova P.A., Korobeynikov A.I., Nazarova S.A., Petrov S.V., Sufiyanov V.G., M. DMK Press, 2014. 298 p.
7. Nesterova A.V. Inzenernyj vestnik Dona (Rus), 2013, №2 URL: ivdon.ru/ru/magazine/archive/n3y2013/1956
8. Vlasov M.A. Inzenernyj vestnik Dona (Rus), 2013, №2 URL: ivdon.ru/ru/magazine/archive/n2y2013/1658
9. Wendt, H.W., 1972. Dealing with a common problem in Social science: A simplified rank-biserial coefficient of correlation based on the U statistic. European Journal of Social Psychology, 2(4): pp. 463-465.
10.Kerby, D.S., 2014. The simple difference formula: An approach to teaching nonparametric correlation. Innovative Teaching, 3(1). Date Views 17.05.2016 URL: amsciepub.com/doi/pdf/10.2466/11.IT.3.1.