УДК 614.1
В.П. Ильин
методические особенности применения статистических непараметрических методов в анализе медико-биологических данных
Учреждение Российской академии медицинских наук Научный центр проблем здоровья семьи
и репродукции человека Сибирского отделения РАМН (Иркутск)
В работе приводятся методические особенности применения непараметрических методов (критерии Манна — Уитни, Вилкоксона, Краскала — Уоллиса, х2 Фридмана) в зависимых и независимых выборках для количественных переменных в двух и более группах при проведении, медико-биологических исследований.
Ключевые слова: непараметрические критерии, зависимые и независимые выборки, множественные сравнения
METHODICAL PARTICULARITIES OF USING OF NONPARAMETRIC METHODS IN MEDICAL AND Biological RESEARCH WORK
V.P. Iljin
Scientific Center of Family Health Problems and Human Reproduction SB RAMS, Irkutsk
Methodical particularities of using of nonparametric methods (Mann — Whitney, Wilcoxon, Kruska! — Wallis, X2 Fridman criteria) in dependent and independent samples for quantitative variables in 2 and. more groups at the realization, of medical and. biological studies.
Key words: nonparametric criteria, dependent and independent samples, plural comparisons
Известно [1, 2, 3, 4, 5, 6], что основной причиной применения непараметрических критериев при проведении медико-биологических исследований является отсутствие нормальности распределения изучаемой переменной. Нормальность распределения сильно зависит от численности выборки. Выборочные распределения показателей в группах численностью 50 и более единиц наблюдения (cases), как правило, являются нормально распределенными. Распределения показателей численностью менее 50 единиц, но более 25, если не распределены нормально, не имеют нескольких «горбов» и значительного числа «выскакивающих» значений, зачастую допускают возможность сведения к нормальному распределению при помощи различных математических преобразований. Распределения показателей, изначально отличающиеся от нормальных, с численностью в группе менее 20 единиц значительно редко удается свести к нормальному распределению.
Что надо помнить при выборе параметрического или непараметрического метода? Параметрические методы более чувствительны, полнее, а значит, результаты, полученные с их помощью, допускают более точную и содержательную трактовку, чем их непараметрические аналоги. При выборе большую роль играет объем выборки. Так, если численность
— 100 и более единиц наблюдения, применение непараметрических методов нецелесообразно, даже если не выполняются некоторые условия применимости параметрических методов. Также ограничением в применении является численность 10 и менее единиц наблюдения в группе. Сам анализ можно проводить, но в этом случае результаты
являются очень грубыми и носят предварительный характер [2, 5, 6].
Другим основанием для применения непараметрического анализа является природа данных в проводимом исследовании. Так, параметрические методы предполагают, что первичные данные непрерывны. Однако результаты исследований могут быть представлены в порядковой шкале, т.е. ранжированы и представляют дискретную шкалу. В этом случае важнее не само значение изучаемой переменной, а его относительное место в ряду всех наблюдаемых значений. Попросту говоря, не важны точные количественные соотношения между наблюдаемыми значениями, а существенным является лишь соотношение «больше — меньше» или «хуже — лучше», что определяется рангом, номером, который присваивается каждому значению в ряду наблюдений, т.е. проводится замена реальных наблюдаемых значений их порядковыми номерами (рангами) в общем ряду. При этом теряется информация о степени различий: любые два соседних ранга отличаются на постоянную величину (единицу), в то время как их реальные значения отличаются на различные величины (какие- то близки, т.е. отличаются «чуть-чуть» друг от друга, а какие-то могут быть «очень» удаленными). В дальнейшем сам непараметрический анализ проводится уже не с первичными наблюдаемыми значениями, а с рангами, сопоставленными первичным данным. В этом случае, в принципе тип распределения не играет никакой роли. Моделью данных при проведении непараметрического анализа являются ранговые последовательности, заменяющие первичные сведения. Ранги являются
равноудаленными друг от друга в последовательности, в то время как первичные данные в изучаемых группах удалены друг от друга на неравномерные расстояния. Все это приводит к тому, что средний ранг не является оценкой среднего значения в группе. Ранги характеризуют различия межгрупповых распределений в целом и не могут заменять собой никакого параметра: среднего или дисперсии.
Многие начинающие исследователи приводят довод в пользу применения непараметрических методов в легкости вычисления критериев по сравнению с их параметрическими аналогами. Однако это довод из прошлого века, когда расчеты приходилось выполнять вручную или в лучшем случае на калькуляторе. Развитое программное обеспечение сделало доступным и легким применение различных критериев и видов анализа.
Какие методические особенности необходимо учитывать при проведении непараметрического анализа? Кроме численности, определяющую роль играет способ организации групп наблюдения. Следует различать парные независимые (несвязные), парные зависимые (связные) и множественные по парные сравнения независимых и зависимых групп. В любом случае основная (нулевая) статистическая гипотеза содержит утверждение об отсутствии различий между группами или принадлежности сравниваемых групп к одной генеральной совокупности. При отклонении нулевой гипотезы принимается альтернативная о наличии различий выборочных групп [2, 3, 4, 5].
Итак, по способу организации выборочных групп следует различать следующие варианты применения непараметрических критериев.
вариант 1. сравнение двух независимых групп
Независимость групп означает, что наблюдения ведутся в двух выборочных группах, в которых нет общности между единицами наблюдений. Таковыми могут быть группа здоровых и группа больных. Одним из наиболее мощных для сравнения двух независимых групп является критерий U Манна — Уитни (Mann — Whitney), который, в некотором смысле, служит альтернативой t-критерия Стьюдента. Идея критерия основана на представлении двух выборок в виде одной последовательности упорядоченных по возрастанию или убыванию единиц наблюдения и сопоставлению каждому значению ранга из общей группы. Равным значениям присваивается одинаковый ранг. В случае равномерного распределения рангов одной группы среди рангов сравниваемой группы принимается нулевая статистическая гипотеза. В случае преобладания на одном из концов общего ряда наблюдаемых значений одного ряда и, соответственно, на противоположном конце — преобладания членов другого ряда, т.е. наблюдается минимальное пересечение рангов. В такой ситуации отвергается нулевая гипотеза и принимается альтернативная о наличии значимых различий. Чем меньше совпадений в значениях рангов наблюдаемых выборочных
групп, тем больше различий в группах. И наоборот, большее перемешивание или пересечение рангов выборочных групп характеризует ситуацию, когда обе группы принадлежат одной генеральной совокупности, т.е. нет статистически значимых различий между группами [3, 5, 6].
Для практического использования в пакете статистических программ Statistica (StatSoft) в модуле непараметрических процедур в качестве альтернативы t-критерия Стьюдента приведены критерии U Манна — Уитни, Вальда — Вольфовица и двухвыборочный критерий Колмогорова — Смирнова [2].
вариант 2. сравнение двух зависимых групп
Зависимость групп означает, что наблюдения ведутся, как правило, с одними и теми же единицами наблюдений, разделенными каким-либо событием, либо имеющими некую общность между единицами наблюдений. Примером зависимых групп могут служить одни и те же пациенты до лечения (группа 1) и эти же пациенты после лечения (группа 2).
Наиболее статистически мощным аналогом t-критерия Стьюдента для зависимых групп является критерий Т Вилкоксона (Wilcoxon). При зависимых выборках стандартные отклонения, как правило, уменьшаются. В этой связи в соответствующих парах наблюдений вычисляются разности, которые затем и ранжируются. Подсчитываются суммы рангов для положительных и отрицательных разностей. Критическое сравнение критерия Т Вилкоксона основано на сравнении полученных оценках рангов с величиной 1/2, которая характеризует равную вероятность положительных и отрицательных значений разностей.
Для практического использования в пакете статистических программ Statistica (StatSoft) в модуле непараметрических процедур в качестве альтернативы t-критерия Стьюдента для зависимых групп приведены критерии Т Вилкоксона и знаков [2]. Отметим, что критерий знаков менее чувствителен к сдвигам [4, 6].
вариант 3. сравнение трех и более независимых групп
Наиболее распространенным непараметрическим критерием сравнения трех и более независимых групп является критерий H Краскала
— Уоллиса (Kruskal — Wallis), предназначенный для проверки однородности групп по уровню выраженности изучаемого признака. Если нулевая статистическая гипотеза об отсутствии различий отклоняется, то принимается альтернативная о статистически достоверных различиях в группах. Однако для выявления конкретной пары групп, имеющих статистические различия, необходимо в дальнейшем провести попарное сравнение групп по одному из критериев: U Манна — Уитни, Вальда
— Вольфовица или двухвыборочному критерию Колмогорова — Смирнова.
Идея построения критерия H Краскала — Уоллиса однотипна критерию U Манна — Уитни, оценивающего степень совпадения наблюдений изучаемых групп в общей последовательности всех наблюдаемых данных. Вычисляется средний ранг для общей последовательности и каждой из групп. Если средние ранги групп существенно не различаются и близки среднему рангу общей последовательности, то принимается гипотеза об отсутствии различий. В противном случае ранги в группах удалены и располагаются отдельными группами, хотя могут и пересекаться друг с другом. Обратим еще раз внимание на тот факт, что по результатам применения критерия H Краскала
— Уоллиса нельзя получить заключение о различиях в какой-либо конкретной группе. Для этого требуется последующее дополнительное попарное сравнение групп по одному из непараметрических критериев для независимых групп [2, 5, 6].
Для практического использования в пакете статистических программ Statistica (StatSoft) в модуле непараметрических процедур во вкладке сравнение нескольких независимых групп приведены критерии Краскала — Уоллиса и медианный тест [2].
вариант 4. сравнение трех и более зависимых групп
Наиболее распространенным непараметрическим критерием сравнения трех и более зависимых групп является критерий х2 Фридмана (Fridman), предназначенный для проверки однородности групп по уровню выраженности изучаемого признака при повторных измерениях. Данный критерий является аналогом параметрического однофакторного дисперсионного анализа (ANOVA) и, по сравнению с ним, при малых выборках обладает существенной большей статистической мощностью. Если нулевая статистическая гипотеза об
отсутствии различий отклоняется, то принимается альтернативная о статистически достоверных различиях. Для утверждения того, какие конкретные группы различаются, необходимо в дальнейшем провести попарное сравнение групп по критерию Т Вилкоксона.
Идея построения критерия х2 Фридмана основана на сравнении суммы рангов каждой из групп при повторных наблюдениях. Отсутствие статистических различий между суммами рангов в группах означает однородность в группах, и в этом случае принимается нулевая гипотеза. В противном случае принимается альтернативная гипотеза [2, 5, 6].
Для практического использования в пакете статистических программ Statistica (StatSoft) в модуле непараметрических процедур во вкладке сравнение нескольких зависимых переменных приведены процедуры рангового дисперсионного анализа [2].
литература
1. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ; пер. с англ. — М.: Мир, 1982. - 488 с.
2. Боровиков В. Statistica: искусство анализа данных на компьютере. Для профессионалов. — СПб.: Питер, 2001. — 656 с.
3. Гланц С. Медико-биологическая статистика; пер. с англ. — М.: Практика, 1998. — 459 с.
4. Закс Л. Статистическое оценивание; пер. с нем. В.Н. Варыгина / под ред. Ю.П. Адлера, В.Г. Горского. — М.: Статистика, 1976. — 598 с.
5. Кулаичев А.П. Методы и средства комплексного анализа данных; 4-е изд., перераб. и доп. — М.: Форум: Инфра-М., 2006. — 512 с.
6. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. — М.: Медиасфера, 2002.
— 312 с.
сведения об авторах
Ильин Владимир Петрович - доктор биологических наук, профессор, ведущий научный сотрудник Научного центра проблем здоровья семьи и репродукции человека СО РАМН (664000, г Иркутск, ул. Тимирязева, 16; тел.: 8 (3952) 20-74-05)