Научная статья на тему 'Методические особенности применения t-критерия Стьюдента в медико-биологических исследованиях'

Методические особенности применения t-критерия Стьюдента в медико-биологических исследованиях Текст научной статьи по специальности «Математика»

CC BY
3009
468
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Acta Biomedica Scientifica
ВАК
Область наук
Ключевые слова
ТИП РАСПРЕДЕЛЕНИЯ / СВЯЗНЫЕ И НЕСВЯЗНЫЕ ВЫБОРКИ / КРИТЕРИИ χ 2 / T-КРИТЕРИЙ СТЬЮДЕНТА / F-КРИТЕРИЙ ФИШЕРА / МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ / χ 2 CRITERIA / STUDENT''S T-CRITERIA / FISHER''S F-CRITERIA / DISTRIBUTION TYPE / APPARENT AND NON-APPARENT SAMPLES

Аннотация научной статьи по математике, автор научной работы — Ильин Владимир Петрович

В работе приводятся методические особенности применения в медико-биологических исследованиях параметрического t-критерия. Стьюдента в связных и несвязных выборках для. количественных переменных, включающих оценку типа распределения, сравнение дисперсий и средних в двух и более группах.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODICAL ASPECTS OF USE STUDENT’S T-CRITERION IN BIOMEDICAL RESEARCH STUDIES

The article presents methodical peculiarities of use of parametric Student's t-criterion in biomedical studies in apparent and non-apparent samples for quantitative variables, including estimation of distribution type, comparison, of dispersions and. averages in two and. more groups.

Текст научной работы на тему «Методические особенности применения t-критерия Стьюдента в медико-биологических исследованиях»

УДК 614.1

В.П. Ильин

МЕТОДИЧЕСКИЕ ОСОБЕННОСТИ ПРИМЕНЕНИЯ Т-КРИТЕРИЯ СТЬЮДЕНТА В МЕДИКО-БИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ

Учреждение Российской академии медицинских наук Научный центр проблем здоровья семьи

и репродукции человека Сибирского отделения РАМН (Иркутск)

В работе приводятся методические особенности применения в медико-биологических исследованиях параметрического t-критерия Стьюдента в связных и несвязных выборках для. количественных переменных, включающих оценку типа распределения, сравнение дисперсий и средних в двух и более группах. Ключевые слова: тип распределения, связные и несвязные выборки, критерии х2, t-критерий Стьюдента, F-критерий Фишера, множественные сравнения

METHODICAL ASPECTS OF USE STUDENT’S T-CRITERION IN BIOMEDICAL RESEARCH STUDIES

V.P. Iljin

Scientific Center of Family Health Problems and Human Reproduction SB RAMS, Irkutsk

The article presents methodical peculiarities of use of parametric Student's t-criterion in biomedical studies in apparent and non-apparent samples for quantitative variables, including estimation of distribution type, comparison of dispersions and averages in two and. more groups.

Key words: distribution type, apparent and non-apparent samples, х2 criteria, Student’s t-criteria,

Fisher's F-criteria

В настоящее время ощущается настоятельная потребность в критическом осмыслении корректности применения статистических методов как основы доказательности выводов и трактовки результатов, полученных в медико-биологических исследованиях. Актуальность данной работы обусловлена несколькими причинами. Одна из них связана с увеличением числа работ, выполняемых соискателями, которые, как правило, не имеют должного математического образования, понимания и умения, а чаще лишь осознают необходимость в применении разнообразных математических приемов доказательства. Второй существенной причиной является доступность и легкость использования самих статистических методов, реализованных в различных программных продуктах. Поэтому только ленивый не преминёт их использовать в украшении своей работы. В итоге мы имеем то, что имеем: соискатели играючи вставляют в свои работы различные статистические критерии без должной научной проработки проблемы применения статистических методов.

Применять статистические методы в исследовательских работах необходимо, но при этом важно понимать методические основы и возможности применения методов параметрического, непараметрического анализов и использовать эти методы корректно! Выбор методов анализа зависит от шкалы, в которой замерены изучаемые переменные, и законов распределения наблюдаемых величин. Непрерывные переменные (такие, как концентрация различных веществ, артериальное давление и т.д.) допускают изучение параметров распределения положения (средних, медиан, ...) и рассеяния (дисперсий, стандартных отклонений), а категориальные и порядковые переменные требуют иных методов (непараметрических или таблиц сопряженности).

Исторически сложилось так, что измерительные, вычислительные и доказательные статистические методы анализа непрерывных переменных разрабатывались и применяются в настоящее время на основе нормального распределения, как доказано для достаточно больших по объему выборок и распределений, близких к нему и имеющих умеренные отклонения от нормального значения [1, 2, 3, 4, 5, 6].

Распространенными методами описания выборки и последующего сравнения двух и более выборок в медико-биологических исследованиях являются параметрические методы, предполагающие редукцию информацию, т.е. свертку первичных исходных данных, представляющих в дескриптивном виде набор параметров, адекватно заменяющих первичные данные, позволяющих проводить сравнение параметров, наиболее полно описывающих распределения переменной. Распределение описывается положением центра (среднее выборки, медиана, ...) и удалением отдельных значений от центра (рассеянием, дисперсией). Среднее значение и стандартное отклонение суть характеристики гауссовой кривой или нормального распределения. В соответствии с законом больших чисел Бернулли, при достаточно большом объеме наблюдений (критерием оценки является сходимость по вероятности) выборочные среднее и дисперсия являются состоятельными оценками параметров распределения. Смысл этого этапа заключается в замене реальных данных, полученных в исследовании, моделью нормального распределения, имеющего конкретные значения средней величины и дисперсии, т.е. двух параметров, определяющих некую кривую нормального распределения из бесконечного множества кривых нормального распределения. Критериев оценки близости (согласия) реальных

данных кривой нормального распределения, полученной в исследовании по значениям среднего и дисперсии, достаточно много. Наиболее известные из них — х2 и критерий Колмогорова — Смирнова. Можно также провести сравнения по коэффициентам асимметрии и эксцесса.

Если по одному из критериев согласия принята гипотеза о нормальности распределения, то с этого момента реальные данные заменены на параметрическую модель, имеющую значения параметров распределения, полученных в реальном исследовании. Дальше проводится сравнение групп между собой по значениям параметров распределений, как правило, по средним и дисперсиям изучаемых выборок с учетом их численности. Критериев сравнения существует множество. Наиболее известные: t-критерий Стьюдента сравнения средних величин и F-критерий Фишера сравнения дисперсий. Известно [1], что t-критерий является робастным, т.е. малочувствительным к умеренным отклонениям от нормальности. Из этого следует, что одна и та же кривая нормального распределения может быть сопоставлена множеству реальных наблюдаемых данных, мало отличающихся друг от друга. При этом очень важно, чтобы сравниваемая переменная величина была измерена в метрической шкале. Умеренное отклонение исходной переменной от нормальности, тем не менее, означает наличие симметрии распределения, отсутствие нескольких «горбов» и «выскакивающих» значений. Принципиальным условием оценки средних является заключение о равенстве или неравенстве дисперсий. Одна из двух гипотез (нулевая о равенстве групповых средних или альтернативная о различии групповых средних) по t-критерию Стьюдента принимается при отсутствии различий дисперсий. Случай сравнения средних при неравенстве дисперсий представляет собой известную проблему Фишера — Беренса [4]. В этом случае рекомендуется применять критерии Уэлча (Welch) либо методы дисперсионного анализа (критерии Тьюки) [2, 4].

Какие тонкости существуют на этапе сравнения параметров распределения? Следует различать выборки по взаимному соотношению: независимые и зависимые выборки. Примером независимых выборок может служить сравнение показателей группы здоровых с группой больных. В этом случае необходимо применять t-критерий Стьюдента для независимых выборок. Примером зависимых выборок служит сравнение группы пациентов до лечения с этой же группой пациентов после лечения. При зависимых выборках стандартные отклонения, как правило, уменьшаются, а разница средних увеличивается. В этом случае необходимо применять t-критерий Стьюдента для зависимых выборок, более тонко учитывающий парные изменения [2, 3, 4, 6].

Особый случай представляет сравнение среднего значения показателя в группе с некоторой

константой, выражающей норму или табличное значение. В этом случае применяется одновыборочный t-критерий Стьюдента [4, 6].

К особенностям применения t-критерия Стьюдента следует отнести множественные сравнения: когда выявляются попарные различия более чем в двух выборках. При многократном попарном сравнении вероятность ошибочно найти различия там, где их нет, значительно возрастает. В этом случае необходима коррекция числа степеней свободы и критического уровня значимости по формулам Бонферрони:

n1 = n х m / 2; a1 = a / k, где: n — исходное число степеней свободы, m — число сравниваемых выборок, a — исходный уровень значимости, k — число сравнений. Поправка Бонферрони применима при числе групп менее 6. В противном случае рекомендуется метод Шеффе однофакторного дисперсионного анализа [3, 4, 6].

Таким образом, применение t-критерия Стьюдента для сравнения средних значений не является тривиальной одношаговой процедурой. Для корректного применения этого критерия необходимо провести несколько подготовительных шагов, включающих проверку симметрии распределения, отсутствие выскакивающих значений и многих горбов, оценить распределение на предмет близости к нормальному, сравнить дисперсии, выбрать нужный вариант t-критерия Стьюдента одновыборочный или для зависимых, независимых групп; при сравнении более двух групп — вычислить поправки Бонферрони. Из этого следует, что применению t-критерия Стьюдента предшествует вычисление хотя бы двух критериев: согласия х2 и F-критерия Фишера сравнения дисперсий. Если в научной работе приводится только один t-критерий Стьюдента, то, скорее всего, работа выполнена некорректно с точки зрения доказательных методов.

ЛИТЕРАТУРА

1. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ; пер. с англ. — М.: Мир, 1982. - 488 с.

2. Боровиков В. Statistica: искусство анализа данных на компьютере. Для профессионалов. — СПб.: Питер, 2001. — 656 с.

3. Гланц С. Медико-биологическая статистика; пер. с англ. — М.: Практика, 1998. — 459 с.

4. Закс Л. Статистическое оценивание; пер. с нем. В.Н. Варыгина / под ред. Ю.П. Адлера, В.Г. Горского. — М.: Статистика, 1976. — 598 с.

5. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия; пер. с англ. Ю.Н. Благовещенского. — М.: Финансы и статистика, 1982. — 317 с.

6. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. — М.: Медиасфера, 2002. — 312 с.

Сведения об авторах

Ильин Владимир Петрович - доктор биологических наук, профессор, ведущий научный сотрудник Научного центра проблем здоровья семьи и репродукции человека СО РАМН (664000, г Иркутск, ул. Тимирязева, 16; тел.: 8 (3952) 20-74-05)

i Надоели баннеры? Вы всегда можете отключить рекламу.