УДК 616-07:519.22
ВЫБОР МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА В МЕДИКО-БИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ
В.М. Мицура, М.Н. Стародубцева Гомельский государственный медицинский университет
В статье представлен обзор современных методов статистического анализа в медико-биологических исследованиях. Приведены основные определения и статистические процедуры, обычно применяемые при планировании и анализе медико-биологических данных с помощью программы STATISTICA. Показаны возможности и ограничения методов статистического анализа, основные ошибки, возникающие при их некорректном применении. Иллюстрацией служат оригинальные примеры статистического анализа из практики авторов.
Ключевые слова: статистический анализ, медико-биологические исследования.
CHOICE OF METHODS OF THE STATISTICAL ANALYSIS IN MEDICAL AND BIOLOGIC RESEARCHES
V.M. Mitsura, M.N. Starodubtseva Gomel State Medical University
In article the review of modern methods of the statistical analysis in medical and biologic researches is submitted. The basic definitions and the statistical procedures usually used at planning and the analysis of the medical and biologic data with the help of program STATISTICA are resulted. Opportunities and restrictions of statistical analysis methods, the basic mistakes arising on their incorrect application are shown. As an illustration original examples of the statistical analysis from practice of authors serve.
Key words: statistical analysis, medical and biologic researches.
Обобщенные количественно-качественные величины, характеризующие различные явления и процессы, являются статистическими показателями. В отличие от индивидуальных значений, называемых признаками, статистические показатели являются характеристиками какого-либо свойства совокупности (группы) в целом. Множество биологических и медицинских статистических признаков и показателей следуют нормальному распределению, при котором отклонения значений от среднего значения симметричны, причем малые отклонения более вероятны, а большие — менее вероятны. График такого распределения имеет колоколообразный вид (так называемая «кривая Гаусса»). Распределение статистического признака по нормальному распределению предполагает отсутствие зависимости (обратной связи) между членами статистической совокупности. Поэтому нормальную форму статистического распределения вероятности считают
частным случаем общего статистического распределения вероятности, так называемого фрактального распределения или распределения Парето [7]. Это распределение по сравнению с нормальным распределением имеет более толстые хвосты и выше пик в связи с наличием обратной связи между членами статистической совокупности. Известным примером такого рода распределения является пример из социологии: чем больше статей опубликовал академик, тем более вероятна его очередная публикация. Интенсивность публикаций академика подкрепляется активностью его учеников, аспирантов, молодых ученых.
При анализе большого объема статистических совокупностей независимых признаков, согласно предельной центральной теореме, распределение считают нормальным. Даже если изначальное распределение признака не подчинялось нормальному закону, то распределение, составленное из средних выборочных значений всевозможных выбо-
рок их этой генеральной совокупности, будет следовать нормальному закону распределения. Так, распределение показателей физического развития, колебания уровня гемоглобина, холестерина крови и т. п. среди большого количества здоровых людей обычно является нормальным.
Нормально распределенные статистические совокупности могут количественно описываться и сравниваться с помощью параметрических методов статистики. В клинических исследованиях, когда изучается ряд тех или иных показателей у больных, особенно при небольшом объеме выборке (менее 30), чаще всего нет оснований считать распределение нормальным, поэтому статистический анализ проводится с помощью непараметрических методов, не требующих нормальности распределения (табл. 1) [4, 8, 9]. Непараметрические методы отличаются простотой, для них не требуется вычислять ка-
кие-либо параметры (средние значения, стандартные отклонения и др.), поэтому они могут использоваться для анализа данных, не имеющих явного количественного выражения. Применение непараметрических критериев статистического анализа целесообразно на этапе разведочного анализа, при малом числе наблюдений (до 30), когда нет уверенности в соответствии закону нормального распределения. Однако если данных много (объем выборки более 100), то не имеет смысла использовать непараметрические критерии [9]. Следует также учитывать, что параметрические критерии мощнее непараметрических. Эффективность непараметрических методов по сравнению с параметрическими составляет 63-95% в зависимости от используемого метода. Кроме того, при использовании непараметрических критериев теряется часть полученной в опыте информации [8, 10].
Таблица 1
Наиболее распространенные статистические критерии, применяемые для решения типовых задач в области медицинской статистики
(по [8] с изменениями)
Сравниваемые показатели Параметрические тесты Непараметрические тесты Методы сравнения долей
Две независимые группы Критерий Стьюдента (двухвыбо-рочный), дисперсионный анализ Критерий Манна-Уитни, критерий Уилкоксона, медианный критерий Критерий х2, точный критерий Фишера
Более двух независимых групп Дисперсионный анализ, критерий Стьюдента для множественных сравнений, критерий Даннета Критерий Краскела-Уол-лиса, медианный критерий Критерий х2
Одна группа, связанные измерения Критерий Стьюдента для связанных пар (парный тест), дисперсионный анализ Т-критерий Уилкоксона, критерий знаков Критерий Мак-Нимара
Одна группа, несколько связанных измерений Дисперсионный анализ повторных измерений, критерий Шеф-фе для зависимых выборок Критерий Фридмана Критерий Кокрена
Два и более сопряженных ряда чисел (выявление коррелятивной связи) Коэффициент корреляции Пирсона Коэффициент ранговой корреляции Спирмена
Статистический анализ данных обычно проходит несколько этапов. Первым из них является проведение мероприятий по описательной статистике, то есть расчет количественных статистических показателей. Наиболее часто используемыми количественными статистическими показателями являются
среднее значение, медиана и среднеквадрати-ческое отклонение. Здесь же рассматривается вопрос о соответствии распределения нормальному распределению вероятности. Среднее значение (чаще всего используется среднее арифметическое) обозначается буквой М (Mean) — показатель центральной тенден-
ции, хорошо характеризует данные, которые группируются в определенном месте, и не пригодно, например, для временных рядов. Медиана — это срединная варианта, центральный член ранжированного ряда. Обозначается Me (Median) и используется для определения среднего уровня признака в числовых рядах с неравными интервалами в группах или если исходные данные представлены в виде качественных признаков. Медиану можно использовать вместо среднего значения, когда в числовом ряду мало значений и имеются «выскакивающие» варианты (при использовании непараметрических критериев). Среднеквадратичное отклонение о (другое ее название — стандартное отклонение, standard deviation, SD) характеризует разброс данных в выборке [2, 10].
Вторым этапом является статистическое оценивание, то есть проводится оценка параметров генеральной совокупности по параметрам выборочной совокупности. На этом этапе важно знание нормальности анализируемой статистической совокупности. В зависимости от этого возможно использование параметрических и непараметрических методов анализа данных для сравнения средних и дисперсий. На этом этапе рассчитываются границы доверительного интервала, в который с доверительной вероятностью попадает среднее значение генеральной совокупности, оцениваемое по выборочным параметрам. Границы доверительного интервала описываются стандартной ошибкой m (другое ее название - средняя квадратичная ошибка среднего выборочного, standard error of mean, SEM) в виде: M±m. Параметры m и о связаны между собой соотношением:
а
m = V"T
/2 V П
где n — объем выборки, а za/2 — коэффициент, связанный с доверительной вероятностью и объемом выборки [6]. Важно всегда в тексте работы приводить значения объема выборки и доверительной вероятности.
Следующим этапом является проверка статистических гипотез. В этих случаях результаты выборки используются для проверки предположений (гипотез) относительно тех или иных свойств распределения генеральной совокупности или сравнении параметров различных выборок.
Обычно проверяют справедливость предположения (нулевую гипотезу Но), противоположного результату, который желают получить. Тогда противоположная гипотеза называется альтернативной (Н1). Тестирование гипотез проводится на наличие различий между выборочными параметрами, средними значениями и дисперсиями. При этом важным параметром является уровень значимости (или мера надежности, р или а), это — вероятность ошибочности вашего вывода (например, о наличии статистически значимого различия между двумя группами). Если р меньше некой пороговой величины (в медико-биологических исследованиях принимается равной 0,05), считают, что вывод (например, о различии групп) можно признать статистически значимым. Величина 0,05 — это не обязательное, но рекомендуемое значение уровня значимости. Иногда уровень значимости р ошибочно называют «доверительной вероятностью». Доверительная вероятность имеет противоположный смысл (1-р). Тогда фраза в тексте статьи «доверительная вероятность считалась значимой < 0,05» обозначает: «мы доверяем нашим данным не более, чем на 5%». В связи с широким использованием англоязычных статистических пакетов на настоящий момент принято проводить тестирование гипотез по методу р-значения.
Использование выражения «достоверные различия (р<0,05)» считается некорректным. Вместо него следует использовать выражение «статистически значимые различия», а также вместо выражения р<0,05 приводить фактические значения достигнутого уровня значимости, например, р = 0,002 [5, 9]. При этом значение р меньше 0,05 указывает на высокую статистическую значимость различий параметров различных статистических совокупностей, значение р между 0,01 и 0,05 указывает на статистически значимые различия между совокупностями, а значении р больше 0,05 — на то, что нет оснований считать выборки принадлежащими различным генеральным совокупностям [10].
Нужно учитывать также, что не все статистически значимые различия являются клинически значимыми. Например, у двух групп больных уровни гемоглобина могут статистически значимо различаться (М1 = 130 г/л, М2 = 140 г/л), а клинически различие может быть совсем незначительным [2].
В практической деятельности также часто возникает необходимость выявления и оценки влияния отдельных факторов на изменчивость какого-либо признака. Под факторами обычно понимают также различные независимые показатели. Дисперсионный анализ позволяет устанавливать степень влияния факторов на изменчивость параметров статистической совокупности (среднего значения признака и его дисперсии). По количеству факторов, соответственно, называют однофакторный дисперсионный анализ, двухфакторный, трехфакторный [6].
Для анализа статистических данных в настоящее время используются многочисленные компьютерные программы, такие как Microsoft Excel, Microsoft Access, STATISTICA, SPSS, SAS и другие [3]. В электронных таблицах MS Excel есть возможность анализа данных с использованием многих статистических методов [4]. Чтобы активизировать функции статистического анализа в MS Excel, необходимо из меню «Сервис» выбрать команду «Надстройки» и в появившемся диалоговом окне установить флажок «Пакет анализа». После этой процедуры, зайдя в меню «Сервис», последним пунктом мы сможем увидеть команду «Анализ данных». Открыв его, можно выбрать статистический метод обработки данных. Из специализированных статистических пакетов самым популярным является STATISTICA. В настоящее время доступна 6-я версия этой программы, имеются специальные издания по работе с ней [1].
В пакете STATISTICA можно не только определить, соответствуют ли данные нормальному закону распределения, но и, в противном случае, описать их каким-либо другим законом [1, 3, 9].
Проверить соответствие полученных данных нормальному закону распределения можно двумя способами. Первый из них — с помощью построения графиков на нормальной вероятностной бумаге, второй — с помощью критериев согласия. Первый способ является «глазомерным», т. к. позволяет провести лишь наглядное сравнение. Упрощенно построение графиков на нормальной «вероятностной бумаге» можно представить следующим образом. На плоскости в двухмерной системе координат проводится прямая линия, построенная
путем математического расчета, рядом с которой откладываются значения полученных экспериментальных вариантов. Если все полученные экспериментальные данные располагаются на указанной прямой либо в непосредственной близости от нее, то распределение описывается нормальным законом. В программе STATISTICA v.6: «Basic Statistics and Tables — Descriptive statistics — Prob. & Scatterplots — Normal probability plot».
В отличие от «глазомерного» способа расчет критериев согласия более точно позволяет сопоставить полученные данные с каким-либо законом распределения. В тех случаях, когда ваши данные являются целыми числами (дискретными величинами), их сопоставление нужно проводить по критерию х2. Если же данные являются дробями, их нужно сопоставлять каким-либо законам распределения по критерию Колмогорова-Смирнова.
Рассчитать критерий Колмогорова-Смирнова для нормального распределения можно в модуле «Basic Statistics and Tables» программы Statistica. Для этого в аналогичном диалоговом окне либо из меню «Analysis» стартовой панели выбрать команду «Descriptive Statistics». Далее в разделе «Distribution» (в программе STATISTICA v.6 — «Normality») нужно установить флажок в строке «KS and Lilliefors test for normality». После этого необходимо нажать либо кнопку «Frequency tables», либо «Histograms». Выполнение указанной последовательности действий приведет к появлению таблицы частот (или гистограммы), где в верхней части указано значение коэффициента Колмогорова-Смирнова и уровень значимости р. Если показанный уровень значимости р>0,05, принимается нулевая гипотеза об отсутствии различий между теоретическим нормальным распределением и имеющимися данными. В таком случае данные могут быть описаны законом нормального распределения, т.е. можно применять параметрические критерии. Если же р < 0,05, нулевая гипотеза отвергается, распределение не может считаться нормальным, параметрические критерии не могут применяться. Например, надпись «K-S d = 09867, р > 0,20» означает, что коэффициент d Колмогорова-Смирнова равен 0,09867, а ваши данные описываются нормальным законом (р>0,20).
Несмотря на то, что критерии Колмогорова-Смирнова и X достаточно четко позволяют ответить на вопрос, каким законом описываются полученные данные, их недостатком является то, что при малых значениях выборки достоверность оценки снижается. Поэтому рекомендуется при малом числе наблюдений для оценки достоверности использовать оба способа: «глазомерный» и оценку по критериям согласия.
В тексте работы нужно указать, какие критерии проверки нормальности использовались. При этом можно ограничиться только тем, что привести значения использованных критериев проверки нормальности и значений «р = ...» с соответствующим комментарием. Помимо этой информации можно привести еще и графики. Это может быть либо гистограмма с линией ожидаемой нормальной функции плотности или функции распределения, либо же график распределения на «вероятностной бумаге».
Обычно краткое описание использованных методов статистики состоит из перечисления этих методов в традиционном разделе «Материалы и методы». Здесь же приводятся данные о размере (объеме) выборки, а также соответствующих групп и подгрупп, название статистических методов и критериев и значение критического уровня значимости. Весьма желательно показать соотношения отдельных подгрупп наблюдений по группирующим признакам, например, по полу, возрасту. Обычно это отражают в таблицах, давая значения доли в процентах для наблюдений по каждой подгруппе. При описании качественных признаков следует указать их природу — ранговые, порядковые или же номинальные, классификационные [5].
Параметрические метода анализа
Пример 1. В качестве примера использования параметрических статистических критериев в медицинских исследованиях приведем сравнение абсолютных и относительных уровней Т-хелперов у больных хроническим гепатитом С (ХГС), получающих интерферонотерапию (I группа) в сравнении с контрольной группой.
С помощью программы STATISTICA, v.6 вначале проверялось соответствие распределения значений Т-хелперов нормальному распределению. При оценке нормальности распределения по критерию Колмогорова-Смирнова (как описано выше) получены следующие значения: для относительного (в %) содержания Т-хелперов d = 0,102 и р>0,20; для абсолютного числа Т-хелперов d = 0,110 и р > 0,20. Таким образом, данные соответствуют нормальному распределению.
Для сравнения данных в исследуемых группах применяли критерий Стьюдента для независимых групп («t-test, independent» в модуле «Basic Statistics / Tables» программы STATISTICA). Группирующей вариантой (grouping) будет код группы (контроль/I группа), а зависимыми переменными (dependent) — значения Т-хел-перов. Программа рассчитывает ряд показателей (M, n, о, t-критерий Стьюдента и уровень его значимости р). Полученные данные внесены в таблицу (табл. 2). На основе анализа данных сделан вывод, что относительные и абсолютные уровни Т-хелперов у больных ХГС во время интер-феронотерапии значимо ниже, чем в контрольной группе (p = 0,003 и р = 0,011 соответственно).
Таблица 2
Значения Т-хелперов у больных ХГС, получающих интерферонотерапию
Показатель Контроль (M ± m, n = 26) I группа (M ± m, n = 36) р
Т-хелперы, % 40,54 ± 0,80 36,15 ± 1,06 p = 0,003
Т-хелперы, 109/л 0,49 ± 0,02 0,38 ± 0,04 p = 0,011
Пример 2. Часто именно форма кривой распределения имеет большое значение для выявления различий между статистическими совокупностями. В качестве при-
мера рассмотрим анализ данных изменения фазы колебаний консоли атомно-силового микроскопа при простукивании поверхностей контрольных эритроцитов и эритро-
цитов, подвергшихся воздействию окисляющего агента — пероксинитрита. Каждая картинка изменения фазы размером 0,5x0,5 мкм содержала более 1000 данных. Для статистического анализа было выбрано по 20 картинок трех различных групп: контроль (контроль 1), положительный контроль (контроль 2) и опытный образец. В качестве положительного контроля были использованы поверхности эритроцитов, обработанных де-активированным пероксинитритом. Распределение изменения фазы каждой картинки
принималось близким к нормальному в связи с большим объемом выборки (п>100). Кроме того, анализу подвергались выборки, составленные из средних значений параметров каждой картинки в пределах данного образца. Эти условия способствуют применению параметрических критериев сравнения данных. Проверке подвергалась гипотеза об отсутствии различий между статистическими совокупностями опытного и контрольных образцов (Но). Результаты статистического анализа представлены на рисунке.
Лф
Рис. 1. Плотность вероятности распределения разности фаз для контрольных (1 и 2) и опытных (3) образцов мембраны эритроцита
Распределение плотности вероятности изменения фазы было аппроксимировано функцией Гаусса (функцией нормального распределения) с помощью инструментов программы Origin со следующими параметрами (в градусах):
1 — M = 104,5 ± 0,8, 2а = 13,9 ± 3,63.
2 — M = 105,1 ± 0,4, 2а = 11,2 ± 2,44.
3 — M = 101,9 ± 0,9, 2а = 25,3 ± 3,82, а = 0,05, n = 20.
Наиболее важным результатом статистического анализа являлось то, что сред-неквадратические отклонение изменения фазы для опытных образцов статистически достоверно различалось от среднеквадра-тических отклонений контрольных образцов (р = 8,5 х10-5 для контроля 1, р = 4х10-7 для контроля 2 соответственно), что позволило сделать вывод об увеличении степени неоднородности структуры мембраны эритроцита при обработке пероксинитритом, не сопровождающееся изменением формы эритроци-
та, что может лежать в основе изменения транспортных свойств эритроцита.
Непараметрические методы анализа Пример 3. В качестве примера использования непараметрических критериев приведено сравнение уровней цитокина ФНО-а в исследуемых группах (обозначения групп, как в примере 1).
Вначале проверили с помощью программы STATISTICA, v.6 соответствие данных (значений ФНО-а) нормальному распределению. Получено значение критерия Колмогорова-Смирнова: d = 0,377 и р < 0,01. Таким образом, данные не соответствуют нормальному распределению.
Для сравнения данных в двух независимых группах применили тест Манна-Уитни («Mann-Whitney U test» модуля «Nonpara-metric Statistics»). Группирующей вариантой (grouping) будет код группы (контроль/I группа), а зависимой переменной (dependent) — числовые значения ФНО-а. Программа рас-
считывает ряд показателей (суммы рангов по группам, п, и, 2, и уровень значимости р). Для расчета уровня р среднее арифметическое (М), его ошибка (т), стандартное отклонение (о) не рассчитываются. Однако для указания, значение в какой группе является большим или меньшим, для описания в тексте используется среднее арифметическое (М) или медиана Ме (как в нашем случае, когда имеется несколько «выска-
кивающих вариант» в I группе, которые значительно завышают M).
Полученные данные представлены в таблице (табл. 3), медиану (Ме) вычислили в разделе «Ordinal descriptive statistics (median, mode,...)» модуля «Nonparametric Statistics». Сделан вывод, что уровни ФНО-а у больных ХГС во время интерферонотера-пии значимо выше, чем в контрольной группе (p = 0,005).
Таблица 3
Сывороточные уровни ФНО-а у больных ХГС, получающих интерферонотерапию
Цитокин Контроль (Ме, n = 10) I группа (Ме, n = 20) р
ФНО-а, пг/мл 6,0 60,39 p = 0,005
Таким образом, проблема выбора статистических методов анализа медико-биологических данных зависит от задач конкретного исследования. Знание основных возможных направлений статистического анализа и владение навыками работы со статистическими программами существенно упрощает получение и представление результатов в научных работах.
ЛИТЕРАТУРА
1. Боровиков В. 8ТЛТ18Т1СЛ. Искусство анализа данных на компьютере: Для профессионалов. 2-е изд. — СПб.: Питер, 2003. — 688 с.
2. Гемджян Э.Г. Статистическая обработка в медицине. http://www.ed.blood.ru.
3. Герасевич В.А. Компьютер для врача: Самоучитель. — СПб.: БХВ-Петербург, 2002. — 640 с.
4. Зайцев В.М., Зуева Л.П., Лифляндский В.Г. и др. Прикладная медицинская статистика — СПб.: СПбГМА им. И.И. Мечникова, 2000. — 300 с.
5. Леонов В. Три «Почему ...» и пять принципов описания статистики в биомедицинских публикациях. http://www.biometrica.tomsk.ru:8101/principals.htm.
6. Мацкевич И.П., Свирид Г.П. Высшая математика: теория вероятности и математическая статистика: Учеб. — Мн.: Выш. шк., 1993.— 269 с.
7. Петерс Э. Хаос и порядок на рынках капитала: новый аналитический взгляд на циклы, цены и изменчивость рынка. Пер. с англ. — М.: Мир, 2000. — 333 с.
8. Сергиенко В.И., Бондарева И.Б. Математическая статистика в клинических исследованиях. — М.: ГЭОТАР Медицина, 2000. — 256 с.
9. Юнкеров В.И., Григорьев С.Г. Математико-статистическая обработка данных медицинских исследований. — СПб.: ВМедА, 2002. — 266 с.
10. Mario F. Triola Elementary statistics. — New York: The Benjamin / Cummings publishing company, Inc., 1989. — 784.
Поступила 03.06.2005
ПРОБЛЕМЫ ОБЩЕСТВЕННОГО ЗДОРОВЬЯ И ЗДРАВООХРАНЕНИЯ
УДК 616.33-002.44-07
ЯЗВЕННАЯ БОЛЕЗНЬ: МЕТОДОЛОГИЯ ПРИНЯТИЯ РЕШЕНИЯ
В.М. Лобанков Гомельский государственный медицинский университет
В экономически развитых странах принята стратегия лечения больных язвенной болезнью, основанная на консервативной тактике, хирургическая применяется, главным образом, по неотложным показаниям. Попытки практиковать аналогичные подходы в отечественных условиях терпят фиаско. Это связано с низкой реализуемостью эффективной консервативной терапии, несравнимо более высокой (в 4-6 раз) частотой неотложных опе-