Научная статья на тему 'Параметрические и непараметрические методы в медицинской статистике'

Параметрические и непараметрические методы в медицинской статистике Текст научной статьи по специальности «Математика»

CC BY
6172
603
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОДЫ ПАРАМЕТРИЧЕСКОЙ СТАТИСТИКИ / PARAMETRIC STATISTICAL METHODS / МЕТОДЫ НЕПАРАМЕТРИЧЕСКОЙ СТАТИСТИКИ / METHODS OF NONPARAMETRIC STATISTICS / ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ / STATISTICAL HYPOTHESIS TESTING / СТАТИСТИЧЕСКИЙ АНАЛИЗ МЕДИЦИНСКИХ ДАННЫХ / STATISTICAL ANALYSIS OF MEDICAL DATA

Аннотация научной статьи по математике, автор научной работы — Герасимов А.Н., Морозова Н.И.

Статья посвящена условиям применимости параметрических и непараметрических методов, включая критику частых методических ошибок. При использовании методов параметрической статистики часто основываются на неправильном посыле, что для проверки применимости методов параметрической статистики нужно выяснить, имеются ли достоверные отличия полученного экспериментального распределения от нормального. Делать этого не следует, так как любой встречающейся в биомедицинских исследованиях показатель распределен заведомо ненормально. Кроме того, для практического применения методов параметрической статистики достаточно близости к нормальному не исходного распределения, а среднего арифметического из имеющегося набора наблюдений. В статье указано, при каких случаях и при каком объеме наблюдений можно использовать методы параметрической статистики и как это связано с величиной коэффициента эксцесса, а также каковы величины погрешности расчета достоверности отличий при использовании методов параметрической статистики. Критическому разбору подвергаются и методы непараметрической статистики. При их большей формальной точности и широте применимости они, однако, проверяют менее ценные статистические гипотезы, так как фактически работают не с величинами, а с их рангами, а при ранжировании значительная часть информации пропадает.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Parametric and Nonparametric Methods in Medical Statistics

The article is devoted to the conditions of applicability of parametric and nonparametric methods, including criticism of frequent methodological errors. By using methods of parametric statistics often make the wrong conclusion that to test the applicability of methods of parametric statistics need to find out whether there are significant differences resulting from the normal allocation of the pilot. Doing this is not necessary, as any encountered in biomedical research component is distributed clearly abnormal. Besides, for the practical application of parametric statistics need sufficient proximity to the source distribution is not normal, and the arithmetic mean from a set of observations. The article stated, under any circumstances and for any amount of observational techniques can be used parametric statistics and how it relates to the value of kurtosis, and what the margin of error calculation of significant differences when using methods of parametric statistics. Subjected to a critical analysis and methods of nonparametric statistics. With their more formal precision and breadth of applicability, however, they checked less valuable statistical hypothesis, as in fact do not work with the values, and their ranks, and the ranking much of the information is lost.

Текст научной работы на тему «Параметрические и непараметрические методы в медицинской статистике»

Параметрические и непараметрические методы в медицинской статистике

А.Н. Герасимов (andr-gerasim@yandex.ru), Н.И. Морозова (n.iv.morozova@mail.ru)

ГОУ ВПО «Первый Московский государственный медицинский университет им. И.М. Сеченова» Минздрава России

Резюме

Статья посвящена условиям применимости параметрических и непараметрических методов, включая критику частых методических ошибок. При использовании методов параметрической статистики часто основываются на неправильном посыле, что для проверки применимости методов параметрической статистики нужно выяснить, имеются ли достоверные отличия полученного экспериментального распределения от нормального. Делать этого не следует, так как любой встречающейся в биомедицинских исследованиях показатель распределен заведомо ненормально.

Кроме того, для практического применения методов параметрической статистики достаточно близости к нормальному не исходного распределения, а среднего арифметического из имеющегося набора наблюдений. В статье указано, при каких случаях и при каком объеме наблюдений можно использовать методы параметрической статистики и как это связано с величиной коэффициента эксцесса, а также каковы величины погрешности расчета достоверности отличий при использовании методов параметрической статистики.

Критическому разбору подвергаются и методы непараметрической статистики. При их большей формальной точности и широте применимости они, однако, проверяют менее ценные статистические гипотезы, так как фактически работают не с величинами, а с их рангами, а при ранжировании значительная часть информации пропадает.

Ключевые слова: методы параметрической статистики, методы непараметрической статистики, проверка статистических гипотез, статистический анализ медицинских данных

parametric and Nonparametric Methods in Medical Statistics

A.N. Gerasimov (andr-gerasim@yandex.ru), N.I. Morozova (n.iv.morozova@mail.ru)

I.M. Sechenov First Moscow State Medical University, State Educational Institution of Higher Professional Training of the Ministry

of Healthcare of the Russian Federation

Abstract

The article is devoted to the conditions of applicability of parametric and nonparametric methods, including criticism of frequent methodological errors. By using methods of parametric statistics often make the wrong conclusion that to test the applicability of methods of parametric statistics need to find out whether there are significant differences resulting from the normal allocation of the pilot. Doing this is not necessary, as any encountered in biomedical research component is distributed clearly abnormal. Besides, for the practical application of parametric statistics need sufficient proximity to the source distribution is not normal, and the arithmetic mean from a set of observations. The article stated, under any circumstances and for any amount of observational techniques can be used parametric statistics and how it relates to the value of kurtosis, and what the margin of error calculation of significant differences when using methods of parametric statistics.

Subjected to a critical analysis and methods of nonparametric statistics. With their more formal precision and breadth of applicability, however, they checked less valuable statistical hypothesis, as in fact do not work with the values, and their ranks, and the ranking much of the information is lost.

Key words: parametric statistical methods, methods of nonparametric statistics, statistical hypothesis testing, statistical analysis of medical data

Один из частых вопросов относительно статистического анализа: какие методы использовать - параметрические или непараметрические и, кстати, чем они отличаются? Параллельное их использование говорит начинающему исследователю, что и у тех, и у других методов есть свои плюсы и минусы, однако разобраться в этом не так легко. Так, прочтя, что параметрические методы можно использовать только для нормально распределенных случайных

величин, многие начинают проверять имеющиеся у них распределения на нормальности и, если получены статистически достоверные отличия, то используют непараметрические методы, а если нет - непараметрические.

Данная проверка неверна по следующим причинам:

1. Невозможно доказать, что имеющиеся наблюдения получены от нормальной случайной величины. Подобная проверка может лишь выявить

ненормальность, тогда как нормальность доказать нельзя.

2. Так как любая фактически наблюдаемая случайная величина распределена не вполне нормально, то при достаточно большом количестве наблюдений будет получено ее статистически достоверное отличие от нормального распределения. Поэтому проверка на нормальность показывает лишь одно - достаточно ли велико отличие наблюдаемой случайной величины от нормальной, чтобы это можно было показать на имеющемся объеме наблюдений.

3. Для того чтобы доказать ненормальность распределения подавляющего большинства фактических данных, проводить их статистический анализ не нужно, так как нормально распределенные случайные величины с ненулевой вероятностью должны принимать значения из любого промежутка. В том числе с ненулевой вероятностью должны наблюдаться и отрицательные значения, следовательно, любая переменная, которая не может принимать неотрицательные значения (например, заболеваемость, концентрация и пр.), распределена ненормально.

И параметрические, и непараметрические методы используются при проверке статистических гипотез. Общая схема следующая:

1. Формулируется статистическая гипотеза (нулевая гипотеза) о том, что никаких различий (связей и пр.) на самом деле нет1. Например, что клиническая эффективность двух методов лечения одинакова.

2. Задается способ расчета величины D-отличия наблюдаемых данных от того, что ожидалось в предположении об истинности нулевой гипотезы. Например, модуль разности доли вылечившихся больных при двух сравниваемых методах лечения.

3. Для фактических данных рассчитывается величина й .

факт

4. В предположении об истинности нулевой гипотезы рассчитывается вероятность того, что за счет случайных флюктуаций будет получена величина й > й .

факт

5. Если вероятность того, что й > йфакт будет получено за счет случайных флюктуаций, слишком мала, то исходная нулевая гипотеза отвергается.

Например, критерий с2 проверяет статистическую гипотезу о равенстве нескольких наборов частот. Для него в качестве величины отличия А берется

UJ

1 Иногда проверяют гипотезы не о равенстве двух величин, а о том, что

одно не меньше другого, например что результаты лечения дженериком не хуже, чем оригинальным препаратом. В подобных случаях говорят об односторонних доверительных интервалах и односторонней достоверности различий.

где N (/< \) - количество наблюдений /-го значения в j-й группе, а Nожид (/< j) - ожидаемое количество этих наблюдений в предположении о том, что частоты во всех группах совпадают.

Приведем пример.

Пусть из 80 мужчин с острым нарушением мозгового кровообращения (ОНМК) в больнице умерло 11, а из 120 женщин - 7. Проверим гипотезу о равенстве внутрибольничной смертности мужчин и женщин с ОНМК.

Из 200 больных суммарно умерло 18, то есть летальность составила 9%. Следовательно, из 80 мужчин ожидаемое количество умерших равно: 80 х 0,09 = 7,2 при фактическом количестве умерших 11 и величине отличия фактического и ожидаемого количества

{N^-K^f (11-7,2)2

N.

ожид

7,2

■ 2,0056.

Для 120 женщин ожидаемое количество умерших: 120 х 0,09 = 10,8, и отличие фактического и ожидаемого количества

(7-11,8)2 11,8

'1,337.

Ожидаемое количество выживших мужчин -72,8 при фактическом количестве 69, что дает отличие

(69-72,8)2 7Z8

■ 0,1984.

Для женщин ожидаемое количество выживших составит 109,2 при фактическом количестве 113, отличие 2,0056 +1,337 + 0,1985 + 0,1322 » 3,6732

(113-109,2)2

^-^-«0,1322.

109,2

Просуммировав полученные различия, получим 2,0056 + 1,337 + 0,1985 + 0,1322 = 3,6732.

В приведенной выше схеме проверки статистических гипотез под пунктом 4 значится: «В предположении об истинности нулевой гипотезы рассчитывается вероятность того, что за счет случайных флюктуаций будет получена величина й > йфакт». Однако во многих случаях сделать это оказывается слишком сложным, и все, что удается, - это получить способ расчета искомой вероятности с погрешностью, которая уменьшается при увеличении объема наблюдений. Подобные статистические критерии называются асимптотическими, в отличие от «точных критериев», в которых это вероятность определяется без погрешностей и вне зависимости от объема наблюдений.

Поэтому при использовании асимптотических критериев, кроме расчета величины статистической достоверности р, нужно проверять, можно ли этим критерием пользоваться, то есть не слишком

ли велика погрешность расчета асимптотического р при имеющемся объеме и характере данных.

Критерий с2 - асимптотический. Определение статистической достоверности2 различий основано на том, что в случае истинности нулевой гипотезы при увеличении объема наблюдений суммарная величина отличий стремится к хп2-распределению с n степенями свободы, где n = (m - 1) (k - 1), m - число сравниваемых групп, k - число разных вариантов значений. Например, для рассмотренного выше примера сравниваемых групп - мужчины и женщины - , вариантов значения тоже два (умер и выжил), следовательно, число степеней свободы равно (2 - 1) (2 - 1) = 1.

Cn2 -распределение, в частности, затабулирова-но в Excel, так что для приведенного примера получаем, что вероятность того, что х^-распределение с 1 степенью свободы меньше или равно 3,6732, равно 0,9447. Следовательно, статистическая достоверность различий р = 0,05529, то есть с р = 0,05 различия летальности недостоверны и исходная гипотеза не может быть отвергнута.

Так как асимптотические критерии рассчитывают р с погрешностью, то нужно еще проверить, можно ли им пользоваться. Для критерия х2 при р = 0,05 им можно практически пользоваться, если общее число наблюдений не менее 50, а минимальное число ожидаемых количеств любой комбинации - не менее 5 - 7. В нашем случае общее число наблюдений составило 200, а минимальное ожидаемое количество (ожидаемое число умерших мужчин) составило 7,2, то есть пользоваться критерием можно.

Однако для таблиц «2 на 2», кроме асимптотического критерия х2, есть и точный критерий, которым можно пользоваться вне зависимости от объема наблюдений. Программа, которая рассчитывает точное значение р, размещена в виде интернет-сервиса (http://1mgmu.com/progi1/xi2. aspx). Ее использование для рассмотренного примера дает величину 0,0493, то есть на самом деле при р = 0,05 различия статистически достоверны.

Критерий х2 позволяет сравнивать частоты встречаемости значений в нескольких группах, однако он ориентирован на работу с категориальными показателями, то есть со случайными величинами, имеющими несколько несравнимых друг с другом значений. При определении достоверности различий используются только частоты отдельных значений, а не сами значения. Например, если анализировать распределение пациентов мужского и женского пола по возрасту, то все разные значения возраста будут считаться различающимися в одинаковой степени. В частности, различия возрастов в 17 и 18 лет будут считаться такими же существенными, как в 17 и 70. Поэтому при анализе истинно числовых случайных величин обычно ис-

пользуются другие статистические критерии, а для их описания применяют не частоты отдельных значений, а параметры или функция распределения.

Статистический параметр случайной величины - число, описывающее какую-то характеристику распределения. Наиболее популярные параметры: математическое ожидание (среднее арифметическое), дисперсия (средний квадрат отклонения от среднего), среднеквадратичное отклонение3 (квадратный корень из дисперсии), мода (самое частое значение) и медиана (половина значений случайной величины должна быть больше медианы и половина - меньше).

Функция распределения F¡iу) = P (£< у) случайной величины х определяется равенством Flx (уу), где Р(А) - вероятность события А. Например, если у - распределение по продолжительности жизни, то F¡iу) - доля умерших в возрасте х или менее, то есть 1 - F¡iу) - вероятность прожить больше у (рис. 1).

Функция распределения полностью определяет распределение числовой случайной величины, так что если две случайные величины имеют одинаковые функции распределения, то и все параметры их тоже равны.

Удобство функции распределения заключается в том, что ее можно использовать как для дискретных случайных величин (то есть имеющих только несколько возможных значений), так и для непрерывных случайных величин (которые принимают бесконечное количество неповторяющихся значений).

Гипотезу о том, что две дискретные случайные величины распределены одинаково, можно проверять при помощи критерия у2, а гипотезу о равенстве функций распределения двух непрерывных случайных величин - при помощи критерия Колмогорова-Смирнова. Оба эти критерия - непараметрические4. Критерий Колмогорова-Смирнова - точный, то есть при его применении не надо беспокоиться о достаточности числа наблюдений. При этом у него есть также и асимптотический аналог, и современные пакеты статистических программ сами определяют, нужно ли проводить расчеты для точного варианта или достаточно асимптотического.

Для непрерывных случайных величин, кроме функции распределения, используется также и плотность распределения - производная от функции распределения. Она показывает удельную частоту встречаемости данного и близких значений. Например, для нормально распределенных случайных величин с математическим ожиданием М и дисперсией А плотность распределения равна

PÁX) =

dFg (jc)

1

dx

4bcD

X

2D

2 Или статистической значимости. Эти термины сейчас используются как синонимы, хотя с этим не все согласны.

3 В англоязычной литературе этот параметр называется «standard deviation», что провоцирует неправильное обозначение его как «стандартное отклонение».

4 Обсуждение этого понятия - ниже.

Рисунок 1.

Функция распределения по ожидаемой продолжительности жизни в современной России

Рисунок 2.

Функция плотности распределения нормальной случайной величины с математическим ожиданием 5 и дисперсией 1

При анализе фактических данных аналогом графика функции плотности распределения является частот-

ная гистограмма, а аналогом функции плотности распределения - диаграмма частот нарастающим итогом.

При проверке статистических гипотез о величине математического ожидания и дисперсий по имеющемуся набору наблюдений х1 ,..., хм рассчитывают их оценки:

XN

Х1 + — + XN ..5

N

(х,-xf +

SN -

N-1

Тогда, если наблюдаемые случайные величины распределены нормально, то хм тоже распределено нормально,

W

распределено как распределение Стьюдента с N - 1 степенью свободы, 5М распределено как

N-1

где D - дисперсия наблюдаемой случайной величины, отношение двух оценок дисперсий, сделанных по разным наборам наблюдений, имеет распределение Фишера-Снедекора, и так далее.

Однако если исходная величина распределена ненормально, то распределение всех указанных оценок не совпадает с указанными. Если бы было точно известно распределение наблюдаемой величины, то можно было бы рассчитать функции распределения всех этих оценок, но так как наблюдаемая величина априори распределена неизвестно как, то кажется, что данная задача не имеет удовлетворительного решения. Но «основной частью» большинства оценок является сумма наблюдений, и тут на помощь приходит классический результат под названием «Центральная предельная теорема», которая говорит о том, что при достаточно большом количестве наблюдений среднее арифметическое распределено нормально. В этом случае, если все равно, как распределена исходная случайная величина, можно делать вид, что она распределена нормально. В этом и состоит суть параметрической статистики - мы работаем со случайными величинами так, как будто они нормально распределены. В этом случае для описания их распределения достаточно знать величины двух параметров - среднего арифметического и дисперсии.

Следовательно, все методы параметрической статистики являются асимптотическими и для их корректного использования нужно знать, какое количество наблюдений необходимо и какова ве-

личина погрешности расчета достоверности различий, то есть корректно применять центральную предельную теорему. В ряде источников она приводится в следующей вульгарной формулировке: «если число наблюдений 30 или более, то их среднее арифметическое распределено нормально». Это неверно6. Для того, чтобы точно сформулировать центральную предельную теорему, определим количественную меру отклонения распределения от нормального.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Определение. Пусть £ - числовая случайная величина с математическим ожиданием М и дисперсией D, а - нормально распределенная с теми же математическим ожиданием М и дисперсией D. Тогда в качестве меры «сумасшествия» х возьмем величину

р(%) = мах (х)-^ (х)|

Данное определение корректно, так как из него следует, что случайная величина имеет нулевую меру «сумасшествия» тогда и только тогда, когда она распределена нормально.

Правильная формулировка центральной предельной теоремы. Пусть х15х2,... - независимые наблюдения случайной ^-величины с математическим ожиданием М и дисперсией D, а

Х„ = 1

п

то есть среднее арифметическое из п наблюдений. Тогда при п ->оо уо(хи)-»0.

Заметим, что в формулировке теоремы нет никаких равномерных оценок - сколько нужно наблюдений для получения той или другой величины близости распределения среднего арифметического к нормальному. Более того, таких оценок нет в принципе - скорость сходимости к нормальному распределению индивидуальна для каждой случайной величины и для любого заранее взятого количества наблюдений (хоть тысячи, хоть миллиона, хоть миллиарда) найдется случайная величина, для которой при этом числе наблюдений распределение среднего арифметического далеко от нормального.

Есть утверждения о том, что скорость сходимости среднего арифметического к нормальному распределению зависит от степени некомпактности распределения, количественной мерой которого является коэффициент эксцентриситета (или эксцесса). То, что для практической близости среднего арифметического к нормальному распределению достаточно 30 наблюдений, верно (в определенной степени) для случайных величин с коэффициентом эксцентриситета не более нескольких единиц7.

5 То, что в оценке сумма квадратов делится не на N, а на N - 1, связано с тем, что рассчитывается квадрат отклонения не от неизвестного «истинного» среднего арифметического, а от его оценки, полученной по тому же набору наблюдений, что занижает величину отклонения. В ряде источников указывается, что если число наблюдений более 30, то делить надо не на N - 1, а на N. Это ошибка - делить надо всегда только на N-1.

6 Ряд авторов, пытаясь писать для медиков «более доходчиво, пусть даже в ущерб математической строгости», злоупотребляют упрощениями.

7 Вопрос о том, как проверять скорость сходимости распределения среднего арифметического к нормальным для случайных величин

с большим коэффициентом эксцентриситета, требует изложения в отдельной работе.

- lí \

Вторая тонкость состоит в самом определении меры отклонения распределения от нормального. При определении меры «сумасшествия» р{%) = мах\р^(х)-р,1(х)\ берется разность вероятностей, то есть вероятности 0,001 и 0,00000000000001 будут считаться близкими. Нормальное распределение - это распределение очень компактное, вероятность больших отклонений для него чрезвычайно мала, так как плотность вероятности уменьшается пропорционально экспоненте от квадрата отклонения. Реально встречающиеся случайные величины не столь компактны, и большие отклонения для них маловероятны, а не очень-очень маловероятны. Общая оценка вероятности больших отклонений (теорема Чебышева) - что вероятность отклонений более чем на к среднеквадратичных отклонений не превосходит 1/к2. Следовательно, вероятность отклонения произвольной случайной величины более чем на 10 среднеквадратичных отклонений не превосходит 0,01, тогда как для нормальной случайной величины это -0,0000000000000000000000152397... .

Поэтому предположение о том, что среднее арифметическое

п

распределено в точности нормально, приводит к многократной ошибке при определении вероятности больших отклонений. Следовательно, если при использовании методов параметрической статистики получена крайне малая величина статистической значимости р, то есть различия «неимоверно достоверны», то верить в это не надо. На самом деле различия достоверны, но не очень-очень достоверны.

Приведем пример. Пусть имеется 80 измерений некоторого показателя, определяемого с точностью до 0,1, значения которого находятся в интервале от 2 до 5. Следовательно, диапазон значений показателя - от 2 до 5 с шагом 0,01, то есть включает в себя 301 возможное значение.

В этом случае величина л:80 тоже должна принимать значения в интервале от 2 до 5, но с шагом 1/8000, то есть может принимать не более чем 24001 различное значение. Следовательно, будет хотя бы одно значение у, которое л;80 принимает с частотой не менее 1/24001, то есть функция распределения ^(л) в точке х = у имеет разрыв размером не менее 1/24001. Непрерывные же случайные величины ни одно конкретное значение не принимают с ненулевой вероятностью, следовательно, их функции распределения разрывов не имеют, а непрерывная функция и функция с разрывами не менее 1/24001 не могут не отличаться менее чем на 1/48002.

Это - оценка различий снизу, реально же различия х80 и нормально распределенной случайной величины будут много больше. Следовательно, нельзя доверять очень высокодостоверным статистическим различиям, которые получаются

в предположении о нормальности распределения среднего арифметического. Различия могут быть достоверными, но все безмезмерно малые величины р, которые получаются при формальном применении статистических критериев, никакого отношения к реальности не имеют.

Таким образом, проблема методов параметрической статистики - в том, что использовать их можно не всегда, а рассчитанная при их помощи достоверность различий может быть очень далека от реальной.

Проблемы непараметрических методов

Формально в определении непараметрических методов постулируется, что для их использования не требуется никаких предположений о виде исходных распределений. Реально же это означает, что методы непараметрической статистики работают не с исходными значениями, а с их рангами.

Вне зависимости от того, как было распределена исходная случайная величина, ранг ее распределен известным образом, он принимает8 значения 1, 2, 3, ..., N то есть распределение рангов известно заранее и «хорошее». Поэтому «истинные» методы непараметрической статистики - точные статистические критерии, которые рассчитывают р без погрешностей и вне зависимости от объема наблюдений.

Многие методы параметрической статистики имеют прямые аналоги методов непараметрической статистики. Например, критерий Стьюдента и дисперсионный анализ определяют достоверность различий средних в двух или нескольких группах, а критерий Манна-Уитни - достоверность различий среднего ранга в двух группах, коэффициент корреляции Пирсона позволяет найти наличие линейной связи двух числовых показателей, а коэффициент ранговой корреляции Спирмена - наличие линейной связи рангов двух показателей. В некоторых случаях прямой аналогии с непараметрическим методом нет. В этом случае можно самостоятельно рассчитать вместо исходной случайной величины ее ранг и применить непараметрический метод к ней. Так как ранг переменной распределен «хорошо», то для применения асимптотических методов параметрической статистики достаточно размера групп около 10.

Следовательно, с применимостью методов непараметрической статистики проблем нет. Основная проблема с ними другая - их малая информативность.

Например, если в результате использования методов параметрической статистики получено, что после лечения препаратом «А» среднее артериальное систолическое давление пациентов составило 152,3 мм рт. ст., а после лечения препаратом «Б» -164,7 мм рт. ст., то врачу приведенные результа-

8 В том случае, когда наблюдаемая случайная величина принимает повторяющиеся значения, значения рангов будут немного иные, например 1,

2, 5, 2, 5, 4,... , однако на приведенные рассуждения это не влияет.

ты понятны. А если в результате использования получено, что средний ранг АДС на препарате А -573,3, а на препарате Б - 709,1, то содержательная ценность этого результата без длительных дополнительных расшифровок сомнительна.

При переходе от исходных значений к рангам значительная часть исходной информации пропадает бесследно, так как ранги значений указывают лишь на то, какое значение больше, но не указывают, на сколько больше.

Поэтому ранговые методы, или методы непараметрической статистики, следует использовать для подстраховки. Например, если из-за недостаточного размера групп или большого коэффициента эксцентриситета корректно сравнить средние по группам нельзя, можно рассчитать достоверность различия средних рангов.

Выводы

1.

2.

Методы параметрической статистики рассчитывают р с погрешностью, зависящей как от числа наблюдений, так и от характера распределения наблюдаемой случайной величины. Часто встречающееся утверждение о том, что можно использовать методы параметрической стати-

стики при числе наблюдений от 30, верно только для случайных величин с коэффициентом эксцентриситета (эксцесса) не более нескольких единиц.

3. Методы непараметрической статистики анализируют не исходные значения, а их ранги.

4. Методы параметрической статистики не зависят от формы распределения исследуемых случайных величин.

5. Все критерии параметрической статистики -асимптотические, то есть рассчитывают р с погрешностью, уменьшающейся при увеличении числа наблюдений.

6. Среди методов непараметрической статистики есть как точные критерии, правильно рассчитывающие р вне зависимости от числа наблюдений, так и асимптотические.

7. При применении методов непараметрической статистики для анализа истинно числовых случайных величин ценность полученных результатов не очень велика, так как при этом теряется информация о том, насколько одни значения больше других. Ш

Статья подготовлена при поддержке гранта

РФФИ 15-07-06947.

Литература

1. Киселев А.С. Краткая история формирования ряда областей медицинской науки и видов высокотехнологичной помощи для взрослых пациентов. Сеченовский вестник. 2014; 16 (4): 2 - 14.

2. Герасимов А.Н. Медицинская статистика. Москва: МИА; 2007: 480.

References

1. Kiselev A.S. Brief history of the formation of a number of areas of medical science and types of high-tech care for adult patients. Sechenovsky Vestnik. 2014; 16 (4): 2 - 14 (in Russian).

2. Gerasimov A.N. Medical statistics. Moscow; MIA; 2007: 480 (in Russian).

ИНФОРМАЦИЯ ВОЗ

Циркулирующий вирус вакцинного происхождения в Лаосской Народно-Демократической Республике (выдержки)

8 октября 2015 года национальный лаосский координатор международной медико-санитарной программы известил ВОЗ об одном подтвержденном случае инфицирования полиовирусом вакцинного происхождения (ПВВП) типа 1 восьмилетнего мальчика (с наступлением паралича 7 сентября), скончавшегося 11 сентября. В районе, где жил ребенок, был низким охват прививками тремя дозами оральной полиовакцины (ОПВ) - 40 - 66% (на сегодняшний день - 44%.)

Последний случай инфицирования эндемическим диким полиовирусом в Лаосе был зарегистрирован в 1993 году.

Циркулирующие полиовирусы вакцинного происхождения (цПВВП) являются редкими, но документально подтвержденными штаммами полиовируса, мутировавшими из штаммов, содержащихся в оральной полиовак-цине (ОПВ). Они могут возникать в некоторых популяциях с ненадлежащими уровнями иммунизации.

Для окончательной ликвидации полиомиелита необходимо исключить циркуляцию дикого полиовируса и цПВВП. В связи с риском инфицирования цПВВП использование ОПВ необходимо прекратить. Изъятие ОПВ будет проводиться поэтапно и начнется с исключения ОПВ, содержащей вирус типа 2. Переход с трехвалентной на двухвалентную ОПВ, запланированный на апрель 2016 года, будет способствовать значительному снижению риска инфицирования цПВВП (90% случаев цПВВП вызывает вирус типа 2). Затем последует стадия окончательного прекращения использования ОПВ и переход к инактивированной полиовакцине (ИПВ), которая не может вызывать инфицирования цПВВП.

Принимая во внимание относительно ограниченные масштабы поездок в этот район и запланированные мероприятия по иммунизации, ВОЗ оценивает риск распространения цПВВП как низкий.

Источник: http://www.who.int/

i Надоели баннеры? Вы всегда можете отключить рекламу.