Научная статья на тему 'ИСПОЛЬЗОВАНИЕ ШАНСА И ШАНСОВОГО ОТНОШЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ СВЯЗИ МЕЖДУ КАЧЕСТВЕННЫМИ ПЕРЕМЕННЫМИ'

ИСПОЛЬЗОВАНИЕ ШАНСА И ШАНСОВОГО ОТНОШЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ СВЯЗИ МЕЖДУ КАЧЕСТВЕННЫМИ ПЕРЕМЕННЫМИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕРОЯТНОСТЬ / ОТНОШЕНИЕ ШАНСОВ / СТАНДАРТНАЯ ОШИБКА / ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ / ВИРУС ГРИППА N1H1

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бакаева О.А., Щенников В.Н.

В статье рассмотрены прикладные статистические понятия, касающиеся шанса. Приведены примеры, иллюстрирующие применение данного метода для выявления зависимости между качественными переменными при лечении вируса гриппа N1H1.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бакаева О.А., Щенников В.Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

USE THE ODDS AND ODD RATIO FOR THE IDENTIFICATION OF COMMUNICATION BETWEEN QUALITATIVE VARIABLES

The article dwells on the applied statistical concepts, concerning odds. The examples illustrating application of the given method for revealing of dependence between qualitative variables at treatment of N1H1virus are resulted.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ ШАНСА И ШАНСОВОГО ОТНОШЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ СВЯЗИ МЕЖДУ КАЧЕСТВЕННЫМИ ПЕРЕМЕННЫМИ»

О.А. Бакаева, аспирант В.Н. Щенников, д-р физ.-мат. наук Мордовский государственный университет им. Н.П.Огарева, г. Саранск

УДК 519.235

ИСПОЛЬЗОВАНИЕ ШАНСА И ШАНСОВОГО ОТНОШЕНИЯ ДЛЯ ВЫЯВЛЕНИЯ СВЯЗИ МЕЖДУ КАЧЕСТВЕННЫМИ ПЕРЕМЕННЫМИ

В статье рассмотрены прикладные статистические понятия, касающиеся шанса. Приведены примеры, иллюстрирующие применение данного метода для выявления зависимости между качественными переменными при лечении вируса гриппа N1H1.

Ключевые слова: шанс, вероятность, отношение шансов, стандартная ошибка, доверительный интервал, вирус гриппа N1H1.

O.A. Bakaeva, P.G.

V.N. Shchennicov, D. Sc. Physics and Math, Prof.

USE THE ODDS AND ODD RATIO FOR THE IDENTIFICATION OF COMMUNICATION BETWEEN QUALITATIVE VARIABLES

The article dwells on the applied statistical concepts, concerning odds. The examples illustrating application of the given method for revealing of dependence between qualitative variables at treatment of N1H1virus are resulted.

Key words: odds, probability, the odds ratio, the standard error, confidence interval, N1H1 flu virus.

Введение

Несколько десятилетий назад самым популярным способом выявления связи между качественными переменными был критерий Хи-квадрат. Но в последнее время многие исследователи отдают предпочтение вычислениям, связанным с шансами. Поскольку критерий отношения шансов не имеет жестких условий применимости, которые существуют у критерия Хи-квадрат, и к тому же статистика шансов интерпретируется значительно легче, то в настоящее время в основе многих расчетов и выводов о наличии связи между качественными признаками лежит понятие шанса.

Теоретическая часть

1. Шанс. Шанс [odds] - это отношение вероятности того, что событие А произойдет к вероятности того, что оно не произойдет.

Шансы и вероятности содержат одну и ту же информацию, но по-разному выражают ее. Если вероятность того, что событие А произойдет обозначить Р(А), то вероятность того, что событие не произойдет, будет равна 1- Р(А). Тогда шансовое преимущество события А (шанс) будет определяться выражением [1]:

n=-PAL (1)

1 - P (A)

Известно, что вероятности противоположных событий в сумме дают 1. Шансы же противоположных событий в произведении дают 1:

P (A) х 1 - P (A) = 1 1 - P (A) P (A) '

Интерпретация значения величины шанса следующая:

1) Если шанс равен 1, то вероятности наступления и того, что событие не произойдет, равны;

2) если шанс больше 1, то вероятность наступления события больше вероятности того, что событие не произойдет;

3) если шанс меньше 1, то вероятность наступления события меньше вероятности того, что событие не произойдет.

По вычисленным значениям шансов можно сделать только малоинформативные выводы: что, вероятнее, произойдет событие или не произойдет. Поэтому в прикладной статистике работают не только с шансами и шансовыми преимуществами, но также часто вычисляют и шансовые отношения. Отношение шансов существует для проявления определенного уровня дихотомической переменной в двух группах субъектов. Например, если два возможных состояния для переменной характеризуются как успех и неуспех, то отношение шансов является мерой шансов успехов в одной группе по отношению к другой [1].

2. Отношение шансов. Отношение шансов (ОШ) (Odds Ratio) - отношение шансов события в одной группе к шансам события в другой группе, или отношение шансов того, что событие произойдет к шансам того, что событие не произойдет.

Расчет OR (воздействия фактора риска) служит хорошим инструментом, но поскольку он основан на выборке, то он является не более чем оценкой. Точность этой оценки отчасти зависит от размера выборки и в целом чем больше выборка, тем правдоподобнее оценка, хотя следует с большой осторожностью подходить к интерпретации OR в исследованиях с огромными размерами выборки. Поэтому в дальнейшем будет целесообразно рассмотреть точность полученной оценки, а также кроме расчета OR вычислить стандартное отклонение и доверительный интервал.

Математически отношение шансов легко получить, если представить данные в виде таблицы 1 сопряженности.

Таблица 1

Таблица сопряженности 2*2

В, В, Всего

Ai fii /12 /10

А2 f2, f22 /2о

Всего /01 /02 /оо

В этом случае оценку отношения шансов можно найти по формуле:

0 = /П х /22 . (2)

/12 х /21

Так как данное выражение является дробью, то при условии /12 = 0 или/21 = 0 оно теряет математический смысл. Поэтому в этом случае, или если вообще в любой ячейке встречается частота, равная нулю, формулу (2) использовать нельзя. В связи с этим было предложено преобразовать выражение для оценки шансов в следующее [1]:

а, = (/11 + 0,5) х (/22 + 0,5) (/12 + 0,5) х (/21 + 0,5).

Отношение шансов используется для представления результатов мета-анализов и исследований случай-контроль. Если заболевание очень редкое - маленькие частоты событий, то отношение шансов примерно равно относительному риску. Значения ОШ от 0 до 1 соответствуют снижению риска, более 1 - его увеличению. ОШ, равное 1, означает отсутствие эффекта. Общая схема интерпретации величины отношения шансов выглядит следующим образом:

1) если отношение шансов равно 1, то шанс для первой группы равен шансу для второй группы, это свидетельствует об отсутствии различий между сравниваемыми группами;

2) если отношение шансов больше 1, то шанс для первой группы больше шанса для второй группы;

3) если отношение шансов меньше 1, то шанс для первой группы меньше шанса для второй группы.

Если значение отношения шансов для нежелательных исходов (например, осложнение или смерть) меньше 1, то это свидетельствует об эффективности метода лечения, направленного на снижение риска этого исхода.

3. Стандартная ошибка отношения шансов. Как было сказано выше, находя значение отношения шансов, мы находим только оценку отношения шансов. Величина стандартной ошибки позволяет оценить точность полученной оценки отношения шансов. Стандартную ошибку отношения шансов можно оценить при помощи следующего выражения [1]:

станд. ошибка (о) = о х

1111

— +-+-+- . (4)

/И /\2 У21 /22

Данная формула для вычисления стандартной ошибки отношения шансов применима, если отношение шансов находится по формуле (2). Если же величина отношения шансов находится по формуле (3), то стандартную ошибку следует вычислять по нижеприведенной формуле:

станд. ошибка (о') = о'х

1111

■ + ~г-+ ^-—+ ^-— . (5)

/и + 0,5 /2 + 0,5 /21 + 0,5 /22 + 0,5 Следует иметь в виду, что само по себе значение ОЯ нечувствительно к размеру выборки, однако от размера выборки зависит размер стандартного отклонения и точность полученных выводов. Величина стандартной ошибки нужна также для построения доверительного интервала для отношения шансов.

4. Доверительные интервалы для отношения шансов. Доверительный интервал - интервал значений, который с заданной доверительной вероятностью накрывает истинное значение оцениваемого параметра. Существует несколько различных способов построения доверительного интервала для отношения шансов. Рассмотрим один из них, который предложен в [1]. Как замечают сами авторы, процесс поиска границ доверительного интервала является итерационным, а следовательно, и весьма громоздким. Однако довольно часто для практических задач достаточно найти приблизительные границы доверительного интервала: шГ - нижняя граница и юи - верхняя граница. Чтобы получить более точные оценки границ доверительного интервала воспользуемся формулами:

®Ь = ехР(Г- саП х 8Е(Г)), (6)

®П = ехР(Г'+ са/2 х SE(Г')), (7)

где са/2 = 1,96 - процентная точка стандартного нормального распределения (р = 0,95);

' Г' = 1п (о1); (8)

Ж (Г) =

1 - + ^ + ^ + (9)

/11 + 0,5 /12 + 0,5 /21 + 0,5 /22 + 0,5

Рассчитав данные значения, мы получим интервал, в котором с доверительной вероятностью 0,95 лежит истинное значение отношения шансов.

Расчетно-аналитическая часть Пример 1. По данным Управления Роспотребнадзора в Республике Мордовия в 2009-2010 гг. было зарегистрировано 75 случаев заболевания вирусом ЩН1 («свиной грипп») среди взрослых людей (18-58 лет) и 45 случаев среди детей (до 18 лет). Среди взрослых было 9 летальных исходов, среди детей летальных исходов не было. Данные по заболеваемости и результатам лечения представлены в таблице 2.

Таблица 2

Частоты результатов лечения вируса ШН1 в Республике Мордовия

в 2009-2010 гг.

Возраст Результат лечения

Летальный Выздоровление Всего

Дети 0-17 лет /11= 0 /12= 45 45

Взрослые 18-58 лет /21= 9 /22 = 66 75

Всего 9 111 120

Разделим данную таблицу на две, в каждой из которых будет информация только о категории больных одного возраста.

Пример 1.1. Вычислим шансы результата лечения для пациентов возрастной группы 0-18

лет.

Таблица 3

Частоты результатов лечения вируса ШН1 в 2009-2010 гг. в Республике Мордовия среди детей

Результат лечения Число пациентов

Выздоровление (f12) 45

Летальный исход (f22) 0

Всего 45

Среди 45 детей, заболевших вирусом «свиного гриппа», летальных исходов не было. Пусть событие ^дет, состоит в том, что любой ребенок из перенесших инфекцию окажется выздоровевшим. Тогда вероятность этого события будет равна Р (Лдет) = 45/45 = =1,00. А вероятность противоположного события Вдет, состоящего в том, что заболевание закончилось летальным исходом, будет нулевой, т.е. Р (Вдет) = 0/45 = 0. Тогда для любого пациента из группы детей шанс, что он излечится, будет равен «бесконечно большой величине».

Для любого же ребенка, перенесшего вирус N1H1, шанс, что заболевание закончится летальным исходом, будет равен:

P (Бяет ) 0 odds (Бяет ) =-V дет7 = - = 0.

V д^ i _ р (вдет) i

Значение шанса летального исхода, равного нулю, говорит о 100%-ной выживаемости среди детей, перенесших данное заболевание. Однако не стоит забывать, что данный коэффициент рассчитан только по данным этой выборки. Поэтому к данному значению нужно относиться как к одному из частных случаев, имеющих максимальный положительный эффект и, возможно, отражающему общее соотношение выздоровления среди взрослых и детей.

Пример 1.2. Вычислим шансы результатов лечения для пациентов возрастной группы 1858 лет.

Таблица 4

Частоты результата лечения вируса N1H1 в 2009-2010 гг. в Республике Мордовия среди взрослых пациентов

Результат лечения Число пациентов

Выздоровление (f22) 66

Летальный исход (f21) 9

Всего 75

Найдем шансовое преимущество события Аврс, состоящего в выздоровлении взрослого паци -ента, исходя из данных таблицы 4. Количество взрослых людей, заболевших вирусом гриппа ШН1, составило 75 человек. Из них 66 человек выздоровело, а в 9 случаях наблюдался летальный исход. Таким образом, Р (Авзр) = 66/75 = 0,88. А вероятность противоположного события, состоящего в том, что заболевание закончилось летальным исходом, равна 1 - Р (Авзр) = 1 - 0,88 = 0,12. Тогда для любого пациента из взрослой группы шансовое преимущество, что он излечится, будет равно

р (Авзр) = 0,88

1 _ P (Авзр) = 0,12

odds(Авзр) = -—^ ч = = 7,333.

Так как odds (4взр) = 7,333 > 1, то вероятность выздоровления пациента больше вероятности летального исхода, и не просто больше, а больше в 7,333 раза. Для нового заболевания, с которым до этого врачам не приходилось сталкиваться, это достаточно хороший показатель эффективности лечения.

Если ввести событие Ввзр, которое будет состоять в том, что результат лечения взрослого па -циента - летальный исход, то шанс, что заболевание закончится летальным исходом, будет равен:

р (Бвзр) = 012 = 0,136.

1 П 88

взр

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

odds (Бвзп ) =-—— = —,—

взр 1 _ P (Бвзр) 0,88

Так как odds (Ввзр) = 0,136 < 1, то вероятность летального исхода меньше вероятности выздоровления, что, несомненно, радует. Чем меньше будет данное значение, тем больше шансов выздороветь-выжить у больного.

Пример 2. Вычислим отношение шансов и сделаем выводы об эффективности лечения для пациентов различных возрастных групп по данным таблицы 2 (см. пример 1).

В случае, когда все значения частот в таблице сопряженности отличны от нуля, для вычисления оценки отношения шансов следует использовать формулу (2). Но так как в рассматриваемом примере f11 = 0, то следует воспользоваться формулой (3). Получаем:

о, = (0 + 0,5) х (66 + 0,5) = 33,25 = 0 0уу (45 + 0,5) х (9 + 0,5) 432,25 , ' Так как отношение шансов отлично от единицы, следовательно, можно сделать вывод о существенном различии в эффективности лечения взрослых пациентов и детей. Полученное значение о' = 0,077 < 1 говорит о том, что шансы, т.е. относительный риск летального исхода для первой группы пациентов - детей, статистически значимо ниже, чем для второй группы пациентов -взрослых. Так как мы вычисляли отношение шансов для нежелательного исхода - летального, и оно получилось меньше единицы, то в целом это свидетельствует об эффективности метода лечения, направленного на снижение риска этого исхода.

Пример 3. Вычислим стандартную ошибку отношения шансов. Так как в ячейке f11 значение частоты равно 0, воспользуемся формулой (5) для вычисления стандартной ошибки. Получим:

станд. ошибка (о ') = 0,077 х —1--1--1--1--1--+ - 1

J 0 + 0,5 45 + 0,5 9 + 0,5 66 + 0,5

= 0,077 хд/ 2,142 = 0,113.

Пример 4. Используя стандартную ошибку отношения шансов, рассчитаем границы доверительного интервала для отношения шансов. Для этого сначала следует найти натуральный логарифм отношения шансов и SE(L'). Имеем следующие расчеты: L' = ln (0,077) = - 2,564,

SE (L') = —1— +-1-+ —1— +-1-= J2,142 = 1,464.

\0 + 0,5 45 + 0,5 9 + 0,5 66 + 0,5

Осталось только найти нижнюю и верхнюю границы доверительного интервала: wL = exp(-2,564-1,96 х 1,464) = 0,004; wL = exp(-2,564 + 1,96 х 1,464) = 1,356.

Итак, с доверительной вероятностью 0,95 значение величины отношения шансов, о' = 0,077 лежит в интервале от 0,004 до 1,356. Доверительный интервал получается достаточно большим и выходит за границы единицы в большую сторону на 0,356, тогда как отклонение влево составляет 0,996. Таким образом, большинство значений, входящих в этот интервал, меньше единицы, и следовательно, применяемое лечение дает положительный результат.

Библиография

1. Бабич П.Н., Чубенко А.В., Лапач С.Н. Применение современных статистических методов в практике клинических исследований. Сообщение третье. Отношение шансов: понятие, вычисление и интерпретация // Укр. мед. часопис. - 2005. - №2 (46) III-IV. - C. 113-119.

2. Кобзарь А.И. Прикладная математическая статистика. - М.: Физматлит, 2006. - 816 с.

3. Лапач С.Н., Чубенко А.В., Бабич П.Н. Статистика в науке и бизнесе. - Киев: Морион, 2002. - 640 с.

4. ФлейсДж. Статистические методы для изучения таблиц долей и пропорций: пер. с англ.. - М.: Финансы и статистика, 1989. - 319 с.

Bibliography

1. Babich P.N., Chubenko A. V., Lapach S.N. Application of modern statistical methods in clinical trials. Part 3. Odds ratio: concept, computation and interpretation // The Ukrainian medical journal. - 2005. - №2 (46) III-IV. -P. 113-119.

2. KobzarA.I. The applied mathematical statistics. - M.: Physmathlit, 2006. - 816 p.

3. Lapach S.N., Chubenko A.V., Babich P.N. Statistics in a science and business. - Kiev: Morion, 2002. -

640 p.

4. Fleiss J. Statistical methods for the study of tables of shares and proportions. Transl. from English. - The finance and statistics, 1989. - 319 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.