Научная статья на тему 'Анализ номинальных и ранговых переменных данных с использованием программного обеспечения Statistica и SPSS'

Анализ номинальных и ранговых переменных данных с использованием программного обеспечения Statistica и SPSS Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
10335
1872
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
STATISTICA / SPSS / КАЧЕСТВЕННЫЕ ДАННЫЕ / ПОПРАВКА ЙЕЙТСА / КРИТЕРИЙ ХИ-КВАДРАТ / ТОЧНЫЙ КРИТЕРИЙ ФИШЕРА / КРИТЕРИЙ МАК-НИМАРА / ОТНОСИТЕЛЬНЫЙ РИСК / ОТНОШЕНИЕ ШАНСОВ / CHI-SQUARE / QUALITATIVE DATA / YATES CORRECTION / FISHER EXACT TEST / MCNEMAR TEST / RELATIVE RISK / ODDS RATIO / САПАЛЫ МәЛіМЕТТЕР / ЙЕЙТСТің ТүЗЕТУі / ХИ-КВАДРАТ КРИТЕРИі / ФИШЕРДің НАқТЫ КРИТЕРИі / МАК-НИМАРДЫң КРИТЕРИі / САЛЫСТЫРМАЛЫ қАУіП / ШАНСТАРДЫң қАТЫСТЫЛЫғЫ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гржибовский А.М., Иванов С.В., Горбатова М.А.

В настоящей работе представлены общие сведения о выполнении статистического анализа данных, описываемых номинальными и ранговыми переменными, с использованием программного обеспечения Statistica 10 и SPSS 20. Рассматриваются критерии хи-квадрат Пирсона, поправка Йейтса, точный критерий Фишера, а также батарея статистических критериев для анализа ранговых переменных. Настоящая статья призвана дать общие сведения об анализе качественных данных, и не заменяет прочтения специализированной литературы по статистике и клинической эпидемиологии.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF NOMINAL AND ORDINAL DATA USING STATISTICA AND SPSS SOFTWARE

This is the sixth paper of a series of articles where we describe basic principles of statistical data analysis using Statistica and SPSS software for beginners. Step-be-step algorithms for Pearson chi-square test and various tests for qualitative data are presented. The main aim of this paper is to provide basic knowledge on qualitative data analysis with practical examples using popular software. The article complements, but does not substitute specialized literature on biostatistics and clinical epidemiology.

Текст научной работы на тему «Анализ номинальных и ранговых переменных данных с использованием программного обеспечения Statistica и SPSS»

Получена: 11 ноября 2016 / Принята: 2 декабря 2016 / Опубликована online: 30 декабря 2016 УДК 614.2 + 303.4

АНАЛИЗ НОМИНАЛЬНЫХ И РАНГОВЫХ ПЕРЕМЕННЫХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ STATISTICA И SPSS

Андрей М. Гржибовский 1-4, http://orcid.org/0000-0002-5464-0498, Сергей В. Иванов 5, http://orcid.org/0000-0003-0254-3941 Мария А. Горбатова 2, http://orcid.org/0000-0002-6363-9595

1 Национальный Институт Общественного Здравоохранения, г. Осло, Норвегия;

2 Северный Государственный Медицинский Университет, г. Архангельск, Россия;

3 Международный Казахско-Турецкий Университет им. Х.А. Ясави, г. Туркестан, Казахстан;

4 Северо-Восточный Федеральный Университет, г. Якутск, Россия;

5 Северо-Западный Государственный Медицинский Университет им. И.И. Мечникова, г. Санкт-Петербург, Россия.

Резюме

В настоящей работе представлены общие сведения о выполнении статистического анализа данных, описываемых номинальными и ранговыми переменными, с использованием программного обеспечения Statistica 10 и SPSS 20. Рассматриваются критерии хи-квадрат Пирсона, поправка Йейтса, точный критерий Фишера, а также батарея статистических критериев для анализа ранговых переменных. Настоящая статья призвана дать общие сведения об анализе качественных данных, и не заменяет прочтения специализированной литературы по статистике и клинической эпидемиологии.

Ключевые слова: Statistica, SPSS, качественные данные, поправка Йейтса, критерий хи-квадрат, точный критерий Фишера, критерий Мак-Нимара, относительный риск, отношение шансов.

Abstract

ANALYSIS OF NOMINAL AND ORDINAL DATA USING STATISTICA AND SPSS SOFTWARE

Andrej M. Grjibovski 1-4, http://orcid.org/0000-0002-5464-0498, Sergej V. Ivanov 5, http://orcid.org/0000-0003-0254-3941 Maria A. Gorbatova 2, http://orcid.org/0000-0002-6363-9595

1 Norwegian Institute of Public Health, Oslo, Norway;

2 Northern State Medical University, Arkhangelsk, Russia;

3 International Kazakh-Turkish University, Turkestan, Kazakhstan;

4 North-Eastern Federal University, Yakutsk, Russia;

5 North-Western State Medical University n.a. I.I. Mechnikov, St. Petersburg, Russia.

This is the sixth paper of a series of articles where we describe basic principles of statistical data analysis using Statistica and SPSS software for beginners. Step-be-step algorithms for Pearson chi-square test and various tests for qualitative data are presented. The main aim of this paper is to provide basic knowledge on qualitative data analysis with practical examples using popular software. The article complements, but does not substitute specialized literature on biostatistics and clinical epidemiology.

Keywords: Statistica, SPSS, chi-square, qualitative data, Yates correction, Fisher exact test, McNemar test, relative risk, odds ratio

Туйшдеме

STATISTICA ЖЭНЕ SPSS БАГДАРЛАМАЛЫК КАМСЫНДАНДЫРУДЫ КОЛДАНУМЕН НОМИНАЛДЫ ЖЭНЕ РАНГ1Л1К АУЫСПАЛЫ МЭЛ1МЕТТЕРД1 ТАЛДАУ

Андрей М. Гржибовский 1-4, http://orcid.org/0000-0002-5464-0498, Сергей В. Иванов 5, http://orcid.org/0000-0003-0254-3941 Мария А. Горбатова 2, http://orcid.org/0000-0002-6363-9595

1 Когамдьщ Денсаулык сактау ¥лттык Институты, Осло к., Норвегия;

2 СолтYCтiк Мемлекеттiк Медициналык Университетi, Архангельск к., Ресей;

3 Х.А. Ясави ат. Халыкаралык Казак - ТYрiк Университетi, Туркестан, Казакстан;

4 СолтYCтiк - Шыгыс Федералдык Университетi, Якутск к-, Ресей;

5 И.И. Мечников атынд. Солтуслк - Батыс мемлекеттiк медициналык университетi, Санкт-Петербург к., Ресей.

Осы жумыста Statistica 10 жэне SPSS 20 багдарламалык; камсындандыруды колданумен номиналды жэне рангiлiк ауыспалылармен сипатталган мэлiметтердH статистикалык; талдауын орындау туралы жалпы мэлiметтер берiлген. Пирсонныц хи-квадрат, ЙейтстН тYзетуi ФишердН нак;ты критерилер^ сол сияккты рангiлiк ауыспалыларды талдау Yшiн статистикалык; критерилер батареясы карастырылады. Осы макала сапалы мэлiметтердi талдау туралы жалпы мэлiметтер беруге талап етiлген жэне статистика жэне клиникалык; эпидемиология бойынша мамандандырылган эдебиеттi оккудыц орнын толтырмайды.

Нег'/зг/ свздер: Statistica, SPSS, сапалы мэлiметтер, Йейтст'щ mY3emyi, хи-квадрат критерш, ФишердН на;ты критерий Мак-Нимардыц критериi, салыстырмалы цауп, шанстардыц ^атыстьлыгы.

Библиографическая ссылка:

Гржибовский А.М., Иванов С.В., Горбатова М.А. Анализ номинальных и ранговых переменных данных с использованием программного обеспечения Statistica и SPSS / / Наука и Здравоохранение. 2016. №6. С. 5-39.

Grjibovski A.M., Ivanov S.V., Gorbatova M.A. Analysis of nominal and ordinal data using Statistica and SPSS software. Nauka i Zdravookhranenie [Science & Healthcare]. 2016, 6, pp. 5-39.

Гржибовский А.М., Иванов С.В., Горбатова М.А. Statistica жэне SPSS багдарламалы; камсындандыруды колданумен номиналды жэне ранплк ауыспалы мэл1меттерд1 талдау / / Гылым жэне Денсаулык сактау. 2016. №6. Б. 5-39.

Настоящая статья продолжает серию публикаций, посвященных статистическому анализу данных биомедицинских исследований [14, 15, 16, 17, 18]. Высокое качество статистического анализа является обязательным условием востребованности результатов исследований международным научным сообществом [29, 1], поэтому задачами настоящей серии статей является формирование у начинающего исследователя базисных представлений о статистической обработке данных, приобретение практического опыта работы с современными статистическими пакетами программ и

предупреждение типичных ошибок, возникающих в процессе анализа результатов исследования.

Авторы настоятельно рекомендуют читателю еще на этапе планирования научно-исследовательской работы ознакомиться с основной литературой по эпидемиологии (например, [34, 25, 37]), и изучить ключевые практические аспекты организации и интерпретации результатов различных типов научных исследований в здравоохранении (одномоментных, когортных, экологических, экспериментальных исследований и «случай-контроль»), которые представлены в статьях,

опубликованных в 2015 году в журнале «Наука и Здравоохранение» [11, 12, 13, 19, 20].

В настоящей статье будут представлены различные способы статистического анализа результатов исследования, описываемых качественными переменными.

Очень часто при выполнении различных видов эпидемиологических исследований в медицине и здравоохранении фиксируются и анализируются признаки, не имеющие непосредственной количественной меры - так называемые качественные признаки [14, 10, 33, 34]. Качественные признаки характеризуют принадлежность явления к какой-либо определенной категории, и подразделяются на номинальные (например, нозологическая форма заболевания, группа крови, наличие осложнений, номер группы наблюдения), и порядковые (ранговые, ординальные). Порядковые признаки отличаются от номинальных тем, что могут быть размещены в порядке возрастания или убывания (например, степень тяжести состояния, стадия сердечной недостаточности, возрастная категория, уровень образования). Порядковые переменные, безусловно, представляются в виде чисел, но, в отличие от количественных признаков, они не дают информации о степени различий между находящимися рядом уровнями значений порядковой переменной и не могут быть подвергнуты арифметическим операциям.

Следует отметить, что порядковые переменные могут быть сформированы на основании количественных переменных, что может быть использовано в процессе выполнения некоторых видов статистического анализа (например, логистической регрессии): в этом случае количественную переменную разделяют на ряд категорий, например, непрерывную переменную возраста пациентов разделяют на возрастные группы, уровень гемоглобина крови разделяют на степени тяжести анемии, непрерывную переменную роста разделяют на низкий, средний и высокий рост и т.п.

К качественным данным относятся также и дихотомические (бинарные) переменные, которые могут принимать только два альтернативных значения (например, мужской или женский пол, основная или контрольная группа наблюдения, благоприятный или

неблагоприятный исход заболевания, нормализация или отсутствие нормализации регистрируемого показателя). В ряде случаев бывает целесообразным представлять дихотомические переменные как порядковые, имеющие две категории значения, одна из которых считается имеющей более высокий уровень по сравнению со второй.

Способом описания качественных признаков является регистрация количества объектов в выборке (или генеральной совокупности), имеющих одно и то же значение качественной переменной, с последующим расчетом доли от общего числа объектов, которая приходится на то или иное значение признака (например, доля умерших пациентов в когорте за определенный период наблюдения, доля атипичных клеток в культуре, доля находящихся на диспансерном наблюдении лиц среди населения, доля болезней системы кровообращения в общей структуре заболеваемости и проч.). Кроме доли, качественная переменная может быть описана с использованием частоты - цифры, показывающей, сколько раз за какой-либо период времени происходило некоторое событие, проявлялось определенное свойство объекта, либо наблюдаемый параметр достигал данной величины (например, число новых случаев внебольничных пневмоний за год на 100 000 населения, число ошибочных результатов измерений на каждые 1 000 измерений, выполненных с помощью прибора, и проч.).

С практической точки зрения одно из главных преимуществ использования качественных признаков в исследовательском процессе заключается в том, что они позволяют оценивать многие истинные клинически значимые исходы исследования, в то время как количественные признаки в большинстве случаев позволяют оценивать суррогатные исходы (динамика показателей количественных диагностических тестов, уровня холестерина крови, динамика массы тела и проч.) [34, 38].

Например, для плацебо-контролируемого исследования (когортного), направленного на оценку влияния нового препарата на течение артериальной гипертензии, динамика уровня артериального давления у пациентов основной и контрольной групп может

рассматриваться как суррогатный показатель, описываемый количественной переменной, но гораздо более важным с клинической точки зрения будет оценка частоты развития в основной и контрольной группах сосудистых катастроф (инсульт и инфаркт) -качественный показатель, описываемый дихотомической переменной (развилось осложнение / не развилось осложнение). Иными словами, истинным исходом в данном случае будет считаться частота развития инсультов и инфарктов в основной и контрольной группах.

Таким образом, результаты исследования, описываемые с помощью качественного признака, представляют собой долю (или частоту).

Для наглядного представления о работе с качественными переменными, рассмотрим гипотетический пример: допустим, проведено поперечное исследование распространенности миопии среди учеников, отдельно взятой школы. Объем выборки составил 150 человек, и выборка была репрезентативной, то есть достаточно точно отражала свойства и характеристики генеральной совокупности (в данном случае генеральной совокупностью являются все дети, обучающиеся в школе). Качественным признаком, оцениваемым в процессе исследования, является факт наличия миопии, который описывается дихотомической качественной переменной, имеющей два альтернативных значения

Методы расчета доверительных интервалов

(«миопия есть» и «миопии нет»). В результате исследования обнаружено, что миопия имела место у 54 обследованных детей. Соответственно, доля школьников с миопией составила 36%. Но можем ли мы сказать, что среди школьников именно 36% детей будут близорукими? Ответ - однозначно нет, так как точечная оценка ни в коей мере не может отражать структуру явления в генеральной совокупности, за исключением случаев, когда в исследование были включены все члены генеральной совокупности, что бывает достаточно редко.

Соответственно, с позиции практического использования результатов данного исследования следует определить некие границы, в которых предположительно будет находиться доля школьников с миопией в генеральной совокупности. Для этого рассчитывается 95% доверительный интервал (ДИ) для доли, который представляет собой область, в которую с 95% вероятностью попадет истинное значение доли в генеральной совокупности. Иными словами, можно с 95% надежностью (вероятностью правильного ответа) сказать, что истинное значение частоты встречаемости признака в генеральной совокупности будет находиться в пределах 95% ДИ.

Существуют различные способы расчета 95% ДИ (таблице 1), каждый из которых имеет свои особенности [8].

Таблица 1.

для долей и частот.

Способ Особенности использования

Метод Уилсона Оптимальный метод для оценки частот: позволяет оценить доверительные интервалы для очень малых и очень больших частот, применим для выборок малого объема

Метод Вальда Метод не рекомендуется для использования при малых объемах выборок и в случае, если частота встречаемости признака менее 25% или более 75%. Доверительные интервалы в большинстве случаев оказываются слишком узкими

Метод Вальда с коррекцией по Агрести-Коуллу Метод не рекомендуется для использования при малых объемах выборок и в случае, если частота встречаемости признака приближается к 0% или 100%

Угловое преобразование Фишера Метод не рекомендуется для использования, если частота встречаемости признака менее 25% или более 75%.

«Точный метод» Клоппера-Пирсона Доверительные интервалы, полученные с использованием метода, в большинстве случаев слишком широки (степень консервативности метода увеличивается по мере уменьшения объема выборки, особенно при n < 15)

Рассмотрим наиболее оптимальный данном случае границы 95% ДИ будут метода расчета 95% ДИ - метод Уилсона. В рассчитываться по формулам [8]:

нижняя граница:

верхняя граница:

где Р - частота (или доля) признака в выборке, N - количество наблюдений в выборке, а параметр 11 - а / 2 принимает значение 1,96.

Все расчеты можно произвести вручную, но более удобным с практической точки зрения способом расчета 95% ДИ по методу Уилсона является использование онлайн-калькулятора, размещенного на интернет-ресурсе «VassarStats: Website for Statistical Computation» по адресу http://faculty.vassar.edu/lowry/prop1.html.

Общий вид данного калькулятора представлен на рисунке 1. Возвращаясь к приведенному выше примеру исследования, для расчета 95% ДИ доли школьников с

миопией с помощью онлайн-калькулятора в поле «k» введем количество наблюдений в выборке, имеющих изучаемый качественный признак - миопию (54 наблюдения), а в поле «п» - объем выборки (150 наблюдений). После нажатия кнопки «Calculate» в поле «Proportion» калькулятор представит долю в виде десятичной дроби, а нижнюю и верхнюю границу 95% ДИ - в поле «Lower limit» и поле «Upper limit» соответственно (окно «95% confidence interval: no continuity correction»).

к = 54

Proportion = 0.36

п = 150

Reset

Calculate

95% confidence interval: по continuity correction

Lower limit = 0.2876 Upper limit = 0.4394

Рис. 1. Онлайн-калькулятор для расчета 95% ДИ для долей (частот) по методу Уилсона

(http://faculty.vassar.edu/lowry/prop1.html).

Таким образом, доля школьников с миопией в генеральной совокупности (популяции) будет с 95% надежностью будет находиться в границах от 28,8% до 43,9%.

Итак, теперь мы можем записать, что в генеральной совокупности доля школьников с миопией составляет 36,0% (95% ДИ: 28,843,9%).

Следует отметить, что ширина ДИ напрямую зависит от объема выборки: чем больше объем выборки, тем меньше будет его ширина, и, соответственно, тем точнее будет предсказано фактическое значение доли (или частоты) в генеральной совокупности, что несет в себе большую практическую пользу.

Графическое отражение связи объема выборки и ширины ДИ представлено на рисунке 2. На данном графике представлены верхняя и нижняя границы 95% ДИ для доли в выборке, равной 25%, рассчитанные с помощью метода Уилсона. Видно, что для объема выборки в 20 наблюдений границы

95% ДИ доли располагается в пределах от 11% до 47%, то для выборки в 160 наблюдений он существенно сужается до границ от 19% до 32%, а для выборки в 640 наблюдений - до границ от 22% до 29%. Таким образом, для того, чтобы получить полезные для практического применения границы ДИ, необходимо иметь достаточный объем выборки, которая, в свою очередь, должна быть репрезентативной. Следует заметить, что границы 95% ДИ не являются симметричными, и асимметрия тем больше, чем ближе к 0% или 100% располагается значение доли в выборке.

Рис. 2. Изменение границ 95% ДИ, рассчитанного по методу Уилсона, в зависимости от объема выборки (значение доли в выборке - 25%).

Таким образом, расчета доли в выборке указанием 95% ДИ может оказаться достаточно для представления результатов исследований, направленных на оценку частоты данного явления в генеральной совокупности, но если целью исследования является проверка статистических гипотез о различиях между долями или частотами в различных группах наблюдения (как во многих аналитических исследованиях), то требуется

методов

использование других

статистического анализа.

Для этого используются статистические методы сравнения частот (или долей) в группах. Дизайн многих эпидемиологических исследований (например, поперечных, когортных, «случай-контроль») предполагает получение в результате исследования данных о частотах событий в группах наблюдения [11, 12, 13]. Например, в случае плацебо-

контролируемого рандомизированного

клинического испытания лекарственного препарата (когортное исследование) будут получены данные о количестве пациентов в основной группе (получавшей исследуемый препарат), и контрольной группе (получавшей плацебо), у которых за период наблюдения наблюдалась положительная динамика заболевания (итоговая дихотомическая переменная имеет 2 альтернативных значения - «положительная динамика» и «отсутствие положительной динамики»).

Представим гипотетическое когортное исследование, целью которого является оценка влияния запыленности воздуха рабочей зоны на частоту развития болезней органов дыхания у работников производства. Допустим, в исследование были включены 197 работника предприятия, в рабочей зоне которых проводились замеры запыленности воздуха, и в течение года регистрировались случаи появления болезней органов дыхания. В данном случае запыленность

В результате обследования 197 работников установлено, что за период наблюдения среди 94 человек, в воздухе рабочей зоны у которых степень запыленности превышала предельно допустимый уровень, у 28 развились заболевания дыхательной системы, а среди 103 работников, в воздухе рабочей зоны у которых степень запыленности не превышала

Подобные данные о частотах интересующих исследователя событий в сравниваемых группах можно представить в виде удобного эпидемиологического инструмента - четырехпольной таблицы (таблица 2) [34, 25]. Данная таблица названа четырехпольной таблицей сопряженности (2*2 ячеек), так как исходные данные присутствуют в четырех полях таблицы - A, B, C и D. Используются также многопольные таблицы сопряженности (например, 2*3, 3*5 ячеек и др.), о которых будет сказано ниже.

является номинальной дихотомической переменной, которая принимает два взаимоисключающих значения: «степень запыленности превышает предельно допустимый уровень» и «степень запыленности равна или ниже предельно допустимого уровня». Переменная, кодирующая исход, также принимает два альтернативных значения - «да» и «нет».

Результаты данного исследования представлены в таблице 3.

предельно допустимый уровень, данные заболевания появились у 16 лиц.

Нам необходимо ответить на вопрос, ассоциировано ли превышение предельно допустимого уровня запыленности воздуха рабочей зоны с повышением числа случаев заболеваний дыхательной системы работающих. Для этого воспользуемся

Таблица 2.

Четырехпольная таблица сопряженности._

Наличие ожидаемого исход а

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Да Нет Всего

Действие фактора Да A B A + B

Нет C D C + D

Всего A + C B + D A + B + C +D

Таблица 3.

Влияние запыленности воздух рабочей зоны на частоту развития болезней органов дыхания у работников производства.__

Развитие заболеваний дь системы (исход нательной )

Да Нет Всего

Степень запыленности (фактор) превышает предельно допустимый уровень 28 66 94

равна или ниже предельно допустимого уровня 16 87 103

Всего 44 153 197

критерием х2 Пирсона - одним из наиболее часто используемых способов статистической обработки качественных данных. Для наглядного представления о принципе действия данного критерия в логических рассуждениях пойдем от обратного: предположим, что степень запыленности никоим образом не влияет на число новых случаев заболеваний дыхательной системы у рабочих (нулевая статистическая гипотеза). В таком случае число наблюдений в ячейках распределилось бы пропорционально таким образом, чтобы отношение числа заболевших к не заболевшим было бы примерно равно при наличии и отсутствии действия исследуемого фактора (то есть А/В = СЮ). Мы можем рассчитать ожидаемое количество наблюдений в ячейках при справедливости нулевой гипотезы: для каждой ячейки оно рассчитывается путем перемножения сумм рядов и столбцов с последующим делением полученного произведения на общее число наблюдений в выборке. Так для ячейки А ожидаемое число наблюдений будет равно 94 (сумма по ряду) х 44 (сумма по столбцу) / 197 « 21, для ячейки В - 103 х 153 / 197 « 73, а для ячеек С и В - 23 и 80 соответственно.

Заметим, что ожидаемые частоты являются расчетными показателями и не обязательно принимают целочисленные значения. Принцип действия критерия х2 заключается в сравнении фактических частот, полученных в результате исследования, с ожидаемыми частотами, с последующей оценкой вероятности справедливости нулевой статистической гипотезы. Рассчитывается критерия х2 по формуле:

где О - фактическое число в ячейке таблицы, а Е - ожидаемое число в данной ячейке таблицы.

Рассчитаем значение критерий х2 для нашего примера:

X2 = (28 - 21)2 / 21 + (66 - 73)2 / 73 + (16 - 23)2 / 23 + (87 - 80)2 / 80 = 5,747

Далее полученное значение сравним с критическим значением для (г - 1) х (с - 1) числа степеней свободы (где г - количество

рядов, с - количество столбцов). В четырехпольной таблице и число столбцов, и число строк равно 2, поэтому df = (2 - 1) х (2 -1) = 1. Для степени свободы, равной 1, для уровня статистической значимости р < 0,05 критическое значение критерия х2 равно 3,841 [32, 26, 5]. Так как полученное в результате расчетов значение критерия х2 (5,747) превышает критическое, нулевая гипотеза об отсутствии влияния степени запыленности воздуха рабочей зоны на число заболеваний дыхательной системы у рабочих отвергается при критическом уровне значимости, равном 0,05 (х2 = 5,747; df = 1; р < 0,05).

Таким образом, мы можем сделать вывод о том, что превышение предельно допустимого уровня запыленности воздуха рабочей зоны ассоциировано с повышением числа случаев заболеваний дыхательной системы у работников. Мы не используем формулировку «превышение предельно допустимого уровня запыленности воздуха рабочей зоны приводит к повышению числа случаев заболеваний дыхательной системы работающих», так как подобный вывод можно сделать только при исключении влияния вмешивающихся факторов - конфаундеров (например, учет различного числа курильщиков в группах наблюдения), и, безусловно, при существова-нии подтвержденной патофизиологической связи между фактором и исходом.

Для применения критерия х2 необходимо соблюдение следующих условий [6, 21, 28]:

1. Включение в анализ только качественных (номинальных или порядковых) данных (возможно создание порядковых категорий из непрерывных данных).

2. Использование только абсолютных фактических и ожидаемых частот (доли и частоты для расчетов не используются).

3. Наблюдения должны быть независимы друг от друга (отбор участников исследования из генеральной совокупности должен производиться независимо друг от друга).

4. Сравниваемые группы должны быть также независимы друг от друга (критерий не может быть использован в случае исследований типа «до - после»).

5. Ожидаемое (не фактическое) число наблюдений в любой из ячеек таблицы

должно быть не менее 5 или 10 (для четырехпольных таблиц).

6. Доля ячеек таблицы с ожидаемым числом наблюдений менее 5 не должна превышать 20% (для многопольных таблиц).

Вычисляемое значение критерия х2 представляет собой не непрерывный ряд значений, а изменяется скачкообразно, так как основывается на частотах, которые являются целыми числами, в то время как табличные значения критического значения критерия основаны на непрерывной шкале. Для компенсации данного несоответствия может быть использована поправка на непрерывность (поправка Йейтса), которая применяется только в случае четырехпольных таблиц [39, 43]. Поправка Йейтса рассчитывается по формуле:

где | О - Е | - абсолютное значение (модуль) разности О и Е (фактического и ожидаемого чисел в ячейке таблицы).

Следует учесть, что учеными обсуждается целесообразность применения данной поправки [6]. Практически во всех русскоязычных пособиях по статистике сообщается о целесообразности применения данной поправки либо всегда, либо при небольшом объеме выборки и в случае, когда количество ожидаемых наблюдений в любой из ячеек таблицы сопряженности меньше 5 (или меньше 5). Ряд англоязычных пособий по статистике, напротив, не рекомендует применять данную поправку ввиду ее излишней консервативности, то есть высокой вероятности не обнаружить различия там, где они есть на самом деле.

В настоящее время считается, что поправку Йейтся целесообразно использовать при количестве ожидаемых наблюдений в любой из ячеек четырехпольной таблицы сопряженности меньше 5 (или 10) и необходимости консервативного подхода к результатам исследования. Значения критерия х2 при использовании поправки Йейтса существенно отличаются значения х2 без ее использования при малых выборках, в

то время как большой объем выборки нивелирует влияние данной поправки.

Рассчитаем поправку Йейтса для нашего случая гипотетического исследования:

X2 = (|28 - 211 - 0,5)2 / 21 + (|66 - 73| - 0,5)2 / 73 + (|16 - 23| - 0,5)2/ 23 + (|87 - 80| - 0,5)2 / 80 = 4,956

Полученное значение критерия х2 с поправкой Йейтса также превышает критическое значение критерия х2, равное 3,841, то есть и в данном случае нулевая гипотеза об отсутствии различий может быть отвергнута (х2 = 3,841; А = 1; р < 0,05).

Следующим альтернативным способом расчета критерия х2 является поправка на правдоподобие, которая вычисляется по формуле [6, 21]:

Поправка на правдоподобие, как и поправка Йейтса, более консервативна, чем критерий X2, что особенно выражено при небольшом объеме выборки.

Рассчитаем значение критерия х2 с поправкой на правдоподобие для нашего примера:

Лх2 = 2 * [(28 * 1П (28 / 21) + 66 * 1П (66 / 73) + 16 * 1П (16 / 23) + 87 * 1П (87 / 80)] = 5,788

И в данном случае полученное значение критерия х2 с поправкой на правдоподобие также превышает критическое значение критерия х2, равное 3,841, то есть и в данном случае нулевая гипотеза об отсутствии различий может быть отвергнута (Лх2 = 5,788; df = 1; р < 0,05).

Существует также способ точного расчета вероятности нулевой гипотезы об отсутствии взаимосвязи между фактором и исходом, который назван точным критерием Фишера [6, 21].

Согласно данному критерию, вероятность распределения чисел по ячейкам таблицы так, как было получено в результате исследования, в случае если была бы верна нулевая гипотеза об отсутствии взаимосвязи между фактором и исходом, вычисляется по формуле (для четырехпольной таблицы):

(A + В)! x (С + Р)! x (A + С)! x (в + Р)!

A! x B! x C! x D! x N!

где N - общее количество наблюдений, а знак «!» - факториал, который равен произведению числа на последовательность чисел, каждое из которых на 1 меньше предыдущего (например, 6! = 6 * 5 * 4 * 3 * 2 * 1 = 720).

Рассчитаем значение точного критерия Фишера для нашего примера:

Р = (94! х 103! х 44! х 153!) / (28! х 66! х 16! х 87! х 197!) = 0,013

Таким образом, мы можем отвергнуть нулевую гипотезу об отсутствии связи между фактором и исходом с вероятностью р = 0,013 (при критическом уровне р = 0,05). То есть вероятность того, что утверждение «превышение предельно допустимого уровня запыленности воздуха рабочей зоны ассоциировано с повышением числа случаев заболеваний дыхательной системы работников» окажется ошибочным, составляет всего 1,3% (при допустимой вероятности ошибки не более 5%).

Большинство специалистов придерживаются мнения, что точный критерий Фишера следует применять при ожидаемом количестве наблюдений менее 5 (или менее 10) в любой из ячеек четырехпольной таблицы. Следует отметить, что данный критерий может оказаться излишне консервативным в случае небольшого объема выборки [6].

Проблема с интерпретацией полученных результатов данных критериев может возникнуть в том случае, когда значение критерия х2 говорит о том, что нулевая гипотеза отвергается (р < 0,05), а более консервативные поправки не позволяют ее отвергнуть (р > 0,05). Такие ситуации могут возникать достаточно часто и наглядно демонстрируют неконструктивность

«дихотомического» подхода к интерпретации значения уровня статистической значимости, когда при любом значении р, даже незначительно превышающем 0,05, исследователь делает безальтернативный вывод об отсутствии статистических различий. Поэтому необходимо взвешенно подходить к интерпретации результатов статистической

обработки исследования и обязательно приводить значение достигнутого уровня статистической значимости до третьего знака после запятой во всех случаях, когда это возможно.

Но все же, как тогда поступать в случаях неоднозначной трактовки достигнутого уровня статистической значимости, полученного при использовании различных статистических методов (когда рассчитанное значение p незначительно превышает критическое)? На этот вопрос нет однозначного ответа, но можно посоветовать увеличить объем выборки (набрать больше наблюдений в исследование), или попытаться объединить группы наблюдений (если количество сравниваемых групп больше 2), если это не противоречит дизайну исследования.

Итак, мы рассмотрели случаи расчета статистических критериев, используемых при анализе четырехпольных таблиц. Но в ходе исследований часто приходится оценивать факторы и исходы, которые могут иметь больше двух альтернативных значений. Примером может служить таблица сопряженности 2x3, в которой фактором является вариант генотипа (3 варианта фактора: доминантная гомозигота, гетерозигота или рецессивная гомозигота), а исходом - развитие фенотипического признака, например, определенного заболевания (2 варианта исхода: признак проявился или не проявился). Примером многопольной таблицы 4x3 является таблица сопряженности, в которой фактором является градация изменения массы тела (нормальная масса тела, избыточная масса тела или ожирение - порядковый признак), а исходом -функциональный класс стенокардии напряжения по NYHA (также порядковый признак - I, II, III или IV степень). В процессе анализа многопольных таблиц следует использовать критерий х2, а в случае, если доля ячеек с ожидаемым числом наблюдений менее 5 превышает 20%, потребуется использовать точный критерий Фишера. Анализ многопольной таблицы

сопряженности, включающей порядковые (ординальные) переменные, также может проводиться с использованием специальных методов анализа связи между переменными, в том числе с помощью коэффициента корреляции Кендалла (т), который представлен в ряде источников [7, 9] и будет подробно описан в следующей статье настоящей серии публикаций, посвященной корреляционному анализу.

Вернемся к нашему гипотетическому исследованию. Итак, с помощью расчета критерия х2 и его альтернативных вариантов, мы статистически подтвердили тот факт, что

превышение предельно допустимого уровня запыленности воздуха рабочей зоны ассоциировано с повышением числа случаев заболеваний дыхательной системы работающих.

С практической точки зрения важным представляется не только подтверждение (или опровержение) факта наличия взаимосвязи между анализируемыми качественными признаками, но и оценка степени этой связи (величины эффекта).

Для этого могут использоваться различные методы, основные из которых представлены в таблице 4 [6, 21, 42].

Таблица 4.

Основные критерии, используемые для оценки силы связи между номинальными переменными.

Наименование критерия

Область применения

Формула расчета

Критерий ф («фи»)

Четырехпольные таблицы

где х2 - значение критерия х2 п - объем выборки

Критерий Крамера (V)

Четырехпольные и

многопольные

таблицы

где х2 - значение критерия х2, п - объем выборки, г -количество рядов (строк), с - количество столбцов

Коэффициент сопряженности Пирсона (ф

Четырехпольные и многопольные таблицы

где х2 - значение критерия х2, п - объем выборки, г ■ количество рядов (или столбцов, так как формула предназначена только для симметричных таблиц). С рассчитывается для симметричных таблиц (формула Sakoda)

Критерий Чупрова

ТО

Многопольные таблицы размером не более 5*5

где х2 - значение критерия х2, п - объем выборки, г -количество рядов (строк), с - количество столбцов

Критерий А

Гудмена-

Краскела

Четырехпольные таблицы

где ^ - наибольшие числа в ячейках в каждом из классов независимой переменной; fd - наибольший из маргинальных итогов (сумм) зависимой переменной, п - объем выборки_

Первые четыре представленных в таблице критерия, оценивающих силу связи между номинальными переменными, могут

принимать значения от 0 до 1. Значения критериев ф и Крамера интерпретируются согласно таблице 5. [6, 21].

Таблица 5.

Интерпретация значений критериев ф и V Крамера согласно рекомендациям

Значение критериев Сила взаимосвязи

ф или V Крамера

<0,1 Несущественная

0,1 - <0,2 Слабая

0,2 - <0,4 Средняя

0,4 - <0,6 Относительно сильная

0,6 - <0,8 Сильная

0,8 -1,0 Очень сильная

Rea и Parker.

Несколько иную интерпретацию имеет критерий А Гудмена-Краскела: его значение, равное нулю, означает, что наличие информации о независимой переменной никак не улучшает возможности прогнозирования значений зависимой переменной, значение, близкое к 1, говорит о высокой точности прогнозирования значения зависимой номинальной переменной на основании значения независимой переменной.

В случае, если в многопольной таблице представлены порядковые переменные, целесообразно провести более глубокий анализ связи между фактором и исходом, с использованием критерия Кендалла (т).

Если рассчитать значения данных критериев для нашего примера, то значения критерия ф, критерия Крамера, коэффициента сопряженности Пирсона (обоих вариантов) и критерия Чупрова будут равны друг другу (их значение составит 0,17, что говорит о слабой связи между фактором и исходом). Это неудивительно, так как мы рассматриваем простейший вариант - четырехпольную таблицу, а различия в значения критериев появляются при анализе многопольных таблиц сопряженности.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Итак, мы рассмотрели математические способы оценки связи между фактором и исходом, но гораздо большую практическую ценность представляют количественные показатели, которые позволяют оценить вероятность возникновения того или иного исхода в зависимости от наличия или отсутствия фактора риска. Данными показателями являются относительный риск (relative risk - RR) и отношение шансов (odds

ratio - OR) [12, 11, 34, 25]. Оба показателя рассчитываются только для четырехпольных таблиц (заметим, что любую многопольную таблицу можно превратить в четырехпольную путем объединения строк и/или столбцов, если это не противоречит цели и дизайну исследования).

Следует обратить внимание на то, что именно на данном этапе анализа данных проявляется тесная связь дизайна эпидемиологического исследования и статистического анализа полученных результатов.

В случае когортного исследования проводится наблюдение за когортой пациентов (или здоровых лиц) и регистрируется частота развития интересующего исследователя исхода в основной и контрольной группах с течением времени. В этом случае правомерно говорить об относительном риске, так как оценивается риск развития исхода в сравниваемых группах.

Относительный риск рассчитывается как отношение риска развития заболевания в группе лиц, на которую действовал фактор, к риску развития заболевания в группе лиц, не подвергавшихся действию фактора.

Относительный риск рассчитывается по формуле (см. таблицу 2):

пр. A / (A + B)

C / (C + D)

Относительный риск демонстрирует, во сколько раз действие фактора увеличивает вероятность развития исхода. Значение отношения рисков, равное 1, говорит о том, что изучаемый фактор не оказывает влияние на развитие исхода, а если относительный

риск больше 1, то можно сделать вывод о том, что действие изучаемого фактора увеличивает вероятность развития исхода (например, заболевания), и чем больше значение относительного риска, тем выше вероятность его развития. Если же относительный риск меньше 1, то фактор, наоборот, снижает вероятность развития исхода.

В нашем примере данные были собраны в результате когортного исследования, поэтому

нижняя граница:

следует рассчитать относительный риск формуле, приведенной выше (таблица 3):

по

28 / (28 + 66)

1,92

16 / (16 + 87)

Но точеная оценка относительного риска, как и частот и долей, не имеет существенной практической ценности, поэтому рассчитаем 95% ДИ для полученного значения с использованием следующих формул [6, 21]:

верхняя граница:

где 1п - натуральный логарифм, е - основание натурального логарифма (~ 2,718).

В нашем случае, после использования вышеприведенных формул, результаты расчета относительного риска следует представлять следующим образом: превышение предельно допустимого уровня запыленности воздуха рабочей зоны повышает риск развития заболеваний дыхательной системы у работников в 1,92 раза (95% ДИ: 1,11-3,31). Разумеется, такая формулировка правомерна только в случае исключения влияния конфаундеров на результаты исследования.

В случае исследований «случай-контроль» использование понятия риска неправомерно, так как данные собираются не путем наблюдения за исследуемой группой лиц или пациентов, а регистрируются на основании сведений о группе лиц, к которых развился исход (так называемые «случаи»), и специальным образом отобранной группы сравнения (так называемые «контроли»). В данном случае для количественной оценки степени влияния фактора на исход используется отношение шансов (шансы -это отношение вероятности того, что событие произойдет, к вероятности того, что данное событие не произойдет). В исследованиях «случай-контроль» оцениваются не шансы развития исхода или «не развития» исхода у

лиц, подвергавшихся действию фактора, а наоборот, шансы быть или не быть подвергнутыми фактору при наличии изучаемого исхода. Отношение шансов показывает, во сколько раз шансы наступления исхода при наличии изучаемого фактора выше шансов исхода при отсутствии действия данного фактора.

Отношение шансов рассчитывается по формуле (см. таблицу 2):

ОК =

А / В

С / Р

Для нашего примера, если бы данные, представленные в таблице 3, были бы собраны в результате исследования «случай-контроль», мы бы рассчитали отношение шансов по формуле:

ОК

28 / 66

16 / 87

2,31

Но точеная оценка отношения шансов также не имеет существенной практической ценности, поэтому рассчитаем 95% ДИ для полученного значения отношения шансов с использованием формул [6, 21]:

нижняя граница:

1п(Ш)-1,96- -+-+—+— \A В С D

верхняя граница:

ln(OR)+l,96'

1111

А В С D

После использования вышеприведенных формул, результаты расчета отношения шансов следует интерпретировать следующим образом: для работников, у которых развились заболевания дыхательной системы, шансы того, что они работают в условиях превышения предельно допустимого уровня запыленности воздуха рабочей зоны, в 2,31 раза (95% ДИ: 1,15-4,61) выше, чем шансы того, что они работают в условиях допустимого уровня запыленности.

Возможна ситуация, когда значение ОК оказывается меньше 1, что говорит о том, что действие изучаемого фактора не вызывает, а, напротив, предотвращает развитие исхода. В таком случае для удобства восприятия рекомендовано представлять данные, альтернативным образом переформулировав ожидаемый исход, или взять обратное значение от рассчитанного отношения шансов (например, ОКдля исхода = 0,35, тогда ОКдля отсутствия исхода _

1/0,35 = 2,86). Также следует взять обратное значение от границ 95% ДИ, но при этом верхняя и нижняя границы ДИ поменяются местами.

Важно отметить, что расчет относительного риска и отношения шансов имеет практический смысл только в том случае, если отвергнута нулевая гипотеза, то есть статистически подтверждена связь между фактором и исходом. Если же попытаться рассчитать 95% ДИ в случае, когда принята нулевая статистическая гипотеза, он будет включать в себя значение 1, что говорит об отсутствии связи между фактором и исходом.

В случае применения отношения шансов к результатам проспективных когортных исследований, оно может достаточно точно отражать относительный риск при редких исходах (до 10%), в то время как в остальных случаях значение отношения шансов будет существенно превышать значение относительного риска, что может привести к неправильному толкованию результатов

исследования. На рисунке 3 представлены одновременно и относительный риск, и отношение шансов для гипотетического проспективного когортного исследования, включающего 200 человек (по 100 человек в основной и контрольной группе), в результате которого в контрольной группе (не подвергавшейся воздействию фактора риска), заболевание развилось у 10% (0,10) лиц, и, соответственно, не развилось у 90% (0,90) лиц. На графике представлены относительный риск и отношение шансов для частоты развития заболевания в основной группе, равной 0,10, 0,15, 0,20 и далее по нарастающей до частоты, равной 0,90. Мы видим, что по мере увеличения частоты развития заболевания в основной группе наблюдается все большее удаление значения отношения шансов от значения относительного риска.

Помимо относительного риска, для количественного представления степени влияния фактора на исход используются и другие расчетные показатели, такие как число больных, которых необходимо лечить для предотвращения одного неблагоприятного исхода (number needed to treat - NNT), снижение относительного риска, снижение абсолютного риска, добавочный риск и другие, с которыми можно ознакомиться в соответствующей литературе по эпидемиологии [34, 25].

Мы рассмотрели способы анализа качественных переменных в независимых выборках, но в исследованиях достаточно часто приходится сравнивать данные парных (связанных) выборок. Примером таких исследований является наблюдение по типу «до - после», когда качественные признаки сравниваются на момент начала с моментом окончания действия изучаемого фактора: например, сравнение приверженности подростков к здоровому образу жизни (удовлетворительная приверженность / неудовлетворительная приверженность) до и после курса занятий в центре здоровья.

90

80

70

60

50

40

30

20

10

81,0 ■

51,0 }

36,0 +

2,3

3,0

3,9

4,9

6,0

7,4

9,0

11,0

27,0 / /

Р

21,0 / *

16,7 у* 13,5

¿Г*» 7.0 7, 8,0 8.5 М

10 1 5 ' 2,0 1 2«5 ' 3'° ^

0,'Ю 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 —»—Относительный риск (ЯЯ) —■—Отношение шансов (ОД)

Рис. 3. Связь относительного риска и отношения шансов (проспективное когортное исследование, п = 200, С / (С + й) = 10%, по оси абсцисс представлены различные значения отношения А / (А + В)).

Другим примером может служить исследование, в котором каждый из членов выборки одновременно подвергается действию двух факторов, действие которых сравнивается: например, оценка улучшения субъективного самочувствия пациентов (улучшение / отсутствие улучшения) при использовании двух схем симптоматической терапии, обе из которых в случайной очередности получает каждый участник исследования - аналог перекрестного исследования.

Для анализа связанных выборок с использованием дихотомических переменных применяется критерий Мак-Нимара [6, 21].

Приведем пример еще одного гипотетического исследования «до - после», направленного на оценку наличия изжоги до начала и после окончания курса комплексного лечения язвенной болезни.

Результаты обследования 66 пациентов представлены в виде таблицы (таблица 7). На момент начала терапии изжога беспокоила 58 пациентов и отсутствовала у 18 участников исследования.

Таблица 7.

Влияние курса лечения язвенной болезни на наличие у пациентов изжоги._

После лечения

Наличие/отсутствие признака Отсутствие Наличие Всего

изжоги изжоги

Наличие изжоги 48 (А) 10 (В) 58 (A + B)

До лечения Отсутствие изжоги 12 (С) 6 (й) 18 (C + D)

Всего 60 (А + С) 16 (В + й) 54 (N = A + D)

Заметим, что в случае сравнения частот в исследовании типа «до - после» требуется рассмотрение в динамике каждого наблюдения по-отдельности.

Итак, в таблице представлено, что после курса лечения изжога перестала беспокоить 48 пациентов из общего количества пациентов, которых она беспокоила (58 человек), при этом она появилась у 6 пациентов из тех, у которых изначально изжога не наблюдалась (18 человек). Также зафиксировано, что у 12 пациентов (из 18-ти) изжога отсутствовала как до, так и после лечения, а 10 пациентов (из 58-ми) изжога как беспокоила, так и продолжила беспокоить.

Мы можем сказать, что в нашей выборке исчезновение изжоги наблюдалось в 82,8% случаев, но при этом она появилась у 33,3% пациентов из числа тех, у которых изжога изначально отсутствовала. Рассмотрим, можно ли считать такой совокупный эффект лечения благоприятным с позиции результатов статистического анализа.

Итак, в клетке А представлено количество благоприятных исходов после воздействия фактора (исчезновение изжоги после курса лечения), а в клетке й - количество неблагоприятных исходов (после курса лечения изжоги, которой изначально не было). Для расчета критерия Мак-Нимара используются данные только в этих двух клетках и некое расчетное значение, равное сумме значений этих двух клеток (И = А + й). Заметим, что значения в клетках В и С, также как и общий объем выборки, при расчете критерия Мак-Нимара не используются.

Нулевая статистическая гипотеза в данном случае состоит в том, что доля наблюдений, у которых наблюдается благоприятная динамика признака, равна доле наблюдений, у которых динамика, напротив, имеет неблагоприятный характер.

Для проверки гипотезы в случае, когда N > 50 (сумма значений в ячейках А и й, но не объем выборки), рассчитывается значение х2 по упрощенной формуле с числом степеней свободы, равным 1:

где | А - 0 \ - абсолютное значение (модуль) разности значений

соответствующих клеток (модуль разности), а единица вычитается с целью выполнения поправки на непрерывность.

Если рассчитанное значение критерия х2 превосходит соответствующее табличное критическое значение, то нулевая гипотеза отклоняется.

Рассчитываем фактическое значение х2:

(148-61-1)^

л 48 + 6

Поскольку рассчитанное значение критерия (31,13) значительно больше критического (3,84) [32, 5, 26], то нулевая гипотеза об отсутствии различий до и после курса лечения отвергается на выбранном уровне значимости (р = 0,05). Таким образом, мы доказали, что предложенное комплексное лечение язвенной болезни статистически значимо уменьшает количество пациентов, страдающих изжогой.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Как уже было сказано выше, таблицы сопряженности могут включать качественные признаки, имеющие порядковую (орднальную) шкалу измерения. Так как порядковые переменные по своей сути являются упорядоченными определенным образом качественными переменными, данный факт дает больше информации о переменных и, соответственно, расширяет возможности их анализа по сравнению с номинальными данными.

Поскольку порядковые переменные упорядочены в определенном направлении (по возрастанию или по убыванию), в основе всех критериев, используемых для анализа таких данных, лежит расчет количества нарушений порядка их расположения [7].

Рассмотрим пример гипотетического исследования, направленного на оценку связи между категорией индекса массы тела (ИМТ) пациента (может быть представлена как

Каждая ячейка таблицы сравнивается по своему положению с остальными, и все пары данных можно классифицировать как конкордантные, дискордантные и связанные либо по зависимой, либо по независимой переменной (конкордантные пары также называют проверсиями, а дискордантные -инверсиями).

Для начала рассмотрим пару ячеек R1C1 и R2C2. Для ячейки R2C2 номер как ряда, так и столбца выше, чем таковые для ячейки R1C1, что позволяет считать эту пару ячеек конкордантной (проверсия). Всего в ячейке R1C1 11 наблюдений, а в ячейке R2C2 - 13 наблюдений, значит в ячейках R1C1 и R2C2 содержится информация о 13 * 11 = 143 конкордантных парах индивидуальных наблюдений. Далее рассмотрим ячейки R1C2 и R2C1. В данном случае порядковый номер ряда для ячейки R1C2 меньше, чем для ячейки R2C1, а порядковый номер столбца -

порядковая переменная) и степени артериальной гипертензии (АГ). Результаты исследования представлены в таблице 8.

В представленной многопольной таблице сопряженности все строки и ряды расположены по возрастанию (от 1 -го до последнего столбца и от 1 -го до последнего ряда) и каждая из ячеек обозначена относительно ее положения по рядам и столбцам (С).

больше, что позволяет считать эту пару ячеек дискордантной (инверсия). Соответственно, общее число конкордантных пар индивидуальных наблюдений для этих ячеек составит 6 * 10 = 60 наблюдений. Примером пары, связанной по рядам, служат ячейки R1C1 и R1C2 (11 * 6 = 66 наблюдений), а примером пары, связанной по столбцам, служат ячейки R1C1 и R2C1 (11 * 10 = 110 наблюдений).

Количество возможных пар ячеек (комбинаций между ячейками) можно рассчитать по формуле п = 0,5 * N * ^ - 1), где N - количество ячеек. Поскольку всего в представленной таблице 6 ячеек, количество возможных комбинаций равно 15-ти (таблица 9). Таким образом, всего в нашем примере выявлены 432 конкордантные пары наблюдений, 129 дискордантных пар и 877 связанных пар, из которых 638 связаны по рядам, а 239 связаны по столбцам.

Таблица 8.

Многопольная таблица сопряженности (3 х 2)._

АГ I ст. (уровень 1) АГ II ст. (уровень 2) Аг III ст. (уровень 3) Всего

Нормальная масса тела (уровень 1) 11 ^1С1) 6 ^1С2) 3 (R1C3) 20 (R1)

Избыточная масса тела (уровень 2) 10 ^2С1) 13 (R2C2) 17 (R2C3) 40 (R2)

Всего 21 (С1) 19 (С2) 20 (C3) 60 (n)

Метка группы (уровня) 1 (»1) 2 (»2) 3 (w3)

Таблица 9.

Комбинации ячеек таблицы сопряженности (результат анализа таблицы 8).

Пары ячеек Количество пар индивидуальных наблюдений

Расчет Всего

Конкордантные пары

R1C1 R2C2 11х13 143

R1C1 R2C3 11х17 187

R1C2 R2C3 6х17 102

Всего: 432

Дискордантные пары

R2C1 R1C2 10х6 60

R2C1 R1C3 10х3 30

R2C2 R1C3 13х3 39

Всего: 129

Пары, связанные по рядам

R1C1 R1C2 11х6 66

R1C1 R1C3 11х3 33

R1C2 R1C3 6х3 18

R2C1 R2C2 10х13 130

R2C1 R2C3 10х17 170

R2C2 R2C3 13х17 221

Всего: 638

Пары, связанные по столбцам

R1C1 R2C1 11х10 110

R1C2 R2C2 6х13 78

R1C3 R2C3 3х17 51

Всего: 239

Основные критерии, которые могут быть данными, представлены в таблице 10 [6, 21, использованы для анализа многопольных 36, 40, 41]. таблиц сопряженности с ординальными

Таблица 10.

Основные критерии, используемые для оценки силы связи между ординальными переменными._

Наименование Особенности использования Формула расчета

критерия

Y-критерий Гудмена- Краскела Симметричный критерий. Игнорируются связанные пары наблюдений где С - количество конкордантных, й - количество дискордантных пар

Критерий ть Кендалла Симметричный критерий. Учитываются связанные пары наблюдений. Используется для квадратных таблиц (2*2, 3*3 и т.д.) где Х - количество пар наблюдений, связанных по рядам, Y - количество пар наблюдений, связанных по столбцам, а С и D - количество конкордантных и дискордантных пар

Продолжение таблицы 10.

Наименование Особенности использования Формула расчета

критерия

Критерий Тс Кендалла Симметричный критерий. Учитываются связанные пары наблюдений, общее количество наблюдений, число рядов и столбцов значение критерия в значительной степени зависит от размеров таблицы (количества рядов и столбцов) где т - меньшее значение количества рядов или столбцов (в нашем примере т=2), N - объем выборки, С и D - количество конкордантных и дискордантных пар

Критерий d Сомера Асимметричный критерий. Учитывает только связанные пары данных по столбцам, если в столбцах записана зависимая переменная (в нашем случае -уровень АГ) где С и D - количество конкордантных и дискордантных пар, соотверственно, а У - количество пар, связанных по зависимой переменной.

Значение всех представленных критериев может варьировать от -1 до 1, причем 1 означает полную прямопропорциональную взаимосвязь между переменными, -1 - полную обратную взаимосвязь между переменными, а 0 - полное отсутствие какой-либо связи между изучаемыми признаками (соответственно, чем ближе значение критерия к 1 или -1, тем взаимосвязь между переменными сильнее).

Для нашего примера (таблица 8), Y = 0,540, ть = 0,309, Тс = 0,337, <1 = 0,379, что говорит о наличии существенной связи между переменными.

Для анализа таблиц с ординальными данными может также быть использован критерий х2 для линейного тренда [7, 40]. Следует отметить, что критерий х2 для линейного тренда, в отличие от классического критерия х2 Пирсона, менее чувствителен к ситуациям, когда ожидаемое количество наблюдений в некоторых ячейках мало.

С помощью критерий х2 для линейного тренда можно оценить, имеется ли в пропорциях тренд возрастания уровня категории исхода при возрастании уровня категории фактора (увеличение степени АГ при увеличении категории ИМТ). Вычисляется он по формуле (см. таблицу 8):

где Ш; - метка группы, ЯЮ - значения в ячейках первого ряда, Н1 - сумма наблюдений в первом ряду таблицы, С; - сумма наблюдений в соответствующем столбце таблицы.

В нашем примере значение критерия х2 для линейного тренда составит 6,35.

Далее полученное значение сравним с критическим значением для (к - 1) числа степеней свободы (к - количество столбцов). Для нашей таблицы df = 3 - 1 = 2. Для числа степеней свободы, равной 2, и для уровня статистической значимости р < 0,05 критическое значение критерия х2 равно 4,605 [32, 5, 26]. Так как полученное в результате расчетов значение критерия х2 для линейного тренда превышает критическое, нулевая гипотеза об отсутствии связи между категорией ИМТ и степенью АГ у пациентов отвергается при критическом уровне значимости, равном 0,05 (х2 = 6,35; df = 2; р < 0,05).

Разумеется, представленные выше способы анализа качественных данных не исчерпываются приведенными выше методами статистического анализа. Более подробно с методами обработки качественных переменных можно ознакомиться в специализированной литературе по статистике [5, 28, 6].

Для того, чтобы читатель приобрел практические навыки выполнения анализа качественных переменных, будет рассмотрен фрагмент данных, которые были собраны в

ходе исследования, направленного на изучение метаболического синдрома и его детерминант в условиях неблагополучной социально-экологической ситуации в Южном Казахстане [22, 23, 27, 31].

В ходе данного исследования были получены значения ИМТ и сведения о виде трудовой деятельности пациентов, которая подразделялась на физический и умственный

труд (дихотомическая переменная). ИМТ является непрерывной переменной, и в данном случае мы представили ее в виде дихотомической переменной, принимающей 2 значения: нормальная масса тела (ИМТ < 25 кг/м2) и избыточная масса тела (ИМТ > 25 кг/м2).

Результаты данного исследования представлены в таблице 11.

Таблица 11.

Наличие ожидаемого исхода

Избыточная масса тела Нормальная масса тела Всего

Вид трудовой деятельности Умственная 90 39 129

Физическая 155 28 183

Всего 255 67 312

Анализ качественных данных будет проведен с использованием программного обеспечения Statistica 10 [30, 3] и SPSS 20 [4], демонстрационные версии которого можно загрузить с официальных сайтов разработчиков (www.stаstsoft.com и www.ibm.com соответственно).

Представленные ниже алгоритмы действий являются не более чем инструментом анализа данных, в то время как корректная интерпретация полученных результатов требует наличия базисных знаний в области биомедицинской статистики, которые могут быть получены только путем изучения специализированной литературы [5, 2, 24, 26, 35].

Анализ качественных данных с использованием программы Statistica 10 К сожалению, программа Statistica 10 не может быть рекомендована начинающему

исследователю для выполнения различных методов анализа качественных данных по причине достаточно сложного и неудобного интерфейса обработки таблиц сопряженности. Поэтому мы рассмотрим только базовые расчеты некоторых критериев на основании таблиц 2^2. В случае, если читатель заинтересуется детализированным

алгоритмом анализа качественных данных в программе Statistica 10, с ним можно ознакомиться в соответствующей литературе [30, 3].

Для того, чтобы внести анализируемые данные в таблицу 2*2, откроем программу и с помощью меню «File» в верхней части экрана создадим новый файл, выбрав раздел «New» (в появившемся окне «Create new document» нажмем «OK»).

Рис. 4. Окно «Nonparametric Statistics» программы Statistica 10.

Далее выберем меню «Statistics», раздел «Nonparametrics», после чего в открывшемся окне (рисунок 4) выберем раздел «2*2 Tables...» и нажмем кнопку «OK». Программа откроет форму таблицы сопряженности 2*2

для заполнения. Внесем в нее данные в соответствие с таблицей 11 (рисунок 5).

Нажатие на кнопку «Summary» откроет окно результатов (рисунок 6).

•¿Л) 2x2 Tables: Spreadsheet! |»ü"

Quick [пш] Summary

90 | 39 | Cancel

155 tf| 23 [g Options ▼

bud Summary: 2X2 Table

Specify the frequences for the two-by-two frequency table; then click Summary: 2x2 Table

Рис. 5. Окно «2x2 Tables» программы Statistica 10 (ввод данных для расчета критерия х2)-

Workbookl* - 2 х 2 Table (Spreadsheet!)

Workbookl' Fl 4, у Nonparametrics É Two-by-two LgT| 2x2 Tab

S IIw£2m

2x2 Table (Spreadsheet-!)

Column 1 Column 2 Row Totals

Frequencies, row 1 90 39 129

Percent of total 28.846% 12.500% 41 346%

Frequencies, row 2 155 28 183

Percent of total 49.679% 8.974% 58.654%

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Column totals 245 67 312

Percent of total 78,526% 21.474%

Chi-square (df=1) 10,001 p= .0016

V-square (df=1) 9,97 p= .0016

Yates corrected Chi-square 9,14 p= ,0025

Phi-square .03207

Fisher exact p. one-tailed p= .0013

two-tailed p= .0020

McNemar Chi-square (A/D) 31,53 p= .0000

Chi-square (B/C) 68.17 p= ,0000 -

h<

2x2 Table (Spreadsheet 1)

Рис. 6. Окно результатов расчета

В таблице, представленной на рисунке 6, в первых 6-ти строках и 3-х столбцах представлена таблица сопряженности, соответствующая таблице 11. Основные результаты расчетов представлены в следующих строках:

- срока «Chi-square (df=1)» представляет значение критерия х2 (10,00) и его уровень статистической значимости (р = 0,0016);

- строка «Yates correction Chi-square» представляет поправку Йейтса и уровень статистической значимости (х2 = 9,14; p = 0,0025);

критерия х2 программой Statistica 10.

- строка «Fisher exact р», «two tailed» -значение точного критерия Фишера (р = 0,0013).

Данный раздел программы не позволяет рассчитывать ожидаемые числа в ячейках таблицы, но это можно сделать самостоятельно и убедиться в том, что ожидаемое число наблюдений в любой из ячеек таблицы превышает 5, поэтому правомерно использовать результаты, представленные в строке «Chi-square (df=1)».

Таким образом, мы выяснили, что наличие избыточной массы тела ассоциировано с

видом трудовой деятельности пациента. Остается открытым вопрос, каким именно образом они ассоциированы. Так как данное исследование является поперечным и в ходе исследования собирались данные о настоящем заболевании (избыточная масса тела) и об имевших место действующих в прошлом (вид трудовой деятельности), по методологии проведения оно сходно с исследованием «случай-контроль», и практически значимой мерой эффекта является отношение шансов.

Для представленного случая отношение шансов рассчитывается по формуле (см. таблицу 11):

90 / 39

OR

= 0,42

155 / 28

Нижняя и верхняя границы 95% ДИ для OR, рассчитанные по вышеприведенным формулам, равны 0,24 и 0,72 соответственно.

Так как значение OR < 1, это означает, что действие фактора (в нашем случае умственного труда, соответствующего в первой строке таблицы сопряженности) уменьшает вероятность появления исхода (в нашем случае ожирения, соответствующего первому столбцу таблицы сопряженности).

Однако такое значение OR трудно для восприятия, поэтому сделаем его более удобным, вычислив обратные значения отношения шансов по формуле OR' = 1 / OR, как для самого значения, так и для границ 95% ДИ.

Итак, после математического преобразования результат исследования будет сформулирован следующим образом: занятие физическим трудом повышает шансы наличия избыточной массы тела в 2,4 раза (95% ДИ: 1,4-4,2).

Результаты исследования парадоксальны -занятия физическим трудом, казалось бы, требуют больше энергозатрат по сравнению с умственным трудом, и по этой причине ожирение в группе лиц, занимающихся физической работой, должно встречаться реже. Но данный подход, несмотря на очевидность, не является корректным, так как не учитывает множество вмешивающихся факторов (конфаундеров), таких как уровень дохода, занятия спортом, особенности пищевых предпочтений, приверженность к здоровому образу жизни и другие. Поэтому

при игнорировании влияния конфаундеров выводы по результатам исследования могут оказаться некорректными.

Далее с помощью программы Statistica 10 рассчитаем значение критерия Мак-Нимара. Воспользуемся для этой цели таблицей 7, повторив ручные расчеты программным способом. Итак, вернемся к окну анализа, нажав на соответствующую вкладку «2 * 2 Tables:..» в нижней левой части рабочего поля программы, и в окне «2*2 Tables» ведем данные согласно таблице 7 (рисунок 7), после чего нажмем кнопку «Summary».

Рис. 7. Окно «2x2 Tables» программы

Statistica 10 (ввод данных для расчета критерия Мак-Нимара).

Результаты расчета критерия Мак-Нимара следует считывать по строке «McNemar Chi-square (A/D)»: значение критерия составляет 31,13, уровень статистической значимости p < 0,0001, что соответствует результатам приведенных выше ручных расчетов значения критерия.

В программе SPSS 20 функциональные возможности для работы с качественными данными реализованы гораздо удобнее с позиции начинающего исследователя, по сравнению с программой Statistica 10.

Для начала работы необходимо открыть файл 6_Categorical_SPSS.sav, который потребуется загрузить с сайта журнала «Наука и Здравоохранение». В файле в первых 3-х строках данные представлены в следующем виде (рисунок 9):

- В столбце «Activity» представлены 2 альтернативных варианта значений: значению «1» соответствует умственный труд («Brainwork»), значению «2» - физический труд («Physical»).

- В столбце «BMI» также представлены 2 альтернативных варианта значений: значению «1» соответствует избыточная масса тела («Overweight»), значению «2» -нормальная масса тела («Normal weight»).

- В столбце «Sum_of_cases» представлено количество пациентов, соответствующее определенным сочетанием

значений в столбцах «Activity» и «BMI» (например, в третьей строке указано количество пациентов, которые занимаются физическим трудом и имеют избыточную массу тела, равное 155).

Данные, представленные в оставшихся 3-х столбцах, будут использованы позже для расчета критерия Мак-Нимара.

Щ Workbooks -2x2 Table (Spreadsheet!.)

Workbook2* R-i j? Nonparametrics Й-: I? Two-by-two □ 2x2Tabl

III

2x2 Table (Spreadsheetl)

Column 1 Column 2 Row Totals

Frequencies, row 1 48 10 58

Percent of total 63.158% 13.158% 76.316%

Frequencies, row 2 12 6 18

Percent of total 15.789% 7,895% 23,684%

Column totals 60 16 76

Percent of total 78,947% 21.053%

Chi-square (df=1) 2.14 p= .1435

V-square (df=1) 2,11 p= .1462

Yates corrected Chi-square 1.28 p= .2576

Phi-square .02816

Fisher exact p. one-tailed p= .1300

two-tailed p= .1868

McNemar Chi-square (A'D) 31.13 p= .0000

Chi-square (B/C) ,05 p= ,8312

Ü

2x 2 Table (Spreadsheet 1)

Рис. 8. Окно результатов расчета критерия Мак-Нимара программой Statistica 10. Анализ качественных данных с использованием программы SPSS 20

*Categorical_SPSS.sav [DataSetl] - IBM SPSS Statistics Data Editor

File Edit View Data Transform Analyze Direct Marketing Graphs Utilities Add-ons Window Help

1: Activity

1,00

Vi:

Activity BMI Sum of cases Start treatment End treatment Sum_patients

1 1.00 1.00 90.00 1.00 1.00 10.00

2 1.00 2.00 39,00 1,00 2.00 48.00

3 2.00 1,00 155.00 2.00 1.00 6.00

4 2.00 2,00 28.00 2.00 2.00 12.00

с

Рис. 9. Представление результатов исследования в файле SPSS 20.

Для обработки представленных данных, прежде всего, необходимо «взвесить» наблюдения, то есть указать программе, что в столбце «Эит^СсаБеБ» указаны значения, соотнесенные с первым и вторым столбцами (в противном случае программа будет считать,

что в файле представлены данные только по четырем наблюдениям).

Для этого войдем в меню «Data» и выберем раздел «Weight cases» («взвесить наблюдения»), как показано на рисунке 10.

@ *Categorical_SPSS.sav [DataSetl] - IBM SPSS Statistics Data Editor

■ i в

File Edit View Data Transform Analyze DlrectMarketing Graphs Utilities Add-ons Window Help

O Define Variable Properties... %} Set Measurement Level for Unknown.. Iffl Copy Data Properties... rfl New Custom Attribute g Define Dates... EE] Define Multiple Response Sets... И ÜÜ àfë H

1 : Activity Visible: 6 of 6 Variables

Ас eat ment End treatment Sumpatients var vai

1 1.00 1.00 10.00 'J

2 1.00 2.00 48.00

3 2.00 1.00 6.00

4 Validation ► ™ Identify Duplicate Cases... Identify Unusual Cases... 2.00 2.00 12.00

5 -

6

7 Sorteases. ES Sort Variables... SSI Transpose... Merge Files ► TO Restructure... Aggregate... Orthogonal Design ► 1

8

I 9

10

11

12

13

14

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

15 ^ Copy Dataset

16 S Split File... H Select Cases...

17

iU, if Weight Cases... \>

Data View Variaöle View

Weight Cases..

IBM SPSS Statistics Processor is ready

Рис. 10. Выбор раздела «Weight cases» меню «Data» программы SPSS 20.

Программа откроет окно «Weight cases», в котором отметим позицию «Weight cases by» и с помощью стрелки перенесем в правое поле переменную «Sum_of_cases» (рисунок 11), подтвердив выбор кнопкой «OK». В результате выполненных манипуляций программа будет

считать значения в столбце «Sum_of_cases» соответствующим значениям в остальных столбцах.

Далее откроем меню «Analyze», раздел «Descriptive Statistics», подраздел «Crosstabs...» (рисунок 12).

Рис. 11. Окно «Weight cases» программы SPSS 20 (выбор переменной «Sum_of_cases»).

@ *Categorical_SPSS.sav [DataSetl] - IBM SPSS Statistics Data Editor UO-US-UBbT

File Edit View Data Transform Analyze Direct Marketing Graphs Utilities Add-ons Window Help

jgjd.s ш 3 ¡ÉT- Reports ► ¡ШЗ Ш ГЗДИИ 1 I ЛЛ ¡ 1 J с

Descriptive Statistics ► Tables ► Compare Means ► General Linear Model ► Generalized Linear Models ► Mixed Models ► Correlate ► Regression ► Loglinear ► Neural Networks ► Classify ► Dimension Reduction ► Scale ► Nonparametric Tests ► Forecasting ► Survival ► Multiple Response ► Missing Value Analysis... Multiple Imputation ► Complex Samples ► Quality Control ► Q ROC Curve... [к] Frequencies... П Descriptives... Explore... Crosstabs... Й Ratio... Q P-P Plots... ¡(^ Q-Q Plots... tek L±±3 J Jj4

8 : ; Visible: 6 of 6 Variables

Activity BMI n_patients var vai

1 1,00 1,( 10.00

2 1.00 2,( 48.00

3 2.00 1,< 6.00

4 2,00 2,( 12,00

5

6

1 7

1 «

9

10

11

12

13

14

II 15

16

I 17

I «

h

Data View Variable View

Crosstabs... IBM SPSS Statistics Processor is ready Weight On

Рис. 12. Выбор подраздела «Crosstabs--» раздела «Descriptive Statistics» меню «Analyze» программы SPSS 20.

В открывшемся окне, прежде всего, перене- (ряд), а переменную «BMI» в поле «Column(s)» сём переменную «Activity» в поле «Row(s)» (столбцы), как показано на рисунке 13.

Рис. 13. Окно «Crosstabs» программы SPSS 20.

Далее нажмем на кнопку «Statistics» и в появившемся окне отметим позиции «Chi-square», «Contingency Coefficient» (коэффициент сопряженности Пирсона), «Phi and Cramer's V», «Lambda» (Л-критерий Гудмана-Краскела), «Risk» (вывод результатов расчета

относительного риска и отношения шансов), а также группу критериев, предназначенных для анализа порядковых данных - «Gamma» (y-критерий Гудмена-Краскела), «Somer's d», «Kendall's tau-b» и «Kendall's tau-с», после чего нажмем кнопку «Continue» (рисунок 14).

Рис. 14. Окно «Crosstabs: Statistics» программы SPSS 20.

Далее в окне «Crosstabs» нажмем на кнопку «Cells», и в окне «Crosstabs: Cell Display» отметим позиции «Observed» и «Expected» для вывода фактических и ожидаемых значений в ячейках, и позиции «Row», «Column» и «Total» для вывода процентной доли количества наблюдений в ячейках по строкам и столбцам, после чего подтвердим выбор кнопкой «Continue».

Программа вернется к окну «Crosstabs» (рисунок 13), в котором нажмем кнопку «OK» для начала расчетов.

Программа представит результаты расчетов в виде нескольких таблиц.

В таблице 12 представлена таблица сопряженности, в которой рассчитаны маргинальные итоги и процентный вклад каждой ячейки (соответствует значениям, приведенным в таблице 11).

Таблица сопряженности качественных переменных «Activity» и «BMI».

Таблица 12.

BMI Total

Overweight Normal weight

Activity Brainwork Count 90 39 129

Expected Count 101,3 27,7 129,0

% within Activity 69,8% 30,2% 100,0%

% within BMI 36,7% 58,2% 41,3%

% of Total 28,8% 12,5% 41,3%

Physical Count 155 28 183

Expected Count 143,7 39,3 183,0

% within Activity 84,7% 15,3% 100,0%

% within BMI 63,3% 41,8% 58,7%

% of Total 49,7% 9,0% 58,7%

Total Count 245 67 312

Expected Count 245,0 67,0 312,0

% within Activity 78,5% 21,5% 100,0%

% within BMI 100,0% 100,0% 100,0%

% of Total 78,5% 21,5% 100,0%

В таблице 13 представлены результаты расчета критерия х2 и его альтернативных вариантов.

В строке «Pearson Chi-Square» в столбце «Value» приведено значение критерия х2 Пирсона (10,004), в столбце «df» - число степеней свободы (1), в столбце «Asymp. Sig. (2-sided)» - уровень статистической значимости (0,002).

В строке «Continuity Correction» аналогичным образом представлены результаты расчета поправки Йейтса на непрерывность, в строке «Likelihood Ratio» -результаты применения критерия х2 с поправкой на правдоподобие.

Строка «Fisher's Exact Test» в столбце «Exact Sig. (2-sided)» представляет результаты расчета точного критерия Фишера.

Строка «Linear-by-Linear Association» представляет результаты расчета критерия х2 для линейного тренда, что было бы важно, если бы изучали порядковые переменные. Тем не менее, любая дихотомическая переменная может быть представлена как порядковая, имеющая 2 уровня значений. И в нашем случае значение критерия х2 для линейного тренда статистически значимо (х2 = 9,972; df = 1; p = 0,002), хотя практическая интерпретация данного результата затруднительна (данный критерий обычно рассчитывают для многопольных таблиц с порядковыми данными).

В представленной таблице под сноской «a» программа сообщает, что ни в одной из клеток анализируемой таблицы сопряженности нет значения меньше 5 (это важно для корректного выбора альтернативных вариантов расчета критерия х2).

Таблица 13.

Результаты расчета критерия х2 и его альтернативных вариантов.

Value df Asymp. Sig. (2-sided) Exact Sig. (2-sided) Exact Sig. (1-sided)

Pearson Chi-Square Continuity Correctionb Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases 10,004a 9,139 9,874 9,972 312 1 1 1 1 ,002 ,003 ,002 ,002 ,002 ,001

a. 0 cells (0,0%) have expected count less than 5. T he minimum expected count is 27,70.

b. Computed only for a 2x2 table

В следующих двух таблицах представлены результаты расчета критериев, предназначенных для математической оценки силы связи между фактором и исходом (Таблица 14 и Таблица 15). В обеих таблицах проведено разделение критериев, предназначенных для

Таблица 14.

Результаты расчета критериев, предназначенных для математической оценки силы связи

оценки силы связи для номинальных переменных («Nominal by Nominal») и порядковых переменных («Ordinal by Ordinal»). Все значения критериев программа представляет в столбце «Value».

Value Asymp. Approx. Approx.

Std. Error3 Tb Sig.

Nominal Lambda Symmetric ,056 ,040 1,348 ,178

by Activity Dependent ,085 ,061 1,348 ,178

Nominal BMI Dependent ,000 ,000 c c

Goodman and Kruskal Activity Dependent ,032 ,020 ,002d

tau BMI Dependent ,032 ,020 ,002d

Ordinal by Somers' d Symmetric -,176 ,056 -3,079 ,002

Ordinal Activity Dependent -,215 ,068 -3,079 ,002

BMI Dependent -,149 ,048 -3,079 ,002

Таблица 15.

Результаты расчета критериев, предназначенных для математической оценки силы связи между фактором и исходом (II)._____

Value Asymp. Std. Error® Approx. Tb Approx. Sig.

Nominal by Nominal Phi -,179 ,002

Cramer's V ,179 ,002

Contingency Coefficient ,176 ,002

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ordinal by Ordinal Kendall's tau-b -,179 ,057 -3,079 ,002

Kendall's tau-c -,145 ,047 -3,079 ,002

Gamma -,412 ,117 -3,079 ,002

N of Valid Cases 312

В таблице 14 значение Л-критерий Гудмана-Краскела («Lambda») следует читать по строке «Symmetric», а значение критерия Сомера необходимо оценивать исходя из того, какая переменная является исходом (в нашем случае зависимой переменной является «BMI», и поэтому значение критерия d = -0,149).

Мы видим, что отношение шансов и его 95% ДИ равны 0,417 (95% ДИ: 0,240-0,723). После вычисления обратной величины отношения шансов мы можем сказать, что: занятие физическим трудом повышает шансы наличия ожирения в 2,40 раза (95% ДИ: 1,384,17).

Если бы наше исследование было когортным исследованием, то мы бы использовали значение относительного риска, представленного в строке «For cohort BMI = Overweight» (интересующий нас исход -развитие избыточной массы тела): относительный риск развития избыточной массы тела у пациентов, занимающихся умственным трудом по сравнению с пациентами, занимающимися физическим трудом, составляет 0,82 (95% ДИ: 0,72-0,94),

Программа также представляет уровень статистической значимости для каждого критерия, но его значение не играет существенной роли.

Последняя таблица представляет наибольшую практическую ценность, так как дает информацию об относительном риске и отношении шансов (таблица 16).

то есть занятие умственным трудом снижает риск развития избыточной массы тела.

Далее рассмотрим способ расчета критерия Мак-Нимара с использованием программы SPSS 20.

Для этого снова воспользуемся примером, приведенным в таблице 7. На рисунке 9 видно, что данные гипотетического исследования представлены в виде 3-х переменных: «Start_treatment» (начало лечения), «End_treatment» (конец лечения), и «Sum_patients», в которой указано количество пациентов, соответствующих двум первым столбцам. Переменные «Start_treatment» и «End_treatment» имеют 2 значения - «1» (изжога есть) и «1» - изжоги нет. Соответственно, количество пациентов, у которых на момент начала лечения изжога была (значение «1»), а

Таблица 16.

Результаты расчета отношения шансов и относительного риска._

Value 95% Confidence Interval

Lower Upper

Odds Ratio for Activity (Brainwork / Physical) For cohort BMI = Overweight ,417 ,824 ,240 ,724 ,723 ,937

For cohort BMI = Normal weight 1,976 1,285 3,038

N of Valid Cases 312

на момент окончания прекратилась (значение «2»), указывается во второй строке (значение равно 48). По тому же принципу заполнены остальные 3 строки файла (рисунок 9).

Прежде чем рассчитывать значение критерия Мак-Нимара, потребуется снова «взвесить» наблюдения, но уже по другой переменной («Sum_patients»). Для этого снова войдем в меню «Data», раздел «Weight cases», нажмем на переменную «Sum_of_cases» и с помощью стрелки между полями перенесем ее обратно в левое поле, после чего не ее место с помощью той же стрелки внесем переменную «Sum_patients» (рисунок 15). Следует учесть, что если в дальнейшем при расчетах «взвешивание» наблюдений больше

не требуется, необходимо в данном окне отметить позицию «Do not weight cases» (рисунок 15).

Для расчета критерия Мак-Нимара необходимо войти в меню «Analyze», раздел «Nonparametric Tests», подраздел «Legacy Dialogs», позиция «2 Related Samples» (рисунок 16).

Далее в открывшемся окне «Two-Related-Samples Tests» отметим только позицию «МсNemar», после чего с помощью стрелки между полями последовательно перенесем переменные «Start_treatment» и «End_treatment» в правое поле «Test Pairs», после чего нажмем кнопку «OK» для начала расчетов (рисунок 17).

Рис. 15. Окно «Weight cases» программы SPSS 20 (выбор переменной «Sum_patients»).

Программа представит результаты в виде двух таблиц. Таблица 17 соответствует таблице 7 с единственным отличием в том, что столбцы поменялись местами.

Таблица 17.

Результаты гипотетического исследования (влияние лечения на наличие изжоги у пациентов)

Start_treatment End_treatment

Yes No

Yes 10 48

No 6 12

В таблице 18 представлены результаты расчета критерия Мак-Нимара, которые

соответствуют результатам расчетов, проделанных ранее (строки «СЫ-Эдиаге» и «АБутр. Э1д.»).

Таблица 18. Результаты расчета критерия Мак-Нимара в программе_§Р^§_20-

Start_treatmen

t &

End treatment

N 76

Chi-Squareb 31,130

Asymp. Sig. ,000

Рис. 16. Выбор позиции «2 Related Samples» подраздела «Legacy Dialogs» раздел «Nonparametric Tests» меню «Analyze» программы SPSS 20.

1Ш1

Рис. 17. Окно «Two-Related-Samples Tests» программы SPSS 20.

Литература:

1. Аканов А.А., Турдалиева Б.С., Изекенова А.К., Рамазанова М.А., Абдраимова Э.Т., Гржибовский А.М. Оценка использования статистических методов в научных статьях медицинских журналов Казахстана // Экология человека. 2013. №5. С. 61-64.

2. Банержи А. Медицинская статистика понятным языком: вводный курс. М. : Практическая медицина, 2007. 287 с.

3. Боровиков В. STATISTICA. Искусство анализа данных на компьютере: для профессионалов. СПб. : Питер, 2003. 688 с.

4. Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. СПб. : ООО «ДиаСофтЮП», 2005. 608 с.

5. Гланц С. Медико-биологическая статистика. М. : Практика, 1998. 459 с.

6. Гржибовский А.М. Анализ номинальных данных (независимые наблюдения) // Экология человека. 2008. №6. С. 58-68.

7. Гржибовский А.М. Анализ порядковых данных // Экология человека. 2008. №8. С. 5662.

8. Гржибовский А.М. Доверительные интервалы для частот и долей // Экология человека. 2008. №5. С. 57-60.

9. Гржибовский А.М. Корреляционный анализ // Экология человека. 2008. №9. С. 5060.

10. Гржибовский А.М. Типы данных, проверка распределения и описательная статистика // Экология человека. 2008. №1. С. 52-58.

11. Гржибовский А.М., Иванов С.В. Исследования типа «случай-контроль» в здравоохранении // Наука и Здравоохранение. 2015. № 4. С. 5-17

12. Гржибовский А.М., Иванов С.В. Когортные исследования в здравоохранении/ / Наука и Здравоохранение. 2015. № 3. С. 5-16.

13. Гржибовский А.М., Иванов С.В. Поперечные (одномоментные) исследования в здравоохранении // Наука и Здравоохранение. 2015. № 2. С. 5-18.

14. Гржибовский А.М., Иванов С.В., Горбатова М.А. Описательная статистика с использованием пакетов статистических программ Statistica и SPSS: и проверка

распределения // Наука и Здравоохранение. 2016. № 1. С. 7-23.

15. Гржибовский А.М., Иванов С.В., Горбатова М.А. Сравнение количественных данных двух независимых выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии // Наука и Здравоохранение. 2016. № 2. С. 5-28.

16. Гржибовский А.М., Иванов С.В., Горбатова М.А. Сравнение количественных данных двух парных выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии // Наука и Здравоохранение. 2016. № 3. С. 5-25.

17. Гржибовский А.М., Иванов С.В., Горбатова М.А. Сравнение количественных данных трех и более независимых выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии // Наука и Здравоохранение. 2016. № 4. С. 5-37.

18. Гржибовский А.М., Иванов С.В., Горбатова М.А. Сравнение количественных данных трех и более парных выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии // Наука и Здравоохранение. 2016. № 5. С. 5-29.

19. Гржибовский А.М., Иванов С.В. Экологические (корреляционные) исследования в здравоохранении // Наука и Здравоохранение. 2015. № 5. С. 5-18.

20. Гржибовский А.М., Иванов С.В. Экспериментальные исследования в здравоохранении // Наука и Здравоохранение. 2015. № 6. С. 5-17.

21. Гржибовский А.М., Унгуряну Т.Н. Анализ категориальных данных с использованием пакета статистических программ SPSS. Учебное пособие. Туркестан, 2015. - 90 с.

22. Жунисова М.Б., Шалхарова Ж.С., Шалхарова Ж.Н., Гржибовский А.М. Типы пищевого поведения и абдоминальное ожирение // Журн. Медицина. 2015. №4. С. 9295.

23. Жунисова М.Б., Шалхарова Ж.С., Шалхарова Ж.Н., Нускабаева Г.О., Садыкова К.Ж., Маденбай К.М., Гржибовский А.М. Психоэмоциональный стресс как предиктор

типа пищевого поведения в Казахстане // Экология человека. 2015. №5. С. 36-45.

24. Зайцев В.М., Лифляндский В.Г., Маринкин В.И. Прикладная медицинская статистика. СПб. : Фолиант, 2003. 428 с.

25. Зуева Л.П, Яфаев Р.Х. Эпидемиология: учебник. СПб : ООО «Издательство Фолиант», 2008. 752 с.

26. Лакин Г.Ф. Биометрия. М. : Высшая школа, 1990. 351 с.

27. Маденбай К.М., Шалхарова Ж.С., Шалхарова Ж.Н., Жунисова М.Б., Садыкова К.Ж., Нускабаева Г.О., Гржибовский А.М. Оценка связи между площадью подкожной жировой ткани и показателями электронейромиографии // Экология человека. 2015. №7. С. 58-64.

28. Петри А., Сэбин К. Наглядная статистика в медицине. М. : ГЭОТАР-Мед, 2003. 140 с.

29. Рахыпбеков Т.К., Гржибовский А.М. К вопросу о необходимости повышения качества казахстанских научных публикаций для успешной интеграции в международное научное сообщество // Наука и Здравоохранение. 2015. №1. С. 5-11.

30. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. М. : МедиаСфера, 2002. 312 с.

31. Садыкова К.Ж., Шалхарова Ж.С., Нускабаева Г.О., Садыкова А.Д., Жунисова М.Б., Маденбай К.М., Гржибовский А.М. Распространенность анемии, ее социально-демографические детерминанты и возможная связь с метаболическим синдромом в г. Туркестан, Южный Казахстан // Экология человека. 2015. №8. С. 58-64.

32. Статистический анализ эмпирических исследований [электронный ресурс]. URL: www.statexpert.org/articles/таблицы_крити ческих_значений_статистических_критериев (дата обращения 10.10.2015).

33. Субботина А.В., Гржибовский А.М. Описательная статистика и проверка нормальности распределения количественных данных // Экология человека. 2014. №2. С. 5157.

34. Флетчер Р. Клиническая эпидемиология. Основы доказательной медицины: пер. с англ. / Р. Флетчер, С.

Флетчер, Э. Вагнер. М. : Медиа Сфера, 1998. 352 с.

35. Юнкеров В.И., Григорьев С.Г. Математико-статистическая обработка данных медицинских исследований. СПб :ВМедА, 2002. 266 с.

36. Agresti A. Introduction to categorical data analysis. New York: John Wiley and Sons, 2007. 400 p.

37. Beaglehole R., Bonita R. Basic epidemiology. World Health Organization, Geneva, 1993.

38. Cleopas T.J. et al. Statistics Applied to Clinical Trials. 4th ed. Springer, 2009.

39. Haviland M.G. Yates's correction for continuity and the analysis of 2x2 contingency tables // Statistics in Medicine. 1990. Vol. 9. P. 363-367.

40. Hildebrand D.K., Laing J.D., Rosenthal H. Analysis of ordinal data. Newbery Park: SAGE University Paper, 1977. 80 p.

41. Liebetrau A.M. Measures of Association. Newbery Park: Sage Publications, 1983. 100 р.

42. Wilkinson L. Statistical methods in psychology journals: guidelines and explanations // American Psychologist. 1999. Vol. 54. P. 594604.

43. Yates F. Contingency tables involving small numbers and the chi-square test // Supplement to the Journal of the Royal Statistical Society. 1934. Vol. 1. P. 222.

References:

1. Akanov A.A., Turdalieva B.S., Izekenova A.K., Ramazanova M.A., Abdraimova, Grjibovski A.M. Otsenka ispolzovania statisticheskih metodov v nauchnih statyakh Kazakhstana [Assesment of use of statistical methods in scientific articles of the Kazakhstan's medical journals]. Ekologiya cheloveka [Human Ecology]. 2013. No.5. pp. 61-64. [in Russian]

2. Banerzhi A. Meditsinskaya statistika ponyatnym yazykom : vvodnyy kurs [Medical statistics in plain language : an introductory course ]. M. : Prakticheskaya meditsina, 2007. p. 287. [in Russian]

3. Borovikov V. STATISTICA. Iskusstvo analiza dannikh na kompyutere: dlya professionalov [STATISTICA. The art of data analysis using computer: for professionals]. SPb. : Piter, 2003. p. 688.

4. Buhl A., Zofel P. SPSS: isskustvo obrabotki informatsii. Analiz statisticheskih daanikh i vosstanovlenie skritikh zakonomernostey [SPSS: the art of information analysis. Statistical data analysis and hidden regularities identification]. SPb. : OOO «DiaSoftUP», 2005. p. 608. [in Russian]

5. Glants S. Mediko-biologicheskaya statistika [The biomedical statistics]. M. : Praktika, 1998. p. 459. [in Russian]

6. Grjibovski A.M. Analiz nominalnikh dannikh [Analysis of nominal data]. Ekologiya cheloveka [Human Ecology]. 2008. No.6. pp. 5668. [in Russian]

7. Grjibovski A.M. Analiz poryadkovikh dannikh [Analysis of ordinal data]. Ekologiya cheloveka [Human Ecology]. 2008. No.8. pp. 5662. [in Russian]

8. Grjibovski A.M. Doveritelnie interval dlya chastot i doley [Confidence intervals for proportions]. Ekologiya cheloveka [Human Ecology]. 2008. No.5. PP. 57-60. [in Russian]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Grjibovski A.M. Korrelatcionniy analiz [Correlation analysis]. Ekologiya cheloveka [Human Ecology]. 2008. No.9. pp. 50-60. [in Russian]

10. Grjibovski A.M. Tipy dannikh, proverka raspredeleniya I opisatelnaya statistika [Types of data, distribution estimation and descriptive statistics]. Ekologiya cheloveka [Human Ecology]. 2008. No.1. pp. 52-58. [in Russian].

11. Grjibovski A.M., Ivanov S.V. Issledovaniya tipa sluchay-kontrol v zdravoohranenii [Case-control studies in health sciences]. Nauka i Zdravoohranenie [Science & Healthcare]. 2015, 4, pp. 5-17 [in Russian].

12. Grjibovski A.M., Ivanov S.V. Kogortnie issledovaniya v zdravoohranenii [Cohort studies in health sciences]. Nauka i Zdravoohranenie [Science & Healthcare]. 2015, 3, pp. 5-16. [in Russian].

13. Grjibovski A.M., Ivanov S.V. Poperechnie (odnomomentnie) issledovanoya v zdravoohranenii [Cross-sectional studies in health sciences]. Nauka i Zdravoohranenie [Science & Healthcare]. 2015, 2, pp. 5-18. [in Russian]

14. Grjibovski A.M., Ivanov S.V., Gorbatova M.A. Opisatel'naya statistika s ispol'zovaniyem paketov statisticheskikh programm Statistica i SPSS [Descriptive statistics using Statistica and SPSS software]. Nauka i Zdravoohranenie

[Science & Healthcare]. 2016, 1, pp. 7-23 [in Russian].

15. Grjibovski A.M., Ivanov S.V., Gorbatova M.A. Sravneniye kolichestvennykh dannykh dvukh nezavisimykh vyborok s ispol'zovaniyem programmnogo obespecheniya Statistica i SPSS : parametricheskiye i neparametricheskiye kriterii [Comparing the quantitative data of two independent groups using the software Statistica and SPSS: parametric and nonparametric tests]. Nauka i Zdravoohranenie [Science & Healthcare]. 2016, 2, pp.5-28 [in Russian].

16. Grjibovski A.M., Ivanov S.V., Gorbatova M.A. Sravneniye kolichestvennykh dannykh dvukh parnikh viborok s ispol'zovaniyem programmnogo obespecheniya Statistica i SPSS : parametricheskiye i neparametricheskiye kriterii [Comparing the quantitative data of two dependent variations using the software Statistica and SPSS: parametric and nonparametric tests]. Nauka i Zdravoohranenie [Science & Healthcare]. 2016, 3, pp. 5-25. [in Russian].

17. Grjibovski A.M., Ivanov S.V., Gorbatova M.A. Sravneniye kolichestvennykh dannykh trekh i boleye nezavisimykh vyborok s ispol'zovaniyem programmnogo obespecheniya Statistica i SPSS : parametricheskiye i neparametricheskiye kriterii [Comparing of the quantitative data of three or more independent samples using Statistica and SPSS software: parametric and nonparametric methods]. Nauka i Zdravoohranenie [Science & Healthcare]. 2016. 4. pp. 5-37. [in Russian].

18. Grjibovski A.M., Ivanov S.V., Gorbatova M.A. Sravneniye kolichestvennykh dannykh trekh i boleye parnikh vyborok s ispol'zovaniyem programmnogo obespecheniya Statistica i SPSS : parametricheskiye i neparametricheskiye kriterii [Comparing of the quantitative data of three or more dependent samples using Statistica and SPSS software: parametric and nonparametric methods]. Nauka i Zdravoohranenie [Science & Healthcare]. 2016. 5. C. 5-29 [in Russian].

19. Grjibovski A.M., Ivanov S.V. Ekologicheskiye (korrelyatsionnye) issledovaniya v zdravoohranenii [Ecological (correlational) studies in health sciences]. Nauka i Zdravoohranenie [Science & Healthcare]. 2015, 5, pp. 5-18. [in Russian].

20. Grjibovski A.M., Ivanov S.V. Eksperimentalnie issledovaniya v zdravookhranenii [Experimental studies in health

sciences]. Nauka i Zdravoohranenie [Science & Healthcare]. 2015, 6, pp. 5-17. [in Russian].

21. Grjibovski A.M., Unguryanu T.N. Analiz kategorialnikh dannikh s ispolzovaniem paketa ststisticheskih program SPSS [Categorical data analysis using SPSS software]. Turkestan, 2015, 90 p. [in Russian].

22. Zhunissova M.B., Shalkarova Zh.S., Shalkarova Zh. N., Nuskabayeva G.O., Sadykova K. Zh., Madenbay K.M., Grjibovski A.M. Tipy pischevogo povedeniya i abdominalnoe ozhirenie [Eating behavior types and abdominal obesity]. Meditsina [Medicine]. 2015. 4. pp. 92-95. [in Russian].

23. Zhunissova M.B., Shalkarova Zh.S., Shalkarova Zh. N., Nuskabayeva G.O., Sadykova K. Zh., Madenbay K.M., Grjibovski A.M. Psykhoemotsionalniy stress kak predictor tipa pischevogo povedeniya v Kazakhstane [Psychoemotional stress and eating behavior in Kazakhstan]. Ekologiya cheloveka [Human Ecology]. 2015. 5. pp. 36-45. [in Russian]

24. Zaytsev V.M., Liflyandskiy V.G., Marinkin V.I. Prikladnaya meditsinskaya statistika [Applied medical statistics] . SPb. : Foliant , 2003. p. 428. [in russian]

25. Zueva L.P, Yafaev R.H. Epidemiologiya: uchebnik [Epidemiology: the textbook]. SPb :

000 «Izdatelstvo Foliant», 2008. p. 752. [in Russian].

26. Lakin G.F. Biometria [Biometrics]. M. : Viscshaya shkola. 1990. p. 351. [in Russian].

27. Madenbay K.M., Shalkarova Zh.S., Shalkarova Zh. N., Zhunissova M.B., Sadykova K. Zh., Nuskabayeva G.O., Grjibovski A.M. Otsenka svyazi mezhdu ploshadyu podkojnoy jirovoy tkani

1 pokazatelyami electroneyromiografii [Assesment of the relationship between subcutaneous fat tissue an results of electromyoneurography]. Ekologiya cheloveka [Human Ecology]. 2015. 7. pp. 58-64. [in Russian].

28. Petri A., Sebin K. Naglyadnaya statistika v meditsine [Demonstrative statistics in medicine]. M. : GEAOTAR-Med, 2003. p. 140. [in Russian].

29. Rakhypbekov T.K., Grjibovski A.M. K voprosu o nedhodimosti povisheniya kachestva kazakhstanskih nauchih publicatsiy dlya uspeshnoy integratsii v mezhdunarodnoe nauchnoe soobschestvo [The need for improvement of the quality of Kazakhstani publications for successful integration in the international research community]. Nauka i

Zdravoohranenie [Science & Healthcare]. 2015. 1. pp. 5-11 [in Russian].

30. Rebrova O. Yu. Statisticheskiy analiz meditsinskih daanikh. Primenenie paketa prikladnikh program STATISTICA [Statistical analysis of medical data. Using of STATISTICA software]. M. : MediaSphera, 2002. p. 312 [in Russian].

31. Sadykova K.Zh., Shalkharova Zh.S., Shalkharova Zh.N. Nuskabaeva G.O., Sadykova A.D., Zhunissova M.B., Madenbay K.M., Grjibovski A.M. Rasprostranennost' anemii , yeye sotsial'no - demograficheskiye determinanty i vozmozhnaya svyaz' s metabolicheskim sindromom v g. Turkestan , Yuzhniy Kazakhstan [Prevalence of anemia, its socio-demographic determinants and potential association with metabolic syndrome in residents of Turkestan, Southern Kazakhstan]. Ekologiya cheloveka [Human Ecology]. 2015. 8. p. 58-64. [in Russian]

32. Statistical analysis of empirical research [website] Available at: www.statexpert.org/articles/Ta6™ qbi_Kp MTMHecKM x_3HaneHMM_CTaTMCTMnecKMx_KpMTepMeB

(Accesed 10 October 2015).

33. Subbotina A.V., Grjibovski A.M. Opisatelnaya statistika I proverka normal'nosti raspredeleniya kolichestvennih dannikh [Descriptive statistics and normality testing for quantitative data]. Ekologiya cheloveka [Human Ecology]. 2014. 2. pp. 51-57. [in Russian].

34. Fletcher R. et al. Klinicheskaya epidemiologiya. Osnovy dokazatel'noi meditsiny [Clinical epidemiology. Basics of the evidence-based medicine] / R. Fletchtr, C. Fletcher, E. Vagner. M. : Media Sphere, 1998. 352 p. [in Russian].

35. Yunkerov V.I., Grigoryev S.G. Matematiko-statisticheskaya obraboka daanikh meditsinskih issledovaniy [Mathematical and statistical analysis of medical research data]. SPb : VMedA, 2002. p. 266. [in Russian]

36. Agresti A. Introduction to categorical data analysis. New York: John Wiley and Sons, 2007. 400 p.

37. Beaglehole R., Bonita R. Basic epidemiology. World Health Organization, Geneva, 1993.

38. Cleopas T.J. et al. Statistics Applied to Clinical Trials. 4th ed. Springer, 2009.

39. Haviland M.G. Yates's correction for continuity and the analysis of 2x2 contingency

tables. Statistics in Medicine. 1990. Vol. 9. P. 363-367.

40. Hildebrand D.K., Laing J.D., Rosenthal H. Analysis of ordinal data. Newbery Park: SAGE University Paper, 1977. 80 p.

41. Liebetrau A.M. Measures of Association. Newbery Park: Sage Publications, 1983. 100 p.

42. Wilkinson L. Statistical methods in psychology journals: guidelines and explanations. American Psychologist. 1999. Vol. 54. p. 594-604.

43. Yates F. Contingency tables involving small numbers and the chi-square test. Supplement to the Journal of the Royal Statistical Society. 1934. Vol. 1. p. 222.

Контактная информация:

Гржибовский Андрей Мечиславович - доктор медицины, магистр международного общественного здравоохранения, Старший советник Национального Института Общественного Здравоохранения, г. Осло, Норвегия; Заведующий ЦНИЛ СГМУ, г. Архангельск, Россия; Профессор Северо-Восточного Федерального Университета, г. Якутск, Россия; Профессор, Почетный доктор Международного Казахско-Турецкого Университета им. Х.А. Ясяви, г, Туркестан, Казахстан; Почетный профессор ГМУ г. Семей, Казахстан.

Почтовый адрес: INFA, Nasjonalt folkehelseinstitutt, Postboks 4404 Nydalen, 0403 Oslo, Norway. Email: Andrej.Grjibovski@gmail.com

Телефон: +4745268913 (Норвегия), +79214717053 (Россия), +77471262965 (Казахстан).

i Надоели баннеры? Вы всегда можете отключить рекламу.