Получена: 8 июля 2016 / Принята: 17 августа 2016 / Опубликована online: 31 августа 2016 УДК 614.2 + 303.4
СРАВНЕНИЕ КОЛИЧЕСТВЕННЫХ ДАННЫХ ТРЕХ И БОЛЕЕ НЕЗАВИСИМЫХ ВЫБОРОК С ИСПОЛЬЗОВАНИЕМ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ STATISTICA И SPSS: ПАРАМЕТРИЧЕСКИЕ И НЕПАРАМЕТРИЧЕСКИЕ
КРИТЕРИИ
Андрей М. Гржибовский 1-4, http://orcid.org/0000-0002-5464-0498, Сергей В. Иванов 5, http://orcid.org/0000-0003-0254-3941 Мария А. Горбатова 2, http://orcid.org/0000-0002-6363-9595
1 Национальный Институт Общественного Здравоохранения, г. Осло, Норвегия;
2 Северный Государственный Медицинский Университет, г. Архангельск, Россия;
3 Международный Казахско-Турецкий Университет им. Х.А. Ясави, г. Туркестан, Казахстан;
4 Северо-Восточный Федеральный Университет, г. Якутск, Россия;
5 Северо-Западный Государственный Медицинский Университет им. И.И. Мечникова, г. Санкт-Петербург, Россия.
Резюме
В настоящей работе представлены общие сведения об использовании однофакторного дисперсионного анализа и непараметрического критерия Краскела-Уоллиса для сравнения количественных признаков трех и более независимых выборок. Описан алгоритм анализа данных с использованием программного обеспечения Statistica 10 и SPSS 20 и представлена интерпретация результатов расчетов. Настоящая статья призвана дать общие сведения об использовании однофакторного дисперсионного анализа, критерия Краскела-Уоллиса и проведении апостериорных сравнений групп, и не заменяет прочтения специализированной литературы по статистике и клинической эпидемиологии.
Ключевые слова:, Statistica, SPSS, однофакторный дисперсионный анализ, критерий Краскела-Уоллиса, апостериорные сравнения, независимые группы.
Abstract
ANALYSIS OF QUANTITATIVE DATA IN THREE OR MORE INDEPENDENT GROUPS USING STATISTICA AND SPSS SOFTWARE: PARAMETRIC AND NON-PARAMETRIC TESTS
Andrej M. Grjibovski 1-4, http://orcid.org/0000-0002-5464-0498, Sergej V. Ivanov 5, http://orcid.org/0000-0003-0254-3941 Maria A. Gorbatova 2, http://orcid.org/0000-0002-6363-9595
1 Norwegian Institute of Public Health, Oslo, Norway;
2 Northern State Medical University, Arkhangelsk, Russia;
3 North-Eastern Federal University, Yakutsk, Russia;
4 International Kazakh-Turkish University, Turkestan, Kazakhstan;
5 North-Western State Medical University n.a. I.I. Mechnikov, St. Petersburg, Russia.
In this paper we summarise basic information on comparisons of three and more independent samples using one-way analysis of variance (one-way ANOVA) and non-parametric Kruskal-Wallis test. Detailed algorithms on how the abovementioned tests can be performed using Statistica 10 and SPSS 20 software are presented. Moreover, we describe peculiarities of interpretation of the results of one-way ANOVA and Kruskal-Wallis test. The aim of this article is to provide general information on the abovementioned statistical tests including post-hoc comparisons, but it does not substitute specialised literature on clinical epidemiology and beiostatistics.
Keywords: Statistica, SPSS, One-Way ANOVA, Kruskal-Wallis test, post-hoc tests, independent samples.
ТYЙiндеме
STATISTICA ЖЭНЕ SPSS БАГДАРПАМАПЫК КАМТАМАСЫЗ ЕТУД1 КОЛДАНУМЕН УШ ЖЭНЕ ОДАН ДА К@П ТЭУЕЛС1З 1Р1КТЕМЕПЕРД1И САНДЫК МЭЛ1МЕТТЕР1Н САПЫСТЫРУ: ПАРАМЕТРП1К ЖЭНЕ ПАРАМЕТРП1К ЕМЕС КРИТЕРИПЕР
Андрей М. Гржибовский1-4, http://orcid.org/0000-0002-5464-0498, Сергей В. Иванов5, http://orcid.org/0000-0003-0254-3941 Мария А. Горбатова2, http://orcid.org/0000-0002-6363-9595
1 Когамдьщ Денсаулык сактау ¥лттык Институты, Осло к., Норвегия;
2 СолтYCтiк Мемлекетлк Медициналык Университетi, Архангельск к., Ресей;
3 Х.А. Ясави ат. Халыкаралык Казак - ТYрiк Университетi, Туркестан, Казакстан;
4 СолтYCтiк - Шыгыс Федералдык Университетi, Якутск к-, Ресей;
5 И. И. Мечников атынд. Солтуслк - Батыс мемлекеттiк медициналык университетi, Санкт-Петербург к., Ресей.
Осы жумыста Yш жэне одан да кеп iрiктемелердH сандык белгiлерiн салыстыру Yшiн Краскела -УоллистН бiрфакторлы дисперсионды талдау nараметрлiк емес критерилерiн колдану туралы жалпы мэлiметтер берiлген. Statistica 10 жэне SPSS 20 багдарламалык камтамасыз етудi пайдаланумен критерилер мэлiметтерi есебшН алгоритмi суреттелген жэне есептер нэтижелершН интерпретациясы берiлген. Осы макала Краскела - УоллистН дисперсионды талдау параметрлт емес критерилерiн колдану жэне топтардыц апостериорлык салыстырмалары еткiзу туралы жалпы мэлiметтер беруге талап еттген жэне статистика жэне клиникалык эпидемиология бойынша мамандандырылган эдебиеттi окудыц орнын толтырмайды.
Heri3ri сездер: Statistica, SPSS, бiрфакторлы дисперсионды талдау, Краскела - УоллистН критерилер^ апостериорлык салыстырмалар, тэуелаз топтар.
Библиографическая ссылка:
Гржибовский А. М., Иванов С. В., Горбатова М. А. Сравнение количественных данных трех и более независимых выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии / / Наука и Здравоохранение. 2016. №4. С. 5-37.
Grjibovski A. M., Ivanov S. V., Gorbatova M. A. Analysis of quantitative data in three or more independent groups using Statistica and SPSS software: parametric and non-parametric tests. Nauka i Zdravookhranenie [Science & Healthcare]. 2016, 4, pp. 5-37.
Гржибовский А. М., Иванов С. В., Горбатова М. А. Statistica жэне SPSS багдарламалык камтамасыз етуд1 колданумен Yш жэне одан да кеп тэуелаз рктемелердщ сандык мэл1меттерш салыстыру: параметрлк жэне параметрлк емес критерилер / / Гылым жэне Денсаулык сактау. 2016. №4. Б. 5-37.
Настоящая статья продолжает серию публикаций, посвященных статистическому анализу данных биомедицинских исследований.
Статистическая обработка данных является завершающим этапом исследования, так как именно после статистического анализа принимается или отвергается исследовательская гипотеза. Примерами исследовательских гипотез являются утверждения «лечение A сокращает сроки госпитализации по сравнению с лечением B», «частота рецидивов заболевания зависит от возраста пациента», «в городе С содержание солей в водопроводной воде не превышает среднюю цифру по региону» и т.п. Вместе с тем, следует учесть, что никакой статистический анализ не может «исправить» некорректно организованное исследование и неправильно собранные данные. Именно поэтому авторы настоящей статьи настоятельно рекомендуют читателю ознакомиться с литературой по эпидемиологии [29, 18, 33], а также с практическими аспектами организации и анализа результатов различных типов научных исследований в здравоохранении (одномоментных, когортных, экологических, экспериментальных исследований и «случай -контроль»), которые представлены в статьях, опубликованных в 2015 году в журнале «Наука и Здравоохранение» [8, 9, 10, 14, 15].
Обязательным условием востребованности результатов исследований международным научным сообществом является высокое качество статистического анализа [22, 1], и задачами настоящей серии является формирование у начинающего исследователя базисных представлений о статистической обработке данных, приобретение практического опыта работы с современными статистическими пакетами программ и предупреждение типичных ошибок, возникающих в процессе анализа результатов исследования.
Данная статья посвящена вопросу сравнения количественных данных трех и более независимых групп с использованием программного обеспечения Statistica 10 и SPSS 20.
Существуют два основных типа статистических методов [4, 19, 32, 34]:
1. Параметрические методы, оперирующие параметрами нормального (гауссовского) распределения - средним арифметическим значением и стандартным отклонением. Нормальное распределение имеет симметричную колоколообразную форму и может быть описано с помощью среднего арифметического значения, стандартного отклонения, либо доверительных интервалов [7, 26]. Прежде чем использовать параметрические методы статистики, исследователь должен убедиться в том, что распределение имеющихся в его распоряжении данных не отличается от нормального (способы проверки распределения включают в себя посторенние гистограммы распределения, квантильной диаграммы, расчет критериев Шапиро-Уилка и Колмогорова-Смирнова подробно описаны в предыдущих выпусках журнала «Наука и Здравоохранение» [11, 12, 13], поэтому в данной статье не приводятся).
2. Непараметрические методы, которые не требуют нормального распределения имеющихся данных. Непараметрические критерии осуществляют ранжирование абсолютных значений признака, что позволяет нивелировать эффект выскакивающих величин («выбросов») и скошенности распределения. Следует отметить, что методы непараметрической статистики могут быть использованы и при наличии нормального распределения количественного признака, но в таком случае они будут иметь меньшую мощность по сравнению с параметрическими методами, то есть могут не уловить имеющиеся различия между группами там, где различия фактически существуют.
Параметрическим способом сравнения трех и более независимых групп является однофакторный дисперсионный анализ (англ. «One-way analysis of variances» - «One-way ANOVA»). Сущность дисперсионного анализа состоит в сравнении разброса средних значений сравниваемых выборок с разбросом значений внутри самих выборок. Соответственно, чем больше отличаются средние арифметические значения
сравниваемых выборок, и чем меньше разброс значений внутри выборок, тем выше вероятность различий между ними.
Применение дисперсионного анализа требует соблюдения следующих условий:
1. Количественный тип данных.
2. Независимость выборок друг от друга.
3. Независимость наблюдений в каждой из выборок.
4. Нормальное распределение признака в популяции, из которой отобраны выборки (как правило, сведения о распределении признака в популяции отсутствуют и поэтому распределение оценивают в каждой из сравниваемых выборок по-отдельности).
5. Равенство дисперсий изучаемого признака в популяциях, из которых взяты выборки (дисперсии также оцениваются в каждой из сравниваемых групп по-отдельности). Если дисперсии различаются, для однофакторного дисперсионного анализа используются критерии Welch или Brown-Forsythe.
Статистика критерия для однофакторного дисперсионного анализа вычисляется по формуле:
F S2межгрупповая
= S2внутригрупповая
где
S2межгрупповая - дисперсия совокупности, оцененная по выборочным средним (межгрупповая дисперсия),
S2внутригрупповая - дисперсия совокупности, оцененная по выборочным дисперсиям (внутригрупповая дисперсия).
Межгрупповая дисперсия рассчитывается следующим образом:
1. Рассчитывается разность между средним арифметическим каждой группы и общим средним по всем группам вместе.
2. Полученные разности возводятся в квадрат.
3. Полученные значения для каждой группы умножаются на количество наблюдений в данной группе.
4. Полученные для каждой группы величины суммируются.
5. Полученная сумма делится на число степеней свободы, которое рассчитывается по формуле m = (количество групп) - 1.
Внутригрупповая дисперсия
рассчитывается так:
1. Рассчитывается разность между каждым отдельным значением в группе и средним значением по группе (расчет производится для каждой из групп по отдельности).
2. Полученные разности возводятся в квадрат.
3. Полученные числа складываются.
4. Полученная сумма делится на число степеней свободы, которое рассчитывается по формуле n = (общее количество наблюдений по всем группам вместе) - (количество групп).
После вычисления F-критерия его значение сравнивается с критическим значением, указанным в статистических таблицах [25, 4, 19]. Если рассчитанное значение F равно или превышает критическое значение F для определенного уровня статистической значимости (как правило, равного 0,05), нулевая статистическая гипотеза отвергается, и делается вывод о том, что группы различаются между собой по средним значениям количественного признака. Следует заметить, результаты
однофакторного дисперсионного анализ не показывают, между какими именно группами найдены различия.
Чтобы ответить на данный вопрос, следует провести попарные апостериорные («post-hoc») сравнения групп между собой, для чего могут быть использованы специальные статистические критерии, с которыми можно ознакомиться в [6, 35]. Если по результатам дисперсионного анализа статистически значимых различий между группами не получено, апостериорные сравнения не имеют смысла.
Перечень используемых критериев для апостериорных сравнений представлен в таблице 1.
Таблица 1.
Статистические критерии для проведения апостериорных попарных сравнений групп.
Название критерия Особенности применения
Критерий Бонферрони (Bonferroni) Дает хорошие результаты при небольшом (до 5-ти) количестве сравнений
Критерий Тьюки (Tukey) Пригоден для проведения большого количества сравнений
Критерий Данна (Dunn) Критерий Шеффе (Scheffe) Обладает несколько меньшей статистической мощностью по сравнению с критерием Тьюки
Q-критерийRyan, Einot, Gabriel, Welch (REGWQ) Имеет наилучшее сочетание мощности и контроля ошибки I типа (выявление различий там, где их на самом деле нет), но требует равенства размеров групп и дисперсии изучаемого признака в группах
Критерий Габриэля (Gabriel) Рекомендован, если количество наблюдений в сравниваемых группах отличается незначительно (на несколько единиц наблюдения)
Критерий Хохберга (Hochberg's GT-2) Рекомендован, если количество наблюдений в сравниваемых группах существенно отличается
Критерий Games-Howell Рекомендован, в случае обнаружения неравенства дисперсий в сравниваемых группах (проверяется с помощью критерия Levene), после использования для дисперсионного анализа критериев Welchили Вгошп-РогБуШе. Следует учесть, что критерий СатеБ-Иоше!! может оказаться слишком либеральным (выявить различия там, где они фактически отсутствуют) в случае сравнения малых по объему групп или в случае, если количество наблюдений в группах сильно отличается
Критерий Даннета (Dunnett) Рекомендован, в случае необходимости сравнения нескольких групп с контрольной группой
Критерий LSD (Least Significant Difference) Не рекомендован для использования, так как не контролирует ошибку I типа
Критерий S-N-K (Studentized-Neuman-Keuls) Не рекомендован для использования, так как слишком либерален
Апостериорные попарные сравнения можно проводить и с помощью критерия Стьюдента [31, 5]. При этом обязательно следует учесть, что в случае множественных сравнений значительно увеличивается вероятность увидеть различия там, где их на самом деле нет (увеличивается вероятность ошибки I типа). Чтобы компенсировать «проблему множественных сравнений», необходимо использовать скорректированный уровень статистической значимости, который рассчитывается по формуле р' = 1 - 0,951/п, где п - количество производимых сравнений (поправка Бонферрони). Например, при наличии 3-х сравниваемых групп проводятся 3 сравнения (1-я группа сравнивается со 2-й, 2-я - с 3-й, и 1-я с 3-й), и р' = 1 - 0,951/3 = 0,017. В случае 4-х групп проводятся уже 6 сравнений (1-2, 1-3, 1-4, 2-3, 2-4, 3-4), и, соответственно,
p' = 0,0085 [6, 4, 27]. Именно по этой причине неприемлемым следует считать указание в результатах исследования с участием нескольких сравниваемых групп выражений наподобие «p1-2 < 0,05; p1-3 < 0,05; p2-3 > 0,05», так как они не позволяют судить о фактической статистической значимости различий.
Тем не менее, использование критерия Стьюдента для проведения post hoc анализа нецелесообразно, так как существующие методы апостериорных сравнений, превышают его по точности и не требуют коррекции критического уровня статистической значимости [6, 35].
Рассмотрим практический пример проведения однофакторного дисперсионного анализа. Представим гипотетическое исследование, в котором сравниваются сроки госпитализации при различных стадиях какого-
либо заболевания. В исследование включены по 11 пациентов с 1-й и 3-й стадиями заболевания и 10 пациентов со 2-й стадией заболевания (исследование было одномоментным, пациенты находились на лечении в разных стационарах).
Результаты наблюдений представлены в таблице 2. Имеющиеся данные полностью соответствуют условиям применения
дисперсионного анализа: количественный тип данных, выборки независимы друг от друга, наблюдения независимы друг от друга, распределение длительности госпитализации соответствует нормальному распределению (читатель может проверить данное утверждение самостоятельно, используя навыки, полученные в результате прочтения предыдущих выпусков [11, 12]).
Таблица 2.
Сроки госпитализации на разных стадиях заболевания.
Группа 1 (стадия 1) Группа 2 (стадия 2) Группа 3 (стадия 3)
№ Длительность № Длительность № Длительность
пациента госпитализации пациента госпитализации пациента госпитализации
1 5 1 10 1 9
2 6 2 7 2 8
3 6 3 9 3 9
4 8 4 11 4 8
5 7 5 9 5 8
6 8 6 10 6 9
7 7 7 10 7 7
8 7 8 9 8 9
9 9 9 11 9 10
10 9 10 12 10 7
11 10 - - 11 10
Результаты расчета:
1. Расчет межгрупповой дисперсии.
По результатам расчетов общее среднее по всем наблюдениям вместе составило 8,56. Среднее по группе 1 равно 7,45, по группе 2 -9,80, по группе 3 - 8,55. Разность между средним каждой группы и общим средним: по группе 1 составило - 1,11, по группе 2 - 1,24, по группе 3 - -0,02. Квадраты разности равны 1,23, 1,53 и 0,00 соответственно. Величины после умножения полученных значений на количество наблюдений в каждой группе равны 13,50, 15,31 и 0,00. После суммирования полученных величин общая сумма составила 28,82. Число степеней свободы для 3-х групп равно 2, поэтому значение межгрупповой дисперсии равно 28,82 / 2 = 14,41.
2. Расчет внутригрупповой дисперсии.
Значения разности каждого отдельного
значения в группе от среднего значения по группе представлены в таблице 3.
Сумма квадратов отличия от среднего составила 51,06. Число степеней свободы для 32-х наблюдений и 3-х групп равно 29. Таким
образом, Значение внутригрупповой дисперсии составляет 51,06/29 = 1,76.
1. Расчет значения: F = 14,41/1,76 = 8,19
2. Сравнение полученного значения F с табличным [25, 4, 19]. Для числа степеней свободы числителя равного 2, и ближайшего к 29-ти представленного в таблице числа степеней свободы знаменателя, равного 30-ти, критическое значение для р = 0,05 составило 3,32.
Рассчитанное значение F (8,19) превышает критическое значение не только для уровня статистической значимости 0,05 (3,32), но и для уровня статистической значимости 0,01 (5,39) Таким образом, нулевая статистическая гипотеза отвергается и делается вывод о том, что группы различаются между собой по средним значениям количественного признака (при этом неизвестно, между какими именно группами найдены различия). По результатам исследования можно сделать вывод о том, что сроки госпитализации при трех стадиях заболевания различаются ^2,29 = 3,51; р < 0,01).
Таблица 3.
Сроки госпитализации на разных стадиях заболевания_
Группа 1 стадия 1) Группа 2 (стадия 2) Группа 3 стадия 3)
Отличие от Квадрат Отличие от Квадрат Отличие от Квадрат
среднего отличия от среднего отличия от среднего отличия от
среднего среднего среднего
-2,45 6,00 0,2 0,04 0,45 0,20
-1,45 2,10 -2,8 7,84 -0,55 0,30
-1,45 2,10 -0,8 0,64 0,45 0,20
0,55 0,30 1,2 1,44 -0,55 0,30
-0,45 0,20 -0,8 0,64 -0,55 0,30
0,55 0,30 0,2 0,04 0,45 0,20
-0,45 0,20 0,2 0,04 -1,55 2,40
-0,45 0,20 -0,8 0,64 0,45 0,20
1,55 2,40 1,2 1,44 1,45 2,10
1,55 2,40 2,2 4,84 -1,55 2,40
2,55 6,50 - - 1,45 2,10
Чтобы узнать, какие именно стадии заболевания различаются между собой по срокам госпитализации, можно провести апостериорные сравнения с использованием критерия Стьюдента [12] со скорректированным критерием значимости, или, что предпочтительнее, использовать специализированные критерии для апостериорных сравнений (рассчитываются с помощью статистических программ).
Если имеющиеся данные не удовлетворяют необходимым условиям применения однофакторного дисперсионного анализа, используют его непараметрический аналог - критерий Краскела-Уоллиса (так называемый «непараметрический
дисперсионный анализ») [6, 28].
Данный критерий используется в том случае, если распределение в группах отличается от нормального, что часто встречается в биомедицинских
исследованиях, особенно в случае сравнения небольших по объему групп. Но, в ряде случаев, если фактическое распределение
скошено влево или вправо, возможно проведение «нормализующей» фактическое распределение математической
трансформации данных, различные варианты которой представлены в предыдущих статьях серии [11, 12].
Критерий Краскела-Уоллиса
рассчитывается с использованием не фактических значений переменных сравниваемых групп, а рангов данных переменных, поэтому он не чувствителен к виду распределения.
Расчет критерия Краскела-Уоллиса выполняется следующим образом:
1. Все переменные сравниваемых групп объединяются и после этого ранжируются от наименьшего к наибольшему значению (совпадающим значениям присваивается средний ранг тех мест, которые занимают одинаковые значения).
2. Вычисляются суммы рангов по каждой из сравниваемых групп по-отдельности К2, Кэ ... й).
3. Рассчитывается статистика критерия Краскела-Уоллиса по формуле:
Н
12
N х ^ + 1)
X ^12 / П1 + К22 / П2 + К32 / П3 + ... + й2 / п,) - 3 х ^ + 1)
где
К - сумма рангов каждой из сравниваемых групп,
п - количество наблюдений в каждой группе,
N - общее количество наблюдений в объединенной выборке.
4. Полученное значение критерия Краскела-Уоллиса сравнивается с табличным [25, 4,19], с учетом следующих условий:
- Если количество сравниваемых групп равно 3, а количество наблюдений в каждой группе не менее 5 (для четырех групп общее число наблюдений должно составлять не менее 10), то расчетное значение Н сравнивают с критическим значением х2 Пирсона (хи-квадрат) с числом степеней свободы df = к - 1, где к - количество групп. Если рассчитанное значение Н равно или превышает критическое значение х2, различия между группами считаются статистически значимыми (р < 0,05, нулевая статистическая гипотеза отвергается).
- Если количество наблюдений в группах менее 5, то в качестве критического значения используются табличные значения распределения Краскела-Уоллиса. Если расчетное значение Н равно или превышает критическое табличное значение, значит,
различия между группами считаются статистически значимыми (р < 0,05, нулевая статистическая гипотеза отвергается). Следует также учесть, что критерий Краскела-Уоллиса может быть использован, если минимальное число наблюдений в одной группе составляет 3, а в двух других группах -по 2 наблюдения. При сравнении четырех или пяти групп минимальное количество наблюдений в каждой группе должно быть не менее 2.
Рассмотрим практический пример использования критерия Краскела-Уоллиса. Представим гипотетическое исследование, в котором сравниваются уровни загрязнения атмосферного воздуха диокисдом азота в 3-х городах (в городах 1 и 3 уровень диоксида азота регистрировали по 5 экологическим станциям, в городе 2 - 6 станций). Результаты измерения уровня диоксида азота представлены в таблице 4.
Таблица 4.
Концентрация диокисда азота в атмосферном воздухе._
Исходные данные
Город 1 Город 2 Город 3
№ экол. 1 2 3 4 5 1 2 3 4 5 6 1 2 3 4 5
станции
Уровень 46 67 59 52 69 51 57 63 54 61 49 51 63 66 52 68
диоксида
азота,
мкг/м3
Ранжированные данные
Уровень 46 49 51 51 52 52 54 57 59 61 63 63 66 67 68 69
диоксида
азота,
мкг/м3
Ранг 1 2 3,5 3,5 5,5 5,5 7 8 9 10 11,5 11,5 13 14 15 16
Город 1 2 2 3 1 3 2 2 1 2 2 3 3 1 3 1
Результаты расчета суммы рангов по группам: РГОрод1 = 45,5, РГОрод2 = 42,0, Кгородэ = 48,5. Согласно полученным суммам рангов:
12
Н = —16х (12 + 1)— х (45,52 / 5 + 42,02 / 6 + 48,52 / 5) - 3 * (16+ 1) = 0,99
Согласно таблице распределения х2, составляет 5,99. Расчетное значение Н (0,85) критическое значение Н для df = 2 и меньше критического значения для уровня критического уровня значимости 0,05 статистической значимости 0,05 (5,99). Таким
образом, принимается нулевая статистическая гипотеза и делается вывод о том, что группы между собой не различаются. По результатам исследования можно сделать вывод о том, что загрязненность атмосферного воздуха диоксидом азота в трех городах не различается (Н = 0,99, df = 2, р > 0,05).
Если в результате расчетов нулевая гипотеза отвергается (то есть принимается альтернативная гипотеза о существовании различий между группами), следующим этапом требуется провести апостериорные попарные сравнения с помощью критерия Манна-Уитни [12, 30, 5], и при этом необходимо использовать скорректированный уровень статистической значимости - учесть поправку Бонферрони. Какие-либо специализированные непараметрические критерии для апостериорных сравнений не используются.
Для того, чтобы читатель приобрел практические навыки проведения статистического сравнения трех независимых выборок количественных переменных, будет рассмотрен фрагмент данных, которые были собраны в ходе исследования, направленного на изучение метаболического синдрома и его детерминант в условиях неблагополучной социально-экологической ситуации в Южном Казахстане [16, 17, 20, 24].
В ходе данного исследования получены значения индекса массы тела (ИМТ), скорости клубочковой фильтрации (СКФ) по МйКй и постпрандиального уровня глюкозы у 39 мужчин и 108 женщин (всего обследованы 147 пациентов). Все три анализируемых признака являются непрерывными количественными переменными.
На предварительном этапе обработки данных количественная шкала значений ИМТ была переведена в номинальную: были выделены 3 «рамки» значений ИМТ: нормальная масса тела, избыточная масса тела и ожирение. Подобная группировка значений позволяет проводить сравнения между различными категориями пациентов и часто используется при анализе данных. Отметим, что получившаяся номинальная переменная, имеющая значения «нормальная масса тела», «избыточная масса тела» и «ожирение», является как номинальной, так и
ординальной, поскольку все три значения могут быть ранжированы по возрастанию или убыванию.
Статистическое сравнение трех групп будет проведено с использованием программного обеспечения Statistica 10 [23, 2] и SPSS 20 [3], которые являются удобными инструментами анализа данных, часто используемыми при обработке данных биомедицинских исследований. Демо-версии программ Statistica и SPSS можно загрузить с официальных сайтов разработчиков (www.stаstsoft.com и www.ibm.com соответственно).
В настоящей статье также представлены наиболее часто используемые приемы разбиения массива исследовательских данных с помощью программы SPSS 20.
Представленные ниже алгоритмы действий являются не более чем инструментом анализа данных, в то время как корректная интерпретация полученных результатов требует наличия базисных знаний в области биомедицинской статистики, которые могут быть получены только путем изучения специализированной литературы [4, 21, 19, 32, 34].
Сравнение 3-х независимых групп с использованием программы Statistica 10.
Для начала работы необходимо открыть файл 4_Filtr_glu_STAT.sta, который потребуется загрузить с сайта журнала «Наука и Здравоохранение». В данном файле представлены следующие вариационные ряды:
1. Категория ИМТ (переменная «Category_BMI»): номинальная группирующая переменная.
2. СКФ по MDRD (переменная «Filtration_MDRD»): непрерывная количественная переменная.
3. Постпрандиальный уровень глюкозы крови (переменная «Postprand_Glu»): непрерывная количественная переменная.
Задача статистического анализа данных -выяснить, различаются ли СКФ по MDRD и постпрандиальный уровень глюкозы крови у пациентов с различными категориями значения ИМТ.
На начальном этапе обработки данных требуется определить тип распределения,
чтобы понять, можно ли использовать параметрический метод (однофакторный дисперсионный анализ), или потребуется сравнивать группы с помощью непараметрического критерия Краскела-Уоллиса. Пошаговый алгоритм проверки распределения на «нормальность» нескольких групп подробно описан в [11, 12].
Проверка на «нормальность» распределения изучаемых количественных переменных показала, что переменная «Filtration_MDRD» имеет близкое к нормальному распределение для всех трех категорий ИМТ, в то время как распределение переменной « P ostp ran d_Gl u » сильно отличается от нормального (читатель может самостоятельно убедиться в этом, выполнив проверку с использованием разделов меню «Statistics» - «Basic Statistics/Tables» -«Descriptive statistics» - «Normality» - кнопка
Далее в появившемся окне необходимо нажать на кнопку «Variables» (рисунок 2) и, как показано на рисунке 3, выбрать в качестве анализируемой переменной «Filtration_MDRD», а в качестве группирующей переменной -«Category_BMI». В обоих окнах выбор подтверждаем нажатием на кнопку «OK».
Программа снова вернется к окну «ANOVA/MANOVA Factorial ANOVA» (рисунок
«Histograms» программы Statistica 10, предварительно задав вывод результатов по группам с помощью кнопки «By Group...»).
Таким образом, для анализа переменной «Filtration_MDRD» целесообразно использовать однофакторный дисперсионный анализ, а для переменной «Postprand_Glu» использование однофакторного дисперсионного анализа неприемлемо, поэтому необходимо будет воспользоваться критерием Краскела-Уоллиса.
Проведем однофакторный дисперсионный анализ переменной «Filtration_MDRD».
Для этого выберем меню «Statistics» (в верхней части рабочего пространства программы), раздел «ANOVA» и в появившемся окне отметим в левом поле позицию «On-way ANOVA», а в правом - «Quick specs dialog», подтвердив выбор нажатием кнопки «OK» (рисунок 1).
2), в котором выберем значения группирующей переменной «Category_BMI», которые будут включены в анализ. Для этого нажмем на кнопку «Factor codes», после чего откроется окно, представленное на рисунке 4, в котором нажатием на кнопку «All» выберем все три варианта группирующей переменной и подтвердим выбор кнопкой «OK».
Рис. 1. Окно «General ANOVA/MANOVA» программы Statistica 10.
Рис. 2. Окно «ANOVA/MANOVA Factorial ANOVA» программы Statistica 10.
Рис. 3. Окно «Select dependent variables and a categorical predictor (factor)» программы Statistica 10.
Рисунок 4. Окно «Select codes for indep. vars (factors)» программы Statistica 10
В появившемся окне нажмем на кнопку после чего нажмем на кнопку «Levene's test «More results», открывающую дополнительные (ANOVA)» для проверки условия равенства
меню анализа (рисунок 5).
В увеличившемся окне «ANOVA Results 1» (рисунок 6) выберем вкладку «Assumptions»,
дисперсии.
Рис. 5. Окно «ANOVA Results 1» программы Statistica 10.
Рис. 6. Вкладка «Assumptions» окна «ANOVA Results 1» («More results») программы
Statistica 10.
Результаты расчета критерия Levene представлены на рисунке 7. Мы видим, что уровень статистической значимости данного критерия превышает критическое значение, равное 0,05 ф = 0,428). Таким образом, можно
считать, что
сравниваемых
различаются,
применения
выполняется.
дисперсии признака в группах статистически не то есть данное условие дисперсионного анализа
Levene's Test for Но Effect "CategoryJBI1 Degrees of freedom nogeneity of Variance Г or all Fs: 2, 144
MS Effect MS Error F P
FiltrationMDRD 189.0751 221.5517 0.853413 0.4281011
Рис. 7. Результаты расчета критерия Levene в программе Statistica 10.
Нажатие на вкладку «ANOVA/MANOVA» в левом нижнем углу рабочего пространства программы позволит вернуться к окну «ANOVA Results 1» («More results») и продолжить
анализ. В данном окне выберем вкладку
«Summary» и нажмем на кнопку «All
effects/Graphs» (рисунок 8) для запуска расчетов.
Рис. 8. Вкладка «Summary» окна «ANOVA Results 1» («More results») программы Statistica 10.
Результаты расчетов представлены на рисунке 9. Мы видим значение F, равное 3,868, и достигнутый уровень статистической значимости: p = 0,023. Так как в данном окне
отмечена позиция «Graph» нажатие на кнопку «OK» откроет график средних значений по всем трем группам (рисунок 10).
Рис. 9. Результаты однофакторного дисперсионного анализа для переменной «Filtration_MDRD» (окно «Table of All Effects» программы Statistica 10).
Рис. 10. График средних значений анализируемой переменной «FNtratюn_MDRD» для различный значений группирующей переменной «Category_BMI».
Таким образом, мы можем сделать вывод о том, что значения СКФ по МйКй различаются у пациентов с различными категориями индекса массы тела (р2,ш = 3,87; р = 0,023).
На основании выведенного программой графика мы можем предположить, что значения СКФ по МйКй ниже у пациентов с ожирением («Са1едогу_ВМ!» = 3). Но это
предположение остается предположением, пока оно не будет подтверждено статистическими расчетами.
Проведем попарные апостериорные сравнения между группами. Вернемся к окну анализа (вкладка «ANOVA/MANOVA» в нижней левой части рабочего поля программы), и выберем вкладку «Post-hoc» (рисунок 11).
Рис. 11. Вкладка «Post-hoc» окна «ANOVA Results 1» («More results») программы Statistica 10.
Программа представит возможность расчета различных критериев для апостериорных сравнений. Например, нажатием на кнопку «Во^еггоп1» выберем критерий Бонферрони, результаты расчета которого представлены на рисунке 12. В открывшейся таблице по строкам и рядам представлены все три значения группирующей
переменной «Оа1едогу_ВМ1», а в ячейках таблицы - полученный при попарных сравнениях уровень статистической значимости. Мы видим, что при попарных сравнениях различия СКФ по МйКй найдены только между группой пациентов с избыточной массой тела и группой пациентов с ожирением (р = 0,038).
Рис. 12. Результаты расчета критерия Бонферрони в программе Statistica 10.
С учетом значений среднего арифметического для СКФ по МйКй, вывод будет следующим: уровень ОКФ по МйКй у пациентов с ожирением (М = 121,90) статистически значимо ниже уровня ОКФ по МйКй у пациентов с избыточной массой тела (М = 133,49). Также целесообразно
приводить и значения стандартного отклонения для каждого признака в форме M ± s (о показателях описательной статистике подробно сказано в первой статье серии [11]).
Заметим, что при проведении post hoc сравнений корректировка критического
значения p не требуется, и оно остается равным 0,05.
К сожалению, в программе Statistica 10 в разделе «ANOVA» отсутствует возможность расчета критериев Welch и Brown-Forsythe, предназначенных для проведения однофакторного дисперсионного анализа, в условиях неравенства дисперсий изучаемого признака в сравниваемых группах.
Далее рассмотрим алгоритм использования непараметрического критерия Краскела-Уоллиса для переменной «Postprand_Glu», имеющей распределение, отличного от нормального. Выберем в меню «Statistics» раздел «Nonparametrics» и в открывшемся окне выберем позицию «Comparing multiple indep. samples (groups)», подтвердив выбор нажатием на кнопку «OK» (рисунок 13).
0.
В появившемся окне с помощью кнопки анализируемую и группирующую переменные, «Variables» (рисунок 14) необходимо выбрать как это показано на рисунке 15.
Рис. 14. Окно «Kruskal-Wallis ANOVA and Median Test» программы Statistica 10
Рис. 15. Окно «Select dep. variables and indep. (grouping) variable» программы Statistica 10.
После подтверждения выбора переменных кнопкой «OK», программа вернется к окну «Kruskal-Wallis ANOVA and Median Test», в котором необходимо выбрать значения группирующей переменной, которые будут включены в анализ. Для этого нажмем на кнопку «Codes» и в открывшемся окне кнопкой «All» выберем все 3 значения группирующей переменной, подтвердив выбор нажатием на кнопку «OK».
Далее в окне «Kruskal-Wallis ANOVA and Median Test» запускаем расчет критерия Краскела-Уоллиса нажатием на кнопку
«Summary». Программа представит расчеты медианного теста и критерия Краскела-Уоллиса. Нас интересует критерий Краскела-Уоллиса, поэтому в дереве каталогов необходимо левой кнопкой мыши выбрать позицию «Kruskal-Wallis ANOVA by Ranks» (рисунок 16). В сформированной программой таблице мы видим количество наблюдений в каждой группе, сумму рангов и средние ранги. В верхней части окна представлено значение критерия Краскела-Уоллиса (H = 11,16) и достигнутый уровень статистической значимости (p = 0,038)
эис. 16. Результаты расчета критерия Краскела-Уоллиса для переменной «Posprand_Glu» в
программе Statistica 10.
Рассчитанное значение уровня статистической значимости для критерия Краскела-Уоллиса позволяет отвергнуть нулевую статистическую гипотезу и сделать вывод о том, что уровень постпрандиальной глюкозы у пациентов с различной категорией
индекса массы тела отличается (Н = 11,16, df = 2, р = 0,004).
Для того, чтобы понять, какие именно группы различаются между собой, проведем попарные сравнения групп с помощью критерия Манна-Уитни [12].
Для этого войдем в меню «Nonparametrics» и в открывшемся окне «Nonparametric Statistics» (рисунок 13) выберем позицию «Comparing two independent samples (groups)», подтвердив выбор кнопкой «OK».
Откроется окно «Comparing two groups», в котором с помощью кнопки «Variables» как обычно выберем в качестве анализируемой переменной «Postprand_Glu», а в качестве
группирующей - «Category_BMI». Следует обратить внимание на поля «Codes for» -«Group 1» и «Group 2», в которые необходимо внести коды групп для попарного сравнения. Установим исходные значения 1 и 2, как показано на рисунке 17, что позволит сравнить пациентов с нормальной массой тела с пациентами с избыточной массой тела.
17. Окно «Comparing Two Groups» программы Statistica 10.
Нажатие на кнопку «Mann-Whitney U test» запустит расчет критерия Манна-Уитни.
Для повторения анализа для сравнения группы 1 с группой 3 и группы 2 с группой 3 потребуется дважды возвращаться к окну «Comparing Two Groups» (вкладка «Comparing Two Groups» в нижней левой части рабочего пространства программы) и вносить новые значения переменной «Category_BMI» в поля «Codes for».
Результаты попарных сравнений представлены на рисунке 18.
Мы видим, что уровень статистической значимости оказался ниже 0,05 как при сравнении группы 1 с группой 2, так и при сравнении группы 2 с группой 3.
С учетом «эффекта множественных сравнений», значение 0,05 не может считаться критическим, и новый критический уровень p должен быть рассчитан по формуле: p' = 1 -0,951/3 = 1 - 0,983 = 0,017 (с учетом проведенных трех попарных сравнений). Теперь мы видим, что различия между группой 1 и группой 3 оказались статистически не значимыми, так как значение p, равное 0,022, хоть и незначительно, но превышает критическое.
Таким образом, на формальных основаниях, мы можем сделать вывод о том, что постпрандиальный уровень глюкозы различался только у пациентов с избыточной массой тела и пациентов с ожирением.
variable Mann-Whitney U Test (Filtr_Glu_STAT) By variable Category_BMI Marked tests are significant at p <,05000
Rank Sum Group 1 Rank Sum Group 2 U z p-value Z adjusted p-value Valid N Group 1 Valid N Group 2 2*1sided exact p
Postprand_Glu 1465,000 1938.000 762,0000 0,503553 0,614576 0.504476 0 613927 34 43 0,616441
Сравнение пациентов с нормальной массой тела (группа
тела (группа 2)
) с пациентами с избыточной массой
variable Mann-Whitney U Test (Filtr_Glu_STAT) By variable Category_BMI Marked tests are significant at p <.05000
Rank Sum Group 1 Rank Sum Group 2 U Z p-value Z adjusted p-value Valid N Group 1 Valid N Group 2 2*1sided exact p
Postprand_Glu 1388.500 3561,500 793,5000 -2.29168 0 021924 -2 29595 и 021679 34 65 0 021180
Сравнение пациентов с нормальной массой тела (группа 1
с пациентами с ожирением (группа 3)
variable Mann-Whitney U Test (Filtr_Glu_STAT) By variable Category_BMI Marked tests are significant at p <.05000
Rank Sum Group 1 Rank Sum Group 2 U Z p-value Z adjusted p-value Valid N Group 1 Valid N Group 2 2*1sided exact p
Postprand_Glu 2201 500 4239.500 1025.500 -3 10172 0 001924 -3.10729 0 001888 48 65 0 001722
Сравнение пациентов с избыточной массой тела (группа 2
с пациентами с ожирением (группа 3)
Рис. 18. Результаты попарных сравнений значений переменной «РоБ1ргап^01и» с помощью критерия Манна-Уитни в программе 81айБйса 10.
Но данное утверждение нельзя считать в достаточной мере логичным, ведь получается, что постпрандиальный уровень глюкозы у пациентов с ожирением не отличается от такового у лиц с нормальной массой тела, но отличается от такового у пациентов с избыточной массой тела, что противоречит клиническому опыту. Разобраться в ситуации поможет графическое представление
постпрандиального уровня глюкозы для всех сравниваемых групп (рисунок 19). В программе Statistica 10 подобную диаграмму (но менее наглядную) можно построить с использованием меню «Graphs» раздел «2D Graphs», подраздел «Box Plots», выбрав анализируемую и группирующую переменные и указав в качестве центральной тенденции медиану.
Рис. 19. Квартильная диаграмма постпрандиального уровня глюкозы у пациентов с различной категорией ИМТ.
Мы видим, что у пациентов с ожирением медиана постпрандиального уровня глюкозы расположена несколько выше по сравнению с остальными двумя группами пациентов. Более важным является тот факт, что прямоугольник, соответствующий 50% наблюдений в каждой группе (от 1-го до 3-го квартилей), для группы пациентов с ожирением расположен выше по сравнению с остальными двумя группами. Исходя из представленной графической информации и значений медиан можно предположить, что у пациентов с ожирением постпрандиальный уровень глюкозы выше по сравнению с пациентами как с избыточной массой тела (группа 2), так и с нормальной массой тела (группа 1). Но апостериорные сравнения подтвердили различия только между группами 2 и 3.
В данном примере наглядно проявилась проблема «дихотомического» подхода к оценке уровня статистической значимости: если он меньше критического уровня, однозначно считают, что различия есть, а если он оказался больше критического уровня или равным ему, то однозначно считают, что различий нет.
Но ведь р = 0,049 и р = 0,051 - это почти одно и то же, и вывод о наличии или отсутствии различий между группами на основании различий в вероятности, составляющей всего лишь 0,1%, трудно считать достаточно обоснованным. Именно поэтому заключение о различиях между группами следует делать не только на основании того, больше или меньше критического уровня оказалось значение р, но и учитывать степень отличия р от критического уровня (по этой причине в результатах научной работы следует приводить значения статистических коэффициентов и рассчитанный уровень статистической значимости, избегая выражений «р < 0,05» и «р > 0,05»).
Оценку результатов статистического анализа также нельзя проводить в отрыве от сути исследуемых явлений и методологии исследования, объективного подхода к качеству собранных данных, оценки возможного влияния вмешивающихся факторов (конфаундеров) и, разумеется, здравого смысла.
Таким образом, целесообразно сделать заключение о том, что постпрандиальный
уровень глюкозы у пациентов с ожирением статистически значимо превышает постпрандиальный уровень глюкозы у пациентов с избыточной массой тела (U = 1025, Z = -3,1, p = 0,002), и статистически не значимо превышает постпрандиальный уровень глюкозы у пациентов с нормальной массой тела (U = 794, Z = -2,3, p = 0,022) с учетом критического уровня статистической значимости, равного 0,017.
Так как полученное значения p оказалось близким к критическому уровню, для выяснения скорректированных («adjusted») значений статистических коэффициентов и достигнутых уровней статистической значимости, в ходе обработки данных целесообразно исключить из анализа «выскакивающие» значения, или на уровне анализа уже собранных данных устранить влияние конфаундеров (используются рестрикция и стратификация данных, а также другие методы, описанные в руководствах по эпидемиологии [29, 18, 33]). Разумеется, все способы модификации исходных данных должны быть тщательно обдуманы и обоснованы.
Сравнение 2-х независимых групп с использованием программы SPSS 20.
Для начала работы необходимо открыть файл 4_Filtr_Glu_SPSS.sav, который следует загрузить с сайта журнала «Наука и Здравоохранение». В файле представлены те же вариационные ряды, что и в файле данных программы Statistica: категория ИМТ («Category_BMI»), СКФ по MDRD («Filtration_MDRD»), постпрандиальный уровень глюкозы крови («Postprand_Glu»). Также представлена еще одна номинальная переменная - пол пациента («Gender») имеющая значение «1» для мужчин и «2» для женщин.
На начальном этапе обработки данных потребуется определить тип распределения. Пошаговый алгоритм проверки распределения на «нормальность» с использованием программы SPSS 20 подробно описан в [11, 12], и поэтому не будет представлен в настоящей статье.
Для проведения однофакторного дисперсионного анализа войдем в меню «Analyze», раздел «Compare means», подраздел «One-Way ANOVA» (рисунок 20).
Fiftr_Glu_SPSS+.sav [DataSetl] - IBM SPSS Statistics Data Editor
File Edit View Data Transform Analyze Direct Marketing Graphs Utilities Add-ons Window Help
# ИЗ «- Reports ► Descriptive Statistics ► Tables ► в ш a—- XXX'j # РП
1:
Gender Category Compare Means ► General Linear Model ► Generalized Linear Models ► Mixed Models ► Correlate ► Regression ► Loglinear ► Q Means... Q One-Sample T Test.. (¡¡jy Independent-Samples T Test... ¡¡¿¡j Paired-Samples T Test... Q One-Way ANOVA.. ir
1 1.00
2 1.00
3 1.00
4 1.00
5 1.00
6 1.00 4.90
7 1 пп Ч 7П
Рис. 20. Выбор раздела «One-Way ANOVA» меню «Analyze» программы SPSS 20.
В открывшемся окне «One-Way ANOVA» «Category_BMI» - в поле группирующей перенесем переменную «Filtration_MDRD» в переменной «Factor» (рисунок 21). поле «Dependent List», а переменную
Рис. 21. Окно «One-Way ANOVA» программы SPSS 20.
Далее нажатием на кнопку «Post Hoc» откроем меню апостериорных сравнений, в котором увидим возможность использования 18-ти различных критериев для апостериорных сравнений (см. выше). Например, выберем критерий Бонферрони, подтвердив выбор нажатием на кнопку «Continue» (рисунок 22).
Далее нажмем на кнопку «Options» (рисунок 21) и выберем позиции «Descriptive» (вывод показателей описательной
статистики), «Homogeneity of variance test» (расчет критерия Levene для проверки равенства дисперсий) и критерии Brown-Forsythe и Welch (для проведения дисперсионного анализа в случае неравенства дисперсий). Также отметим «Means plot» для вывода графика средних арифметических значений (рисунок 23). Выбор подтверждаем нажатием на кнопку «Continue». Запуск анализа производится кнопкой «OK» (рисунок 21).
Рис. 22. Окно « One-Way ANOVA: Post hoc Multiple Comparisons» программы SPSS 20.
Рис. 23. Окно «One-Way ANOVA: Options» программы SPSS 20.
Программа представляет результаты расчетов в виде нескольких таблиц, из которых будут приведены наиболее важные. В таблице 4 приведены результаты расчета критерия Levene (уровень статистической значимости («Sig.») составил 0,426), в таблице 5 - результаты дисперсионного
анализа (F = 3,868, p = 0,023). В таблице 6 представлены результаты расчета критериев Welch и Brown-Forsythe, которые следует использовать, если условие равенства дисперсий не выполняется (в случае, если уровень статистической значимости критерия Levene меньше 0,05).
Таблица 4.
Результаты расчета критерия Levene для проверки равенства дисперсий переменной «Filtration MDRD».
Levene Statistic df1 df2 Sig.
,853 2 144 ,428
Результаты дисперсионного анализа переменной «Filtration_MDRD».
Таблица 5.
Sum of Squares df Mean Square F Sig.
Between Groups 4650,220 2 2325,110 3,868 ,023
Within Groups 86565,416 144 601,149
Total 91215,636 146
Таблица 6.
Результаты расчетов критериев Welch и Brown-Forsythe для переменной «Filtration_MDRD».
Statistic3 df1 df2 Sig.
Welch 3,782 2 86,133 ,027
Brown-Forsythe 4,061 2 133,742 ,019
График средних значений переменной сравнений групп между собой с помощью «Filtratюn_MDRD» представлен на рисунке 24. критерия Бонферрони представлены в Результаты апостериорных попарных таблице 7.
Рис. 24. График средних значений переменной «Filtration_MDRD».
Таблица 7.
Результаты апостериорных сравнений переменной «ННгаИоп.МОКй» с использованием критерия Бонферрони.
(I) Category_BMI (J) Category_BMI Mean Std. Error Sig. 95% Confidence Interval
Difference (I-J) Lower Upper
Bound Bound
Normal weight Overweight -1,20589 5,49589 1,000 -14,5184 12,1066
Obesity 10,58365 5,18934 ,130 -1,9863 23,1536
Overweight Normal weight 1,20589 5,49589 1,000 -12,1066 14,5184
Obesity 11,78954* 4,66609 ,038 ,4870 23,0921
Obesity Normal weight -10,58365 5,18934 ,130 -23,1536 1,9863
Overweight -11,78954* 4,66609 ,038 -23,0921 -,4870
Результаты однофакторного дисперсионного анализа, полученные с помощью программы SPSS 20, соответствуют полученным с использованием программы Statistica 10 и не требуют дополнительных пояснений.
Далее выполним расчет критерия Краскела-Уоллиса для переменной
«Postprand_Glu», имеющей распределение, отличное от нормального.
Для этого снова войдем в меню «Analyze», выберем раздел «Nonparametric Tests», подраздел «Legacy Dialogs», в котором выберем позицию «K Independent Samples», как показано на рисунке 25.
Ц Filtr_Glu_SPSS+.sav [DataSetl] - IBM SPSS Statistics Data Editor
File Edit View Data Transform Analyze Direct Marketing Graphs Utilities Add-ons Window Help
3 Reports ► Descriptive Statistics > Tables ► Compare Means ► General Linear Model ► Generalized Linear Models > Mixed Models > Correlate ► Regression ► Loglinear ► Neural Networks ► Classify ► Dimension Reduction ► Scale > Я ¡Я " LStJ ^ra — ffl JM
1 :
Gender Category ind Glu var var var var var
1 1,00 5,70
2 1.00 5,40
3 1,00 4,50
4 1,00 4.90
5 1,00 4,70
6 1.00 4.90
7 1.00 3.70 6,30
8 1,00
9 1,00 5,10
10 1.00 15.90
11 1.00 r; ?n
12 1,00 Nonparametric Tests * Forecasting ► Survival ► Multiple Response > Ej Missing Value Analysis... Multiple Imputation ► Complex Samples ► Quality Control ► Q ROC Curve... A One Sample... f\ independent Samples... | Related Samples...
13 1.00
14 1,00
15 1.00 Legacy Dialogs ► Chi-square... ES Binomial... ¡Ü Runs... □ 1-Sample K-S... E 2 Independent Samples...
16 1.00 b,2U
17 1.00 4.10
18 1.00 4.40
19 1.00 4.70
20 1.00 4.30
21 1.00 2.0U 14U.42 3,90 |g|j K Independent Samples... Q 2 Related Samples... 0 K Related Samples...
22 1.00 3.00 163.09 5.10
23 1.00 3.00 91.36 4,20
24 1.00 2.00 179.87 11.10
Рис. 25. Выбор раздела «K Independent Samples» меню «Analyze» программы SPSS 20.
В открывшемся окне «Test for Several Independent Samples» оставим отмеченной позицию «Kruskal-Wallis H», перенесем переменную «Postprand_Glu» в поле «Test Variable List», а переменную «Category_BMI» - в поле группирующей переменной
«Grouping Variable» (рисунок 26), после чего потребуется нажать на кнопку «Define Range» и выбрать значения группирующей переменной так, как показано на рисунке 27, подтвердив выбор кнопкой «Continue».
Рис. 26. Окно «Test for Several Independent Samples» программы SPSS 20.
Рис. 27. Окно «Several Independent Samples» (выбор значений группирующей переменной)
программы SPSS 20.
Запуск анализа производится кнопкой «ОК» (рисунок 26).
Результаты расчета критерия Краскела-Уоллиса программа представляет в виде таблицы (таблица 8), в которой значение Н представлено в строке «СЫ-Эдиаге» (11,162), а уровень статистической значимости - в строке «АБутр. Э1д.» (0,004).
Таблица 8.
Результаты расчета критерия Краскела-Уолл и са для переменной «Роз1рга^_01и».
Postprand_Glu
Chi-Square df Asymp. Sig. 11,162 2 ,004
Апостериорные сравнения выполним с помощью критерия Манна-Уитни. Для этого
снова войдем в меню «Analyze», выберем раздел «Nonparametric Tests», подраздел «Legacy Dialogs», в котором выберем позицию «2 Independent Samples» (рисунок 25).
В открывшемся окне «Two-Independent-Samples Tests» оставим отмеченной позицию «Mann-Whitney U», и перенесем анализируемую и группирующую переменны в соответствующие поля окна (рисунок 28). Нажатие на кнопку «Define Groups» позволит выбрать значения переменной
«Category_BMI», которые будут сравниваться попарно. Сначала в соответствующие поля окна введем значения 1 и 2 для сравнения пациентов с нормальной и избыточной массой тела (рис. 29). Нажатие на кнопку «Continue» подтверждает выбор, а запуск анализа производится кнопкой «OK» (рисунок 28).
Рис. 28. Окно «Two-Independent-Samples Tests» программы SPSS 20.
Рис. 29. Выбор значений группирующей переменной в программе SPSS 20.
Результаты расчета критерия Манна-Уитни для выбранных значений группирующей переменной «1» и «2», соответствующих пациентам с нормальной массой тела и пациентам с избыточной массой тела, представлены в таблице 9. Уровень статистической значимости критерия указан в строке «АБутр. Э1д. (2^Ы)» (0,611).
Таблица 9.
Результаты расчета критерия Манна-Уитни для переменной «Postprand_Glu» (значения
Postprand_Glu
Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed) 762,000 1938,000 -,509 ,611
Попарные сравнения с помощью критерия Манна-Уитни необходимо повторить еще 2 раза, указывая с помощью кнопки «Define
Groups» другие сравниваемые группы - «1» и «3», «2» и «3». Напомним, что при интерпретации полученного значения p следует учитывать «эффект множественных сравнений» и пользоваться
скорректированным уровнем статистической значимости (в данном случае p' = 0,05).
Далее в статье описаны наиболее часто используемые практические приемы управления массивом исследовательских данных, позволяющие детальнее проанализировать результаты исследования. Наиболее часто управление массивом данных требуется для некоторых приемов нивелирования конфаундеров.
В клинической эпидемиологии чрезвычайно важным приемом анализа, постоянно используемым в исследовательской работе, является разбиение данных на группы и проведение анализа непосредственно внутри групп. В программе SPSS 20 в удобной форме заложена возможность разбиения данных на
группы с последующим их анализом по-отдельности или селективное включение в анализ определенных групп наблюдений.
Для разделения данных на группы в SPSS 20 используется функция «Split file». Приведем пример разделения массива данных по
переменной «Gender», имеющей значение «1» для мужчин и «2» для женщин.
Для разбиения данных на подгруппы требуется войти в меню «Data» и выбрать раздел «Split file» (рисунок 30).
(gj Filtr_Glu.SPSS.sav [DataSetl] - IBM SPSS Statistics Data Editor File Edit View Data Transform Analyze Direct Marketing G
C Define Variable Properties... T^j Set Measurement Level for Unknown... Copy Data Properties... Jl New Custom Attribute Define Dates... EB] Define Multiple Response Sets...
1 : Gender
Ge
1
2
3
4 Validation > m Identify Duplicate Cases... Identify Unusual Cases...
5
6
7 ^jf Sort Cases... Sort Variables... ¡53 Transpose... Merge Files ► ¡JJ3 Restructure... ¡Hi Aggregate... Orthogonal Design ►
8
9
10
11
12
13
14
15 ^ Copy Dataset
16 H Split File... H Select Cases... if* Weight Cases...
17
18
19
P<
Рис. 30. Выбор функции «Split file» меню «Data» программы SPSS 20.
В открывшемся окне «Split file» отметим позицию «Organize output by groups» и перенесем переменную «Gender» в поле «Groups Based on» и подтвердим выбор нажатием на кнопку «OK». По умолчанию в данном разделе была отмечена позиция «Analyze all cases, do not create groups», согласно которой в анализ включаются все данные без исключения.
Теперь все дальнейшие действия (проверка «нормальности» распределения, однофакторный дисперсионный анализ, расчет критерия Краскела-Уоллиса и проч.) буду выполняться раздельно для подгруппы мужчин и подгруппы женщин. Подобное разделение может быть проведено в процессе стратификации данных - одного из методов борьбы с конфаундерами (например,
подобное разбиение на группы может быть целесообразным в случае, когда количество включенных в исследование лиц одного пола в несколько раз больше количества лиц другого пола).
Чтобы отключить функцию разделения файла, необходимо снова войти в меню «Data», раздел «Split file» и выбрать позицию «Analyze all cases, do not create groups».
Программа SPSS 20 также позволяет включать в анализ определенные случаи из имеющегося массива данных. Для этого используется функция «Select Cases» в меню «Data» (рисунок 30). В окне «Select cases» по умолчанию отмечена позиция «All cases», которая включает в анализ все имеющиеся данные. Отметим позицию «If condition is satisfied» и нажмем кнопку «If...» (рисунок 32).
Рис. 31. Окно «Split file» программы SPSS 20.
Рис. 32. Окно «Select Cases» программы SPSS 20.
Программа откроет окно «Select Cases: If», в котором можно задать условия, при соблюдении которых переменные будут включены в анализ (рисунок 33).
В открывшемся окне с помощью стрелки перенесем переменную «Gender» в поле справа и с помощью калькулятора в центре окна введем значения «=» и «1».
Получившееся выражение «Gender = 1», ограничивает анализ данных только мужчинами (рисунок 33). Также возможно введение условий включения в анализ и для количественных переменных. Работа с массивами данных в программе SPSS подробно описана в [2].
Рис. 33. Окно «Select Cases: If» программы SPSS 20.
В следующей статье серии будет представлен алгоритм обработки количественных данных трех и более парных выборок с использованием программ Statistica 10 и SPSS 20.
Литература:
1. Аканов А.А., Турдалиева Б.С., Изекенова А.К., Рамазанова М.А., Абдраимова Э.Т., Гржибовский А.М. Оценка использования статистических методов в научных статьях медицинских журналов Казахстана // Экология человека. 2013. №5. С. 61-64.
2. Боровиков В. STATISTICA. Искусство анализа данных на компьютере: для профессионалов. СПб. : Питер, 2003. 688 с.
3. Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. СПб.: ООО «ДиаСофтЮП», 2005. 608 с.
4. Гланц С. Медико-биологическая статистика. М. : Практика, 1998. 459 с.
5. Гржибовский А.М. Анализ количественных данных для двух независимых групп // Экология человека. 2008. №2. С. 54-61.
6. Гржибовский А.М. Анализ трех и более групп количественных данных // Экология человека. 2008. №3. С. 50-58.
7. Гржибовский А.М. Типы данных, проверка распределения и описательная
статистика // Экология человека. 2008. №1. С. 52-58.
8. Гржибовский А.М., Иванов С.В. Исследования типа «случай-контроль» в здравоохранении // Наука и Здравоохранение. 2015. № 4. С. 5-17.
9. Гржибовский А.М., Иванов С.В. Когортные исследования в здравоохранении // Наука и Здравоохранение. 2015. № 3. С. 5-16.
10. Гржибовский А.М., Иванов С.В. Поперечные (одномоментные) исследования в здравоохранении // Наука и Здравоохранение. 2015. № 2. С. 5-18.
11. Гржибовский А.М., Иванов С.В. Описательная статистика с использованием пакетов статистических программ Statistica и SPSS // Наука и Здравоохранение. 2016. № 1. С. 7-23.
12. Гржибовский А.М., Иванов С.В. Сравнение количественных данных двух независимых выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии // Наука и Здравоохранение. 2016. №2. С. 5-28.
13. Гржибовский А.М., Иванов С.В. Сравнение количественных данных двух парных выборок с использованием программного обеспечения Statistica и SPSS: параметрические и непараметрические критерии // Наука и Здравоохранение. 2016. №3. С. 5-25
14. Гржибовский А.М., Иванов С.В. Экологические (корреляционные) исследования в здравоохранении // Наука и Здравоохранение. 2015. № 5. С. 5-18.
15. Гржибовский А.М., Иванов С.В. Экспериментальные исследования в здравоохранении // Наука и Здравоохранение. 2015. № 6. С. 5-17.
16. Жунисова М.Б., Шалхарова Ж.С., Шалхарова Ж.Н., Гржибовский А.М. Типы пищевого поведения и абдоминальное ожирение // Медицина. 2015. №4. С. 92-95.
17. Жунисова М.Б., Шалхарова Ж.С., Шалхарова Ж.Н., Нускабаева Г.О., Садыкова К.Ж., Маденбай К.М., Гржибовский А.М. Психоэмоциональный стресс как предиктор типа пищевого поведения в Казахстане // Экология человека. 2015. №5. С. 36-45.
18. Зуева Л.П., Яфаев Р.Х. Эпидемиология : учебник. СПб : ООО «Издательство Фолиант», 2008. 752 с.
19. Лакин Г.Ф. Биометрия. М. : Высшая школа, 1990. 351 с.
20. Маденбай К.М., Шалхарова Ж.С., Шалхарова Ж.Н., Жунисова М.Б., Садыкова К.Ж., Нускабаева Г.О., Гржибовский А.М. Оценка связи между площадью подкожной жировой ткани и показателями электронейромиографии // Экология человека. 2015. №7. С. 58-64.
21. Петри А., Сэбин К. Наглядная статистика в медицине. М. : ГЭОТАР-Мед, 2003. 140 с.
22. Рахыпбеков Т.К., Гржибовский А.М. К вопросу о необходимости повышения качества казахстанских научных публикаций для успешной интеграции в международное научное сообщество // Наука и Здравоохранение. 2015. №1. С. 5-11.
23. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. М. : Медиа Сфера, 2002. 312 с.
24. Садыкова К.Ж., Шалхарова Ж.С., Нускабаева Г.О., Садыкова АД, Жунисова М.Б., Маденбай К.М., Гржибовский А.М. Распространенность анемии, ее социально-демографические детерминанты и возможная связь с метаболическим синдромом в г. Туркестан, Южный Казахстан // Экология человека. 2015. №8. С. 58-64.
25. Статистический анализ эмпирических исследований [электронный ресурс]. URL: www.statexpert.org/articles/табли цы_кр итически х_значений_статистических_критериев (дата обращения 02.08.2015).
26. Субботина А.В., Гржибовский А.М. Описательная статистика и проверка нормальности распределения количественных данных // Экология человека. 2014. №2. С. 51-57.
27. Унгуряну Т.Н., Гржибовский А.М. Однофакторный дисперсионный анализ с использованием пакета статистических программ STATA // Экология человека. 2014. №5. С. 60-64.
28. Унгуряну Т.Н., Гржибовский А.М. Сравнение трех и более независимых групп с использованием непараметрического критерия
Краскела-Уоллиса в программе STATA // Экология человека. 2014. №6. С. 55-58.
29. Флетчер Р. Клиническая эпидемиология. Основы доказательной медицины: пер. с англ. / Р. Флетчер, С. Флетчер, Э. Вагнер. М. : Медиа Сфера, 1998. 352с.
30. Харькова О.А., Гржибовский А.М. Сравнение одной и двух несвязанных выборок с помощью пакета статистических программ STATA: непараметрические критерии // Экология человека. 2014. №4. С. 60-64.
31. Харькова О.А., Гржибовский А.М. Сравнение одной и двух несвязанных выборок с помощью пакета статистических программ STATA: параметрические критерии // Экология человека. 2014. №3. С. 57-61.
32. Юнкеров В.И., Григорьев С.Г. Математико-статистическая обработка данных медицинских исследований. СПб : ВМедА, 2002. 266 с.
33. Beaglehole R., Bonita R. Basic epidemiology. World Health Organization, Geneva, 1993.
34. Cleopas T.J. et al. Statistics Applied to Clinical Trials. 4th ed. Springer, 2009.
35. Toothaker L.E. Multiple comparison procedures. Sage University paper series on quantitative applications in the social sciences, 07-089. SAGE Publications, 1993. 104 p.
References:
1. Akanov A.A., Turdalieva B.S., Izekenova A.K., Ramazanova M.A., Abdraimova, Grjibovski A.M. Otsenka ispolzovania statisticheskih metodov v nauchnih statyakh Kazakhstana [Assesment of use of statistical methods in scientific articles of the Kazakhstan's medical journals]. Ekologiya cheloveka [Human Ecology]. 2013, 5, pp. 61-64. [in Russian]
2. Borovikov V. STATISTICA. Iskusstvo analiza dannikh na kompyutere: dlya professionalov [STATISTICA. The art of data analysis using computer: for professionals]. SPb.: Piter, 2003. P. 688.
3. Buhl A., Zofel P. SPSS: isskustvo obrabotki informatsii. Analiz statisticheskih daanikh i vosstanovlenie skritikh zakonomernostey [SPSS: the art of information analysis. Statistical data analysis and hidden regularities identification]. SPb. : OOO «DiaSoftUP», 2005. P. 608. [in Russian]
4. Glants S. Mediko-biologicheskaya statistika [The biomedical statistics]. M. : Praktika, 1998. pp. 459. [in Russian]
5. Grjibovski A.M. Analiz kolichestvennikh dannikh dlya dvuh nezavisimih grupp [Analysis of quantitative data of two independent samples]. Ekologiya cheloveka [Human Ecology]. 2008, 2. pp. 54-61. [in Russian]
6. Grjibovski A.M. Analiz trekh i bolee grup kolichestvennih dannikh [Analysis of quantitative data of three and more independent samples]. Ekologiya cheloveka [Human Ecology]. 2008. 3. pp. 50-58. [in Russian]
7. Grjibovski A.M. Tipy dannikh, proverka raspredeleniya I opisatelnaya statistika [Types of data, distribution estimation and descriptive statistics]. Ekologiya cheloveka [Human Ecology]. 2008, 1. pp. 52-58. [in Russian].
8. Grjibovski A.M., Ivanov S.V. Issledovaniya tips sluchay-kontrol v zdravoohranenii [Case-control studies in health sciences]. Nauka i Zdravoohranenie [Science & Healthcare]. 2015, 4, pp. 5-17. [in Russian].
9. Grjibovski A.M., Ivanov S.V. Kogortnie issledovaniya v zdravoohranenii [Cohort studies in health sciences]. Nauka i Zdravoohranenie [Science & Healthcare]. 2015, 3, pp. 5-16. [in Russian]
10. Grjibovski A.M., Ivanov S.V. Poperechnie (odnomomentnie) issledovanoya v zdravoohranenii [Cross-sectional studies in health sciences]. Nauka i Zdravoohranenie [Science & Healthcare]. 2015, 2, pp. 5-18. [in Russian]
11. Grjibovski A.M., Ivanov S.V. Opisatel'naya statistika s ispol'zovaniem paketov statisticheskikh programm Statistica i SPSS [Descriptive statistics using Statistica and SPSS software]. Nauka i Zdravoohranenie [Science & Healthcare]. 2016, 1, pp. 7-23. [in Russian].
12. Grjibovski A.M., Ivanov S.V. Sravneniye kolichestvennykh dannykh dvukh nezavisimykh vyborok s ispol'zovaniyem programmnogo obespecheniya Statistica i SPSS : parametricheskiye i neparametricheskiye kriterii [Comparing the quantitative data of two independent groups using the software Statistica and SPSS: parametric and nonparametric tests]. Nauka i Zdravoohranenie [Science & Healthcare]. 2016, 2, pp. 5-28. [in Russian].
13. Grjibovski A.M., Ivanov S.V. Sravneniye kolichestvennykh dannykh dvukh neparnikh
viborok s ispol'zovaniyem programmnogo obespecheniya Statistica i SPSS : parametricheskiye i neparametricheskiye kriterii [Comparing the quantitative data of two dependent variations using the software Statistica and SPSS: parametric and nonparametric tests] // Nauka i Zdravoohranenie [Science & Healthcare]. 2016, 3, pp.5-25. [in Russian].
14. Grjibovski A.M., Ivanov S.V. Ekologicheskiye (korrelyatsionnye) issledovaniya v zdravoohranenii [Ecological (correlational) studies in health sciences]. Nauka i Zdravoohranenie [Science & Healthcare]. 2015, 5, pp.5-18. [in Russian].
15. Grjibovski A.M., Ivanov S.V. Eksperimentalnie issledovaniya v zdravookhranenii [Experimental studies in health sciences]. Nauka i Zdravoohranenie [Science & Healthcare]. 2015.6, pp.5-17. [in Russian].
16. Zhunissova M.B., Shalkarova Zh.S., Shalkarova Zh. N., Nuskabayeva G.O., Sadykova K. Zh., Madenbay K.M., Grjibovski A.M. Tipy pischevogo povedeniya i abdominalnoe ozhirenie [Eating behavior types and abdominal obesity]. Meditsina [Medicine]. 2015, 4. pp. 92-95.
17. Zhunissova M.B., Shalkarova Zh.S., Shalkarova Zh. N., Nuskabayeva G.O., Sadykova K. Zh., Madenbay K.M., Grjibovski A.M. Psykhoemotsionalniy stress kak predictor tipa pischevogo povedeniya v Kazakhstane [Psychoemotional stress and eating behavior in Kazakhstan]. Ekologiya cheloveka [Human Ecology]. 2015. 5. pp. 36-45. [in Russian]
18. Zueva L.P, Yafaev R.H. Epidemiologiya: uchebnik [Epidemiology: the textbook]. SPb : OOO «Izdatelstvo Foliant», 2008. P. 752. [in Russian].
19. Lakin G.F. Biometria [Biometrics]. M. : Viscshaya shkola. 1990. P. 351. [in Russian]
20. Madenbay K.M., Shalkarova Zh.S., Shalkarova Zh. N., Zhunissova M.B., Sadykova K. Zh., Nuskabayeva G.O., Grjibovski A.M. Otsenka svyazi mezhdu ploshadyu podkojnoy jirovoy tkani I pokazatelyami electroneyromiografii [Assesment of the relationship between subcutaneous fat tissue an results of electromyoneurography]. Ekologiya cheloveka [Human Ecology]. 2015. 7. pp. 58-64. [in Russian]
21. Petri A., Sebin K. Naglyadnaya statistika v meditsine [Demonstrative statistics in medicine]. M. : GEAOTAR-Med, 2003. p. 140. [in Russian]
22. Rakhypbekov T.K., Grjibovski A.M. K voprosu o nedhodimosti povisheniya kachestva kazakhstanskih nauchih publicatsiy dlya uspeshnoy integratsii v mezhdunarodnoe nauchnoe soobschestvo [The need for improvement of the quality of Kazakhstani publications for successful integration in the international research community]. Nauka i Zdravoohranenie [Science & Healthcare]. 2015, 1. pp. 5-11.
23. Rebrova O. Yu. Statisticheskiy analiz meditsinskih daanikh. Primenenie paketa prikladnikh program STATISTICA [Statistical analysis of medical data. Using of STATISTICA software]. M. : MediaSphera, 2002. P. 312.
24. Sadykova K.Zh., Shalkharova Zh.S., Shalkharova Zh.N. Nuskabaeva G.O., Sadykova A.D., Zhunissova M.B., Madenbay K.M., Grjibovski A.M. Rasprostranennost' anemii , yeye sotsial'no - demograficheskiye determinanty i vozmozhnaya svyaz' s metabolicheskim sindromom v g. Turkestan , Yuzhniy Kazakhstan [Prevalence of anemia, its socio-demographic determinants and potential association with metabolic syndrome in residents of Turkestan, Southern Kazakhstan]. Ekologiya cheloveka [Human Ecology]. 2015, 8. pp. 58-64. [in Russian]
25. Statistical analysis of empirical research [website] Available at: www.statexpert.org/articles/
Ta6.n^bi_KpMTMHecKMx_3HaHeHMM_CTaTMCTMHecK
Mx_KpMTepueB (Accesed 02 August 2015).
26. Subbotina A.V., Grjibovski A.M. Opisatelnaya statistika I proverka normal'nosti raspredeleniya kolichestvennih dannikh [Descriptive statistics and normality testing for quantitative data]. Ekologiya cheloveka [Human Ecology]. 2014, 2. pp. 51-57. [in Russian]
27. Unguryanu T.N., Grjibovski A.M. Odnofaktorniy dispersionnyy analiz s ispol'zovaniyem paketa statisticheskikh programm STATA [One-way analysis of variance (ANOVA) in STATA software]. Ekologiya cheloveka [Human Ecology]. 2014, 5. pp. 60-64. [in Russian]
28. Unguryanu T.N., Grjibovski A.M. Sravneniye trekh i boleye nezavisimykh grupp s ispol'zovaniyem neparametricheskogo kriteriya Kraskela - Uollisa v programme STATA [Analysis of three independent groups usina non-parametric Kruskal-Wallis test in STATA software]. Ekologiya cheloveka [Human Ecology]. 2014, 6. pp. 55-58. [in Russian].
29. Fletchtr R., Fletcher C., Vagner E.M. et al. Klinicheskaya epidemiologiya. Osnovy dokazatel'noi meditsiny [Clinical epidemiology. Basics of the evidence-based medicine]: Media Sphere, 1998, 352p. [in Russian].
30. Kharkova O.A., Grjibovski A.M. Sravnenie odnoy i dvuh nesvyazannih viborok s pomoshyu paketa statisticheskih programm STATA: neparametricheskie kriterii [Analysis of one and two independent samples using STATA software: nonparametric tests]. Ekologiya cheloveka [Human Ecology]. 2014, 4. pp. 60-64. [in Russian].
31. Kharkova O.A., Grjibovski A.M. Sravnenie odnoy i dvuh nesvyazannih viborok s pomoshyu paketa statisticheskih programm STATA: parametricheskie kriterii [Analysis of one and two
independent samples using STATA software: parametric tests]. Ekologiya cheloveka [Human Ecology]. 2014, 3. pp. 57-61. [in Russian].
32. Yunkerov V.I., Grigoryev S.G. Matematiko-statisticheskaya obraboka daanikh meditsinskih issledovaniy [Mathematical and statistical analysis of medical research data]. SPb : VMedA, 2002, P. 266. [in Russian]
33. Beaglehole R., Bonita R. Basic epidemiology. World Health Organization, Geneva, 1993.
34. Cleopas T.J. et al. Statistics Applied to Clinical Trials. 4th ed. Springer, 2009.
35. Toothaker L.E. Multiple comparison procedures. Sage University paper series on quantitative applications in the social sciences, 07-089. SAGE Publications, 1993. 104 p.
Контактная информация:
Гржибовский Андрей Мечиславович - доктор медицины, магистр международного общественного здравоохранения, Старший советник Национального Института Общественного Здравоохранения, г. Осло, Норвегия; Руководитель отдела международных программ и инновационного развития ЦНИЛ СГМУ, г. Архангельск, Россия; Профессор кафедры общественного здоровья и здравоохранения Медицинского Института Северо-Восточного Федерального Университета, г. Якутск, Россия; Профессор Международного Казахско-Турецкого Университета им. Х.А. Ясяви, г, Туркестан, Казахстан.
Почтовый адрес: INFA, Nasjonalt folkehelseinstitutt, Postboks 4404 Nydalen, 0403 Oslo, Norway.
Email: [email protected]
Телефон: +4745268913 (Норвегия), +79214717053 (Россия), +77471262965 (Казахстан).