Научная статья на тему 'Применение статистических программ и методов в медико-биологических научных исследованиях'

Применение статистических программ и методов в медико-биологических научных исследованиях Текст научной статьи по специальности «Прочие медицинские науки»

CC BY
2548
326
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
медико-биологические научные исследования / статистические методы / medical and biological research / statistical methods

Аннотация научной статьи по прочим медицинским наукам, автор научной работы — Глушаков Александр Иванович

Проведён структурный наукометрический анализ 120 авторефератов диссертаций казанских исследователей. Оценке были подвергнуты диапазон используемых медицинских специальностей, применение статистических программ, объёмы данных исследования и указанные в работах статистические методы. При адекватном использовании возможностей статистического анализа и соответствующего комментария выполненных статистических процедур правильность полученных результатов не будет вызывать сомнений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Carried out was a structural scientometric analysis of 120 abstracts of thesis" of Kazan researchers. Assessed were the range of medical specialties, the usage of statistical programs, the volumes of presented data in the studies and statistical methods referred to in the studies. In the case of appropriate use of the possibilities of statistical analysis and relevant commentary of the performed statistical procedures the results of the studies show no doubt of correctness.

Текст научной работы на тему «Применение статистических программ и методов в медико-биологических научных исследованиях»

цией, осложненной или же сочетанной с туберкулезом, выявлено, что на стадии первичных проявлений ВИЧ-инфекции туберкулез протекает без особенностей. Эффективность его лечения в этот период существенно не отличается от таковой у неинфицированных ВИЧ. Заболевание туберкулезом у больных на данной стадии ВИЧ-инфекции регистрируется чаще, чем среди всей популяции, ибо преимущественно обследуются лица из групп высокого риска заболевания туберкулезом — больные наркоманией, пациенты, ведущие асоциальный образ жизни. Последний контингент требует особого внимания фтизиатров к проблемам ВИЧ-инфекции, а также усиления контроля за осуществлением противоэпидемических мероприятий в стенах противотуберкулезных учреждений.

ЛИТЕРАТУРА

1. Данные из районного архива по статистическим отчетам Альметьевского противотуберкулезного диспансера за 2000 — 2007 гг.

УДК (085.3)+(-83.41)]:61

2. Данные из районного архива статистических отчетов Альметьевского центра по профилактике и борьбе со СПИД и инфекционными заболеваниями за 2000-2007 гг.

3. Карачунский М.А. Туберкулез при ВИЧ-инфекции // Пробл. туб. - 2000. - № 1 - С. 47 - 51.

4. Фролова О.П. Туберкулез у больных ВИЧ-инфекцией: клинико-морфологические и эпидемиологические аспекты // Пробл. туб. - 2002. - № 6 - С. 30 - 33.

Поступила 27.01.08.

PROBLEMS OF DEVELOPMENT OF TUBERCULOSIS IN PATIENTS WITH HIV INFECTION

R.I. Usmanov, R.I. Usmanova, E.A. Frolova

Summary

Analyzed was the combined morbidity of HIV infection and tuberculosis in the Almetyevsk region for 20042007 period. Revealed was an increase in the number of registered cases of HIV and tuberculosis, especially among males. Noted was a dramatic increase in the number of registered secondary diseases in patients with HIV infection associated with tuberculosis. HIV infection does not only provoke the development of tuberculosis, but also has a pronounced negative effect on its symptoms and course.

Key words: HIV infection, tuberculosis.

ПРИМЕНЕНИЕ СТАТИСТИЧЕСКИХ ПРОГРАММ И МЕТОДОВ В МЕДИКО-БИОЛОГИЧЕСКИХ НАУЧНЫХ ИССЛЕДОВАНИЯХ

Александр Иванович Глушаков

Кафедра медицинской экспертизы (зав. — проф. А.И. Ибрагимов) Казанского государственного медицинского университета, е-таИ- glushakow67@mail.ru

Реферат

Проведён структурный наукометрический анализ 120 авторефератов диссертаций казанских исследователей. Оценке были подвергнуты диапазон используемых медицинских специальностей, применение статистических программ, объёмы данных исследования и указанные в работах статистические методы. При адекватном использовании возможностей статистического анализа и соответствующего комментария выполненных статистических процедур правильность полученных результатов не будет вызывать сомнений.

Ключевые слова: медико-биологические научные исследования, статистические методы.

Корректное использование статистического анализа связано с внедрением принципов доказательной медицины, постепенной интеграцией отечественной науки в мировую, развитием грантовой 550

поддержки науки и повышением требований к методическому качеству исследований и изложению результатов [1—7].

Мы провели структурный наукометрический анализ применяемых статистических программ и методов в современных диссертационных исследованиях. Материалом исследования послужили 120 авторефератов диссертаций на соискание учённой степени кандидата медицинских наук, защищённых в 4 казанских диссертационных советах (по 2 — в КГМА и КГМУ) в период от июня 2006 г. до декабря 2007 г. Ознакомиться с текстами авторефератов читателям можно на http:// kgmu.kcn.ru/page.php.parm=’division/news_ dis.html и http://www.kazanmedacademy. ru/download/. Структурной оценке были

подвергнуты диапазон используемых медицинских специальностей, применение статистических программ, объёмы данных исследования и указание в работах статистических методов. Конфиденциальность анализируемого материала гарантирует отсутствие ссылок на авторов диссертационных исследований.

По каким специальностям пишут диссертации? Из всего перечня медицинских наук (32 наименования) казанские исследователи отдают предпочтение 20 специальностями, что соответствует профильности существующих диссертационных советов. При этом, вопреки мнению о конъюнктурном использовании общих организационных специальностей типа «общественное здоровье и здравоохранение», каждая седьмая диссертация выполнена по нервным болезням, каждая восьмая — по акушерству и гинекологии и лишь каждая десятая — либо по педиатрии, либо по общественному здоровью и здравоохранению. Незначительно от последних по общему количеству защищённых диссертационных исследований отстают работы по хирургии (9%). Названные пять специальностей составляют чуть больше половины всёх выполненных и защищенных на ученых советах диссертационных исследований. На шестом и седьмом местах по актуальности заявленной тематики находятся работы по лучевой диагностике и лучевой терапии, а также по фармакологии и клинической фармакологии (по 6%), единичны работы по физиологии, кардиологии, инфекционным болезням (по 3%), эндокринологии, патологической физиологии, психиатрии, травматологии и ортопедии (по 2%). Крайне редко казанские врачи-исследователи обращаются к внутренним болезням, а также к кожным и венерическим болезням, нейрохирургии.

Каждая пятая диссертация проходит по двум специальностям: из 120 диссертаций таковых было 25 работ. Исследования по аллергологии и иммунологии, патологической физиологии, кожным и венерическим болезням, нейрохирургии в 100% случаев совмещали две специальности. Почти 2/3 всех работ в фармакологии и клинической фармакологии, эндокринологии, травматологии и ортопедии содержали второй шифр. В половине работ

по гигиене и внутренним болезням указана вторая специальность, а также в трети работ по педиатрии, нервным болезням, акушерству и гинекологии, кроме своей, — и другие специальности. Напротив, крайне редки совмещения специальностей у диссертационных работ, выполненных по общественному здоровью и здравоохранению, лучевой диагностике и лучевой терапии.

Какие статистические программы применяются? К сожалению, каждый четвёртый автореферат казанских исследователей не содержит указания на использование каких-либо статистических пакетов. Среди других диссертационных работ лидерами среди применяемых статистических программ выступают Statistica и с незначительным отрывом от неё Excel, занимающая по трети всех упоминаний, за ними следуют применяемый почти в 2,5 раза реже Biostat, ещё вдвое реже SPSS. На долю указанных четырёх статистических пакетов приходится 88% автоматизированного обсчёта. В оставшихся случаях называются также такие статистические программы, как Statgraphics и MicroCAL (чуть более 3%), ещё реже — GraphPadPrism (1,5%) и единичные упоминания о STATNR, RewMan, OpenOffice, Armstat и PolyAnalyst.

Среди диссертационных работ по отдельным медико-биологическим специальностям о применении универсального статистического пакета Statistica указывается в 16 (из 20), кроме стоматологии, инфекционных, внутренних, кожных и венерических болезней. Ссылки на использование популярного табличного процессора Excel есть в работах по 13 специальностям, кроме общественного здоровья и здравоохранения (!), физиологии, патологической физиологии, эндокринологии, внутренних болезней, кожных и венерических болезней, Biostat — по 14 специальностям. К услугам последнего не обращались авторы диссертаций по фармакологии и клинической фармакологии, физиологии, кардиологии, психиатрии, эндокринологии, кожным и венерическим болезням. Социологический пакет SPSS использовали в диссертациях только по 7 специальностям. Чуть меньше (в трети работ) использовано сочетание нескольких статистических программ, причем от-

Описание данных

Изучение различия (критерий Стьюдента)

Изучение различия (др. статистические критерии)

Исследование зависимости (корреляционный, дисперсионный

и регрессивный анализы) Упоминание о статистической достоверности (р<0,05, р<0,0010 и

уровне значимости а > 95%) Упоминание об использовании параметрических или непараметрических методов Классификация (дискриминантный, кластерный анализы,

прогноз)

25,9%

2,4%

Снижение размерности (факторный анализ) 1,1%

Единичные упоминания о других методах 0,9%

I-------

—I—

10

—I—

20

—I

30

Рис. 1. Использование статистических методов (452 упоминания).

мечаются как общеизвестное дополнение одних пакетов другими, так и самые разные. Так, среди совмещений чаще всего имело место Б1а11811са+Ехсе1 (35%), затем БРББ+Ехсе! (12%), Б1а1;181;1са+Вю81а1+Ехсе1 (9%), а также Вю81а1+Ехсе1 и Statgra-рЫсБ+МлсгоСЛЪ (по 7%), реже Statis-tica+Exce1+SPSS, Statgraphics+Exce1 и SPSS+RewMan (по 5%), в единичных случаях Statistica+Statgraphics, Statistica+Biostat, Statistica+SPSS и Statgraphics+Exce1+SPSS. Использование нескольких статистических программ одновременно чаще всего встречается в работах по педиатрии, нервным болезням и акушерству и гинекологии, т.е. самым многочисленным специальностям.

Какие объёмы данных используются? Около 7% авторефератов не содержат численного указания на объёмы исследуемого материала. Примерно треть диссертационных исследований привлекали 100—149 ед. наблюдения (31%), каждая восьмая работа строила свои выводы на 200—299 ед. (12,5%), затем по популярности следуют выборки в 150—199 и 1000—1999 ед. (по 12%), за ними — в 300—499 ед. (9%), 500—999 ед. (7%) и 70—99 ед. (4%). Исследований, проведённых на очень большом материале, — 2000—4999 и 10 000 ед. и более — было незначительно (по 3%), а на сверхмалом материале в 30 ед. — одиночное.

В зависимости от выбранной специальности объёмы материала исследования составили работы по аллергологии и иммунологии, хирургии и внутренним болезням, нервным болезням, кардиологии 552

и эндокринологии составили в среднем 100—149 ед. Вторую по распространённости группу в 200—299 ед. использовали в акушерстве и гинекологии, психиатрии, травматологии и ортопедии, стоматологии и инфекционным болезням, третью в 150—199 ед. — в фармакологии и клинической фармакологии, лучевой диагностики и лучевой терапии, а одноранговую с ней выборку в 1000—1999 ед. — по общественному здоровью и здравоохранению. Объёмы данных в 300—499 ед. встречались в педиатрии и нейрохирургии, а в 500— 999 ед. — по гигиене.

В зависимости от используемых статистических программ объёмы материала исследования составили в среднем 100—149 ед. — в GraphPadPrism и Armstat, Statgraphics и MicroCAL. Во вторую по встречаемости группу (200—299 ед.) вошли статистические пакеты OpenOffice, Biostat и SPSS, в третьею (150—199 ед.) — Statistica. При объёме выборки больше 1000 ед. наблюдения использовали RewMan, а 300-499 ед. — Excel. При этом распределение средних объёмов данных по статистическим пакетам не совсем совпадали с актуальностью использования этих пакетов.

Какие статистические методы указываются? В каждом девятом автореферате диссертации не были указаны применяемые статистические методы. В оставшихся работах имеются 82 оригинальные ссылки в 452 упоминаниях на статистические приёмы, обозначения и т.д. Группировка по отдельных видам статистического ана-

лиза [3, 5] позволяет систематизировать указанные методы (рис. 1).

Среди статистических приёмов анализа почти в каждом четвёртом случае упоминаний было описание данных, в каждом пятом — изучение различия с использованием критерия Стьюдента, в каждом шестом — либо непараметрических критериев, либо корреляционного, дисперсионного и регрессионного анализов. Группа по изучению различий сравниваемых совокупностей с помощью параметрических и непараметрических критериев является лидером среди статистических методов (более 35%). Отдельно отмечаем упоминания о пороге статистической достоверности (р<0,05 и р<0,001) и уровне значимости (а>0,95), а также об использовании параметрических и непараметрических методов (по убывающей 9,5-9,0%). Если и их долю прибавить к доле методов изучения различий как описание результатов и условий применения статистических критериев, то вместе они составят более половины всех упоминаний. Среди оставшихся методов совершено редким в применении является классификация (дискриминантный и кластерный анализы, прогноз) и почти единичным — снижение размерности (факторный анализ).

В указаниях статистических методов в зависимости от специальности наиболее часто прибегали к описанию данных в работах по лучевой диагностике и лучевой терапии, инфекционным болезням (по 35% случаев описаний статистических методов), нервным болезням, педиатрии, хирургии, кардиологии, физиологии и психиатрии (по 25%). Реже использовали описание данных в работах по общественному здоровью и здравоохранению, акушерству и гинекологии, стоматологии, гигиене и эндокринологии (по 15%), фармакологии и клинической фармакологии, аллергологии и иммунологии, патологической физиологии (по 10%). Полностью обходились без ссылки на описание данных в диссертационных исследованиях по травматологии и ортопедии.

К помощи параметрического критерия Стьюдента чаще всего прибегали в работах по физиологии, психиатрии, травматологии и ортопедии, внутренним болезням (по 35% всех упоминаний), чуть

меньше — по патологической физиологии, фармакологии и клинической фармакологии, нервным болезням (по 25%), в среднем — в исследованиях по акушерству и гинекологии, педиатрии, хирургии, лучевой диагностике и лучевой терапии, аллергологии и иммунологии (по 15%), крайне редко — по общественному здоровью, стоматологии, кардиологии (по 10%). Непараметрическими критериями чаще всего пользовались в фармакологии и клинической фармакологии, эндокринологии (по 25—30%), в среднем — в исследованиях по нервным болезням, акушерству и гинекологии, педиатрии, лучевой диагностике и лучевой терапии, кардиологии (по 15%), минимальное указание на данные статистические критерии — по хирургии, общественному здоровью и здравоохранению, физиологии (10%).

Исследование зависимости (в виде корреляционного, дисперсионного и регрессионного анализов) больше всего присутствовало в работах по общественному здоровью и здравоохранению, гигиене, стоматологии, аллергологии и иммунологии (по 30%), ниже среднего — по акушерству и гинекологии, педиатрии, лучевой диагностике и лучевой терапии (по 15%), менее всего — по нервным болезням, хирургии, кардиологии, инфекционным болезням, психиатрии, фармакологии и клинической фармакологии (10-5%). Совсем не прибегали к корреляционному, дисперсионному и регрессионному анализам в работах по физиологии, патологической физиологии, эндокринологии, травматологии, внутренним болезням, нейрохирургии.

Упоминание о статистической достоверности (р<0,05 и р<0,001) и уровне значимости (а>0,95) отмечено в работах по многим специальностям, кроме физиологии, эндокринологии, патологической физиологии и нейрохирургии: максимально — в небольшом числе работ по патологической физиологии, кардиологии и физиологии (20—25%), умеренно — по фармакологии и клинической фармакологии, аллергологии и иммунологии, травматологии и ортопедии, внутренним болезням, нервным болезням, хирургии, инфекционным болезням и эндокринологии (10—15%), минимально — в значительном числе работ по акушерству и гинеколо-

гии, педиатрии, общественному здоровью и здравоохранению, лучевой диагностике и лучевой терапии (по 5—7%).

Классификациями больше всего пользовались в работах по нейрохирургии, травматологии, патологической физиологии, хирургии, тогда как по другим специальностям — единично, по гигиене (!), инфекционным болезням, эндокринологии, внутренним болезням не использовали вообще.

Снижение размерности как статистический приём применяли только в работах по гигиене, крайне редко — по педиатрии, общественному здоровью и здравоохранению, фармакологии и клинической фармакологии.

При указании статистических методов в зависимости от применяемых программ отмечается, что для описания данных чаще всего прибегают к Excel и MicroCAL (по 40% случаев использования пакета), реже — к Statistica и SPSS (30— 35%), еще реже — к Biostat и Statgraphics (по 25%).

Определение критерия Стьюдента присутствует во всех пакетах, но только его одного — в Statnr и OpenOffice (по 100%) и Armstat (в 50%). Высокой остаётся доля использования критерия Стьюдента в статистических программах RewMan и SPSS (30—33%), реже — в Statgraphics и Biostat (20—25%), еще реже — в Excel, MicroCAL и Statistica (10—15%). Непараметрические критерии оценки чаще всего определяли с помощью пакетов GraphPadPrism и RewMan (45—35%), реже— Statgraphics,Statistica и Excel (20—15%), редко — Biostat и SPSS (10—5%).

Исследование зависимости путем корреляционного, дисперсионного и регрессионного анализов имело максимальное применение в программах Armstat (50% случаев использования пакета), реже — в MicroCAL и Excel (30—20%), редко — в Statistica, SPSS, Biostat и Statgraphics (по 15%).

Метод классификации (дискри-

минантный и кластерный анализы, прогноз) имел место при применении Statgraphics (15%), MicroCAL и SPSS (6—4%), Statistica и Excel (3—2%), а метод снижения размерности в виде факторного анализа — в SPSS и Statistica (4—2%), а также в единичных случаях в Excel и Biostat.

ВЫВОДЫ

1. Выбранные медико-биологические специальности отражают основной спектр научных предпочтений казанских диссертаций, защищенных за 1,5 года. Работы, созданные на грани двух специальностей, вносят разнообразие в изучение описываемых явлений и использование статистических методов и средств.

2. Структура применяемых статистических программ соответствует предпочтению отечественных исследователей. Однако использование табличного процессора Excel более оправдано при больших объёмах (по единицам наблюдения) исследований, чем при малых. Довольно редко применяется специально разработанная для медицинских научных работников и аспирантов программа Biostat. Сочетание статистических программ позволяет недостаток одних (Excel) компенсировать универсальностью других (Statistica, Statgraphics и Biostat).

3. Просматривается некоторое соответствие между объёмом материала исследования и выбранной специальностью. Диссертационные работы клинико-биологической направленности (по хирургии, внутренним болезням, нервным болезням, кардиологии, эндокринологии, физиологии и др.), как правило, немногочисленны по объёму материала, тогда как медико-социологические исследования (по общественному здоровью и здравоохранению, гигиене, а в ряде случаев по педиатрии, лучевой диагностике и лучевой терапии), напротив, многочисленны.

4. В исследованиях с выборками небольшого объёма (до 150 ед.) используют экзотические статистические программы с малым набором аналитических характеристик и функций — GraphPadPrism, Armstat, MicroCAL, оставляя при этом более чувствительные универсальные средства Statistica и Biostat для несколько больших объёмов (150—299 ед.).

5. Указанные в авторефератах диссертаций статистические методы отражают конъюнктуру в направлении и обработке результатов исследования. Высокая доля применения параметрических и непараметрических критериев различия (в оценке изменений до и после эксперимента) свидетельствует о наличии «сдвиговой

парадигмы» в изучении явления в ущерб другим группам методов статистического анализа — описанию явления или системы, классификации её состава, прогноза поведения, а также поиску новых информативных оценочных показателей посредством снижения размерности.

6. Использование параметрического критерия Стьюдента не комментируется наличием необходимых условий (нормальности распределения и равенства дисперсии в сравниваемых группах), тогда как немногочисленные по объёму выборки без соответствующих оговорок ставят под сомнения правомерность параметрической оценки. Совместное использование параметрических и непараметрических методов также не всегда объясняется условиями их применения.

7. Применение статистических программ универсального характера (Sta-tistica, Statgraphics и Biostat) отмечено при широком спектре использования статистических методов, тогда как обращение к экзотических программам — только для расчёта коэффициента Стьюдента и когда необходимость других приемов статистического анализа исследователями отвергалась.

Итак, выбор статистических программ и методов остаётся прерогативой личного предпочтения каждого научного исследователя и традицией его специальности. Он не всегда соответствует возможностям статистических оценок, а следует в русле минимально обязательного. Необходимо адекватно применять приёмы статистического анализа и приводить комментарий выполненных статистических процедур в достаточном объёме — только в этом случае полученные результаты завершенного исследования не будут вызывать сомнения.

ЛИТЕРАТУРА

1. Гланц С. Медико-биологическая статистика (с приложением Biostat). — М: Практика, 1999. — 334 с.

2. Леонов В.П., Ижевский П.В. // Бюлл. ВАК. — 1997. — № 5. — С.56—61. — Режим доступа: http://www. informika.ru/text/ magaz/bullvak/5-97/bl6.html#[[F13]].

3. Леонов В.П. // Междун. журнал мед. практики. — 2007. — № 2. — С.19—35. — Режим доступа: http://www. biometrica.tomsk.ru/error.htm; http://www.mediasphera. ru/journals/practik/.

4. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. — М.: МедиаСфера, 2006. — 312 с. (3-е издание).

5. Статистические методы в медикобиологическом эксперименте (типовые случаи) / Д.А. Новиков, В.В. Новочадов. — Волгоград: ВолГМУ, 2005. — 84 с. — Режим доступа: http://www.mtas.ru/medstat/.

6. Тукшаитов Р.Х. Методологические аспекты повышения информативности биометрического показателя порога значимости// Казанский мед. ж. — 1999. — № 4. — С.259—262.

7. Тукшаитов Р.Х. Основы оптимального представления статистических показателей на графиках, диаграммах и в таблицах. — Казань: КазГЭУ, 2006. — 228 с.

Поступила 21.03.08.

THE USAGE OF STATISTICAL PROGRAMS AND TECHNIQUES IN MEDICAL AND BIOLOGICAL RESEARCH

A.I. Glushakov

Summary

Carried out was a structural scientometric analysis of 120 abstracts of thesis’ of Kazan researchers. Assessed were the range of medical specialties, the usage of statistical programs, the volumes of presented data in the studies and statistical methods referred to in the studies. In the case of appropriate use of the possibilities of statistical analysis and relevant commentary of the performed statistical procedures the results of the studies show no doubt of correctness.

Key words: medical and biological research, statistical methods.

i Надоели баннеры? Вы всегда можете отключить рекламу.