Научная статья на тему 'ПРИМЕНЕНИЕ МЕТОДА БАЙЕСОВСКОЙ КЛАССИФИКАЦИИ  ДЛЯ ОЦЕНКИ ВЕЛИЧИНЫ ИНДИВИДУАЛЬНОГО РИСКА'

ПРИМЕНЕНИЕ МЕТОДА БАЙЕСОВСКОЙ КЛАССИФИКАЦИИ ДЛЯ ОЦЕНКИ ВЕЛИЧИНЫ ИНДИВИДУАЛЬНОГО РИСКА Текст научной статьи по специальности «Науки о здоровье»

CC BY
101
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Гигиена и санитария
Scopus
ВАК
CAS
RSCI
PubMed
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о здоровье , автор научной работы — Д.А. Димитриев, А.Д. Димитриев, Г.М. Воронцова

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ПРИМЕНЕНИЕ МЕТОДА БАЙЕСОВСКОЙ КЛАССИФИКАЦИИ ДЛЯ ОЦЕНКИ ВЕЛИЧИНЫ ИНДИВИДУАЛЬНОГО РИСКА»

Таблица 3

Возможные уровни заболеваемости детей в возрасте 0—6 лет ОРВИ и гриппом при снижении уровня загрязненности атмосферного воздуха Р на одну единицу в районах Казани

Район

Заболеваемость ОРВИ (Л„). %.

Снижение заболеваемости, %

Заболеваемость гриппом

Снижение заболеваемости, %

Авиастроительный 0,94 13,7 0,95 16,8

Советский 0,80 17,5 1,15 11.5

Вахитовский 0,77 27,3 0,65 22,6

Приволжский 0,51 31,0 0,72 21,7

Кировский 0.81 18,9 1,15 16,0

Ново-Савиновский 1,15 17,2 1,26 12,5

Московский 1,03 13,4 0.90 17,4

Казань 0,82 21,9 0,96 13.5

Приволжском (р = 1,84) — заболеваемость ОРВИ соответственно снизилась бы на 27,3 и 31%, гриппом — на 22,6 и 21,7% — значительно больше, чем в районах со сравнительно высокими показателями Р. в пределах 2,07—3,07 в Авиастроительном, Советском, Кировском, Московском. В этих районах сокращение уровней показателей заболеваемости ОРВИ и гриппом составило бы от 12,5 до 18,9%.

Корреляционная зависимость между степенью загрязненности атмосферного воздуха и заболеваемостью ОРВИ детей в возрасте 0—14 лет Московского района оказалась наиболее выраженной — гху± т = 0,98 ± 0,01 (р < 0,001). Далее следуют значения коэффициентов корреляции (г^ ± т) в убывающем порядке: Ново-Сави-

новский район — 0,93 ± 0,06 (р < 0,001), Советский — 0,92 ±0,07 CP < 0,001), Кировский - 0,87 ± 0,10 (р < 0,001), Авиастроительный - 0,86 ± 0,11 (р < 0,001), Вахитовский — 0,73 ± 0,17 (р < 0,001), Приволжский — 0,72 ± 0,17 (р < 0,001). В целом по городу Казани корреляционная зависимость составила 0,84 ± 0,11 (р < 0,001).

Между уровнем загрязненности атмосферного воздуха Р и заболеваемостью гриппом детей в возрасте 0—14 лет всех районов города выявлена средней степени корреляционная зависимость от т = 0,42 ±0,10 (р < 0,001) — Вахитовский район до r^ ± т = 0,68 ±0,12 (р < 0,001) — Московский район.

Таким образом, корреляционным анализом выявлена различная степень зависимости уровня загрязненности атмосферного воздуха и заболеваемости детей ОРВИ и гриппом, а также установлены коэффициенты регрессии, позволяющие определить, на сколько снизится заболеваемость при снижении показателя загрязненности Р на одну единицу.

Поступило 30.05.02

Summary. The paper characterizes diffuse ambient air pollution (P index) in accordance with the data of Kazan stationary stations in 1996-2000. The incidence of childhood respiratory diseases is studied for the same period. A correlation between morbidity and ambient air pollution is analyzed. There is a direct significance correlation between Kazan's ambient air pollution and morbidity rates in children aged 0-14 years, which is as follows r>y ± m = 0.626±0.104. The regression coefficient has been established, which is Ry/I = 0.183 when the atmospheric contamination is changed by one unit.

С КОЛЛЕКТИВ АВТОРОВ, 2003

УДК 614.7:616-036.88-053.31-092.12):519.24

Д. А. Димитриев, А. Д. Димитриев, Г. М. Воронцова

ПРИМЕНЕНИЕ МЕТОДА БАЙЕСОВСКОЙ КЛАССИФИКАЦИИ ДЛЯ ОЦЕНКИ ВЕЛИЧИНЫ ИНДИВИДУАЛЬНОГО РИСКА

Центр Госсанэпиднадзора в Чувашской Республике, Чебоксары

Центральным вопросом профилактической медицины является оценка вероятности возникновения заболевания (т. е. риска) у каждого отдельно взятого индивидуума. Решение этой проблемы позволяет перейти к новому уровню профилактики — разработке комплекса конкретных мероприятий по предупреждению болезни у отдельного человека. Другая важная сторона проблемы — учет большого количества факторов, обусловливающих повышение или снижение уровня риска конкретного патологического состояния, определение значимости каждого из этих факторов и его влияния на величину риска. Другими словами, речь идет о том, относится или нет данный индивидуум к группе риска и почему.

На наш взгляд, одним из подходов к решению этой проблемы может стать применение метода статистической классификации, основанного на теореме Байеса. В литературе имеются работы, посвященные использованию этого метода в различных областях биологии и медицины. Байесовский анализ используется для оценки риска различных заболеваний [21], в том числе бронхиальной астмы 125], нарушений течения беременности [13]. Основанные на теореме Байеса статистические методы нашли применение в психологии и психиатрии [6, 27, 29], а также в других областях медицины в качестве основы для компьютерной диагностики и упраапения процессом лечения [16, 19, 23, 30]. В литературе также имеются работы, посвященные использованию байесовской классификации в гигиене [8] и при анализе географического распределения уровней заболеваемости [17].

Первым, наиболее важным шагом классификации является определение параметров, значения которых будут использоваться для предсказания заболевания. Для этого необходимо изучить литературные данные, свидетельствующие о значимости того или иного фактора для формирования патологии. Это позволяет создать список переменных, которые могут иметь значение для величины индивидуального риска. Следующим шагом является определение шкалы, в которой измерены значения параметров [14]. Эта процедура чрезвычайно важна для всех последующих вычислений, так как статистика критерия тесно связана с природой переменных. В настоящей работе мы рассматривали параметры, измеренные в качественной шкале. Необходимо заметить, что байесовская процедура классификации возможна и для непрерывных переменных с нормальным распределением, однако метод вычисления будет отличаться от приведенного ниже.

Теперь мы подошли к вопросу о том, оказывает ли данный фактор влияние на величину риска. Проверка этой гипотезы возможна с помощью широко применяемых в статистике критериев (х2, отношение шансов) [1]. Все вышеописанные действия позволяют определить список значимых в теоретическом и статистическом смысле показателей (предикторов).

Классификация на основе теоремы Байеса требует определения ряда понятий, которыми мы будем в дальнейшем оперировать. Вначале определим априорную вероятность <7, как вероятность того, что индивидуум принадлежит к популяции \У„ / = 1,2. Если под популяциями мы будем понимать здоровых (IV,) или больных (1У2),

то <72 будет равна абсолютному риску. Сумма априорных вероятностей + q1— \. Условная вероятность Рг(х — это вероятность получения вектора наблюдений х, если известно, что объект принадлежит к популяции IV,, /' = 1, 2 111 В нашем случае Рг(х\ \У2) — это доля больных, у которых обнаружено данное значение изучаемого параметра, — то же для здоровых. Рг(Н^х) — это условная вероятность того, что объект принадлежит к популяции (V, при данном векторе наблюдений х. Рг{ И» и РН №2\х) также называются апостериорными вероятностями [1]. Апостериорная вероятность Рг{И^|х) является вероятностью того, что при данных значениях параметров у индивидуума сформируется патологическое состояние. Теорема Байеса гласит, что во введенных обозначениях равенство

д,Рг(х | К)

<7, Рг(х\П'1) + ч2Рг(.х\Н'1)

,/ = 1,2,

(1)

справедливо для любого распределения величины х. Логарифм отношения двух апостериорных вероятностей г вычисляется по следующей формуле:

. = Рг(^х) = й ^ Ых^) *Р«Щх) Ь Рг{х,\ '

(2)

где у — число изучаемых параметров, у = 1, ..., р\ 1^2/Я\) — постоянная. Величины q2 и <7, можно получить, зная уровень заболеваемости изучаемого контингента. Величина 1{£Рг(х1\Уг)/Рг(х\\У{)) — это вес предикторной переменной. Таким образом, г является суммой постоянной и весов предикторных переменных. Формулу (2) легко преобразовать с учетом того, что Рг( + Рг( |Ц|х) = 1. Тогда

\х) =

10' I + 10!'

(3)

В качестве примера применения метода байесовской классификации приведем результаты изучения факторов риска смерти в перинатальный период, проведенного нами совместно с кафедрой акушерства и гинекологии ЧГУ им. И. Н. Ульянова.

Изучение перинатальной смертности является важным вопросом как с научной, так и с практической точки зрения. Выявляя факторы, модифицирующие величину риска перинатальной смертности, мы тем самым приходим к более глубокому пониманию сложного комплекса взаимоотношений в системе мать—плод—новорожденный. С другой стороны, такое понимание может послужить основой для разработки мероприятий, направленных на контроль наиболее значимых факторов риска и соответственно на снижение вероятности смерти в перинатальный период развития. Последнее представляется особенно актуальным в связи со сложившейся к настоящему времени негативной тенденцией в динамике народонаселения Чувашской Республики. Сбор информации о факторах риска осуществлялся посредством выкопи-ровки данных из первичных медицинских документов (обменная карта (ф. 113-у), история родов (ф. 096-у), история развития новорожденного (ф. 097-у)). При этом в качестве исследуемой группы нами рассматривались дети, умершие в перинатальный период, и их матери, проживающие на территории Чувашской Республики. Для точного выявления случаев перинатальной смерти мы использовали подходы, изложенные в специальной литературе [15]. Контролем являлись выжившие дети и их матери из тех же городов. Всего было изучено 355 случаев смерти в перинатальный период и соответствующее число выживших и их матерей. Как отмечают многие авторы [5, 10, 12], к факторам, оказывающим влияние на уровень перинатальной смертности, относятся биологические, медицинские и социальные. При этом важное место среди факторов риска перинатальной смертности за-

нимают особенности течения беременности и качество медицинской помощи |2, 4]. Согласно данным литературы, уровень загрязнения окружающей среды также может влиять на состояние здоровья новорожденных и уровень перинатальной смертности [7, 20, 24]. Так, среди соединений, влияющих на здоровье новорожденных, отмечаются озон, СО, N0^ [18, 22], химические вещества, поступающие в организм с водой, подвергшейся хлорированию [28].

Как установили С. В. Беляков и соавт. [3], у женщин, подвергавшихся профессиональному воздействию паров ртути, отмечались повышенный уровень перинатальной смертности, снижение умственных способностей детей. Повышает риск перинатальной смерти воздействие на женский организм в период беременности соединений серы |11]. В ходе экспериментов было установлено, что уровень перинатальной смертности в группе экспериментальных животных, подвергавшихся воздействию нитрозаминов, в 4 раза выше по сравнению с контролем [9]. Эти и другие данные [26, 31] позволили нам предположить наличие влияния факторов окружающей среды антропогенного происхождения на состояние системы мать—плод—новорожденный в условиях Чувашской Республики. Для определения влияния изучаемого фактора на перинатальную смертность были рассчитаны значения критерия х2- Вычисления производились на основе величин распространенности фактора в опытной и контрольной группах. Для тех факторов, которые в силу статистической достоверности их влияния могут рассматриваться в качестве предикторов, были рассчитаны вес и постоянная на основе теоремы Байеса. Результаты вычислений приведены в таблице.

Результаты, приведенные в таблице, позволяют не только судить о наборе факторов, оказывающих влияние на здоровье новорожденных, но и оценить степень влияния каждого из них на перинатальную смертность. Особый интерес представляют факторы, которые можно контролировать с помощью профилактических мероприятий. Так, обращает на себя внимание значительное влияние качества медицинской помощи на величину апостериорной вероятности. Сюда относятся регулярность наблюдения в ЖК и его качество, адекватность стационарного лечения беременной женщины и правильная тактика ведения родов.

Определенное влияние на величину изучаемого риска оказывает и загрязнение окружающей среды. Комбинация индивидуальных значений предикторов позволяет решить вопрос о принадлежности индивидуума к группе риска. Так, рассмотрим новорожденного, родившегося в срок (вес переменной -0,27653) в результате нормальных по продолжительности родов (-0,03317) при тазовом предлежании (1,169188). Частота сердечных сокращений плода была меньше 140 в I мин (0,060513). При поступлении отмечались схватки (-0,14314), продолжительность безводного промежутка составила менее 12 ч (-0,09099), амниотомия не проводилась (0,114751), отошедшие воды были с примесями (0,635909). Общая экспертная оценка ведения родов отрицательная (0,266795). Матери новорожденного на момент родов исполнилось 28 лет (-0,03937); в ходе беременности наблюдалась нефропатия II степени тяжести (0,552391), экспертная оценка проводившегося в связи с этим стационарного лечения отрицательная (0,39794). При поступлении в роддом в моче был обнаружен белок (0,402788). Срок постановки на учет в ЖК составил 18 нед (0,095-199), наблюдение в ЖК было регулярным (-0,10433) и осуществлялось правильно (-0,16268). Риск внутриутробной гипоксии плода в период наблюдения в ЖК был низким (-0,09413). Для матери характерен дефицит массы тела (0,176993). Семья проживает на территории с высоким уровнем загрязнения окружающей среды (0,102), условия проживания семьи удовлетворительные (-0,05505). Такой ребенок будет отнесен к группе риска смерти в перинатальный период (г = 0,42406; РгЦУ^х) = 0,6809; Рг{ 1¥2\х) > Рг(\У,\х)).

Вес некоторых предикторов смерти в перинатальный период

Фактор и его значения Вес

Условия жизни:

низкий материальный уровень жизни 0,150707

удовлетворительный и хороший уровень -0,05505 Срок родов:

в срок -0,27653

преждевременные 1,11685 Продолжительность родов:

норма -0,03317

стремительные 0,110977

быстрые -0,10138

затяжные 0,562723 Продолжительность безводного промежутка:

до 12 ч -0,09099

12-24ч 0,449712

более 24 ч 1,223755 Амниотомия:

есть -0,6124

нет 0,114751 Качество вод при амниотомии:

прозрачные -0,31747

непрозрачные 0,904115 Характер изменения массы тела беременной:

норма и избыток -0,02581

дефицит 0,176993 Частота сердечных сокращений плода в минуту:

более 160 1,225094

140-160 -0,1885

140 и менее 0,060513 Характер родовой деятельности при поступлении:

схватки -0,14314

без родовой деятельности 0,181541 Качество околоплодных вод:

прозрачные -0,16772

с примесями 0,635909 Степень тяжести нефропатии:

нет нефропатии -0,013

I степень -0,1613

II и III степени 0,552391 Наличие белка в моче:

есть 0,402788

нет -0,06048 Срок постановки на учет в женской консультации (ЖК):

до 12 нед -0,08292

12-23 нед 0,095199

больше 23 нед 0,082451 Уровни риска по внутриутробной гипоксии плода в ЖК:

низкий и средний риск -0,09413

высокий риск и крайне высокий риск 0,142897 Наблюдение в ЖК:

регулярное 0,442954

нерегулярное -0,10433 Положение плода при поступлении:

альтернатива продольно-головному 1,169188

продольно-головное -0,06008 Экспертная оценка наблюдения в ЖК:

отрицательная 0,2538

положительная -0,16268 Экспертная оценка стационарного лечения:

отрицательная 0,39794

положительная -0,09938 Экспертная оценка ведения родов:

отрицательная 0,266795

положительная -0,04446 Возраст, годы:

до 19 лет 0,155052

20-24 -0,12122

25-26 0,012285

27-29 -0,03937

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

30-34 0,127879

35 и старше 0,30103 Уровни загрязнения окружающей среды:

превышение гигиенических нормативов 0,102

на уровне ПДК -0,128 постоянная -2,07

Представленные данные свидетельствуют о возможности применения метода статистической классификации с целью решения вопроса об отнесении конкретного индивидуума к группе риска.

J1 итература

1. Афифи А., Эйзен С. Статистический анализ: подход с применением ЭВМ: Пер. с англ. — М.. 1982.

2. Барашнев Ю. И. // Рос. вестн. перинатол. и педиат.

- 1997. - № 3. - С. 14-19.

3. Беляков С. В., Смулевич В. Б., Кошкин В. С., Окунев 3. В. // Гиг. и сан. - 1994. - № 7. - С. 15-17.

4. Дубинская Л. А. Научное обоснование управления профилактикой материнской и перинатальной заболеваемости и смертности в регионе с низким уровнем рождаемости: Автореф. дис. ... канд. мед. наук.

- Иваново, 1996.

5. Запорожан В. П., Аряев Н. Л. // Рос. вестн. перинатол. и педиат. - 1995. — № 5. - С. 10-16.

6. Калядин Н. И., Куликова Н. П., Лекомцева В. Т. и др. // Мед. техника. - 1993. - № 3. - С. 40-42.

7. Литвинов H. Н., Казачков В. И., Астахова Л. Ф. // Гиг. и сан. - 1990. - № 11. - С. 80-81.

8. Маркин А. В. // Там же. - 1993. - № 1. - С. 46-48.

9. Медико-биологические исследования в гигиене / Меркурьева Р. В., Судаков К. В., Бонашевская Т. И., Журков И. С. - М., 1986.

10. Никитин А. И. // Пробл. репрод. - 1995. - № 1. — С. 10-16.

11. Петрова О. П. // Вопр. охр. мат. - 1982. - № 4. — С. 55-56.

12. Пуртов И. И. // Здравоохр. Рос. Федерации. — 1993.

- № 9. - С. 16-17.

13. Слепцова С. И., Глазкова Т. Г. // Вестн. АМН СССР.

- 1990. - № 5. - С. 7-10.

14. Тюрин Ю. Н., Макаров А. А. Анализ данных на компьютере. — М., 1995.

15. Фролова О. Г. Репродуктивные потери. — М., 1997.

16. Austin Р. С., Naylor С. D., Tu J. V. // J. Eval. Clin. Pract. - 2001. - Vol. 7, N 1. - P. 35-45.

17. Bithell J. F. И Stat. Med. - Vol. 19, N 17-18. -P. 2203-2215.

18. Bobak M., Leon D. A. // Lancet. - 1992. - Vol. 340, N 8826. - P. 1010-1014.

19. Cooper G. F., Buchanan B. G., Kayaalp M. et al. // Ргос. AMIA Symp. - 1998. - P. 180-184.

20. Dejmek J., SeJevan S. G., Sram R. J. // Cas. Lék. Ces. -1996. - Vol. 135, N 16. - P. 510-515.

21. Denison D. G., Holmes C. C. // Biometrics. — 2001. — Vol. 57, N 1. - P. 143-149.

22. Happenbrouers T., Calub M., Arakawa K. et al. // Am. J. Epidemiol. - 1981. - Vol. 113, N 6. - P. 623-635.

23. Heller I., Isakov A., Blinder- Weiner S., Topilsky M. // Meth. Informat. Med. - 1995. - Vol. 34, N 3. -P. 259-265.

24. Knobel H. //., Chen C. J., Liang К Y. // Pediatrics. -1995. - Vol. 96, N 6. - P. 1106-1110.

25. Lockhart A. A., Malo J. L., Racineux J. L. // Rev. Mai. Respir. - 1994. - Vol. 11, N 2. - P. 217-222.

26. Norska-Borowka I., Bursa J. // Folia Med. Cracov. — 1993. - Vol. 34, N 1-4. - P. 73-83.

27. Ota T. H Seishin Shinkeigaku Zasshi. - 2000. -Vol. 102, N 10. - P. 1015-1029.

28. Reif J. S., Hatch M. С., Bracken M. et al. // Environ. Hlth Perspect. - 1996. - Vol. 104, N 10. - P. 1056— 1061.

29. Rentschier I., Juttner M., Caelli T. 11 Vision Res. - 1994.

- Vol. 34, N 5. - P. 669-687.

30. Wilcox A., Hripcsak G. Ц Proc. AMIA Symp. - 1999.

- P. 455-459.

31. Woodruff T. J., Grillo J., Schoendorf К. С. Ц Environ Hlth Perspect. - 1997. - Vol. 105, № 6. - P. 608-

Поступила 29.0S.02

i Надоели баннеры? Вы всегда можете отключить рекламу.