Научная статья на тему 'Определение основных факторов риска развития неинфекционных заболеваний: метод деревьев классификации'

Определение основных факторов риска развития неинфекционных заболеваний: метод деревьев классификации Текст научной статьи по специальности «Науки о здоровье»

CC BY
562
136
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Гигиена и санитария
Scopus
ВАК
CAS
RSCI
PubMed
Область наук
Ключевые слова
ФАКТОРЫ РИСКА ПОТЕРИ ЗДОРОВЬЯ / НЕИНФЕКЦИОННЫЕ ЗАБОЛЕВАНИЯ / ДЕТИ-ДОШКОЛЬНИКИ / МНОГОФАКТОРНЫЙ АНАЛИЗ / ДЕРЕВЬЯ КЛАССИФИКАЦИИ / RISK FACTORS FOR LOSS OF HEALTH / NON-COMMUNICABLE DISEASES / MULTIVARIATE ANALYSIS / CLASSIFICATION TREES / PRESCHOOLERS

Аннотация научной статьи по наукам о здоровье, автор научной работы — Константинова Екатерина Даниловна, Вараксин А. Н., Жовнер И. В.

Представлена идеология применения одного из методов оценки многофакторного влияния факторов риска на здоровье населения метода деревьев классификации. Метод деревьев классификации представляет собой иерархическую процедуру построения решающего правила, позволяющего разделить население на группы с повышенной и пониженной заболеваемостью «в координатах» факторов риска. Основное достоинство метода возможность нахождения комплекса факторов риска, оказывающих максимальное влияние на здоровье населения (в противовес распространенным методикам, анализирующим только однофакторные эффекты). В статье представлено два возможных варианта применения метода деревьев классификации: 1) нахождение комплекса экологических факторов риска (ФР), оказывающих максимальное влияние на распространенность неинфекционных заболеваний у детей-дошкольников Екатеринбурга (экологические ФР это загрязнение атмосферного воздуха, питьевой воды, наличие газовой плиты в квартире ребенка и др.). Показано, что совместно с социально-экономическими ФР экологические ФР увеличивают распространенность заболеваний органов дыхания у детей-дошкольников Екатеринбурга в 2,5-4 раза (в зависимости от перечня и числа экологических ФР); 2) нахождение комплекса неэкологических факторов, максимально эффективно компенсирующих негативное действие загрязнения окружающей среды на здоровье населения. Такая постановка задачи связана с тем, что факторы загрязнения окружающей среды являются (как правило) немодифицируемыми, в то время как семейные, поведенческие или социальные факторы могут быть частично или полностью устранены. Выполнение приведенных в статье рекомендаций может снизить распространенность болезней кровообращения у детей-дошкольников Екатеринбурга более чем в 2 раза.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о здоровье , автор научной работы — Константинова Екатерина Даниловна, Вараксин А. Н., Жовнер И. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Identification of the main risk factors for non infectious diseases: method of classification trees

There is presented ideology of the application of one of the methods for assessment of the influence of multi-factor influence of risk factors on population health the method of classification trees. The method of classification trees is a hierarchical procedure for constructing a decision rule that allows to divide the population into groups with higher and lower morbidity "in the coordinates of risk factors. The main advantage of the method the possibility of finding the complex of risk factors having the greatest impact on the health of the population (in contrast to common methods, analyzing only the single-factor effects). In the paper there are presented two possible variants of application of classification trees: 1) the finding of the complex of environmental risk factors (RF), which provides the maximum impact on the prevalence of non infectious diseases in preschool children) in Yekaterinburg (environmental risk factors the pollution of air, drinking water, in the presence of a gas stove in the child ’s flat, etc.). It is shown that, together with socio-economic risk factors environmental risk factors increase the prevalence of respiratory diseases in preschool children in Ekaterinburg in 2.5-4 times (depending on the list and the number of environmental RF), 2) finding the complex of non-environmental factors that most effectively compensating the negative effect of environmental pollution on human health. This posing of the problem is associated with the fact that pollution environmental factors are (usually) unmodified, while family, behavioral or social factors can be partially or completely eliminated. Implementation of the recommendations presented in the paper can reduce the incidence of circulatory diseases in preschool children in Yekaterinburg more than 2 times.

Текст научной работы на тему «Определение основных факторов риска развития неинфекционных заболеваний: метод деревьев классификации»

атмосферного воздуха. Гигиена и санитария. 2004; 6: 16-21.

7. Прусаков В.М., Вержбицкая Э.А., Прусакова А.В., Ткаченко А.В., Прусакова М.В. Оценка риска здоровью как средство повышения эффективности управления состоянием санитарно-эпидемиологическим благополучием населения. Бюллетень ВСНЦ СО РАМН. 2005; 5: 48-55.

8. Прусаков В.М., Прусакова М.В. Анализ динамики риска заболеваемости от воздействия факторов окружающей среды. Гигиена и санитария. 2006; 1: 45-9.

References

1. Determination and use of regional background values of health problems of the population for the risk assessment and ecological condition of territories: Methodical recommendations. Angarsk; 2002 (in Russian).

2. Estimation of influence of air pollution and meteorological conditions on the consultation rates for ambulance services: Methodical recommendations. Moscow; 1991 (in Russian).

3. GD 52.04.186-89. Guidelines for air pollution control. Moscow; 1991 (in Russian).

4 . Prusakov V.M., Prusakova A.V. Assessment of environmental

health situation criteria based on a statistical approach for determination of the background of health problems. In: Materials of Plenum of the Scientific Council for human ecology and environmental health of the Russian Federation «Actual problems of human health and his environment and their solutions». 14-15 December 2011, Moscow. Moscow: 2011 (in Russian).

5. Comprehensive hygienic assessment of the intensity level of medical and environmental situation of different areas due to pollution of the environment by toxicants: Methodical recommendations N 2510/5716-97-32. Moscow: 1997 (in Russian).

6. Prusakov V.M., PrusakovaA.V., MаtorovaN.I. Pupils’ adaptation assessment in conditions of iodine deficiency and air pollution. Gigiena i sanitariya. 2004; 6: 16-21 (in Russian).

7. Prusakov V.M., Verzhbitskaja E.A., Prusakova A.V., Tkachenko A.V., Prusakova M.V. Assessment of risk to health as means of increase of the managment efficiency the condition sanitary and epidemiologic well-being of the population. Bulletin ESSC SD RAMS. 2005; 5: 48-55 (in Russian).

8. Prusakov V.M., Prusakova M.V. Dynamic analysis of disease risk from the effects of environmental factors. Gigiena i sanitariya. 2006; 1: 45-9 (in Russian).

Поступила 07.02.13

Методы исследований

О КОЛЛЕКТИВ АВТОРОВ, 2013 УДК 614.7:616.1/.8]:001.8

Е.Д. Константинова1, А.Н. Вараксин1, И.В. Жовнер2

ОПРЕДЕЛЕНИЕ ОСНОВНЫХ ФАКТОРОВ РИСКА РАЗВИТИЯ НЕИНФЕКЦИОННЫХ ЗАБОЛЕВАНИЙ: МЕТОд дерЕВЬЕВ КлАССИФИКАцИИ

1ФГБУН «Институт промышленной экологии» УрО РАН, 620990, Екатеринбург; 2МУ «Городская детская больница № 16», 620027, Екатеринбург

Представлена идеология применения одного из методов оценки многофакторного влияния факторов риска на здоровье населения - метода деревьев классификации. Метод деревьев классификации представляет собой иерархическую процедуру построения решающего правила, позволяющего разделить население на группы с повышенной и пониженной заболеваемостью «в координатах» факторов риска. Основное достоинство метода - возможность нахождения комплекса факторов риска, оказывающих максимальное влияние на здоровье населения (в противовес распространенным методикам, анализирующим только однофакторные эффекты). В статье представлено два возможных варианта применения метода деревьев классификации: 1) нахождение комплекса экологических факторов риска (ФР), оказывающих максимальное влияние на распространенность неинфекционных заболеваний у детей-дошкольников Екатеринбурга (экологические ФР - это загрязнение атмосферного воздуха, питьевой воды, наличие газовой плиты в квартире ребенка и др.). Показано, что совместно с социально-экономическими ФР экологические ФР увеличивают распространенность заболеваний органов дыхания у детей-дошкольников Екатеринбурга в 2,5-4 раза (в зависимости от перечня и числа экологических ФР); 2) нахождение комплекса неэкологических факторов, максимально эффективно компенсирующих негативное действие загрязнения окружающей среды на здоровье населения. Такая постановка задачи связана с тем, что факторы загрязнения окружающей среды являются (как правило) немодифицируемыми, в то время как семейные, поведенческие или социальные факторы могут быть частично или полностью устранены. Выполнение приведенных в статье рекомендаций может снизить распространенность болезней кровообращения у детей-дошкольников Екатеринбурга более чем в 2 раза.

Ключевые слова: факторы риска потери здоровья, неинфекционные заболевания, дети-дошкольники, многофакторный анализ, деревья классификации

E. D. Konstantinova1, A. N. Varaksin1, I. V. Zhovner2 — IDENTIFICATION OF THE MAIN RISK FACTORS FOR NON INFECTIOUS DISEASES: METHOD OF CLASSIFICATION TREES.

institute of Industrial Ecology, 620219, Ekaterinburg, Russian Federation; 2 City Children's Hospital № 16, 620027, Ekaterinburg, Russian Federation

69

[гиена и санитария 5/2013

There is presented ideology of the application of one of the methods for assessment of the influence of multi-factor influence of risk factors on population health - the method of classification trees. The method of classification trees is a hierarchical procedure for constructing a decision rule that allows to divide the population into groups with higher and lower morbidity "in the coordinates of risk factors. The main advantage of the method - the possibility of finding the complex of risk factors having the greatest impact on the health of the population (in contrast to common methods, analyzing only the single-factor effects). In the paper there are presented two possible variants of application of classification trees: 1) the finding of the complex of environmental risk factors (RF), which provides the maximum impact on the prevalence of non infectious diseases in preschool children) in Yekaterinburg (environmental risk factors - the pollution of air, drinking water, in the presence of a gas stove in the child’s flat, etc.). It is shown that, together with socio-economic risk factors environmental risk factors increase the prevalence of respiratory diseases in preschool children in Ekaterinburg in 2.5-4 times (depending on the list and the number of environmental RF), 2) finding the complex of non-environmental factors that most effectively compensating the negative effect of environmental pollution on human health. This posing of the problem is associated with the fact that pollution environmental factors are (usually) unmodified, while family, behavioral or social factors can be partially or completely eliminated. Implementation of the recommendations presented in the paper can reduce the incidence of circulatory diseases in preschool children in Yekaterinburg more than 2 times.

Key words: riskfactors for loss of health, non-communicable diseases, preschoolers, multivariate analysis, classification trees

В рамках современной парадигмы эпидемиологии неинфекционных заболеваний мы имеем дело с так называемой паутиной причинности. Имеется в виду, что «болезнь имеет много причин, каждая из которых может увеличить риск ее возникновения, но не является ни необходимой, ни достаточной для того, чтобы эта болезнь случилась» [1].

Одним из инструментов для количественной оценки взаимосвязей в сложной системе «среда обитания - здоровье населения» являются методы многофакторного статистического анализа, которые позволяют учитывать одновременное влияние на систему большого числа факторов [2-4]. В настоящей работе для этих целей использован метод деревьев классификации, который позволяет формулировать практические рекомендации по сохранению здоровья [5-8].

Материалы и методы

В работе использованы данные о наличии/отсут-ствии патологий и о наличии/отсутствии факторов повышения распространенности патологий у 441 ребенка-дошкольника г. Екатеринбурга, собранные в детской городской больнице № 16. Исследовано влияние 12 наиболее значимых и распространенных факторов риска (ФР) на четыре наиболее распространенные среди детей дошкольного возраста патологии: заболевания органов дыхания; болезни системы кровообращения; заболевания костно-мышечной системы и соединительной ткани; некоторые патологии класса «Психические расстройства и расстройства поведения» [9-12]. В настоящей работе представлены результаты для заболеваний органов дыхания и системы кровообращения.

Результаты и обсуждение

Одно- и двухфакторный анализ

В таблице представлены результаты одно- и двухфакторного анализа. Однофакторный анализ подразумевает оценку распространенности заболевания W в группах детей, на которых действует фактор риска (распространенность Wj) и не действует фактор риска (распространенность Wo). Отношение Wj/W0 называют относительным риском RR. В случае двух факторов RR рассчитывается для групп детей, на которых действуют и не действуют два фактора одновременно.

Для корреспонденции: Константинова Екатерина Даниловна, K_Konst@ecko.uran.ru

Многофакторный анализ - метод деревьев классификации (ДК)

Метод ДК - один из методов дискриминантного анализа (классификация с обучением). Применительно к нашей задаче предполагается наличие двух классов объектов (здоровые и больные), которые надо разделить на основе анализа комплекса факторов риска (ФР) потери здоровья, характеризующего как больного, так и здорового ребенка.

Рассмотрим применение метода ДК на примере определения комплекса ФР, оказывающих наибольшее влияние на распространенность заболеваний верхних дыхательных путей у детей-дошкольников Екатеринбурга (рис. 1).

Пояснения к рисунку. Исходная вершина (№ 1) содержит всю исследуемую выборку детей. Средняя распространенность патологии органов дыхания в ней составляет W = 24,0%. Первое деление в ДК происходит по фактору «физическая активность» (ФА), который позволяет разделить детей на две группы с максимально различными W: у 206 детей с достаточной ФА (вершина № 3) распространенность заболевания W = 18,4% (существенно ниже общей W = 24,0%), а у 235 детей с недостаточной ФА (вершина № 2) распространенность Wj = 29,5%. Продолжая построение дерева, можно разделить вершины № 2 и № 3. Наиболее эффективное деление этих вершин проводится по ФР «загрязнение атмосферного воздуха выбросами автотранспорта» (сокр. АВТО). В результате разделения появляются новые группы детей (вершины № 4-7), среди которых есть дети с очень низкой (например, W0 = 10,7% в вершине № 6) и очень высокой (Wj = 36,0% - вершина № 5) распространенностью заболевания. Деление вершин можно продолжить, включая новые ФР; результат включения фактора риска «газовая плита в квартире ребенка» показан на рисунке.

Полученные результаты позволяют сформулировать предметно ориентированное решающее правило для заболеваний органов дыхания:

- в класс детей с низкой распространенностью заболевания попадают (преимущественно) дети с достаточным уровнем физической активности в сочетании с проживанием в районе с низким уровнем загрязнения воздуха либо с проживанием в квартире, в которой установлена электрическая плита, при среднем и высоком уровнях загрязнения воздуха (электрическая плита, предположительно, компенсирует негативное влияние загрязнения атмосферного воздуха);

70

Влияние ФР и их комплексов на распространенность заболеваний органов дыхания

Фактор риска Уровни фактора риска Относительный риск (однофакторный эффект) Относительный риск (парный эффект)

ФР1 - за- низкий

грязнение атмос- ферного воздуха выбросами автотран- спорта средний высо- кий RR (ФР1) = 1,41 RR (ФР1 + ФР2) = 3,1 RR (ФР1 + ФР3) = 3,4

ФР2 - тип элек-

плиты триче- ская RR (ФР2) = 1,31 RR (ФР2 + ФР3) = 2,3 RR (ФР2 + ФР5) = 2,3

газовая

ФР3 -физическая активность ребенка недо- статоч- ная доста- точная RR (ФР3) = 1,57 RR (ФР3 + ФР5) = 2 RR (ФР3 + ФР6) = 1,7

ФР4 - материальная обеспеченность семьи хоро- шая доста- точная RR (ФР4) = 1,63 RR (ФР4 + ФР2) = 2 RR (ФР4 + ФР3) = 1,7

недо-

статоч-

ная

Примечание. ФР5 - санитарное состояние квартиры; ФР6 - курение матери.

- класс детей с высокой распространенностью заболевания характеризуется недостаточным уровнем физической активности в сочетании с проживанием в районе с высоким уровнем загрязнения воздуха либо в квартире с газовой плитой (негативное влияние газовой плиты перевешивает положительный эффект проживания в районе с низким и средним уровнем загрязнения атмосферного воздуха).

Решающее правило такого типа понятно специалисту в предметной области (эпидемиологу) и помогает

выработать рекомендации, позволяющие снизить заболеваемость детей. Пример рекомендации: если семья живет в районе с высоким загрязнением атмосферного воздуха, желательно, чтобы в квартире была установлена электрическая (не газовая) плита; во всех случаях сильный положительный эффект дает ориентация семьи на активный образ жизни, что позволяет ребенку иметь достаточную физическую активность. Также значимым результатом метода ДК является возможность сравнения величины однофакторного эффекта неблагоприятного действия каждого фактора, совместного действия двух ФР и многофакторного воздействия (действие комплекса ФР).

Как было сказано выше, алгоритм, основанный на иерархической идее, может быть применен для выявления комплекса факторов, компенсирующих неблагоприятное действие окружающей среды. Рассматривалась возможность компенсации негативного влияния загрязнения воздушной среды внутри жилища вредными соединениями, выделяющимися при сгорании бытового газа, на распространенность болезней системы кровообращения, класс D9 (рис. 2).

Согласно данным рис. 2, негативное действие загрязнения воздушной среды внутри жилища вредными соединениями, выделяющимися при сгорании газа, на здоровье детей, приводящее к повышению распространенности болезней системы кровообращения (класс D9), может быть компенсировано достаточным уровнем физической активности ребенка, наличием у матери высшего образования и отсутствием курения матери. Очевидно, что такие рекомендации понятны специалисту в предметной области (врачу) и могут быть реально использованы для снижения заболеваемости детей. Согласно приведенным данным, следование перечисленным рекомендациям может снизить распространенность D9 у детей-дошкольников Екатеринбурга с W = 16,3% до W = 7,8%, то есть более чем в 2 раза.

Выводы. 1. Представлена идеология применения метода деревьев классификации - эффективного метода нахождения комплекса факторов риска, оказывающих наибольшее негативное влияние на здоровье детей. Результаты, получаемые в методе деревьев классификации, наглядны и легко интерпретируются как научными

Рис. 1. Дерево классификации для заболеваний органов дыхания; ФА - физическая активность ребенка; АВТО = -1 означает низкий уровень загрязнения атмосферного воздуха выбросами автотранспорта, АВТО = 0 и +1 - средний и высокий уровни соответственно.

71

гиена и санитария

5/2013

Мать не курит

работниками в области эпидемиологии, так и специалистами практического здравоохранения.

2. Для всех факторов риска и их сочетаний метод деревьев классификации позволяет сделать количественную оценку степени их влияния на здоровье населения.

3. Методика деревьев классификации применена к оценке влияния комплексов факторов риска на распространенность заболеваний у детей-дошкольников Екатеринбурга и для выявления комплекса факторов, компенсирующих негативное влияние окружающей среды на здоровье. Показано, что для заболеваний органов дыхания наиболее значимым комплексом факторов риска потери здоровья является загрязнение атмосферного воздуха выбросами автотранспорта и недостаточная физическая активность ребенка. Показано также, что негативное влияние этой пары ФР на здоровье детей усиливается такими факторами риска, как загрязнение воздуха в квартире ребенка при использовании газовой плиты, курение матери и недостаточная материальная обеспеченность семьи; относительный риск RR = 2, 4.

4. найден комплекс неэкологических факторов (достаточный уровень физической активности ребенка, отсутствие курения матери, наличие у матери высшего образования), который частично нивелирует негативное влияние газовой плиты в квартире ребенка на распространенность болезней системы кровообращения (по нашим данным, более чем в 2 раза).

Работа выполнена при поддержке Программы исследований президиума УрО РАН «Фундаментальные науки - медицине», проект № 12 - П-2-1033.

Литература (пп. 2, 6-8, 12 - см. References)

1. Привалова Л.И., Кацнельсон Б.А., Кузьмин С.В., Никонов Б.И., Гурвич В.Б., Кошелева А.А., Малых О.Л., Воронина С.А. Экологическая эпидемиология: принципы, методы, применение. Екатеринбург; 2003.

3. Чубукова И.А. Data Mining. М.: БИНОМ; 2008.

4 . Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности. М.: Финансы и статистика; 1989.

5. КонстантиноваЕ.Д., Вараксин А.Н. Метод «Деревья классификации» в задачах оценки комплексного влияния факторов риска на здоровье детей. Экологические системы и приборы. 2009; 10: 23-8.

9. Антонов К.Л., Константинова Е.Д., Вараксин А.Н. Воздействие выбросов автотранспорта на здоровье детей г. Екатеринбурга. Гигиена и санитария. 2007; 5: 28-32.

10. Константинова Е.Д., Вараксин А.Н., Живодеров А.А., Жов-нер И.В. Эколого-социальные факторы и здоровье детей промышленного центра. Уральский медицинский журнал. 2007; 11: 48-52.

11. Чеботарев П.А. Оценка состояния здоровья детского населения, проживающего в городах с различным загрязнением атмосферного воздуха. Гигиена и санитария. 2007; 6: 76-8.

D9

300

ФА

достаточная 138

№1 W=16,3%

№2

Высшее образование матери

74

ФА

недостаточная 162

Среднее и среднее специальное образование матери

64

W=19,1%

№6

Рис. 2. Дерево классификации для выявления комплекса факторов, компенсирующих негативное влияние загрязнения воздушной среды внутри жилища на распространенность болезней системы кровообращения (класс D9).

Reference s

1. Privalova L.I., Katsnel’son B.A., Kuz’min S.V et al. Environmental epidemiology: principles, methods, applications. Ekaterinburg. 2003 (in Russian).

2. Fletcher R., Fletcher, S., Wagner E. Clinical Epidemiology. The Essentials. Williams&Wilkins; 1996.

3. Chubukova I.A. Data Mining. Moscow; 2008 (in Russian).

4. Ayvazyan S.A., Bukhshtaber V.M., Enyukov I.S., Meshalkin L.D. Applied Statistics: Classification and reduction of dimension. Moscow; 1989 (in Russian).

5. Konstantinova E.D., Varaksin A.N. The method of “Classification Trees” in problems of the combined effect of risk factors on children’s health. Ekologicheskie Sistemy i Pribory. 2009; 10: 23-8 (in Russian).

6. Konstantinova E.D., Varaksin A.N. Elaboration and application of a new hierarchical classification algorithm in epidemiological research. 23rd Conference of International Society for Environmental Epidemiology, Barcelona. 2011, September 13-16.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Molinaro A., Dudoit S., van der Laan M.J. Tree-based multivariate regression and density estimation with right-censored data. J. Multivar. Anal. 2004; 90 (1): 154-77.

8. Lionel Guidi, Frederic Ibanez, Vincent Calcagno, Gregory Beau-grand A new procedure to optimize the selection of groups in a classification tree: Applications for ecological data. Ecological Modelling. 2009; 220 (4): 451-61.

9. Antonov K.L., Konstantinova E.D., Varaksin A.N. The impact of vehicle emissions on the health of children in Ekaterinburg. Gigiena i sanitariya. 2007; 5: 28-32 (in Russian).

10. KonstantinovaE.D., VaraksinA.N., ZhivoderovA.A.. ZhovnerI.V Ecological and social factors and children’s health in industrial city. Ural’skij medicinskij zhurnal. Ekaterinburg. 2007; 11 (39): 48-52 (in Russian).

11. Chebotarev P.A. Health assessment of the child population living in cities with different air pollution. Gigiena i sanitariya. 2007; 6: 76-8. (in Russian).

12. Hodas N., Meng O., Lunden M.M. et al. Variability in the fraction of ambient fine particulate matter found indoors and observed heterogeneity in health effect estimates. J. Exp. Sci. Environ. Epidemiol. 2012; 22: 448-54.

Поступила 13.02.13

72

i Надоели баннеры? Вы всегда можете отключить рекламу.