Научная статья на тему 'Применение многомерных статистических методов при выполнении задач совершенствования информационно-аналитического обеспечения системы социально-гигиенического мониторинга'

Применение многомерных статистических методов при выполнении задач совершенствования информационно-аналитического обеспечения системы социально-гигиенического мониторинга Текст научной статьи по специальности «Науки о здоровье»

CC BY-ND
135
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СОЦИАЛЬНО-ГИГИЕНИЧЕСКИЙ МОНИТОРИНГ / SOCIO-HYGIENIC MONITORING / ФАКТОРЫ РИСКА / RISK FACTORS / ФАКТОРНЫЙ АНАЛИЗ / FACTOR ANALYSIS / ИЕРАРХИЧЕСКИЙ КЛАСТЕРНЫЙ АНАЛИЗ КОРРЕЛЯЦИЙ / HIERARCHICAL CLUSTER ANALYSIS OF CORRELATIONS

Аннотация научной статьи по наукам о здоровье, автор научной работы — Айдинов Г.Т., Марченко Борис Игоревич, Софяникова Л.В., Синельникова Ю.А.

Обосновывана необходимость применения многомерных статистических методов при выполнении задач совершенствования информационно-аналитического обеспечения системы социально-гигиенического мониторинга на региональном уровне и уровне муниципальных образований. Представлены результаты применения методов факторного анализа и иерархического кластерного анализа корреляций при изучении структуры потенциальных факторов риска при злокачественных новообразованиях желудка у жителей города Таганрога Ростовской области.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о здоровье , автор научной работы — Айдинов Г.Т., Марченко Борис Игоревич, Софяникова Л.В., Синельникова Ю.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The application of multidimensional statistical methods in the tasks of improving of information and analytical providing of the system socio-hygienic monitoring

The necessity of application of multidimensional statistical methods in the tasks of improving of information and analytical providing of the system of socio-hygienic monitoring at the regional and the municipal levels have been substantiated. Presents the results of applying the methods of factor analysis and hierarchical cluster analysis of correlations when studying of the structure of the potential risk factors in malignant tumors of the stomach in the city of Taganrog in Rostov region.

Текст научной работы на тему «Применение многомерных статистических методов при выполнении задач совершенствования информационно-аналитического обеспечения системы социально-гигиенического мониторинга»

4

ЗНиСО

УДК: 614.1

ПРИМЕНЕНИЕ МНОГОМЕРНЫХ СТАТИСТИЧЕСКИХ МЕТОДОВ ПРИ ВЫПОЛНЕНИИ ЗАДАЧ СОВЕРШЕНСТВОВАНИЯ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОГО ОБЕСПЕЧЕНИЯ СИСТЕМЫ СОЦИАЛЬНО-ГИГИЕНИЧЕСКОГО МОНИТОРИНГА

Г.Т. Айдинов1,2, Б.И. Марченко1,3, Л.В. Софяникова1,2, Ю.А. Синельникова1

1ФБУЗ «Центр гигиены и эпидемиологии в Ростовской области» Роспотребнадзора, г. Ростов-на-Дону, Россия 2ГБОУ ВПО «Ростовский государственный медицинский университет»

Минздрава России, г. Ростов-на-Дону, Россия 3Институт управления в экономических, экологических и социальных системах ФГАОУ ВПО «Южный федеральный университет» Минобрнауки России, г. Таганрог, Россия

Обосновывана необходимость применения многомерных статистических методов при выполнении задач совершенствования информационно-аналитического обеспечения системы социально-гигиенического мониторинга на региональном уровне и уровне муниципальных образований. Представлены результаты применения методов факторного анализа и иерархического кластерного анализа корреляций при изучении структуры потенциальных факторов риска при злокачественных новообразованиях желудка у жителей города Таганрога Ростовской области.

Ключевые слова: социально-гигиенический мониторинг, факторы риска, факторный анализ, иерархический кластерный анализ корреляций.

G.T. Aydinov, B.I. Marchenko, L.V. Sofyanikova, Yu.A. Sinelnikova □ THE APPLICATION OF MULTIDIMENSIONAL STATISTICAL METHODS IN THE TASKS OF IMPROVING OF INFORMATION AND ANALYTICAL PROVIDING OF THE SYSTEM SOCIO-HYGIENIC MONITORING □ FBHE «Center of Hygiene and Epidemiology in the Rostov region» of the Federal Service for Supervision of Consumer Rights Protection and Human Well-Being, Rostov-on-Don, Russia; SBEI HPE «Rostov State Medical University» of the Ministry of Healthcare of Russia, Rostov-on-Don, Russia; Institute of Management In Economic, Ecological and Social Systems of the FSAEI HPE «Southern Federal University» of the Ministry of Education and Science of Russia, Taganrog, Russia.

The necessity of application of multidimensional statistical methods in the tasks of improving of information and analytical providing of the system of socio-hygienic monitoring at the regional and the municipal levels have been substantiated. Presents the results of applying the methods of factor analysis and hierarchical cluster analysis of correlations when studying of the structure of the potential risk factors in malignant tumors of the stomach in the city of Taganrog in Rostov region.

Key words: socio-hygienic monitoring, risk factors, factor analysis, hierarchical cluster analysis of correlations.

Введение. Углубленные аналитические исследования причинно-следственных связей в системе «среда обитания — здоровье населения» при ведении социально-гигиенического мониторинга предусматривают использование не только категорированных данных, представленных в формах государственной и отраслевой статистической отчетности, но и сведений специализированных баз данных,

формирующихся на основе персонифицированного учета по наиболее значимым показателям здоровья населения. При этом возникает необходимость применения многомерных статистических методов, основной задачей которых является представление анализируемых данных в пригодном для предметной интерпретации виде, выявление закономерностей и поиск смысла в обилии

06965887

^ исходной информации. Методы, позволяющие обрабатывать многомерные информационные массивы, обеспечивают реализацию таких процедур, как структурирование исходной >з= информации (факторный анализ), классификация (кластерный анализ), экстраполяция (множественный регрессионный анализ) и ^ распознавание образов (дискриминантный анализ). Наличие современных персональных средств вычислительной техники, мощных и достаточно простых в применении универсальных специализированных программных —у средств, реализующих практически весь спектр статистических методов, позволяет использовать методы многомерного анализа данных, не вдаваясь в детали их математической обработки. К особенностям примене-~ ния методов многомерного анализа данных ^^ относится осуществление многочисленных ^^ итераций при циклической обработке ис-^ ходной информации, что определяет не-^ обходимость непосредственного участия на каждом этапе процедуры специалиста в области социально-гигиенического мониторинга, который должен принимать решения о характере дальнейшей обработки анализируемых данных [1, 2, 5, 6, 8].

Цель работы — продолжение исследования структуры потенциальных факторов риска для отдельных локализаций злокачественных новообразований в г. Таганроге Ростовской области на основе аналитической обработки специализированной базы данных персонифицированного учета с применением многомерных статистических методов [3, 4]. В качестве возможных причин, способствующих возникновению злокачественных новообразований, рассматривался широкий спектр разнородных факторов потенциального риска генетического (наследственного), средово-го, профессионально-производственного и индивидуального характера [7].

Материалы и методы. Изучение структуры потенциальных факторов риска для отдельных локализаций злокачественных новообразований в г. Таганроге Ростовской области проведено на основе сведений о 29 564 случаях заболеваний за период 1988—2014 гг., содержащихся в специализированной базе данных персонифицированного учета. Сообразно с современными представлениями о мультикаузальной природе злокачественных новообразований был применен метод факторного анализа с целью выделения, количественной характеристики и качественной интерпретации наиболее типичных сочетаний — групповых (латентных, скрытых) факторов, объединяющих раз-

нородные, но тесно коррелирующие между собой регистрируемые первичные потенциальные факторы риска, задача группировки которых реализована с использованием метода иерархического кластерного анализа корреляций. Корреляционные матрицы рассчитывались на основе информации о 107 разнородных первичных потенциальных факторах риска и других значимых параметрах, регистрируемых в специальных «Картах расследования случая злокачественного новообразования с впервые установленным диагнозом». Извлечение групповых факторов проводилось методом главных компонентов, при определении числа групповых факторов использовались критерии Кайзера и Кеттелла, вращение факторов осуществлялось по методу Varimax. Приемлемость исходных данных для факторного анализа оценивалась по критериям адекватности выборки Кайзера—Мейера—Олкина и сферичности Барлетта. Каждый из извлеченных в ходе факторного анализа групповых факторов включает тесно коррелирующие между собой первичные потенциальные факторы риска с наибольшими величинами факторных нагрузок, которые количественно характеризуют степень их обусловленности действием соответствующего группового фактора. Первичные потенциальные факторы риска расценивались как высокоинформативные и значимые при величинах соответствующих им факторных нагрузок 0,500 и более. Качественная интерпретация извлеченных групповых факторов заключалась в их смысловой идентификации через первичные потенциальные факторы риска. Иерархический кластерный анализ корреляций обеспечил классификацию первичных потенциальных факторов риска с группировкой их в иерархически организованные кластеры и наглядным графическим представлением результатов в виде дендрограмм. Процедуры факторного анализа и иерархического кластерного анализа корреляций выполнены с использованием профессионального пакета статистических программ «Statistical Package for Social Science» (SPSS) version 13.0 [6].

Результаты и обсуждение. При изучении потенциальных факторов риска злокачественных новообразований желудка у 2 468 больных с впервые установленным диагнозом за период 1988—2014 гг. выявлено, что для данной формы онкологической патологии значимыми являются как наследственная предрасположенность (в 16,94 % случаев у кровных родственников были диагностированы злокачественные новообразования,

06965827

6

ЗНиСО

причем в 11,95 % случаев — аналогичной локализации), так и другие потенциальные факторы риска, в частности хронические заболевания системы пищеварения (44,14 % больных), употребление алкоголя (57,08 %), табакокурение (51,12 %) и профессиональные вредности (26,33 %).

Проведенный факторный анализ позволил за восемь итераций сократить число исходных потенциальных факторов риска до восемнадцати со значениями факторных нагрузок 0,500 и более. В результате удалось выделить и содержательно интерпретировать три групповых (латентных, скрытых) фактора, объясняющих 84,481,% суммарной дисперсии.

Оказалось, что приоритетный для данной локализации злокачественных новообразований групповой фактор первого ранга с долей дисперсии 37,132,% объединяет девять взаимосвязанных первичных потенциальных

Злоупотребление алкоголем 0,624

Употребление преимущественно крепких алкогольны);налитков 0,722

Активное курение при стаже 5 лег «более 0,819

Хронические заболевании желудка -язвенная болезнь, полипоз желудка гилоацидный гастрит 0,703 Хронические заболевания других отделов желудочно-кишечного 0,571 тракта

Групповой фактор 2 рангл

(28,231 %)

Неблагоприятные санитарно-кимичеекие параглетры качества водопроводной воды 0.506

Использование водопроводной воды _

без досчистки 0,512

Злокачественные новообразования других локализаций у кроеных родственников 0,577

Злокачественные новообразования лелудка — у кровных родственников 0,639

Групповой фактор 3 ранга

(19,118

Частое (болев 4 раз в неделю) употребление ■ жареного мяса 0,699

Избыток в рационе животных жиров 0,71 8 ■

Частое употребление острой пищи 0,602

Избыток в рационе копчены* продуктов

0,602

Привычна употреблять очень горячую пишу и напитки 0,573

Нерегулярное питание 0,587

Недостаток в рационе кисломолочных продуктов 0,525

Недостаток в рационе свежих: овощей, зелени и фруктов 0,514.

Дефицит в рационе витаминов А, С и Е

0.529

Рис. Дендрограмма факторной структуры и значения факторных нагрузок при злокачественных новообразованиях желудка у жителей г. Таганрога за период 1988—2014 гг. (по результатам кластерного анализа корреляций)

факторов риска. Характерно, что наибольшая факторная нагрузка (0,738) в структуре первого группового фактора приходится на привычку употреблять очень горячую пищу и напитки. Второе, третье и четвертое ранговые места в структуре данного группового фактора занимают такие первичные потенциальные факторы риска, как избыток в рационе животных жиров, в том числе употребляемых для жарения; частое (3—4 раза в неделю и более) употребление жареного мяса, а также склонность к частому употреблению острой пищи при соответствующих величинах факторных нагрузок: 0,718, 0,699 и 0,602. Затем в порядке убывания факторных нагрузок, следуют такие первичные потенциальные факторы риска, как нерегулярное питание (при факторной нагрузке 0,587), избыток в рационе копченых продуктов (0.573), дефицит в рационе продуктов, богатых витаминами А, С и Е (0,529), недостаток в рационе кисломолочных продуктов (0,525), а также свежих овощей, зелени и фруктов (0,514). Таким образом, первый групповой фактор можно интерпретировать как «индивидуальные особенности питания» (см. рисунок).

Групповой фактор второго ранга с долей в суммарной дисперсии 28,231 % включает две подгруппы первичных потенциальных факторов риска. Первую подгруппу составляют привычные интоксикации, в том чис-

|ле активное привычное и пристрастное курение со стажем 5 лет и более (при факторной нагрузке 0,819), а также злоупотребление алкоголем (0,624), особенно в случае употребления преимущественно крепких алкогольных напитков (0,722). Во вторую подгруппу входят такие первичные потенциальные факторы риска, как наличие в анамнезе хронических заболеваний желудка (язвенная болезнь желудка, полипоз желудка, гипоацидный гастрит) и хронических заболеваний других отделов желудочно-кишечного тракта при факторных

Групповой фактор 1 ранга (37,132 %)

06965887

^ нагрузках соответственно 0,703 и 0,571. Вышеуказанное позволяет интерпретировать данный групповой фактор как «индивидуальные привычные интоксикации и хронические >з= заболевания органов пищеварения».

Групповой фактор третьего порядка, доля которого в суммарной дисперсии составляет ^ 19,118 %, объединяет четыре первичных потенциальных фактора риска, причем два 5 наиболее значимых из их числа характеризуют ^ степень наследственной предрасположенности к заболеванию злокачественными новооб-—р разованиями желудка. Так, приоритетным среди первичных потенциальных факторов риска является наличие среди кровных родственников случаев заболеваний злокачественными новообразованиями желудка —р (факторная нагрузка 0,639), а также про-^^ чих локализаций и форм процесса (0,577). ^^ Оставшиеся два первичных потенциальных ^ фактора риска относятся к факторам средового ^ характера — это, во-первых, проживание на селитебных территориях с неблагоприятными санитарно-химическими параметрами качества воды системы централизованного хозяйственно-питьевого водоснабжения (0,506), и, во-вторых, использование в питьевых целях водопроводной воды без доочистки (0,512). Данный групповой (латентный) фактор интерпретирован как «наследственная предрасположенность и потенциальные факторы риска популяционного уровня».

Результаты, полученные при проведении кластерного анализа корреляций, свидетельствуют о том, что в структуре первого группового фактора («индивидуальные особенности питания») выделяются две иерархически организованные подгруппы тесно взаимосвязанных первичных потенциальных факторов риска, которые можно интерпретировать как, во-первых, «неблагоприятная структура рационов с избыточным потреблением животных жиров, острой пищи, копченых продуктов, жареного мяса в сочетании с привычкой употреблять очень горячую пищу и напитки»; во-вторых, «дефицитарные параметры рационов» — недостаточное потребление кисломолочных продуктов, свежих овощей, зелени и фруктов, а также продуктов, богатых витаминами А, С и Е в сочетании с нерегулярным характером питания. В рамках группового фактора второго ранга («индивидуальные привычные интоксикации и хронические заболевания органов пищеварения») наиболее тесно взаимосвязанными оказались активное курение и злоупотребление алкоголя, в том числе при преимущественном

употреблении крепких спиртных напитков, а также хронические заболевания желудка и других отделов желудочно-кишечного тракта. Третий групповой фактор («наследственная предрасположенность и потенциальные факторы риска популяционного уровня») также включает две подгруппы, объединяющие по два взаимосвязанных параметра — злокачественные новообразования у кровных родственников, в том числе желудка; а также неблагоприятные санитарно-химические параметры качества водопроводной воды и ее использование без доочистки.

Заключение. Таким образом, применение при аналитической обработке базы данных персонифицированного учета онкологических заболеваний многомерных статистических методов — факторного анализа и кластерного анализа корреляций — позволило упростить факторную структуру; выделить, интерпретировать и количественно оценить по доле вклада в общую дисперсию групповые (латентные, скрытые) факторы; ранжировать по значениям факторных нагрузок первичные потенциальные факторы риска возникновения злокачественных новообразований желудка, а также определить их иерархическую структуру.

ЛИТЕРАТУРА

1. Дубров A.M. и др. Многомерные статистические методы / A.M. Дубров, B.C. Мхитарян, Л.И. Тро-шин. М.: Финансы и статистика, 2003. 352 с.

2. Кожевников С.Н. и др. Использование многомерных методов статистического анализа для определения программ лечебно-профилактической помощи медицинским работникам в современных условиях / С.Н. Кожевников, А.В. Денисов, И.И. Новикова, Ю.В. Ерофеев //Здоровье населения и среда обитания. 2013. № 10 (247). С. 20—22.

3. Марченко Б.И. и др. Изучение структуры потенциальных факторов риска при злокачественных новообразованиях в г. Таганроге Ростовской области / Б.И. Марченко, Г.В. Масляева, Ю.А. Еременко //Социально-гигиенический мониторинг здоровья населения: Материалы XV Республиканской научно-практической конференции. Рязань: РязГМУ, 2011. С. 16—24.

4. Марченко Б.И. и др. Структура факторов риска при злокачественных новообразованиях трахеи, бронхов и легкого / Б.И. Марченко, Г.В. Масляева //Комплексное воздействие факторов окружающей среды и образа жизни на здоровье населения: диагностика, коррекция, профилактика: Материалы Пленума Научного совета Российской федерации по экологии человека и гигиене окружающей среды. М., 2014. С. 227—229.

5. Медик В.А. Методические основы комплексной оценки состояния здоровья населения

06965827

0

ЗНиСО

//Медицина труда и промышленная экология. 2003. № 7. С. 3—8.

6. Наследов А.Д. SPSS: Компьютерный анализ данных в психологии и социальных науках. СПб.: Питер, 2005. 416 с.

7. Фролова О.А. и др. Оценка риска развития канцерогенных и неканцерогенных эффектов при употреблении продуктов питания / О.А. Фролова, М.В. Карпова //Гигиена и санитария. 2012. № 5. С. 107—108.

8. Цинкер М.Ю. и др. Статистическое моделирование для оценки влияния факторов среды обитания на индикаторные показатели здоровья населе-

ния Российской Федерации / М.Ю. Цинкер, Д.А. Кирьянов, С.В. Клейн //Здоровье населения и среда обитания. 2013. № 11 (248). С. 36—38.

Контактная информация:

Марченко Борис Игоревич, тел.: 8 (904) 346-15-75, e-mail: marchenko@pbox.ttn.ru

Contact information: Marchenko Boris, р^пе: 8 (904) 346-15-75, e-mail: marchenko@pbox.ttn.ru

УДК 614.78

АКТУАЛЬНОСТЬ ОЦЕНКИ МНОГОСРЕДОВОГО КАНЦЕРОГЕННОГО РИСКА ДЛЯ ЗДОРОВЬЯ НАСЕЛЕНИЯ ОТ ВОЗДЕЙСТВИЯ ХИМИЧЕСКИХ ВЕЩЕСТВ, ЗАГРЯЗНЯЮЩИХ ОКРУЖАЮЩУЮ СРЕДУ

В.И. Курчанов1, Т.Е. Лим1,2, И.А. Воецкий1, С.А. Головин1

1ФБУЗ «Центр гигиены и эпидемиологии в городе Санкт-Петербург» Роспотребнадзора, г. Санкт-Петербург, Россия 2ГБОУ ВПО «Северо-Западный государственный медицинский университет им. И.И. Мечникова» Минздрава России, г. Санкт-Петербург, Россия

Проведен анализ онкологической заболеваемости населения и результатов много-средовых оценок канцерогенного риска для здоровья населения, произведенных за последние шесть лет в населенных пунктах различных регионов Российской Федерации. По результатам проведенного анализа установлены приоритетные факторы и пути поступления химических канцерогенов, выявлены территории с повышенным уровнем риска, разработаны рекомендации по дальнейшему изучению ситуации. Ключевые слова: многосредовая оценка риска, факторы среды обитания, канцерогенный риск, атмосферный воздух, почва, продукты питания, питьевая вода, здоровье населения, онкологическая заболеваемость.

V.I. Kurchanov, T.Ye. Lim, I.A. Voyetsky, S.A. Golovin □ THE RELEVANCE OF ASSESSMENT OF MULTICOMPARTMENT CARCINOGENIC RISK TO HEALTH FROM EXPOSURE TO CHEMICALS THAT POLLUTE THE ENVIRONMENT

□ FBHE «Center of Hygiene and Epidemiology in the city of Saint-Petersburg» of the Federal Service for Supervision of Consumer Rights Protection and Human Well-Being, Saint-Petersburg, Russia; SBEI HPE «North-Western State Medical University named after I.I. Mechnikov»» of the Ministry of Healthcare of Russia, Saint-Petersburg, Russia.

The analysis of the results of the multicompartment assessment of carcinogenic risk to public health made in the last six years in the localities of various regions of the Russian Federation. The analysis of the incidence of malignant neoplasms. According to the results of the analysis are set priority factors and pathways of the chemical carcinogens, identified areas with elevated levels of risk, developed recommendations for further study of the situation. Key words: multi-compartment risk assessment, environmental factors, carcinogenic risk, risk assessment, air, drinking water, soil, foodstuffs, health, cancer incidence.

Применение методологии оценки риска позволяет получить представление о приоритетных факторах, средах, путях поступления, компонентах химического загрязнения на территории, а так же провести количе-

ственную оценку экспозиции и получить результаты, характеризующие уровни риска на рассматриваемых территориях.

Цель исследования — анализ результатов многосредовых оценок канцерогенного риска

06965887

i Надоели баннеры? Вы всегда можете отключить рекламу.