Научная статья на тему 'Система поддержки принятия решений для оценки воздействия факторов среды на здоровье населения на основе моделирования'

Система поддержки принятия решений для оценки воздействия факторов среды на здоровье населения на основе моделирования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
533
164
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФАКТОРЫ СРЕДЫ / ЗДОРОВЬЕ НАСЕЛЕНИЯ / ОЦЕНКА ВОЗДЕЙСТВИЯ / ИНФОРМАЦИОННО-АНАЛИТИЧЕСКАЯ СИСТЕМА / БАЗЫ ДАННЫХ / МОДЕЛИРОВАНИЕ / ПРОГНОЗИРОВАНИЕ / ENVIRONMENTAL FACTORS / POPULATION HEALTH / IMPACT ASSESSMENT / INFORMATION AND ANALYTICAL SYSTEM / DATABASES / MODELING / FORECASTING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ермолаева Светлана Вячеславовна, Журавлев В.М., Смагин А.А., Липатова С.В.

На основе статистических данных санитарно-гигиенического мониторинга Ульяновской области за период с 1992 по 2014 год разрабатывается информационно-аналитическая система как средство поддержки принятия решений на уровне региональных служб слежения за здоровьем населения и состоянием окружающей среды на основе моделирования взаимосвязи «окружающая среда организм человека». Система состоит из трех подсистем, которые взаимодействуют между собой и обмениваются данными. Первая подсистема это база данных, обеспечивающая сбор, хранение и организацию доступа к данным со стороны конечных пользователей через Интернет. Вторая подсистема обеспечивает проведение статистической обработки данных, визуализацию текущих статистических параметров набора данных и построения на их основе статистических прогностических моделей поведения отдельных факторов социально-экономической системы региона, включая окружающую среду. Третья подсистема прогноза на основе нечеткой логики необходима для построения моделей в ситуациях неполной или искаженной информации о состоянии тех или иных параметров динамики региона. Эти три подсистемы будут работать под управлением единой сервисной системы сбора и управления данными через Интернет. Разработанная структура информационно-аналитической системы позволит более эффективно осуществлять оценку взаимодействия факторов среды и здоровья населения с целью управления данной системой взаимоотношений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ермолаева Светлана Вячеславовна, Журавлев В.М., Смагин А.А., Липатова С.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODEL-BASED DECISION SUPPORT SYSTEM FOR ASSESSMENT OF ENVIRONMENTAL FACTORS IMPACT ON POPULATION HEALTH

Based on the statistical data of the sanitation and hygiene monitoring for the period from 1992 to 2014, an information and analytical system is being developed as a means of model-based decision support at the level of regional services' monitoring of population health and the environment. The system consists of several interacting subsystems and exchange data. The first subsystem is a database for collection, storage and organization of end-user access on the Internet. The second subsystem processes statistical data, ensures visualization of current statistical parameters of data sets and, on their basis, constructs statistical forecasting models of behavior of individual factors of the region's social and economic system, including the environment. The third forecasting subsystem based on fuzzy logic is necessary to construct models in situations of incomplete or distorted information about the status of various parameters of the region's dynamics. These three subsystems will be part of a unified service system for collection and management of data via the Internet. The developed framework of the information and analytical system will ensure a more effective assessment of interactions of environmental and population health factors in order to manage this system of relationships.

Текст научной работы на тему «Система поддержки принятия решений для оценки воздействия факторов среды на здоровье населения на основе моделирования»

УДК [614.7:614.2]:681.518

СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ДЛЯ ОЦЕНКИ ВОЗДЕЙСТВИЯ ФАКТОРОВ СРЕДЫ НА ЗДОРОВЬЕ НАСЕЛЕНИЯ НА ОСНОВЕ МОДЕЛИРОВАНИЯ

© 2016 г. С. В. Ермолаева, В. М. Журавлев, А. А. Смагин, С. В. Липатова

Ульяновский государственный университет, г. Ульяновск

На основе статистических данных санитарно-гигиенического мониторинга Ульяновской области за период с 1992 по 2014 год разрабатывается информационно-аналитическая система как средство поддержки принятия решений на уровне региональных служб слежения за здоровьем населения и состоянием окружающей среды на основе моделирования взаимосвязи «окружающая среда - организм человека». Система состоит из трех подсистем, которые взаимодействуют между собой и обмениваются данными. Первая подсистема - это база данных, обеспечивающая сбор, хранение и организацию доступа к данным со стороны конечных пользователей через Интернет. Вторая подсистема обеспечивает проведение статистической обработки данных, визуализацию текущих статистических параметров набора данных и построения на их основе статистических прогностических моделей поведения отдельных факторов социально-экономической системы региона, включая окружающую среду. Третья подсистема прогноза на основе нечеткой логики необходима для построения моделей в ситуациях неполной или искаженной информации о состоянии тех или иных параметров динамики региона. Эти три подсистемы будут работать под управлением единой сервисной системы сбора и управления данными через Интернет. Разработанная структура информационно-аналитической системы позволит более эффективно осуществлять оценку взаимодействия факторов среды и здоровья населения с целью управления данной системой взаимоотношений.

Ключевые слова: факторы среды, здоровье населения, оценка воздействия, информационно-аналитическая система, базы данных, моделирование, прогнозирование

MODEL-BASED DECISION SUPPORT SYSTEM FOR ASSESSMENT OF ENVIRONMENTAL

FACTORS IMPACT ON POPULATION HEALTH

S. V. Ermolayeva, V. M. Zhuravlev, A. A. Smagin S. V. Lipatova

Ulyanovsk State University, Ulyanovsk, Russia

Based on the statistical data of the sanitation and hygiene monitoring for the period from 1992 to 2014, an information and analytical system is being developed as a means of model-based decision support at the level of regional services' monitoring of population health and the environment. The system consists of several interacting subsystems and exchange data. The first subsystem is a database for collection, storage and organization of end-user access on the Internet. The second subsystem processes statistical data, ensures visualization of current statistical parameters of data sets and, on their basis, constructs statistical forecasting models of behavior of individual factors of the region's social and economic system, including the environment. The third forecasting subsystem based on fuzzy logic is necessary to construct models in situations of incomplete or distorted information about the status of various parameters of the region's dynamics. These three subsystems will be part of a unified service system for collection and management of data via the Internet. The developed framework of the information and analytical system will ensure a more effective assessment of interactions of environmental and population health factors in order to manage this system of relationships.

Keywords: environmental factors, population health, impact assessment, information and analytical system, databases, modeling, forecasting.

Библиографическая ссылка:

Ермолаева С. В., Журавлев В. М., Смагин А. А., Липатова С. В. Система поддержки принятия решений для оценки воздействия факторов среды на здоровье населения на основе моделирования // Экология человека. 2016. № 3. С. 9-17.

Ermolayeva S. V., Zhuravlev V. M., Smagin A. A., Lipatova S. V. Model-Based Decision Support System for Assessment of Environmental Factors Impact on Population Health. Ekologiya cheloveka [Human Ecology]. 2016, 3, pp. 9-17.

Оценка воздействия факторов окружающей среды на здоровье населения является основным направлением медико-экологических, медико-географических и других исследований, связанных с человеком. Проблема оценки взаимодействия окружающей среды и человека очень сложна, так как необходимо учитывать множество важных и не всегда вполне определенных факторов [7, 9, 14, 15]. Моделирование в эколого-экономическом мониторинге играет важную роль, как для анализа состояния систем, так и для оценки происходящих в них процессов [4, 6, 8]. Это инструмент для разработки прогнозов и

многовариантных сценариев отклика системы на природные явления и управленческие решения. При исследовании сложных фрагментов природы и жизни современного человека, его взаимодействия со средой обитания используются различные подходы и создаются разнообразные модели [1—3, 10, 12, 13]. Многие модели посвящены охране природной среды, которые описывают загрязнение воздушного бассейна, степень загрязнения водоемов и т. д. Например, модель комплексной медико-экологической оценки системы «окружающая среда — здоровье человека» [3] отражает взаимодействие природно-экологиче-

ских факторов с показателями здоровья населения. В основу предложенной модели положен поэтапный принцип определения причинно-следственных связей распространения и формирования заболеваний органов дыхания, основанный на рассмотрении зависимости между состоянием окружающей среды и показателями заболеваемости органов дыхания на популяционном уровне. Большинство разработанных ранее моделей являются статичными и сложными в применении. Для получения информации о динамическом изменении параметров модели необходимо осуществлять множество непростых вычислений.

В связи с этим актуальным является создание информационно-аналитической системы поддержки принятия решений для оценки воздействия факторов среды на здоровье населения, которая могла бы учитывать такие важные обстоятельства, как неточность исходных данных, влияющих на оценку, получение точных корреляций измеренных экологических параметров, обоснование и формирование интегральных показателей, проведение экологического прогноза, компьютерное моделирование опасных экологических ситуаций и качественное отображение результатов анализа.

Целью данной работы является разработка структуры и подбор оптимальных методов и приемов информационно-аналитической системы (ИАС) поддержки принятия решений для оценки воздействия факторов экологического и социально-экономического неблагополучия среды на здоровье населения на основе моделирования взаимосвязи «окружающая среда — организм человека».

Методы

Разрабатываемая ИАС создается как средство поддержки принятия решений на уровне региональных служб слежения за здоровьем населения и состоянием окружающей среды.

Для обеспечения исходными данными для функционирования системы предполагается организация сбора данных на всей территории Ульяновской области (к настоящему времени производится накопление данных по отдельным районам.) Для демонстрации основных принципов, положенных в основу работы системы в целом и ее подсистем, был выбран Сенгилеевский район Ульяновской области как один из районов с напряженной социально-эколого-экономической обстановкой. Производился сбор данных о качестве атмосферного воздуха и питьевой воды, загрязнении и деградации почв, социально-экономическом развитии территории и качестве жизни населения, демографической ситуации, состоянии здоровья населения.

Данные о состоянии атмосферного воздуха, питьевой воды и почвы за 2012—2014 годы получены в результате собственных исследований, анализы проб которых произведены на базе химико-аналитической лаборатории научно-исследовательского технологического института Ульяновского государственного университета. Данные с 1992 по 2011 год о качестве

окружающей среды и социально-экономическом развитии территории получены из ежегодных отчетов Центра метеорологии и мониторинга окружающей среды Ульяновской области, Министерства лесного хозяйства, природопользования и экологии Ульяновской области и службы госстатистики по Ульяновской области.

Для создания web-интерфейса использовался язык программирования php, в качестве системы управления базами данных использовалась PostgreSQL. База включает в себя данные за период с 1992 по 2014 год и содержит около 300 показателей и 5 тысяч их значений.

Результаты и их обсуждение

Для оценки воздействия факторов экологического и социально-экономического неблагополучия среды на здоровье населения разработаны основные функции и структура ИАС поддержки принятия решений.

Информационно-аналитическая система служит для выполнения следующих задач:

1. Сбор статистических данных санитарно-гигиенического мониторинга. При этом предполагается, что исходными данными для пакетов статистической обработки являются таблицы наблюдений по одной или нескольким переменным. Сбор электронных данных осуществляется в заданные сроки или выборочно.

2. Получаемые по Интернет статистические данные должны размещаться в базе данных сервера в формах, удобных для их обработки, с возможностью их дальнейшего аккумулирования и быстрого поиска.

3. Накопленные данные должны быть обработаны с учётом выявления взаимосвязи между эколого-со-циально-экономическими параметрами, на основе которых устанавливаются причинные факторы, оказывающие наиболее сильное влияние на изменение социально-эколого-экономической ситуации в регионе. Здесь возникает задача характеризования установленных связей, которая решается с помощью коэффициентов и показателей корреляции. Применяя корреляционный анализ, следует иметь в виду, что наличие даже очень сильных корреляционных связей еще не означает существования прямой зависимости между сравниваемыми параметрами. Часто корреляция является следствием того, что оба показателя тесно связаны с некоторым третьим, не учитываемым фактором. Поэтому выбор наиболее подходящих и эффективных пакетов статистической обработки данных имеет важное прикладное значение.

4. Из-за возникающих ошибок при сборе статистических данных, вызванных неточностью измерений самих приборов, влияния внешних отрицательных факторов, а также присутствия человеческого фактора при оформлении и переносе медицинских наблюдений на электронные носители и подачи этих данных не в строго определенные моменты времени возникает потребность в использовании метода нечёткой логики, который позволяет проводить учёт разброса параметров и выдавать в этих случаях удовлетворительные для оценок результаты.

5. Установленные корреляционные зависимости выявляют множество факторов (причин), которые определяют текущее состояние социально-эколого-экономической обстановки. Знание распределений их значений на временном ряду позволяет сделать экстраполяционный социально-эколого-экономический прогноз. Анализ и оценка параметров при прогнозировании может осуществляться и с помощью компьютерного моделирования с использованием таких структур данных, как дерево событий (целей, отказов), обладающих высокой наглядностью и простотой работы с ними.

Для функционирования АИС необходимо создание удобного интерфейса для аналитика, а также неподготовленного пользователя, для которого важны окончательные данные и прогноз.

Общая структура системы и анализируемый набор данных

Реализация указанных выше взаимосвязанных задач порождает структуру информационно-аналитической системы, представленной на рис. 1.

Подсистема сбора статистических данных Размещение статистических данных в базе данных

Полсистеча моделировании наоеноне нечеткой 11л И1

Подсистема статистической ойряботки Г.) ГИЬ1Х

Подсистема

прогнозирования

обстановки

Подсистемя визуалгашии н о I обряжен ия ыин ыя Интерфейс

]> :|мм.| |:и11VI

Рис. 1. Общая структура информационно-аналитической системы

Для хранения данных создана реляционная база данных (рис. 2) и web-интерфейс (рис. 3), позволяющий оператору вносить значения показателей из разных точек региона, используя любой тип компьютера (персональный, ноутбук, нетбук, планшет) или

Корреляцня

щеюнфякатор корреляции

РК

^ Идентификатор локантепя 1 РК ? Идентификатор показателя 2 ГК Значаще Интервал

Рекомендация

^ кЩенткфиткатор реком екцацин РК ^ НД^НГифик^ Г^р ПРКДЗЭГ^ ПЯ Г". Значение изменении

Показатель

^ Идентнфигатрр показателя РК ^ Идентификатор родителя р К ^ Ндентнфш.аюр КП5ССЭ РК название описанн Вертнпя граница нижняя граница

даже мобильное устройство, обязательным условием является лишь наличие доступа к глобальной сети Интернет.

Использование web-решения позволяет обеспечить расширяемость системы за счет включения в нее различных сервисов (картографических, автоматизированного сбора данных и т. д.). Для удобства ведения базы данных используется иерархическое представление социально-эколого-экономических показателей. Данные можно просматривать как в виде плоских таблиц, так и в виде графиков (см. рис. 3). Графики содержат не только значения показателей, но и демонстрируют допустимый «коридор» значений (красные линии описывают минимальные и максимальные допустимые значения показателя в каждый момент времени).

Подсистема статистической обработки данных и построения статистических моделей прогноза

Для первичного представления о характере тенденций и флуктуаций изучаемых параметров в разрабатываемой системе предусмотрена подсистема, позволяющая рассчитывать все основные базовые статистики рядов наблюдений. К ним относятся: средние значения, дисперсии, корреляции с вычислением соответствующих погрешностей. К первому уровню анализа данных будет относиться комплекс программ вычисления параметров многопараметрических линейных моделей на основе метода наименьших квадратов. Вторым уровнем анализа данных является анализ эмпирических распределений изучаемых параметров, а также их тонкий анализ на основе метода условной декомпозиции распределений, если набирается достаточно статистического материала. Для анализа данных на втором уровне также будут привлекаться методы спектрального анализа. Третий уровень анализа данных — это проведение вычислений статистических характеристик скользящих рядов наблюдений и построение статистических моделей прогноза их изменений на доступный для объективной оценки интервал времени в будущем.

Класс показателя

? 11деиндикатор класса Название

Пользователь

У Идентификатор пользователи РК Погни

Каш пароля

Группа

Имя

Фамнпкя Е-татП

Значен и? показателя

? идентификатор значения РК ? Идентификатор показатели № 1 Идентификатор района РК Значение Дата

верхняя граница нижняя граница

лки

Райои

^ Идентификатор района РК название Описание

Рис. 2. Логическая схема базы данных для хранения статистической информации о социально-эколого-экономи-ческой ситуации в регионе

Рис. 3. Web-интерфейс ведения статистической базы данных

Расчет базовых статистик совершается по стандартным формулам вычисления несмещенных и состоятельных оценок средних, дисперсии и корреляций (Пирсона) [3, 5]. В частности, коэффициент корреляции между отдельными показателями с временным сдвигом т оценивался по формуле:

]

1

N-T-i ó ók ti

Vi, .v К, . v ), (1)

где I — номер временного отсчета, N — длина ряда, 1 — значение измеряемого показателя с номером ] на момент времени /, т — временной сдвиг, выраженный в числе временных отсчетов,

/ 1 >, (2)

лл _

— оценка среднего значения и дисперсии соответствующих рядов.

Для анализа значимости коэффициента корреляции на соответствующем сдвиге проводилось его сравнение с критическим значением коэффициента корреляции КЯг (т) , вычисляемого на основе критерия Пирсона [5]:

Т(а) =

|У1Г(т)|УЛТ-т-2

(3)

где Т (а) — критическое значение распределения Стьюдента для уровня значимости а. Поскольку величина Т (а) при уровне значимости а = 0,05 не сильно отличается от значения Тс; 2 для длин рядов N > 7, то формула (3) приводит к простому соотношению:

I |=

V^-i

(4)

т+Т^-2' л/ЛГ-г + 2'

Эта величина и определяла уровень значимости коэффициентов корреляции на сдвиге т, т. е. согласно нулевой гипотезе значимыми признавались такие значения коэффициента корреляции, которые превышали критическое значение, вычисленное по формуле (4) .

В пакете программ предусмотрено построение многопараметрических линейных моделей следующего общего вида:

м

(5)

где x,y . — значения независимом и зависимом переменных в моменты времени с номером Ak — параметры модели, соответствующие фиксированной пробной функции Fk(x), M — размерность модели, s. — случайные отклонения. В пакете программ в настоящей версии будет предусмотрена возможность выбирать пробные функции из стандартной библиотеки функций, включающей мономы x , где n — произвольное вещественное число, функции вида ekx, sin (mx) и cos (mx), с заданными значениями k и ю. Кроме автоматического вычисления параметров модели вычисляются погрешности коэффициентов Ak.

Анализ второго уровня включает вычисление гистограмм по стандартным вычислительным алгоритмам и их сравнение по критерию х2 со стандартным набором таких теоретических распределений, как нормальное

распределение и набор распределений вида:

.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Метод условной декомпозиции распределений опирается на методологию, описанную в работе [5] и предусматривает построение совокупности распределений, удовлетворяющих формуле полной вероятности [2]:

=2>„

,

где рт (х) — эмпирические распределения, построенные как гистограммы по совокупности Q эмпирических признаков или условий, а рт — априорные вероятности появления признаков. Кроме этого на втором уровне анализа будут включаться варианты кластерного анализа данных для выявления групп признаков для более адекватного их статистического анализа.

Значимые корреляции между показателями здоровья детей и показателями загрязнения питьевой воды

(ежегодные данные 1992-2014 гг.)

Загрязняющие питьевую воду вещества, мг/л

Первичная заболеваемость, на 1 000 детей Железо Аммиак и аммоний ион Нитраты (по N0,) Нитриты (по N0,) Хлориды (по С1) Сульфаты (по S04) Марганец Медь Жесткость общая

Болезни с диагнозом, установленном впервые в жизни 0,00 -0,47 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Болезни органов дыхания 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,57

Болезни органов пищеварения 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Болезни мочеполовой системы 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,53

Болезни эндокринной системы 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Болезни нервной системы -0,63 0,00 0,00 0,00 0,00 0,00 0,00 0,48 -0,69

Болезни крови и кроветворных органов 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,48

Болезни системы кровообращения 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Болезни костно-мышечной системы и соединительной ткани 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Болезни кожи и подкожной клетчатки 0,54 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,52

Врожденные аномалии 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Инфекционные и паразитарные болезни -0,55 0,00 0,00 0,00 0,00 0,00 0,00 0,00 -0,86

Злокачественные новообразования 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Психические расстройства и расстройства поведения 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Болезни глаза и его придаточного аппарата 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Болезни уха и сосцевидного отростка 0,00 -0,58 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Отдельные состояния, возникающие в перинатальном периоде 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00

Анализ третьего уровня состоит в применении всех методов первого и второго уровня к отдельным отрезкам временных рядов меньшей длины, чем исходные ряды, но сдвинутых друг относительно друга на некоторый интервал времени. Такая методика, называемая часто методом скользящих рядов, позволяет изучить наличие изменений статистических параметров на исследуемом отрезке времени.

На основе описанной выше методики произведены вычисления корреляционных связей между показателями качества питьевой воды и заболеваемостью

детского населения. Табл. 1 содержит полную картину значимых корреляционных связей между показателями заболеваемости детей и концентрацией загрязняющих веществ в питьевой воде. Нулевые значения корреляций в таблице означают, что соответствующие значения коэффицентов корреляций на уровне значимости а = 0,05 не отличимы от нуля для данного набора данных. Как видно из таблицы, существенное воздействие (на данном уровне значимости) для исследуемого набора данных на здоровье детей оказывают железо, медь, аммиак и жесткость

Рис. 4. Регрессионная модель зависимости числа болезней кожи и подкожной клетчатки детей (случаев на 1 000 детского населения) от концентрации железа (мг/л) в питьевой воде (ежегодные данные 1992—2014 гг.)

воды. Показано, что данная концентрация железа в питьевой воде Сенгилеевского района имеет достоверную связь с болезнями кожи и подкожной клетчатки, концентрация меди — с болезнями нервной системы, степень жесткости воды — с болезнями органов дыхания, мочеполовой системы, крови и кроветворных органов, кожи и подкожной клетчатки. Такие взаимосвязи неслучайны, они хорошо изучены и отражены в работах некоторых исследователей [11, 12].

На графиках (рис. 4 и 5), дополняющих табл. 1, представлены регрессионные линейные модели вида зависимости числа страдающих тем или иным видом заболевания от величины концентрации вредных веществ. Каждая точка на диаграмме отвечает соотношению величин в один определенный год.

Так например, из графика на рис. 4 следует, что в рассматриваемом наборе данных увеличение концентрации железа в воде (горизонтальная ось) в "среднем" приводила к увеличению числа детей, впервые страдающих заболеваниями кожи и подкожной клетчатки (вертикальная ось). Увеличение показателя жесткости питьевой воды (рис. 5) также приводило к увеличению числа детей, страдающих болезнями мочеполовой системы.

Member functions for output number 1 named UUater_Quj[[ty

$ 0,0 0.5

О 4 --

a i ------

Рис. 5. Регрессионная модель зависимости числа болезней мочеполовой системы детей (случаев на 1 000 детского населения) от степени жесткости общей (мг/л) в питьевой воде (ежегодные данные 1992-2014 гг.)

Подсистема моделирования на основе нечеткой логики

Качество результатов статистических исследований напрямую зависит от качества данных. По результатам корреляционного анализа можем получить зависимости, которые противоречат опыту эксперта из-за небольшого количества данных или из-за их недостоверности. К сожалению, не всегда имеется возможность получить полные и достоверные данные. В связи с этим возникает необходимость для моделирования системы привлекать методы, способные оперировать неопределенностью, например нечеткую логику.

Для описания социально-эколого-экономической ситуации в регионе необходимо ввести лингвистические переменные для каждого рассматриваемого параметра и привлечь экспертов для построения нечетких правил. Так как ситуация зависит от множества факторов, относящихся к разным группам, предлагается ввести интегральный показатель для группы, а затем использовать его при построении нечетких правил. Например, качество воды зависит от содержащихся в ней загрязняющих веществ (железо не должно превышать 0,3 мг/л, аммиак — 1,5 мг/л, марганец — 0,1 мг/л, медь — 1 мг/л, жесткость воды

- -у-- / \

/ 1 \

1 \ L 1 / j___ \ \

I 1 / 1 i \ ^ 1

t \ / "V

; 1 /

I ----- 1 I*1 — -—-i-A

; \ —

: : :

Lgcad mirtcur

Vkfpt а Quality

Рис. 6. Выходная лингвистическая переменная (интегральный показатель качества воды)

не более 8 мг/л, нитриты — не более 3,3 мг/л). Для каждого параметра выстраивается лингвистическая переменная, значениями которой являются нечеткие переменные (обозначили их как «good» и «bad», хорошее и плохое показание соответственно, у каждой лингвистической переменной свои нечёткие переменные, хоть они и имеют одинаковое имя). Нечеткая переменная задается функцией принадлежности. Все функции принадлежности, описывающие значения нечетких лингвистических переменных, представлены на рис. 6.

При этом видно, что граничные значения используются как ориентиры, но они не являются точками перегиба функций, т. к. учитывается возможность погрешности измерений, границы «размываются», чтобы учитывать неопределенность данных.

Также в системе определяются и выходные лингвистические переменные, которые определяют интегральные показатели, например качество воды. В качестве значений выходной переменной также взяты нечеткие переменные «good», «middle» и «bad» (хорошее, среднее/нормальное и плохое). Для оценки качества воды выбрана пятибалльная шкала.

Для определения зависимости качества воды от входных параметров на основе экспертной информации строятся нечеткие правила вывода. Приведенные правила не являются окончательными и могут редактироваться экспертами. На каждое значение выходной лингвистической переменной сформулировано как минимум одно правило.

Для вывода используется алгоритм Мамдани, который позволит получать значения качества воды при разных входных значениях переменных. Качество воды зависит от 6 входных параметров, зависимость которых можно представить в трехмерном виде (так как в трехмерном виде возможно использование только 3 осей, то поверхности вывода отображают

зависимость качество от 2 параметров при зафиксированных нулевых значениях остальных 4). Поверхности вывода позволяют наглядно представить зависимость лингвистических переменных, а использование системы нечетких правил совместно с алгоритмом Мамдани позволяет получить на произвольные четкие значения показателей воды (в конкретной ситуации) нечеткие значения входных и выходных переменных и после операции дефазификации четкое значение интегрального показателя качества воды (в баллах).

С использованием нечетких правил ввода данных качества питьевой воды построена трехмерная модель (рис. 7), которая показывает зависимость лингвистических переменных (две входных лингвистических переменных и интегральная выходная, остальные равны нулю).

После получения интегральных показателей качества воды, почвы, атмосферного воздуха, социально-экономического развития их можно использовать как входные параметры для лингвистических переменных, описывающих состояние здоровья (по группам болезням).

Применение лингвистических переменных для параметров, характеризующих социально-эколо-го-экономическую ситуацию в регионе, даст возможность одновременно анализировать результаты корреляционного анализа, представив выявленные зависимости в виде нечетких правил, и формализовать экспертные знания.

Подсистема прогнозирования

Разработка прогнозного видения социально-эколо-го-экономических систем предусматривает учет сходных моментов в их развитии: стохастичность (неопределенность параметров), многовариантность, репрезентативность, при этом экстраполяция анализа социально-эколого-экономической системы в целом затрудняется из-за нестабильности развития обстановки. В целом

Рис. 7. Поверхности вывода: зависимость качества воды от содержания железа и аммиака

прогнозирование осуществляется в три этапа: экстраполяция, моделирование и экспертиза. Каждая из этих групп методов имеет существенные ограничения. В основу всех действий включаются: анализ объекта прогнозирования, анализ статистической отчетности; классификация событий; структура объекта; выбор критериев, метод построения дерева событий, целей и задач; метод аналогий; картографирование, результаты по построению корреляционных и статистических зависимостей, метод экспертных оценок.

Последовательность применения методов и их выбор в каждом конкретном случае может меняться, но основные этапы прогнозирования должны быть неизменными. Сложность структуры объекта прогнозирования, высокая степень неопределенности его динамики, развития и функционирования являются теми факторами, с помощью которых определяется выбор экспертных методов.

Экологическая экстраполяция подразумевает учет и развитие тенденций в системе отношений здоровья населения и влияния различных факторов, опирается на выявление и воспроизведение устойчивых процессов функционирования и развития социоэкосфер. Следует отметить, что экстраполяция большинства тенденций в социально-эколого-экономической системе затруднена.

Таким образом, разработанная структура информационно-аналитической системы с подобранными методами анализа данных и прогнозирования позволит более эффективно осуществлять оценку взаимодействия факторов среды и здоровья населения. Методы и подходы к анализу данных ИАС учитывают такие важные обстоятельства, как неточность исходных данных, влияющих на оценку, получение точных корреляций измеренных экологических параметров, обоснование и формирование интегральных показателей, проведение экологического прогноза, компьютерное моделирование опасных экологических ситуаций и качественное отображение результатов анализа.

Научная, научно-техническая и практическая ценность результатов заключена в разработке нового подхода к оценке воздействия факторов среды на здоровье населения для управления данной системой взаимоотношений. Моделирование взаимосвязи «окружающая среда — организм человека» позволит выявить факторы риска экологически и социально обусловленной заболеваемости населения конкретной территории с целью разработки рекомендации по их минимизации или полному устранению.

Данная статья не отражает конечных результатов исследования, так как в ней рассматривается лишь начальный этап исследования. В дальнейшем планируется представить результаты всех подсистем ИАС с многофакторным моделированием взаимосвязи «окружающая среда — организм человека».

Список литературы

1. Антонова Н. Б. Модели оценки воздействий загрязнения окружающей среды на здоровье человека //

Проблемы окружающей среды и природных ресурсов : Обзор информации : ВИНИТИ. 1995. № 3. С. 76-96.

2. Батурин В. А., Батурина Е. Ю., Бычков И. В., Га-ченко А. С., Данилина Е. В., Думова И. И., Дьякович М. П., Ефимова Н. В., Косов А. А., Кумачев А. А., Маторо-ва Н. И., Ружников Г. М., Урбанович Д. Е. Моделирование и оценка состояния медико-эколого-экономических систем / под ред. В. А. Батурина. Новосибирск, 2005. 249 с.

3. Веремчук Л. В. Методы моделирования медико-биологических и медико-экологических процессов // Здоровье. Медицинская экология. Наука. 2014. № 2 (56). С. 31-33.

4. Гмурман В. Е. Теория вероятностей и математическая статистика. М. : Высшая школа, 2003. 480 с.

5. Журавлев В. М., Морозов В. Н., Петряков М. С., Самойлов В. В. Метод условной декомпозиции эмпирических распределений и его применение к задаче анализа рядов наблюдений // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. 2014. № 3. С. 178-197.

6. Ефимова Н. В. Экогении: теоретические проблемы и поиск решений // Бюллетень ВСНЦ СО РАМН. 2005. № 1-2. С. 17-19.

7. Карпин В. А., Гудков А. Б., Катюхин В. Н. Мониторинг заболеваемости коренного населения Ханты-Мансийского автономного округа // Экология человека. 2003. № 3. С. 3-8.

8. Кику П. Ф. Информационно-аналитическое моделирование медико-экологических процессов здоровья населения // Профилактическая и клиническая медицина. 2005. № 1. С. 36-43.

9. Коробицын А. А., Банникова Р. В., Гудков А. Б., Вязьмин А. М., Шихова В. А. Медико-экологические аспекты образа жизни северян // Экология человека. 1999. № 2. С. 46-49.

10. Найденко В. В., Губанов Л. Н.. Косариков А. Н., Афанасьева И. М., Иванов А. В. Эколого-экономический мониторинг окружающей среды. Нижний Новгород, 2003. 186 с.

11. Ревич Б. А. Загрязнение окружающей среды и здоровье населения. Введение в экологическую эпидемиологию. М. : Изд-во МНЭПУ, 2001. 264 с.

12. Рукавишников В. С., Шаяхметов С. Ф. Фундаментальные исследования института в области медицины труда и экологии человека, их внедрение в практическое здравоохранение // Медицина труда и промышленная экология. 2005. № 12. С. 1-5.

13. Фомина А. В. Изучение влияния социально-экономических факторов на здоровье населения методом моделирования // Вестник Российского университета дружбы народов. Серия: Медицина. 2002. № 4. С. 57-60.

14. Унгуряну Т. Н., Новиков С. М., Бузинов Р. В., Гудков А. Б., Осадчук Д. Н. Риск для здоровья населения от химических веществ, загрязняющих атмосферный воздух, в городе с развитой целлюлозно-бумажной промышленностью // Гигиена и санитария. 2010. № 4. С. 21-24.

15. Чащин В. П., Сюрин С. А., Гудков А. Б., Попова О. Н., Воронин А. Ю. Воздействие промышленных загрязнений атмосферного воздуха на организм работников, выполняющих трудовые операции на открытом воздухе в условиях холода // Медицина труда и промышленная экология. 2014. № 9. С. 20-26.

References

1. Antonova N. B. Models of pollution impact assessment on human health. Problemy okruzhayushhei sredy iprirodnyh

resursov [Problems of the environment and natural resources]. Obzor informatsii, VINITI. 1995, 3, pp. 76-96. [in Russian]

2. Baturin V. A., Baturina E. Yu., Bychkov I. V., Gachenko A. S., Danilina E. V., Dumova I. I., Dyakovich M. P., Efimova N. V., Kosov A. A., Kumachev A. A., Matorova N. I., Ruzhnikov G. M., Urbanovich D. E. Modelirovanie i otsenka sostoyaniia mediko-ekologo-ekonomicheskih system [Modeling and assessment of combined medical, ecological and economic systems]. Novosibirsk, 2005. 249 p

3. Veremchuk L.V. Modeling techniques of biomedical and medical ecology processes. Zdorovie. Meditsinskaia ekologiia. Nauka [Health. Medical ecology. Science]. 2014, 2 (56), pp. 31-33. [in Russian]

4. Gmurman V E. Teoriia veroyatnostei i matematicheskaia statistika [Probability theory and mathematical statistics]. Moscow, 2003, 480 p.

5. Zhuravlev V. M., Morozov V. N., Petryakov M. S., Samoylov V. V Conditional decomposition method of empirical distributions and its application to the analysis of a series of observations. Izvestiia vyshchih uchebnyh zavedenii. Povolzhskii region. Fiziko-matematicheskie nauki [Proceedings of higher educational institutions. Volga region. Physical and mathematical sciences]. 2014, 3, pp. 178-197. [in Russian].

6. Efimova N. V. Ecogenia: theoretical problems and solutions. Byul. VSNC SO RAMN[Bulletin of Eastern-Siberian Scientific Center of Siberian Branch of Russian Academy of Medical Sciences]. 2005, 1-2, pp.17-19. [in Russian]

7. Karpin V. A., Gudkov A. B., Katyuhin V. N. Monitoring of the incidence of indigenous people of the Khanty-Mansi Autonomous Okrug. Ekologiya cheloveka [Human Ecology]. 2003, 3, pp. 3-8. [in Russian]

8. Kiku P. F. Information and analytical modeling of medical ecology processes of population health. Profilakticheskaia i klinicheskaia meditsina [Preventive and clinical medicine]. 2005, 1, pp. 36-43. [in Russian]

9. Korobitsin A. A., Bannikova R. V., Gudkov A. B. Vyazmin A. M., Shikhova V. A. Medico-ecological aspects of

the Northerners' way of life. Ekologiya cheloveka [Human Ecology]. 1999, 2, pp.46-49. [in Russian]

10. Naydenko V. V., Gubanov L. N. Kosarikov A. N., Afanasev I. M., Ivanov A. V. Ekologo-ekonomicheskii monitoring okruzhayushhei sredy [Ecological and economic monitoring of the environment]. Nizhny Novgorod, 2003, 86 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

11. Revich B. A. Zagryaznenie okruzhayushhei sredy i zdorov'e naseleniia. Vvedenie v ekologicheskuiu epidemiologic [Pollution of the environment and population health. Introduction to environmental epidemiology]. Moscow, 2001, 264 p.

12. Rukavishnikov V. S., Shayakhmetov S. F. Fundamental institute research in the field of occupational medicine and human ecology, its implementation in practical healthcare. Meditsina truda i promyshlennaia ekologiia. 2005, 12, pp. 1-5. [in Russian]

13. Fomina A. V Study of the influence of social and economic factors on population health based on modeling. Vestnik Rossiiskogo universiteta druzhby narodov. Seriia: Meditsina [Bulletin of the People's Friendship University of Russia. Series: Medicine]. 2002, 4, pp. 57-60. [in Russian]

14. Unguryanu T. N., Novikov S. M., Buzinov R. V., Gudkov A. B., Osadchuk D. N. Public health risk from chemicals, air pollutants in the city with developed pulp and paper industry. Gigiena i sanitariia. 2010, 4, pp. 21-24. [in Russian]

15. Chashhin V P., Sjurin S. A., Gudkov A. B., Popova O. N., Voronin A. Ju. Influence of industrial pollution of ambient air on health of workers engaged into open air activities in cold conditions. Meditsina truda i promyshlennaia ekologiia. 2014, 9, pp. 20-26. [in Russian]

Контактная информация:

Ермолаева Светлана Вячеславовна - кандидат биологических наук, доцент кафедры биологии, экологии и природопользования ФГБОУ ВО «Ульяновский государственный университет» Министерства образования и науки Российской Федерации

Адрес: 432000, г. Ульяновск, ул. Л. Толстого, д. 42

E-mail: erm_iv@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.