Научная статья на тему 'О ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ ЛИНЕЙНОГО РЕГРЕССИОННОГО АНАЛИЗА ПРИ ПРОГНОЗИРОВАНИИ СОСТОЯНИЯ ЗДОРОВЬЯ В ЗАВИСИМОСТИ ОТ ФАКТОРОВ ОКРУЖАЮЩЕЙ СРЕДЫ'

О ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ ЛИНЕЙНОГО РЕГРЕССИОННОГО АНАЛИЗА ПРИ ПРОГНОЗИРОВАНИИ СОСТОЯНИЯ ЗДОРОВЬЯ В ЗАВИСИМОСТИ ОТ ФАКТОРОВ ОКРУЖАЮЩЕЙ СРЕДЫ Текст научной статьи по специальности «Клиническая медицина»

CC BY
28
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Гигиена и санитария
Scopus
ВАК
CAS
RSCI
PubMed
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по клинической медицине , автор научной работы — А П. Барановский, К Г. Косулин, Л К. Квартовкина

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ ЛИНЕЙНОГО РЕГРЕССИОННОГО АНАЛИЗА ПРИ ПРОГНОЗИРОВАНИИ СОСТОЯНИЯ ЗДОРОВЬЯ В ЗАВИСИМОСТИ ОТ ФАКТОРОВ ОКРУЖАЮЩЕЙ СРЕДЫ»

Таким образом, поведенческие факторы риска (курение, употребление алкоголя, нарушение режима и кратности питания, игнорирование физкультуры и др.) присущи значитель-

Методы исследования

КОЛЛЕКТИВ АВТОРОВ. 1991

УДК 614.7:312.6

А. П. Барановский, К. Г. Косулин, Л. К. Квартовкина

О ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ ЛИНЕЙНОГО РЕГРЕССИОННОГО АНАЛИЗА ПРИ ПРОГНОЗИРОВАНИИ состояния ЗДОРОВЬЯ в ЗАВИСИМОСТИ ОТ ФАКТОРОВ

ОКРУЖАЮЩЕЙ СРЕДЫ

Волгоградские медицинский и политехнический институты

В последнее время много внимания уделяется вопросам количественной взаимосвязи между показателями здоровья и качеством окружающей среды с выходом на прогнозирование уровней этих показателей у различных континген-тов населения. Для прогнозирования наиболее широко используется метод множественной корреляции (регрессионный анализ) [1, 3, 4, 6].

Приведем результаты прогнозирования среднемесячной заболеваемости острыми респираторными заболеваниями (ОРЗ) у детей в возрасте до 14 лет по одному из районов города. Зависимость заболеваемости ОРЗ от атмосферных загрязнителей и климатических факторов имеет следующий вид:

(/= 103,2—37,6*|—62,6*2+119,4*з—7,2*4+310,8*ь— — 108,6*6— 1,2*7+1,4*8—0,27*9,

где у — среднемесячная заболеваемость ОРЗ (количество случаев на 1000 детского населения); х\—*6 — среднемесячные концентрации (в миллиграммах на 1 м3) пыли, сернистого ангидрида, двуокиси азота, сероводорода и формальдегида соответственно; *7—*9— среднемесячные показатели климатических факторов. Коэффициент множественной корреляции для данного уравнения равен 0,75.

При анализе уравнения обращают на себя внимание отрицательные значения коэффициентов у ряда загрязнителей в регрессионной модели (пыль, сернистый ангидрид, сероводород, формальдегид). Аналогичные отрицательные значения коэффициентов при аргументах регрессионного уравнения встречаются и в других работах. А. С. Бабаджанов [i] установил зависимость заболеваемости ОРЗ от атмосферных загрязнителей:

{/=953,2—24,1*,+4,64*2—0,84*з—3,28*4—0,1*5—30,5*6,

где *|—*б — среднегодовые концентрации окислов серы, аммиака, пыли, сернистого ангидрида, окиси углерода и двуокиси азота соответственно. Д. К. Соколовым и соавт. [6] выявлена взаимосвязь между смертностью женщин в возрасте от 40 до 44 лет от злокачественных опухолей бронхов, трахеи и легких и уровнем загрязнения атмосферного воздуха и природно-климатическими условиями:

у =3,53*1—5,12*2—3,05*3+4,13*4+0,01*5+0,005*6+ +0,008*7—0,007*8—0,01*9+0,002*10+0,009*п+0,002*12,

где х\—*6 — среднегодовые концентрации пыли, сернистого ангидрида, окислов азота, сажи, окиси углерода и сероводорода соответственно.

Математическое толкование отрицательного знака у коэффициента определенного аргумента, не имеющего в модели отрицательных значений, состоит в том, что при повышении численного значения этого аргумента снижается значение функции. Например, при увеличении концентрации сернистого ангидрида (согласно полученному уравнению) произойдет снижение детской заболеваемости на определенную величину. Это противоречит не только накопленному гигиеной опыту, но и здравому смыслу, т. е. в данном случае представленное уравнение не имеет биологического смысла.

Подобные отрицательные коэффициенты при аргументах регрессионного уравнения возникают из-за специфики математических расчетоз. Это положение иллюстрирует рис. 1, на котором представлены данные заболеваемости, включаемые в расчеты при моделировании (а) и концентрации загрязнителя (б). Анализируя эти графики, можно заметить, что отрицательный знак в регрессионной модели обусловлен совпадением во времени максимумов одного из них и минимумов другого. Величина коэффициента при аргументе будет за-висить от того, насколько часо такие совпадения встречаются в модели, а также от величин совпадающих на одном временном интервале максимумов и минимумов.

При прогнозировании зависимостей показателей здоровья и атмосферных загрязнителей используются усредненные данные. При использовании среднемесячных величин может возникнуть ситуация, когда сезонные изменения заболеваемости не совпадают с сезонными изменениями концентраций загрязнителей, носящими в конкретной местности стационарный характер [5]. В нашем случае это нашло отражение в отрицательных коэффициентах при аргументах регрессионного уравнения. При увеличении усреднения вводимых в модель данных (например, при использовании среднегодовых величин) подобная картина возникает, если концентрации загрязнителя имеют тенденцию к снижению, а заболеваемость, напротив, к увеличению.

Эти неточности прогнозирования основаны на предположении, что заболеваемость линейно изменяется при изменении концентраций загрязнителей. Таким образом, применение линейного регрессионного анализа приводит к значительному

Рис. 1. Образование отрицательного значения коэффициента при расчете уравнения линейной регрессии.

По оси абсцисс — время (в усл. ед.); по оси ординат — уровни факторов (в усл. ед.). а — величины заболеваемости, включаемые в расчеты при моделировании, 6 — концентрации загрязнителя.

0 2 4 6 в Ю 12

3 а

l---1

I I__

/ !

4 5

О 1Т 2Т ЗТ 4Г 5Т 6Т 7Т ВТ

Рис. 2. Динамика изменения заболеваемости ОРЗ при длительном повышении концентрации сернистого ангидрида.

Здесь и на рис. 3 по оси абсцисс — время (в сут); по оси ординат — уровни факторов (в усл. ед.). а — концентрация сернистого ангидрида; б — уровень заболеваемости ОРЗ.

у=к-х+Т■

dx dt

¡/=72,15х+527

dx dt

где х — среднее значение концентрации сернистого ангидрида dx

приращение концентрации за-

за 16,6 сут (в мг/м );

dt

Рис. 3. Динамика изменения заболеваемости ОРЗ при кратковременном повышении концентрации сернистого ангидрида.

2

I----1

I_1_I_I_1-1-L.

п 2Т ЗТ 4Т 5Т

упрощению имеющихся зависимостей, а в ряде случаев — к искажению биологического смысла описываемых явлений.

Биологической некорректности можно избежать усложнив модель. Есть два возможных варианта ее усложнения. Первый вариант — учет нелинейного характера зависимости заболеваемости от концентраций загрязнителей, второй — построение модели с учетом динамических характеристик происходящих процессов на основе методов статистической динамики [2].

Мы воспользовались вторым методом, чтобы исследовать динамику заболеваемости при воздействии загрязнителя, который имел отрицательный коэффициент в регрессионном уравнении. В качестве загрязнителя был выбран сернистый ангидрид, период наблюдения — с января по март. При моделировании использовались среднесуточные данные по концентрации сернистого ангидрида и заболеваемости. В результате проведенных расчетов получено дифференциальное уравнение следующего вида:

Уравнение будет достоверно описывать изменение заболеваемости минимум за период времени (Тл — достоверный период наблюдения), равный 16,6 сут. С учетом численных значений коэффициентов уравнение приобретает следующий вид:

грязнителя за 16,6 сут.

Чтобы более полно представить биологический смысл полученного дифференциального уравнения, предлагаем обратиться к его графической интерпретации (рис. 2 и 3). По оси абсцисс отложены временные интервалы, соответствующие ранее вычисленному периоду ТА. Ось ординат не имеет размерности, поскольку в данном случае представлена качественная характеристика изменений концентрации загрязнителя и величины заболеваемости.

На кривой а (см. рис. 2) представлена динамика изменения концентрации сернистого ангидрида. Участок 1 этой кривой соответствует средней концентрации загрязнителя до ее повышения, участок 2 отображает повышение среднего уровня концентрации загрязнителя, наблюдающееся в течение нескольких периодов времени Тл участок 3 — снижение концентрации до прежнего уровня. На кривой б этого графика — динамика изменений уровней заболеваемости. Согласно представленному дифференциальному уравнению при повышении средней концентрации загрязнителя в течение нескольких периодов времени Тл произойдет повышение заболеваемости с выходом на максимальный ее уровень в течение первого периода Гд (участок 2). Величина изменения заболеваемости

в этот период будет определяться как коэффициентом к (72,15), так и коэффициентом Т (527,0) при производной. После первого периода Тл произойдет снижение заболеваемости до уровня, определяемого величиной коэффициента к (участок 3), после чего она останется на этом уровне в течение всего периода повышения концентрации загрязнителя. После снижения концентрации сернистого ангидрида до прежней средний уровень заболеваемости снизится в течение одного периода 7Д на величину, определяемую коэффициентом при производной (участок 4).

Рассмотрим случай кратковременного повышения концентрации загрязнителя (см. рис. 3). Как и на рис. 2, на верхней кривой представлена динамика изменения концентрации сернистого ангидрида. В период кратковременного воздействия загрязнителя произойдет повышение заболеваемости на период времени Гд и на величину, определяемую обоими коэффициентами дифференциального уравнения (кривая б, участок 2). После снижения концентрации до прежней произойдет снижение среднего уровня заболеваемости на период времени Тл и на величину коэффициента при производной (участок 3). Интересно, что согласно данному дифференциальному уравнению однократный массивный выброс будет действовать так же, как и умеренное повышение концентрации на период времени Та.

Предложенный вариант прогнозирования в данном случае ни в коей мере не конкурирует с регрессионным анализом. Он был использован для качественной оценки динамики событий, некорректно интерпретируемых регрессионным анализом (отрицательное значение коэффициента у аргумента уравнения). В перспективе при создании системы подобных дифференциальных уравнений для каждого атмосферного загрязнителя и наличии данных о сезонном характере распределения концентраций загрязнителей в данной конкретной местности возможно прогнозирование уровней заболеваемости.

Литература

1. Бабаджанов А. С. // Гиг. и сан,— 1989,— № 11,— С. 32— 33.

2. Иващенко Н. Н. Автоматическое регулирование.— М., 1973.

3. Карелин А. О., Лебедев С. В. // Гиг. и сан,— 1989.— № П.— С. 65—66.

4. Осипян В. А., Соколов Д. К. // Там же.— 1989.— № 12,—

С. 43-46.

5. Полищук А. И., Землянко Е. М. // Охрана окружающей среды и использование вторичных ресурсов.— М., 1990.— Вып. 1,—С. 1—6.

6. Прогноз заболеваемости населения в связи с изменением факторов окружающей среды большого города: Метод, рекомендации / Соколов Д. К. и др.— М., 1987.

Поступила 11.09.90

i Надоели баннеры? Вы всегда можете отключить рекламу.