МОДЕЛИРОВАНИЕ УРОВНЯ ЗАБОЛЕВАЕМОСТИ БОЛЕЗНЯМИ ОРГАНОВ ДЫХАНИЯ НАСЕЛЕНИЯ ПРИМОРСКОГО КРАЯ
A.Г. Гузенко1, канд. техн. наук, доцент
С.В. Кучерова2, канд. физ.-мат. наук, доцент
B.В. Ващенко1, старший преподаватель
Тихоокеанский государственный медицинский университет Минздрава России 2Владивостокский государственный университет (Россия, г. Владивосток)
DOI:10.24412/2500-1000-2024-9-3-158-162
Аннотация. Болезни органов дыхания являются одной из ведущих причин заболеваемости и смертности в мире. Приморский край, как регион с уникальным климатом и экологическими условиями, может иметь свои специфические факторы риска, влияющие на здоровье населения. Моделирование заболеваемости поможет выявить связь между этими факторами и уровнем здоровья населения.
В результате исследования была разработана линейная регрессионная модель, которая позволит проанализировать уровень заболеваемости болезнями органов дыхания среди населения Приморского края и выявить ключевые факторы, оказывающие на него влияние.
Ключевые слова: статистические данные, факторный анализ, линейная регрессия, метод наименьших квадратов, критерии оценивания модели.
На протяжении многих лет заболевания органов дыхания остаются в центре внимания исследователей, медицинских специалистов и организаторов здравоохранения. В настоящее время нет четкой тенденции к уменьшению числа случаев этих заболеваний, что вызывает возрастающий интерес к изучению данной проблемы [12].
Уровень и характер заболеваемости населения определяются не только биологическими факторами, но и разнообразными социально-экономическими и природными условиями1. Это создает необходимость в выявлении наиболее значимых социально-экономических факторов, влияющих на заболеваемость дыхательными заболеваниями среди населения Приморского края.
Основной задачей работы является создание линейной регрессионной модели, описывающей зависимость числа заболевших болезнями органов дыхания в Приморском крае. Также будет проедена оценка адекватности модели и определение ключевых факторов, влияющих на уровень заболеваемости.
Для построения модели заболеваемости выбраны социально-экономические факторы, основанные на официальных данных, представленных в ежегодных сборниках Территориального органа Федеральной службы государственной статистики по Приморскому краю (Приморскстат) за период с 2010 по 2022 годы. В исследовании использовались методы дисперсионного, корреляционного и регрессионного анализа.
Для проведения исследования были выбраны следующие четыре фактора: xl -выбросы загрязняющих веществ в атмосферный воздух от стационарных источников, тыс. т; X2 - ожидаемая продолжительность жизни (оба пола), число лет; xз -численность безработных (в среднем за год), тыс. чел.; X4 - среднесписочная численность работников вредных производств, тыс. чел.3 Вредные производства включают в себя: добыча полезных ископаемых и организация сбора; утилизации отходов, деятельность по ликвидации загрязнений; химическое производство. В качестве зависимой переменной у выступает уровень заболеваемости населения болезнями органов дыхания, тыс. чел. (за-
регистрировано заболеваний у пациентов с диагнозом, установленным впервые в жизни). Все статистические данные являются агрегированными.
Заболеваемость населения Приморского края в период 2010-2022 гг. имеет незначительную тенденцию к росту (см. рис. 1).
Рис. 1. Уровень заболеваемости населения Приморского края в период 2010-2022 гг.
На основе собранных данных построена множественная линейная регрессия
у = 3282,85 + 0,06х1 - 35,43х2 - 3,55х3 + 2,3х4 + 8,
где у - зависимая переменная; xn - независимые переменные; a - свободный коэффициент; Ьп - коэффициенты регрессии; е - остаточные величины.
Далее проведен анализ качества полученной модели по критериям, представленным в таблице [3-6].
Таблица. Результаты анализа четырехфакторной модели
Критерий Числовое значение Вывод
Множественный коэффициент корреляции 0,912 Связь между результативным признаком и всем набором исследуемых факторов характеризуется как весьма высокая (по шкале Чеддока) [7]
Множественный коэффициент детерминации 0,833 Модель объясняет 83,3% изменчивости заболеваемости органов дыхания
Критерий Фишера 9,951 Подтвердил статистическую значимость и надежность модели в целом (3,838 - табличное значение)
Статистика Стьюдента = 3,22, Ь2 = -2,73, Нз = -4,37 Показала статистическую значимость и надежность параметров а, Ь2 и Ь3 уравнения регрессии (2,31 - табличное значение)
Средняя ошибка аппроксимации ~ 2,16% Свидетельствует о хорошем подборе модели к исходным данным, так как ее значение не превышает порога 10%
Анализ модели показал ее адекватность и соответственно возможность ее дальнейшего применения в прогнозировании уровня заболеваемости населения.
Для модели множественной линейной регрессии факторы должны отвечать следующим требованиям:
1. Быть количественно измеримы.
2. Не должны быть интеркоррелированы и находиться в точной функциональной связи.
Первое условие выполнено. Второе условие не соблюдено, так как обнаружена мультиколлинеарность факторов:
/Переменные
У
*3
V
Хл
У 1
0,05092
Xi
0,05092 1
0,271592 -0,77026 0,68023 0,568193 0,638434 -0,20021
*2
0,271592
*3
0,68023
*4 \
0,638434
0,77026 0,568193 -0,20021
1
0,85314 0,384397
-0,85314 1
-0,58604
0,384397 0,58604 1
/
Значения парных коэффициентов корреляции rXiX? « -0,77 и « -0,85
превышают значение 0,7, что подвергает сомнению адекватность модели4.
Необходимо исключить мультиколлине-арность факторов. В результате анализа исключен фактор X2. Далее построена матрица парных коэффициентов корреляции, все значения межфакторых коэффициентов корреляции не превышают значения 0,7. После удаления из рассмотрения фактор
X2, исчезла коллинеарность и факторов xl и X2. Что подтверждает правильность исключения из анализа фактора X2.
Далее проведен анализ качества трех-факторной линейной модели регрессии, из которой на основе анализа доверительных интервалов были исключены факторы xl и X4.
Таким образом, получена парная линейная модель, хорошо аппроксимирующая исходные данные, имеет вид
y = 759,22 - 1,64x3 + б,
где хз - численность безработных (в среднем за год), тыс. чел.; коэффициент a показывает, что среднее число заболевших у составляет 759,22 тыс. чел. независимо от численности безработных xз; коэффи-
циент Ьз показывает, что с увеличением численности безработных на одну тысячу человек число заболевших в среднем уменьшится на 1,64 тыс. чел. (см. рис. 2).
800
if700 F | 600
Р % 500
л S
5 О 400
I щ
to -и g| 200
° Я
'и §
Поле корреляции / Correlation field
• • •
• » •
_K- - -1.6399x f 759,22
J
20
40
60
SO
100
120
Численность безработных, тыс. чел. / The number of unemployed, thousand реор1евание
Рис. 2. График простой линейной регрессии
Анализ качества парной линейной регрессии доказал адекватность модели.
Далее были протестированы остатки е данного уравнения. Исследование остат-
ков включало в себя проверку выполнения пяти предпосылок метода наименьших квадратов.
График зависимости остатков от теоретических значений зависимой переменной
показал случайный характер остаточных величин. Средняя величина остатков близка к нулю. Тест Гольдфельда-Квандта подтвердил наличие гомоскедастичности остатков. Критерий Дарбина-Уотсона выявил наличие положительной автокорреляции остатков. Для устранения автокорреляции был использован обобщённый метод наименьших квадратов. Подчинение остатков нормальному распределению определенно визуально.
В результате исследования была разработана парная линейная модель, демонстрирующая зависимость уровня заболеваемости населения болезнями органов дыхания от численности безработных в Приморском крае. Согласно результатам регрессионного анализа, с увеличением числа безработных наблюдается снижение количества заболевших. Адекватность модели была подтверждена с помощью методов дисперсионного, корреляционного и регрессионного анализа. Одним из основных ограничений исследования стало агрегирование статистических данных, предоставленных Приморскстатом.
Полученные результаты могут быть полезны для прогнозирования уровня заболеваемости болезнями органов дыхания
Результаты исследования можно прокомментировать, акцентируя внимание на ограниченности и агрегировании статистических данных. Одним из значимых антропогенных факторов, влияющих на здоровье населения, является загрязнение воздуха. Хотя крупные промышленные предприятия Приморского края, негативно влияющие на атмосферу, уже прекратили свою деятельность, муссонный климат региона и влияние Тихого океана продолжают оказывать серьезное воздействие на качество воздуха. Это обстоятельство стало причиной исключения из модели таких факторов, как выбросы загрязняющих веществ от стационарных источников и среднесписочная численность работников на вредных производствах.
В современных условиях наблюдается тенденция к росту безработицы. При анализе показателей безработицы в России следует учитывать, что уровень безработицы рассчитывается Федеральной службой государственной статистики на основе экономически активного населения страны. Также стоит отметить, что многие безработные не обращаются в медицинские учреждения и предпочитают заниматься самолечением.
среди населения Приморского края.
Библиографический список
1. Антонов Н.С., Сахарова Г.М., Русакова Л.И., Салагай О.О. Динамика заболеваемости болезнями органов дыхания среди населения Российской Федерации в 2010-2022 гг. // Медицина. - 2023. - №3. - С. 1-17.
2. ПогореловА.Р., ГодованецЕ.Т., Гайчукова Е.А. Региональные особенности динамики и территориальных различий заболеваемости взрослого населения Приморского края болезнями органов дыхания // Географическая среда и живые системы. - 2022. - №2. -С. 55-71.
3. Голубова Т.Н., Овсянникова Н.М., Махкамова З.Р., Ткаченко И.Ю. Множественный регрессионный анализ как подход в комплексной оценке показателей по туберкулезу в Республике Крым // Медицина. - 2021. - №2. - С. 100-112.
4. Никулина С.Ю., Шишкова К.Ю., Чернова А.А., Шульман В.А. Прогнозирование развития фибрилляции предсердий методом множественной логистической регрессии // Терапия. - 2021. - №9. - С. 66-74.
5. Мудров В.А. Алгоритмы регрессионного анализа в биомедицинских исследованиях с помощью пакета программ SPSS // Забайкальский медицинский вестник. - 2020. - №2. -С. 177-190.
6. Ядгаров М.Я., Берикашвили Л.Б., Каданцева К.К., Кузовлев А.Н., Переходов С.Н., Лихванцев В.В. Многофакторный анализ в клинической медицине // Анестезиология и реаниматология. - 2021. - №5. - С. 64-70.
7. Мудров В.А. Алгоритмы корреляционного анализа данных в биомедицинских исследованиях с помощью пакета программ SPSS // Забайкальский медицинский вестник. -2020. - №2. - С. 169-176.
SIMULATION OF POPULATION MORBIDITY BY RESPIRATORU DISEASES IN
PRIMORYE TERRITORY
A.G. Guzenko1, Candidate of Technical Sciences, Associate Professor
S.V. Kucherova2, Candidate of Physical and Mathematical Sciences, Associate Professor
V.V. Vashchenko1, Senior Lecturer
1Pacific State Medical University
2Vladivostok State University
(Russia, Vladivostok)
Abstract. Respiratory diseases are one of the leading causes of morbidity and mortality worldwide. Primorsky Territory, as a region with a unique climate and ecological conditions, may have specific risk factors that affect the health of the population. Modeling morbidity will help identify the relationship between these factors and the health status of the population.
As a result of the study, a linear regression model was developed, which will allow for the analysis of the level of morbidity from respiratory diseases among the population of Primorsky Territory and identify the key factors influencing it.
Keywords: statistical data, factor analysis, linear regression, the least squares method, criteria for evaluating the model.