Анализ факторов, влияющих на заболеваемость клещевым энцефалитом, с использованием логико-вероятностных и корреляционно-регрессионных моделей
В.Б. Бериков1 ([email protected]), Г.С. Лбов1, Г.Л. Полякова1 ([email protected]),
В.Н. Бахвалова2 ([email protected]), В.В. Панов2,
Л.Д. Щучинова3 ([email protected]), П.А. Гладкий4 ([email protected]),
Ю.С. Коротков5 ([email protected]), А.Я. Никитин6 ([email protected]), С.Л. Лутова7,
Л.М. Банникова8, Л.И. Козловский8, В.И. Баштанник9, Э.А. Мезенцева9,
В.Н. Михеев10, Н.И. Шульгина11 ([email protected]), М.К. Герасимов1,
В.А. Гусев1 ([email protected]), П.П. Маслов12 ([email protected]), И.А. Пестунов13
([email protected]), О.В. Морозова14 ([email protected])
1 Институт математики им. С.Л. Соболева Сибирского отделения РАН, г. Новосибирск ([email protected])
2 Институт систематики и экологии животных СО РАН, г. Новосибирск ([email protected])
3 Управление Роспотребнадзора по Республике Алтай, г. Горно-Алтайск
4 Медсанчасть № 168 г. Новосибирска
5 ГУ «Институт полиомиелита и вирусных энцефалитов им. М.П. Чумакова» РАМН, Москва ([email protected])
6 ФГУЗ «Иркутский научно-исследовательский противочумный институт Сибири и Дальнего Востока» Роспотребнадзора ([email protected])
7 Городская поликлиника № 14 г. Новосибирска
8 ФБУЗ «Центр гигиены и эпидемиологии в Новосибирской области»
9 ФГУЗ «Центр гигиены и эпидемиологии Советского района г. Новосибирска»
10 ФБУН «Государственный научный центр вирусологии и биотехнологии «Вектор» Роспотребнадзора, пос. Кольцово Новосибирской области
11 Управление Роспотребнадзора по Новосибирской области
12 Новосибирский государственный технический университет
13 Институт вычислительных технологий СО РАН, г. Новосибирск
14 Институт химической биологии и фундаментальной медицины СО РАН, г. Новосибирск
Резюме
Проведен совместный анализ многомерных временных рядов ежегодных показателей заболеваемости клещевым энцефалитом (КЭ) населения Новосибирска, Иркутска и Горно-Алтайска, среднемесячных температур, относительной влажности воздуха, количества осадков, среднегодовой солнечной активности, выраженной в числах Вольфа, и охвата вакцинацией с использованием логико-вероятностных и корреляционно-регрессионных моделей. Общими для трех природных очагов КЭ (в Новосибирске, Иркутске и Горно-Алтайске) значимыми факторами являются относительная влажность воздуха ноября предшествующего года, относительная влажность воздуха апреля и июня, а также температура июня текущего года, которые были выявлены как при построении логической решающей функции (имеющей форму дерева решений), так и при состав-
Analysis of Factors Influencing the Incidence of Tick-Borne Encephalitis, Using Logical-and-Probabilistic and Correlation-Regression Models
V.B. Berikov1 ([email protected]), G.S. Lbov 1, G.L. Polyakova1 ([email protected]), V.N. Bakhvalova2 ([email protected]), V.V. Panov2, L.D. Shchuchinova3 ([email protected]), P.A. Gladky4 ([email protected]), Yu.S. Korotkov5 ([email protected]), A.Ya. Nikitin6 ([email protected]), S.L. Lutova7, L.M. Bannikova8, L.I. Kozlovsky8, V.I. Bashtannik9, E.A. Mezentseva9, V.N. Miheev10, N.I. Shulgina11 ([email protected]), М.К. Gerasimov1, V.A. Gusev1 ([email protected]), P.P. Maslov12 ([email protected]), I.A. Pestunov13 ([email protected]), O.V. Morozova14 (mov@ niboch.nsc.ru)
1 S.L. Sobolev Institute of Mathematics of the Siberian Branch of the Russian Academy of Sciences, Novosibirsk (im@math. nsc.ru)
лении уравнения регрессии. Показана однонаправленная положительная зависимость между солнечной активностью и заболеваемостью КЭ в Новосибирске и Иркутске, однако в Горно-Алтайске такая корреляция после 2001 года отсутствовала. Значимого влияния вакцинации на заболеваемость КЭ не выявлено.
Ключевые слова: относительные показатели заболеваемости клещевым энцефалитом, температура воздуха, относительная влажность воздуха, количество осадков, шлнечная активность, вакцинация, логико-вероятностные и корреляционно-регрессионные модели
2 Institute of Animal Systematics and Ecology of the Siberian Branch of the Russian Academy of Sciences, Novosibirsk (office@eco. nsc. ru)
3 Service for Surveillance on Consumer Rights Protection and Human Well-Being of the Altai Republic, Gorno-Altaisk
4 Health Part № 168 of Novosibirsk
5 M. Р. Chumakov Institute of Poliomyelitis and Viral Encephalitis of the Russian Academy of Medical Sciences, Moscow (institute@poliomyelit. ru)
6 Irkutsk Antiplague Research Institute of Siberia Far East of Federal Service for Surveillance on Consumer Rights Protection and Human Well-Being ([email protected])
7 City Polyclinic № 14 of Novosibirsk
8 Center for Hygiene and Epidemiology in the Novosibirsk Region
9 Center for Hygiene and Epidemiology in Soviet Area of Novosibirsk
10 State Research Center of Virology and Biotechnology «Vector», Koltsovo, Novosibirsk Region
11 Service for Surveillance on Consumer Rights Protection and Human Well-Being of the Novosibirsk Region
12 Novosibirsk State Technical University
13 Institute of Computational Technologies of the Siberian Branch of the Russian Academy of Sciences, Novosibirsk
14 Institute of Chemical Biology and Fundamental Medicine
of the Siberian Branch of the Russian Academy of Sciences, Novosibirsk Abstract
Joint analysis of multidimensional time series of annual tickborne encephalitis (TBE) prevalence among Novosibirsk, Irkutsk and Gorno-Altaysk populations, monthly air temperatures, relative humidity, rainfalls, annual solar activity expressed as Wolfs numbers and vaccination rate was performed using logical-and-probabilistic and correlation-regression models. Common significant factors for three studied TBE natural foci were relative air humidity of November of preceding year, relative humidity of April and June as well as temperature of June of current year that were revealed by means of both decision tree and regression equation construction. Unidirectional positive correlation between solar activity expressed in Wolf's numbers and TBE rate was shown for Novosibirsk and Irkutsk but for Gorno-Altaysk such correlation after 2001 was absent. Significant influence of vaccination on TBE prevalence was not found.
Key words: tick-borne encephalitis prevalence, air temperature, relative air humidity, rainfall, solar activity, vaccination rate, logical-and-probabilistic and correlation-regression models
Введение
В настоящее время известно более 20-ти инфекционных агентов, переносимых клещами, включая вирусы, бактерии и простейшие. На территории России официально регистрируют заболеваемость клещевым энцефалитом (КЭ), иксодовым клещевым боррелиозом (ИКБ) и клещевым риккетсио-зом (КР).
К факторам, определяющим заболеваемость КЭ, традиционно относят численность клещей и их про-кормителей, уровень их инфицированности, масштабы акарицидных обработок и вакцинации, а также метеорологические и астрофизические факторы.
Для специфической профилактики КЭ в России применяют шесть инактивированных вакцин. Уровни иммунизации против КЭ в большинстве эндемичных областей России в среднем составляют 5% от общей численности населения [7].
Влияние внутрибиотопических факторов (обеспеченность кормом, хищники, болезни и др.), определяющих популяционную динамику членов паразитарных систем природно-очаговых инфекций и отражающихся на заболеваемости людей, осуществляется на фоне факторов более широкого зонального и регионального масштабов (тепло-обеспеченность, влажность воздуха и почвы, ко-
личество осадков, различные виды солнечной радиации и др.) [4, 28 - 31, 33]. Полагают, что одними из ведущих причин многократного увеличения заболеваемости населения КЭ в конце ХХ века в России, в том числе на Урале и в Сибири, стало потепление и повышение влажности [6, 7 - 10]. Так, в Иркутской области в течение 1993 - 2003 годов температура февраля повысилась на 6 °С и достигла -11 °С, а длительность безморозного периода увеличилась с 90 - 100 до 120 - 130 дней. За 1956 - 2003 годы на территории Иркутска и Иркутского района численность иксодовых клещей возросла в 57,5 раза, а заболеваемость клещевым энцефалитом - в 40,2 раза [6]. Показана возможность прогнозирования обилия клещей на основе анализа климатических факторов [12, 14, 15]. Связь между климатическими условиями и численностью клещей выявлена также в заповеднике «Столбы» Красноярского края (методом спектрального анализа временных рядов) [11, 12]. Зависимость заболеваемости КЭ от метеорологических факторов в Иркутской области была выражена в виде корреляционно-регрессионых моделей, для прогноза заболеваемости КЭ использовались уравнения регрессии [13]. Для юга Дальнего Востока и Западной Сибири было показано, что изменения заболеваемости людей КЭ по годам на 80 - 90% определяются комплексом природных факторов [31]. Уравнения множественной регрессии, разработанные для достоверного прогноза заболеваемости в этих двух регионах, отличались по набору факторов: на Дальнем Востоке (в Приморье) достоверный прогноз получали в уравнении, учитывающем численность красно-серой полевки в предыдущем году и сумму осадков в августе предыдущего года, а в Западной Сибири (Кемеровская область) - обилие нимф на мелких млекопитающих в предыдущем году и сумму осадков за январь - февраль [31]. По мнению авторов, составление таких уравнений требует дифференцированного подхода, их следует разрабатывать для территорий не более масштаба области или мельче, поскольку учет заболеваемости ведется по административным единицам [31]. Это мнение согласуется с данными для двух западно-сибирских природных очагов КЭ: если в эндемичном районе Кемеровской области была выявлена положительная зависимость заболеваемости людей от обилия имаго клещей, то для антропургического природного очага КЭ Новосибирской области было показано, что ни многолетняя динамика обилия клещей, ни их вирусофорность не коррелировали с колебаниями заболеваемости населения [1, 2, 5, 31]. Влияние природных факторов на заболеваемость КЭ в Новосибирске было представлено в виде логических закономерностей с высокой прогнозирующей способностью [21, 23, 27, 40]. В Республике Алтай влияние природных факторов на заболеваемость КЭ ранее не анализировали [34]. Помимо климатических факторов, паразитарная система
КЭ, как и все экологические системы в биосфере Земли, находится под влиянием активности Солнца [4]. К классическим космофизическим индексам традиционно относят числа Вольфа (число пятен и их групп на диске Солнца).
Поскольку существуют как общие, так и индивидуальные закономерности для каждой территории, то для повышения статистической надежности прогноза проведен совместный анализ данных по разным эндемичным областям. Для обработки исходных данных использовали как стандартные корреляционно-регрессионные, так и логико-вероятностные модели. Последние представляют собой набор логических закономерностей, представленных на языке, близком к естественному языку логических суждений, отражающих внутренние причинно-следственные связи сложных объектов, и обладают достаточно высокой прогностичностью.
В процессе построения прогностической модели автоматически отбирались наиболее информативные характеристики для каждого рассматриваемого объекта, что повышало надежность результатов. Кроме того, логико-вероятностные модели не требуют таких предположений о классе распределений, как нормальность, линейная разделимость образов, независимость переменных. Модели были разработаны в Институте математики Сибирского отделения РАН под руководством профессора Г.С. Лбова [17 - 19, 38, 39]. Используемые алгоритмы построения логико-вероятностной модели основаны на идеологии, заложенной в программную систему ЛАСТАН, разработанную в ИМ СО РАН и предназначенную для построения деревьев решений в задачах распознавания образов, регрессионного анализа и анализа разнотипных временных рядов [20].
цель работы - анализ влияния природных факторов и вакцинации на заболеваемость КЭ населения Иркутска, Новосибирска и Горно-Алтайска с использованием логико-вероятностных и корреляционно-регрессионных моделей.
Материалы и методы
Для исследования были использованы следующие временные ряды:
• ежегодные относительные показатели заболеваемости КЭ (на 100 тыс. населения) в Иркутске, Новосибирске и Горно-Алтайске;
• среднемесячная температура воздуха (Т);
• среднемесячная относительная влажность воздуха (V);
• среднемесячное количество осадков (О);
• ежегодные показатели солнечной активности, выраженные числами Вольфа
• ежегодные показатели охвата населения вакцинацией против КЭ.
Был сформирован перечень общих факторов, по которым известны данные для указанных территорий. Временные ряды включали исходные дан-
ные для Иркутска и Новосибирска за 20 лет (с 1991 по 2010 г.) и для Горно-Алтайска за 16 лет (с 1995 по 2010 г.). Метеорологические данные были получены с метеостанций, находящихся в окрестностях Иркутска, Новосибирска и Горно-Алтайска.
Рассматривалась следующая формальная постановка задачи. Пусть некоторый объект (явление) описывается набором случайных характеристик X = (Х1,..., Хп), изменяющихся во времени. Необходимо на основе анализа информации, представляющей измерения этих характеристик в последовательные моменты времени (предыстории), обнаружить вероятностную зависимость значения целевой характеристики У (показателя заболеваемости КЭ) от предыстории в некоторый будущий момент времени.
В данной статье рассматриваются два варианта постановки задачи. В первом случае в таблице исходных данных каждая строка соответствует наблюдениям за один год (12 месяцев) начиная с октября - в силу специфики влияния метеорологических факторов на заболеваемость КЭ через воздействие не только на физиологическое состояние человека, но и на состояние естественных хозяев вируса, существенно зависящее от условий переживания неблагоприятных условий холодного периода года. Анализ влияния метеорологических факторов текущего года (последних 12 месяцев) на значение целевой переменной (показателя заболеваемости КЭ) и прогноз заболеваемости КЭ в текущем году выполнялись по значимым факторам за один год (т.е. осуществляется текущий прогноз). Во втором случае исходная таблица заменялась на новую, где для каждой строки (момента времени 1:) определялась последовательность предшествующих лет (так называемая предыстория). Каждая строка заменялась на предысторию, и предполагалось, что в конце года на основе данных о метеорологических факторах за к лет (предыстории длины к) выполняется оценка заболеваемости КЭ в будущем году (т.е. осуществляется заблаговременный прогноз). Введем обозначения: у\=(Т<-, Т,\'\Т Т1,..., Т'9) - данные о среднемесячных температурах воздуха, соответствующие году 1:; V = (VЦ VVУуУ90 и V = (ОО ОО < ..., О¿) - данные о среднемесячных влажности и осадках соответственно; X1 = (Ц..., Т<, Ц'2,01..., 0/2) - данные о природных факто рах в год 1, где нижние индексы метеорологических факторов обозначают порядковый номер месяца. Обучающая выборка для первого случая постановки задачи имеет вид V = [у^, у2', V', у3', У' }, а для второго - у = {X'-2,XX', У'+'} при предыстории три года.
Для обнаружения логических закономерностей использовались алгоритмы построения логических решающих функций в виде деревьев решений [18, 19, 21, 22, 24 -27, 40]. Из-за сложности статистической задачи (многомерность пространства переменных, малое число наблюдений, не-
стационарность) возникла необходимость в «огрублении» статистической информации - использовалось небольшое число интервалов значений переменных, включая показатель заболеваемости. При обработке исходных данных для переменной У было выбрано три интервала, то есть три образа. Первый образ определялся величиной показателя заболеваемости КЭ до 10 (низкая заболеваемость), второй - от 10 до 20 (средняя), третий - больше 20 (высокая). Дерево решений строилось путем разбиения пространства переменных на области с помощью алгоритма, осуществляющего направленный поиск варианта решения, оптимального по критерию минимизации оценки риска ошибочной классификации [19]. Выбор значимых переменных (факторов) выполнялся на основе принципов, заложенных в алгоритме случайного поиска с адаптацией (СПА) [16].
Для одновременной обработки исходных данных всех рассматриваемых регионов в обучающую выборку были введены булевы переменные, характеризующие принадлежность к региону каждого из временных рядов. При построении деревьев решений по специально сформированным тестовым выборкам оценивалась среднеквадратичная погрешность прогнозирования уровня заболеваемости, а анализируемые факторы упорядочивались по их важности.
Для оценки качества найденных решающих функций использовались метод разделения исходной выборки на обучающую и контрольную и метод «скользящего экзамена». При «скользящем экзамене» поочередно каждый объект (при текущем прогнозе - наблюдения за один год, при заблаговременном - предыстория соответствующей длины) исключается из выборки, на оставшейся части определяется решающая функция, с помощью которой затем выполняется прогноз для исключенного из выборки объекта. Прогнозируемое целевое значение данного объекта сравнивается с заданным (исходным) значением и используется для вычисления оценки ошибки прогноза, после чего объект возвращается в исходную выборку. Доля ошибок прогноза для всей выборки показывает качество алгоритма построения логической решающей функции [3, 25, 27]. Метод «скользящего экзамена» не требует задания вероятностных предположений о виде распределения.
Построение логико-вероятностных моделей влияния метеорологических факторов на уровень заболеваемости КЭ (текущий прогноз)
Для того чтобы определить общие значимые факторы, но не исключать специфику каждого региона, была выполнена совместная обработка информации по всем рассматриваемым регионам.
При построении логико-вероятностной модели получены следующие закономерности для текущего прогноза (через Р* обозначена байесов-
ская оценка вероятности правильной классификации для i-й закономерности, полученная согласно [19, стр. 96]):
Если (Vе [68,5%, 80,6%]) и (У<4е [64,5%, 75%]) и (У'6е [442,3%, 77%])и (Т'6е [13 °С4 17 °С]), то У '= 3; Р* = 0,75.
Если (V'~'е [68,5%, 80,6%]) и Vе [66,5%, 77%])
! t
и (7"6е [17 "C, 21 C]), то Y < = 2; P2 = 0,6.
Если (Vе [68,5%, 80,6%]) и {V¡е [46%, 64.5%]) и (V6е [(36,5%, 77%]) и (Г 6е [13 °С, 17 °С]), тоГ f= 1; P* = 0,75.
Если (V-е [80,5%, 89%]) и (V6f е [42,3%, 66,5%]) и (T6е [17 °С, 21 C]), то Y' = 1; P¡ = 0,75.
Построение логико-вероятностных моделей влияния метеорологических факторов на уровень заболеваемости КЭ (заблаговременный прогноз)
При заблаговременном прогнозе с учетом предыстории за три года для трех рассматриваемых регионов были получены следующие закономерности: Если (О91 > 58,2) и (О51-2 > 35,2),
то У+1 = 3; Р* = 0,85.
' 1 '
Если (О91 < 58,2) и (Т;-2 > 5,6 °С),
то У+1 = 3; Р2* = 0,73.
Если (О91 < 58,2) и (Т;-2 < 5,6 °С)
и (О; < 12,5) и ^ > 71,6%), то У 1+1 = 3; Р3* = 0,57.
Если (О91 < 58,2) и (Т;-2 < 5,6 °С)
и (О; < 12,5) и ^ < 71,6%), то У+1 = 2; Р4* = 0,5.
Если (О91 > 58,2) и (О;-2 < 35,2), то У '+1 = 2; Р5* = 0,57.
Если (О91 < 58,2) и (Т;-2 < 5,6 °С) и (О; > 12,5),
то У+1 = 1; Р* = 0,76.
Полученное дерево решений представлено на рисунке 1.
Построение корреляционно-регрессионных моделей влияния метеорологических факторов на уровень заболеваемости КЭ
Для создания регрессионной модели использовали алгоритм построения коллективного решения [19], состоящий из следующих этапов:
1. По исходной таблице с помощью процедуры бу-стинга (определенным образом организованного последовательного отбора объектов, включаемых в различные подвыборки [36]) был построен ансамбль деревьев решений/регрессии. При этом по специально отведенным тестовым выборкам оценивалась среднеквадратичная погрешность прогнозирования уровня заболеваемости.
2. С помощью пошагового регрессионного анализа подбиралась линейная модель такой сложности (сложность определяется числом включенных в модель переменных), для которой среднеквадратичная ошибка наиболее близка к полученной ошибке процедуры бустинга.
При построении уравнения регрессии было сформировано 25 вариантов дерева регрессии. Средняя ошибка прогнозирования на тестовых выборках оказалась равной 6,5.
При совместном анализе данных по Иркутску, Горно-Алтайску и Новосибирску получена следующая модель регрессии:
У1 = 63,9 + 0,63 ■ V* - 1,16 ■ Р - 0,5У/-1 + 11,6 ■ б,
4 6 11
где б - булева переменная, обозначающая принадлежность к Горно-Алтайску, то есть б = 1 для Горно-Алтайска и б = 0 для Новосибирска и Иркутска. Все коэффициенты и модель в целом значимы (а = 0,05); множественный коэффициент корреля-
Рисунок 1.
Дерево решений для заблаговременного прогноза заболеваемости КЭ одновременно для трех регионов. Левая ветвь, выходящая из каждой вершины, соответствует истинности, а правая - ложности высказывания, проверяемого в данной вершине
Y = 2
ции равен 0,7; Р = 0,00002, средняя ошибка регрессии Б = 6,7.
Необходимо отметить, что при рассмотрении каждого из регионов отдельно для получения надежных статистических выводов необходимо уменьшать сложность модели (число включаемых переменных). При построении соответствующих регрессионных моделей найденные значимые факторы либо совпали с факторами, выделенными при совместном анализе (для Иркутска - У6\ для Новосибирска - Т61), либо определялись предшествующими месяцами: У101-1 , У51 (для Горно-Алтайска).
Анализ влияния солнечной активности на уровень заболеваемости КЭ
Несмотря на зависимость рассматриваемых природных факторов от активности Солнца, последняя при их совместном анализе не оказалась определяющей характеристикой. Для выявления роли данного фактора рассмотрим его отдельно.
В результате обработки данных по заболеваемости КЭ в рассматриваемых регионах и числам Вольфа за 20-летний период в рамках логико-вероятностной модели, построенной одновременно для трех регионов, были получены логические закономерности, характеризующие влияние солнечной активности на заболеваемость КЭ (через 6 обозначена булева переменная, обозначающая принадлежность к Горно-Алтайску, а через у - булева переменная, обозначающая принадлежность к Иркутску):
1) Если (М £ [2,8; 19,5]) и (6 = 1), то Y 1 = 3; P'l = 0,8.
2) Если (М £ [2,8; 19,5]) и (6 = 0), то Y 1 = 1; Р2* = 0,8.
3) Если (М £ [19,5; 63,9]) и (6 = 1), то Y 1 = 1; Р3* = 0,8 (таким образом, для Горно-Алтайска активность Солнца, измеряемая в W, неоднозначно определяет уровень заболеваемости).
4) Если (М £ [19,5; 63,9]) и (6 = 0) и (у = 0), то Y 1 = 1; Р4* = 0,8.
5) Если (М £ [19,5; 63,9]) и (у = 1), то Y 1 = 1; Р5* = 0,7.
6) Если (М £ [63,9; 146,8]) и (6 = 1), то Y 1 = 3; Р' = 0,6.
7) Если (М £ [63,9; 146,8]) и (6 = 1), то Y 1 = 3; Р7* = 0,9.
8) Если (М 1 £ [63,9; 146,8]) и (у = 1), то Y 1 = 2; Р8* = 0,7.
Динамика солнечной активности и заболеваемости КЭ в Новосибирске и Иркутске приведена на рисунке 2, в Горно-Алтайске - на рисунке 3. Для упрощения анализа значения показателей нормированы от 0 до 1.
Результаты анализа динамики солнечной активности и уровня заболеваемости КЭ (см. рис. 2) в рассматриваемых регионах подтвердили однонаправленную зависимость между уровнем заболеваемости КЭ и солнечной активностью для Новосибирска [23] и Иркутска, а для Горно-Алтайска она подтверждается только до 2000 года. После пика заболеваемости КЭ населения в Иркутске и Новосибирске с 2000 года наблюдалось ежегодное снижение и заболеваемости, и солнечной активности [32].
Однако в Горно-Алтайске с 2000 года наблюдался высокий уровень заболеваемости при низкой солнечной активности, что свидетельствует о наличии дополнительных факторов, определяющих высокий уровень заболеваемости [32].
Общая для трех регионов модель регрессии имеет следующий вид:
1п У1 = 2,25 + 0,0016 ■ М 1 + 0,18 ■ 6,
где 6 - булева переменная, обозначающая принадлежность к Горно-Алтайску; все коэффициенты и модель в целом значимы (а = 0,05); множественный коэффициент корреляции Я = 0,54; Р = 0,014, средняя ошибка регрессии Б = 0,53.
Рисунок 2.
Динамика солнечной активности и заболеваемости КЭ в Новосибирске и Иркутске
х
w
со а>
-Q X
о о.
с о X
□ Числа Вольфа
Заболеваемость КЭ в Новосибирске Заболеваемость КЭ в Иркутске
Годы
ч«5 ч«5 ч«5 ч«5 ч<У Ч«5 ч<У Ч«5
Рисунок 3.
Динамика солнечной активности и заболеваемости КЭ в Горно-Алтайске
и 0) -Q
О
о.
CP
о X
0,003
Числа Вольфа
Заболеваемость КЭ в г. Горно-Алтайске
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Годы
Рисунок 4.
Динамика охвата вакцинацией против КЭ и заболеваемости КЭ в Новосибирске
(для наглядности данные нормированы от минимального до максимального значения по каждому показателю)
0,00
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Годы наблюдения
О) 6
Анализ влияния вакцинации на заболеваемость КЭ
При совместном рассмотрении влияния метеорологических факторов и вакцинации на заболеваемость КЭ в рамках корреляционно-регрессионных и логико-вероятностных моделей,
построенных для всех рассматриваемых регионов, вакцинация не вошла в перечень значимых факторов.
Уровни охвата вакцинацией населения эндемичных областей России в последние годы повсеместно возрастали. Так, количество иммуни-
Рисунок 5.
Динамика охвата вакцинацией против КЭ и заболеваемости КЭ в Иркутске
Вакцинация от КЭ
Заболеваемость КЭ
0,00
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Годы наблюдения
зированного населения Новосибирска возрастало и в 2010 году составляло приблизительно 4%.
Иммунизация населения против КЭ в Горно-Алтайске (Республика Алтай), Новосибирске и Иркутске проводится преимущественно вакциной Энцевир производства НПО «Микроген» (г. Томск).
Анализ динамики охвата вакцинацией против КЭ и уровня заболеваемости КЭ для Новосибирска и Иркутска (рис. 4, 5) выявил слабую обратную зависимость, а для Горно-Алтайска корреляция отсутствовала (рис. 6). Несмотря на высокий (40%) уровень охвата иммунизацией населения против КЭ в Республике Алтай, показатели заболеваемости превышали среднероссийские приблизительно в 10 раз [34].
С использованием логико-вероятностных и корреляционно-регрессионных моделей найдены закономерности, отражающие влияние метеорологических и астрофизических факторов на заболеваемость КЭ населения Новосибирска, Иркутска и Горно-Алтайска. При проведении анализа использовалась гипотеза, что жизненный цикл клеща составляет три года. Отобранный комплекс характеристик включает имеющиеся факторы, общие для трех регионов за рассматриваемый период времени (1991 - 2010 гг.). Особый интерес (с точки зрения теории солнечно-биосферных связей) представляет влияние солнечной активности на заболеваемость КЭ. Практическое
значение имеет также вопрос о наличии взаимосвязи между охватом вакцинацией населения и заболеваемостью КЭ. Поэтому роль указанных факторов исследована в работе отдельно. Надежность выводов проверялась методом «скользящего экзамена», а также контролем выполнения основных требований к регрессионной модели (отсутствие мультиколлинеарности переменных и вырожденности обращаемой матрицы и т.д.). Необходимо отметить, что решаемая проблема отличается высокой степенью стохастической неопределенности, а также отсутствием в настоящий момент данных о многих потенциально важных факторах, влияющих на заболеваемость. К числу таких факторов можно отнести, например, данные о соотношении субтипов вируса и о патогенности штаммов, циркулирующих в исследуемое время на каждой из рассматриваемых территорий. Сбор указанных данных и их анализ планируется провести на дальнейшем этапе работы.
Выводы
1. При построении общей модели для прогнозирования заболеваемости КЭ для трех природных очагов определяются общие значимые факторы, такие как относительная влажность воздуха ноября предшествующего года, относительная влажность воздуха апреля и июня,
Рисунок 6.
Динамика охвата вакцинацией против КЭ и заболеваемости КЭ в Горно-Алтайске
1,00
Rai^i iMuai IMQ Г»Т k'f^
Qañn пораолллгти
0,00
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Годы наблюдения
а также температура июня текущего года. Необходимо отметить совпадение результатов анализа зависимости заболеваемости КЭ от природных факторов с применением логико-вероятностных моделей при текущем прогнозе и уравнения регрессии.
2. При построении общей логико-вероятностной модели для заблаговременного прогноза заболеваемости КЭ за год до прогнозируемого периода с учетом двух прошлых лет одновременно для трех эндемичных областей некоторые значимые факторы отличаются от выявленных при текущем прогнозе. Относительная влажность воздуха в осенний период октября - ноября предшествующего года оказалась общим фактором, определяющим уровни заболеваемости КЭ при текущем и заблаговременном прогнозах. При этом при предварительном прогнозе заболеваемости КЭ определяющими также оказались количество осадков в апреле и сентябре предыдущего года и температура воздуха в апреле и количество осадков в мае за три года до анализируемого, что не соответствовало уравнениям множественной регрессии ни для Дальнего Востока (с необходимостью учета количества осадков в августе), ни для Кемеровской области (с определяющими осадками в январе - феврале) [31]. Выявленные отличия могут объясняться глобальными изменениями климата в направлении потепления и повышения влажности за последние 25 лет
под действием антропогенной трансформации природных очагов КЭ. Возможно, локальные особенности обусловлены динамикой паразитарной системы КЭ, поскольку влияние природных факторов на заболеваемость КЭ может быть как прямым, так и опосредованным характеристиками сопряженных паразитарных систем. Необходимо отметить, что из всех анализируемых природных факторов наиболее существенное влияние оказывают влажность воздуха и количество осадков, а не температура и солнечная активность. Известно, что условия развития иксодовых клещей в контитентальном климате Новосибирска и Иркутска не являются оптимальными - при достаточной теплообеспеченности их лимитирует дефицит влаги. Возможно, повышение влажности может увеличивать репродуктивную активность клещей и адаптированного к ним вируса КЭ.
3. Изменение активности Солнца, измеряемой числами Вольфа, неоднозначно приводит к изменению уровня заболеваемости КЭ. Для Новосибирска и Иркутска сохраняется однонаправленная зависимость между уровнями заболеваемости КЭ и солнечной активностью, а для Горно-Алтайска она подтверждается только до 2000 года, а затем заболеваемость КЭ возрастает при снижении солнечной активности.
4. Иммунизация против КЭ в настоящее время не определяет уровней заболеваемости из-за
низкого охвата вакцинацией населения Новосибирской и Иркутской областей и из-за возможного несоответствия вакцинных штаммов современным изолятам вируса КЭ в Горном Алтае. ■
Данная работа проводилась при частичной финансовой поддержке Междисциплинарного интеграционного проекта Сибирского Отделения РАН № 83, поддержке РФФИ (проекты № 10-01-00113-а, 11-07-00346а, 11-07-12083-офи-м-2011).
Литература
1. Бахвалова В.Н., Добротворский А.К., Панов В.В. и др. Временная изменчивость компонентов паразитарной системы клещевого энцефалита и их связь с заболеваемостью людей / Материалы Всероссийской научной конференции «Современные научные и прикладные аспекты клещевого энцефалита» (к 70-летию открытия вируса клещевого энцефалита). - М., - 2007. С. 140, 141.
2. Бахвалова В.Н., Морозова О.В., Морозов И.В. Свойства популяции вируса клещевого энцефалита, циркулировавшего в 1980 - 2006 гг. на территории Новосибирской области // Бюллетень СО РАМН. 2007. № 4 (126). С. 41 - 48.
3. Бериков В.Б., Лбов Г.С. Оценивание качества таксономических деревьев решений и кластерного ансамбля / Интеллектуализация обработки информации: 8-я Международная конференция. Республика Кипр, г. Пафос, 17 - 24 октября 2010 г.: Сборник докладов. - М.: МАКС Пресс, 2010. С. 13 - 16.
4. Владимировский Б.М., Темурьянц Н.А. Влияние солнечной активности на биосферу. - М.: Изд-во МНЭПУ 2000. - 98 с.
5. Добротворский А.К., Бахвалова В.Н., Харитонова Н.Н., Сапегина В.Ф. Динамика параметров паразитарной системы клещевого энцефалита в условиях северной лесостепи Приобья // Сиб. экол. журнал. 1994. Т. 1. № 4. С. 369 - 375.
6. Злобин В.И., Данчинова Г.А., Сунцова О.В., Бадуева Л.Б. Климат как один из факторов, влияющих на уровень заболеваемости клещевым энцефалитом / Изменение климата и здоровье России в XXI веке. - М.: АдамантЪ, 2004. С. 121 - 124.
7. Злобин В.И. Эпидемиологическая обстановка и проблемы борьбы с клещевым энцефалитом в Российской Федерации // Бюллетень сибирской медицины. 2006. № 5 (приложение № 1). С. 16 - 23.
8. Измеров Н.Ф., Ревич Б.А., Коренберг Э.И. Оценка влияния потепления климата на здоровье населения - новая задача профилактической медицины // Вестник РАМН. 2005. № 11. С. 33 - 37.
9. Команденко Н.И., Жукова Н.Г. Некоторые дискуссионные вопросы проблемы клещевого энцефалита // Бюллетень сибирской медицины. 2006. № 5 (приложение № 1). С. 57 - 62.
10. Коренберг Э.И., Ковалевский Ю.В. Основные черты эко-эпидемиологии клещевого энцефалита // Вестник инфектологии и паразитологии. http://www.nedug.ru/lib/lit/infect/01oct/infect145/ infect.htm (дата обращения - 28.05.2011 г.)
11. Коротков Ю.С., Акулова Л.М., Хазова Т.Г. и др. Циклические изменения численности таежного клеща в заповеднике «Столбы» // Мед. паразитология и паразитарные болезни. 1992. № 3. С. 7 - 10.
12. Коротков Ю.С. Постепенная изменчивость паразитарной системы клещевого энцефалита // Вопросы вирусологии. 2005. № 3. С. 52 - 56.
13. Коротков Ю.С., Никитин А.Н., Антонова А.М. Роль климатических факторов в многолетней динамике заболеваемости населения г. Иркутска клещевым энцефалитом // Бюллетень ВСНЦ СО РАМН. 2007. № 3 (55). С. 121 - 125.
14. Коротков Ю.С., Никитин А.Н., Антонова А.М. Временная структура численности таежного клеща в пригородной зоне Иркутска // Бюллетень ВСНЦ СО РАМН. 2007. № 3 (55). С. 126 - 130.
15. Коротков Ю.С., Кисленко Г.С., Буренкова Л.А. и др. Пространственная и временная изменчивость зараженных клещей Ixodes ricinus и Ixodes persulcatus и возбудителем болезни Лайма в Московской области // Паразитология. 2008. № 6 (42). С. 441 - 451.
16. Лбов Г.С. Выбор эффективной системы зависимых признаков // Вычислительные системы. Вып. 19. Новосибирск, 1965. С. 21 - 34.
17. Лбов Г.С. Методы обработки разнотипных экспериментальных данных. - Новосибирск: Наука, 1981. - 160 с.
18. Лбов Г.С., Старцева Н.Г. Логические решающие функции и вопросы статистической устойчивости решений. - Новосибирск: Изд-во Ин-та математики, 1999. - 212 с.
19. Лбов Г.С., Бериков В.Б. Устойчивость решающих функций в задачах распознавания образов и анализа разнотипной информации. - Новосибирск: Изд-во Ин-та математики, 2005. - 218 с.
20. Лбов Г.С., Бериков В.Б. Методы анализа данных и знаний: http://math. nsc.ru/AP/datamine/index.html (дата обращения - 28.05.2011 г.)
21. Лбов Г.С., Полякова Г.Л., Пестунов И.А. О влиянии астрофизических и природных факторов на заболеваемость клещевым энцефалитом //
22.
23.
24.
Горный информационно-аналитический бюллетень. 2009. Отдельный вып. № 18. С. 72 - 78.
Лбов Г.С., Герасимов М.К. Прогнозирование экстремальных событий на основе анализа многомерных разнотипных временных рядов // Вычислительные технологии. 2010. Т. 15. № 5. С. 81 - 92. Лбов Г.С., Полякова Г.Л., Бахвалова В.Н., Морозова О.В. Исследование влияния природных факторов на заболеваемость клещевым энцефалитом // Вестник НГУ Сер.: Биология, клиническая медицина. 2010. № 3. С. 31 - 37.
Лбов Г.С., Полякова Г.Л., Пестунов И.А. Метод прогнозирования на основе анализа коротких временных рядов / Труды Конгресса по интеллектуальным системам и информационным технологиям AIS-IT10. Т. 1. - М.: Физматлит, 2010. С. 264 - 271.
25. Лбов Г.С., Полякова Г.Л. Решение задачи прогнозирования в классе логических решающих функций / Доклады III Международной научной конференции «Математическая биология и биоинформатика». Пущи-но, 10 - 15 октября 2010 г. С. 226 - 227.
26. Лбов Г.С., Полякова Г.Л., Бахвалова В.Н. и др. Метод прогнозирования характеристик паразитарной системы клещевого энцефалита, заболеваемости населения в зависимости от метеорологических и астрофизических факторов / XV Всероссийский симпозиум c международным участием «Сложные системы в экстремальных условиях». - Красноярск, 2010. С. 47.
Лбов Г.С., Полякова Г.Л. Метод прогнозирования в классе логических решающих функций // Вестник Сибирского государственного аэрокосмического университета им. акад. М.Ф. Решетнева. 2010. Вып. 5 (31). С. 42 - 45.
Наумов Р.Л., Лабзин В.В., Гутова В.П. Цикличность изменения элементов паразитарной системы очагов клещевого энцефалита / Парази-тологический сборник. - Л.: Наука. 1984. С. 139 - 160. Никитин А.Я., Балахонов С.В., Андаев Е.И., Чеснокова М.В. Эпидемиологическая обстановка по клещевому энцефалиту, ее прогноз и основные направления профилактических мероприятий в регионах Сибири // Проблемы особо опасных инфекций. 2008. № 4 (98). С. 21 - 24. Никитин А.Я., Балахонов С.В., Андаев Е.И. и др. Прогноз заболеваемости населения клещевым энцефалитом в Сибирском федеральном округе на 2010 - 2012 гг. // Журн. инфекционной патологии. 2010. № 3 (17). С. 103 - 105.
Окулова Н.М. Биологические взаимосвязи в лесных экосистемах (на примере природных очагов клещевого энцефалита). - М.: Наука, 1986. С. 1 - 246.
Полякова Г.Л., Лбов Г.С., Бериков В.Б. и др. Анализ влияния солнечной активности на заболеваемость клещевым энцефалитом, иксодо-вым клещевым боррелиозом и клещевым риккетсиозом в эндемичных областях России / Материалы научной конференции «Фундаментальные науки - медицине». - Новосибирск, 2010, С. 78. Ревич Б.А. Изменение здоровья населения России в условиях меняющегося климата // Проблемы прогнозирования. 2008. № 3 (108). С. 140 - 150.
Щучинова Л.Д. Эпидемиологический надзор и контроль инфекций, передающихся клещами, в Республике Алтай: Автореф. дис. ... к.м.н. - Омск, 2009.
Dietterich T.G. An experimental comparison of three methods for constructing ensembles of decision trees: Bagging, boosting, and randomization // Machine Learning. 2000. V. 40 (2). R 139 - 158. Johnston J., Di Nardo J. Econometric methods. 4th Ed. McGraw-Hill, 1997. http://www.rospotrebnadzor.ru/directions_of_activity/profilaktika/ob-zor/30673/Статья ФГУН «Екатеринбургский НИИ вирусных инфекций» Роспотребнадзора «Клещевой боррелиоз».
Lbov G.S. Algorithm of searching the global extremum of a function of variables measured in different scales / Rroc. 9th IFIR Conf. New York, 1980. V. 2. R. 201 - 205.
Lbov G.S., Berikov V.B. Recognition of a dynamic object and prediction of quantitative characteristics in the class of logical functions // Pattern Recognition and Image Analysis. 1997. V. 7 (4). R. 407 - 413. Lbov G.S., Gerasimov M.K., Rolyakova G.L. A method of interval iredic-tion based on logical regularities / The third IASTED international multiconference on automation, control, and information technology (ACIT 2010) in cooperation with the Russian academy of sciences, conference «Control, diagnostics, and automation» (ACIT-CDA 2010), June 15 - 18 2010. Novosibirsk, Russia. V. 2. R. 245 - 249.
27.
28.
29.
30.
31.
32
33
34
35.
36. 37
38
39
40.