Научная статья на тему 'РАЗРАБОТКА МОДЕЛИ, ПРОГНОЗИРУЮЩЕЙ РАСПОСТРАНЕНИЕ ИНФЕКЦИЙ НА ОСНОВЕ ИСТОРИЧЕСКИХ ДАННЫХ НА ПРИМЕРЕ COVID-19'

РАЗРАБОТКА МОДЕЛИ, ПРОГНОЗИРУЮЩЕЙ РАСПОСТРАНЕНИЕ ИНФЕКЦИЙ НА ОСНОВЕ ИСТОРИЧЕСКИХ ДАННЫХ НА ПРИМЕРЕ COVID-19 Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
162
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
новые типы инфекций / COVID-19 / компартментный подход / веб-сервис / предиктивная модель / модели временных рядов / модели предметной области / технологии контейнеризации и оркестрации / new types of infections / COVID-19 / compartment approach / web service / predictive model / time series models / domain models / containerization and orchestration technologies

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Верба Вера Алексеевна, Вовик Андрей Геннадьевич

Предметом исследования является прогнозирование распространения инфекций на основе исторических данных. Был проведен обзор научных исследований, связанных с математическим моделированием при помощи компартментных моделей и калибровкой моделей на основе исторических данных. Представлены графики прогноза распространения COVID-19 для Москвы с помощью SIR, SEIR и SEIQR моделей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Верба Вера Алексеевна, Вовик Андрей Геннадьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF A MODEL PREDICTING THE SPREAD OF INFECTIONS BASED ON HISTORICAL DATA ON THE EXAMPLE OF COVID-19

The subject of the study is the prediction of the spread of infections based on historical data. A review of scientific research related to mathematical modeling using compartment models and calibration of models based on historical data was conducted. Graphs of the COVID-19 spread forecast for Moscow using SIR, SEIR, and SEIQR models are presented.

Текст научной работы на тему «РАЗРАБОТКА МОДЕЛИ, ПРОГНОЗИРУЮЩЕЙ РАСПОСТРАНЕНИЕ ИНФЕКЦИЙ НА ОСНОВЕ ИСТОРИЧЕСКИХ ДАННЫХ НА ПРИМЕРЕ COVID-19»

УДК 330.1

doi :10.18720/SPBPU/2/id21 -412

Верба Вера Алексеевна1,

доцент, канд.техн.наук, доцент; Вовик Андрей Геннадьевич1,

ассистент

РАЗРАБОТКА МОДЕЛИ, ПРОГНОЗИРУЮЩЕЙ РАСПОСТРАНЕНИЕ ИНФЕКЦИЙ НА ОСНОВЕ ИСТОРИЧЕСКИХ ДАННЫХ НА ПРИМЕРЕ COVID-19

1 2

' Россия, Москва, Московский технический университет связи

и информатики, 1 verba@list.ru

Аннотация. Предметом исследования является прогнозирование распространения инфекций на основе исторических данных. Был проведен обзор научных исследований, связанных с математическим моделированием при помощи компартментных моделей и калибровкой моделей на основе исторических данных. Представлены графики прогноза распространения COVID-19 для Москвы с помощью SIR, SEIR и SEIQR моделей.

Ключевые слова: новые типы инфекций, COVID-19, компартментный подход, веб-сервис, предиктивная модель, модели временных рядов, модели предметной области, технологии контейнеризации и оркестрации.

Vera A. Verba1,

Associate Professor, Candidate of Technical Sciences;

Andrej G. Vovik 2, Assistant (tutor)

DEVELOPMENT OF A MODEL PREDICTING THE SPREAD OF INFECTIONS BASED ON HISTORICAL DATA ON THE EXAMPLE OF COVID-19

1 2

' Moscow Technical University of Communications and Informatics,

Moscow, Russia, 1 verba@list.ru

Abstract. The subject of the study is the prediction of the spread of infections based on historical data. A review of scientific research related to mathematical modeling using compartment models and calibration of models based on historical data was conducted. Graphs of the COVID-19 spread forecast for Moscow using SIR, SEIR, and SEIQR models are presented.

Keywords: new types of infections, COVID-19, compartment approach, web service, predictive model, time series models, domain models, containerization and orchestration technologies.

Введение

Актуальность темы настоящей работы обусловлена увеличением количества проблем, связанных с возникновением новых типов инфекций, и недостатком сервисов, прогнозирующих заболеваемость COVID-19. Изучение такого вопроса необходимо не только для выработки устойчивого понимания моделей прогнозирования инфекций в целом, но и для поиска собственного решения.

Что касается объекта данного исследования, то целесообразно обозначить им инфекцию, вызываемую коронавирусом SARS-CoV-2. Предметом исследования является прогнозирование распространения инфекций на основе исторических данных. Был проведен обзор научных исследований, связанных с математическим моделированием при помощи компартментных моделей и калибровкой моделей на основе исторических данных.

Цель работы состоит в разработке модели и веб-сервиса, позволяющего прогнозировать распространение инфекций на основе исторических данных на примере COVID-19.

1. Постановка задачи

1.1. Описание предметной области

Для реализации обозначенной цели можно отметить некоторые из следующих задач:

• проанализировать существующие методы прогнозирования инфекций на основе исторических данных, рассмотреть их преимущества и недостатки в рамках прогнозирования распространения COVID-19;

• провести обзор продуктов-аналогов и используемые ими методы прогнозирования;

• спроектировать архитектуру веб-сервиса, позволяющего прогнозировать распространение инфекций на примере COVID-19;

• реализовать веб-сервис согласно разработанной архитектуре.

Основное назначение использования данного сервиса заключается в

возможности своевременно узнавать об ожидаемой в ближайшее время динамики течения инфекционных заболеваний. Разработка такой информационной системы крайне актуальна, поскольку может улучшить контроль заболеваемости, что может привести к уменьшению числа летальных исходов. Как показывает настоящая эпидемиологическая ситуация в мире в связи с пандемией нового SARS-COV-2, прогнозирование инфекций является одной из важнейших задач машинного обучения и математического моделирования. Такие модели могут быть применимы как к

новым типам инфекций, так и к давно существующим смертельным вирусам, с которыми человечество живет бок о бок уже несколько десятков лет, — это ВИЧ, лихорадка денге, туберкулез и множество других. Модели, имитирующие поведение инфекций в различных условиях, принимаются во внимание государственным аппаратом в качестве движущего рычага при принятии решений в сфере общественного здравоохранения. Они позволяют не только подготовиться к возможному росту числа инфицированных, но и предотвратить его, а также оценить результативность, возможные риски и последствия тех или иных решений в области здравоохранения.

Необходимость разработок таких моделей очевидна, так как способность предсказывать возможное будущее и «корректировать» в соответствии с этим мероприятия по борьбе с инфекцией в первую очередь ведет к снижению общего числа смертей, а также к выбору наиболее оптимального варианта поддержки экономики в условиях эпидемии. Использовать такие модели могут не только органы власти, но и некоммерческие организации в сфере здравоохранения, причем для последних в условиях ограниченности ресурсов это особенно важно, так как искусственный интеллект и компьютерное моделирование способны автоматизировать рутинные процессы, тем самым существенно сокращая затраты на такую деятельность, как ручной сбор информации, ее предобработка и анализ датасетов.

Помимо этого, «взгляд в будущее» может помочь как малому, так и крупному бизнесу выработать наиболее оптимальную в настоящий момент стратегию мер по отношению к клиентам и сотрудникам, чтобы не допустить локальных вспышек инфекции и минимизировать возможные экономические риски.

Обычному человеку также зачастую может быть полезно взглянуть на вирусную динамику, чтобы решить, например, стоит ли ему отправляться в какую-либо местность и какое количество времени будет относительно безопасно в ней находиться.

Существующие модели прогнозирования можно поделить на две большие группы — модели временных рядов и модели предметной области [1].

Модели временных рядов особенно хорошо подходят для прогнозирования сезонных или цикличных вспышек заболевания [2]. Основная суть таких моделей заключается в представлении текущего состояния как функции прошлых состояний. Такие модели универсальны для любой предметной области, т. е. методы прогнозирования остаются одинаковыми, будь это прогнозирование влажности воздуха, продажи билетов на авиарейсы или распространения инфекций.

Одна из таких моделей — это знаменитая ARIMA — модель авторегрессионного интегрированного скользящего среднего для нестационарных временных рядов, а также SARIMA — это расширение модели ARIMA для учета сезонной составляющей ряда.

Модели ARIMA часто используются в исследованиях инфекционных заболеваний, особенно для поиска взаимосвязей между развитием инфекции и факторами окружающего мира. Так, например, модель ARIMA использовалась для исследования сезонности распространения лептоспироза и его связи с количеством осадков и температурой окружающей среды [3]. С помощью ARIMA была найдена взаимосвязь между распространением малярии и природным феноменом Эль-Ниньо [4].

Общий алгоритм разработки данной модели состоит из следующих шагов [5]:

1) Стационаризация временного ряда, т. е. сведение к минимуму в данных тренда и сезонности путем взятия разностей порядка ё от временного ряда (порядок разности ё подлежит экспериментальной оценке).

2) Оценка параметров р — количество компонент авторегрессии и q — количество компонент скользящего среднего.

3) Проверка модели, например, с помощью информационных критериев Акаике или Шварца, оценка остатков построенной модели при помощи теста Жарка-Бера.

Однако модель ARIMA имеет существенный недостаток, связанный с тем, что она плохо подходит для сложно-структурированных нелинейных данных, которыми зачастую характеризуется развитие инфекций. Так, распространение нового SARS-COV-2 было сопряжено с активными мерами сдерживания со стороны органов власти, причем эти меры носили непостоянный характер, что привело к появлению в данных постоянно изменяющегося тренда и, соответственно, к сложной структуре, зависящей от множества внешних факторов.

Другая группа методов прогнозирования временных рядов — искусственные нейронные сети различных архитектур. Но вне зависимости от архитектуры нейронной сети или ее способа обучения такой метод прогнозирования требует большого количества данных, так как данные о распространении инфекционного заболевания, как правило, зашумле-ны [6]. К тому же в случае новых инфекций такой способ может быть вовсе не применим или применим только для краткосрочных прогнозов.

Еще одно семейство методов опирается на поиск в ретроспективных данных близких к настоящему времени тенденций — это рассуждения на основе прецендентов. Однако, как и предыдущая группа методов такой метод рассчитан на краткосрочные прогнозы, а использование

его для прогнозов даже среднего срока потребовало бы огромных массивов данных.

В целом существенный недостаток моделей временных рядов в отношении прогнозирования инфекций исходит из их универсальности. Такие модели не учитывают законы и особенности предметной области, а потому неспособны давать долгосрочный прогноз в условиях зашумленности или малого количества данных.

Модели предметной области — это математические модели, отражающие специфику конкретной области. Математические модели, в отличие от моделей временных рядов, не только прогнозируют будущее, но и раскрывают природу рассматриваемого процесса.

Один из самых известных и широко применяемых методов в математическом моделировании инфекционных заболеваний в эпидемиологии — построение классической трехкомпонентной SIR-модели (Sus-pectible-Infectious-Recovered), разработанной Кермарком и МакКендри-ком в 1927 году [7]. На протяжении почти столетия эта модель остается фундаментальной в эпидемиологии.

Согласно данной модели, вся популяция разделена на 3 отсека: S — suspectible (восприимчивые), I — infectious (инфицированные) R — recovered (выздоровевшие). Однако на сегодняшний день существует множество расширений данной модели, которые усложняют данную схему путем добавления новых «отсеков» — это модели SEIR (Suspectible-Exposed-Infectious-Recovered), SAIR (Suspectible-Asymptomatic-Infectious-Recovered) и многие другие. Семейство таких моделей получило название компартментных моделей в эпидемиологии.

Стандартная SIR-модель описывается системой из трех дифференциальных уравнений (1.1), которая описывает скорость перехода индивидуумов из одного отсека в другой.

dS(t)

-0*S(t)I(t)

dl(t)

= p*swm -r*Kt) (i.i)

dR(t)

где S(t) — количество восприимчивых индивидуумов в заданный момент времени,

I(t) — количество заразных индивидуумов в заданный момент времени,

R(t) — количество выздоровевших индивидуумов в заданный момент времени,

Р — это коэффициент перехода индивидуумов из отсека S в отсек I, обратно пропорциональный среднему количеству заболевших людей в день,

у — коэффициент выздоровления, обратно пропорциональный среднему количеству дней, необходимых для выздоровления.

Компартментные модели способны давать прогнозы на любой срок и открывают возможности к аналитическому исследованию природы инфекционного заболевания и его последствий.

Недостаток таких моделей в том, что каждая модель изначально выстраивается вокруг конкретного заболевания, его структура заложена в систему дифференциальных уравнений модели, а потому компарт-ментную модель распространения гриппа нельзя использовать для прогноза случаев ОРВИ.

Помимо этого, при построении таких моделей мы делаем два основных допущения, которые могут сказаться на точности прогноза, таких как:

1) Вся популяция однородна. Каждый индивидуум в популяции подвержен тем же опасностям, что и другие.

2) Популяция хорошо смешана. Все восприимчивые индивидуумы имеют одинаковый шанс заразиться.

Однако есть способ избежать последствий таких допущений — это использовать индивидуальные модели [8] (IBM — Individual-based models). В таких моделях мы рассматриваем не всю популяцию, а каждого индивидуума как набор функций (особенностей индивидуума), которые могут изменяться со временем. Такие модели разработаны для тех случаев, когда поведение людей меняет окружающую среду, а окружающая среда влияет на их поведение. Недостаток таких моделей, прежде всего, в их сложности и неопределенности параметров и структуры модели.

1.2. Постановка требований к разработке веб-сервиса, прогнозирующего распространение инфекций

Можно выделить следующие требования к разработке веб-сервиса, прогнозирующего распространение инфекций.

Модель должна:

• использовать компартментный подход на примере COVID-

19;

• давать прогноз распространения заболеваемости COVID-19 по субъектам РФ;

• быть откалибрована на основе исторических данных;

• позволять строить прогноз, основываясь на заданном пользователем конкретном периоде в прошлом;

• позволять выбирать срок прогнозирования;

• давать адекватный прогноз.

Что касается требований к серверной части, то должны быть разработаны:

• открытый межпрограммный интерфейс (API) модели для ее удобной интеграции со сторонними сервисами;

• серверная часть веб-сервиса, использующая API модели.

Главная страница веб-сервиса должна содержать:

• название веб-сервиса;

• формы для ввода параметров, необходимых для построения модели;

• графическую часть в виде интерактивного графика заболеваемости и смертности;

• инструкцию по работе с сервисом.

Разрабатываемый веб-сервис прогнозирования инфекций на примере COVID-19 рационально поделить на два микросервиса.

Первый отвечает за логику представления приложения. Именно этот микросервис определяет графическую часть приложения, в том числе метод отображения интерактивных графиков и прочих элементов. Этот микросервис состоит из двух уровней: уровень бизнес-логики и уровень представления.

На уровне бизнес-логики осуществляется общение со сторонними микросервисами по межпрограммному интерфейсу (API), в частности, с микросервисом прогнозирования распространения COVID-19. Именно на этом уровне формируются необходимые структуры данных для последующей их передачи в уровень представления.

На уровне представления осуществляется непосредственное преобразование данных, полученных с уровня бизнес-логики, в человеко-читаемую форму, удобную для анализа.

Второй микросервис отвечает за модель прогнозирования распространения COVID-19. Именно здесь хранятся все необходимые данные для моделирования. Также именно здесь осуществляется непосредственно математическое моделирование распространения COVID-19. Данный микросервис предоставляет открытый API — это открывает возможности для интеграции микросервиса через HTTP-протокол не только в разрабатываемый веб-сервис, но и в любые уже существующие системы.

Схема архитектуры веб-сервиса представлена на рисунке 1.

Рис. 1. Схема архитектуры приложения

Такое разделение веб-сервиса позволит в дальнейшем без особых затрат встраивать в систему новые микросервисы, например, с моделью прогнозирования распространения другого заболевания. Помимо этого, модели, работающие с большими объемами данных и осуществляющие большое количество вычислений, зачастую требуют очень много ресурсов от сервера. Выделение модели в отдельный микросервис позволит решить эту проблему путем подключения технологии контейнеризации и оркестрации в приложении, что позволит автоматически масштабировать микросервис в зависимости от текущей нагрузки.

2. Проектирование предиктивной модели распространения инфекций

Оптимальным вариантом построения модели прогнозирования COVID-19 является математическое моделирование с использованием компартментного подхода. В первой главе также были приведены дифференциальные уравнения, из которых состоит стандартная трехкомпо-нентная SIR-модель. Однако для того, чтобы построить достоверный прогноз, необходимо достоверно описать инфекцию, и в первую очередь это значит правильно выбрать тип модели.

В SIR-модель, помимо классических трех отсеков, могут быть встроены и другие, например:

1. Exposed — отсек, характеризующий индивидуумов, у которых болезнь пребывает в инкубационной стадии, зараженный, но еще не заразный.

2. Asymptomatic infectious — отсек, характеризующий бессимптомных заразных индивидуумов. Возможно, что такие индивидуумы менее заразны, но при этом они не помещаются в карантин.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Quarantined — помещенный в карантин, зараженный, но уже не заразный.

Отсеков может быть и больше, они могут быть по-разному описаны и скомбинированы в зависимости от поведения рассматриваемой инфекции. При необходимости можно описать свой собственный отсек, если это поможет построить более точную модель.

Стандартная SIR-модель имеет два параметра — традиционно это в и у [9]. Параметр в обозначает коэффициент заражения и рассчитывается как ft = р * с, где р — вероятность заражения восприимчивого индивидуума при контакте с инфицированным, с — среднее число контактов восприимчивого индивидуума в день. Параметр у — коэффициент выздоровления, который обратно пропорционален среднему количеству дней, необходимых для излечения от болезни. Оба этих параметра характеризуют скорость перехода индивидуумов из одного отсека в другой.

Нельзя точно сказать, чему равны р и с, поэтому в —это параметр, который нельзя измерить напрямую. Вместо этого прибегают к процессу, называемому «калибровкой», т. е. пытаются оценить параметры с помощью набора исторических данных [10]. В основе этого процесса лежит минимизация ошибки между действительными значениями в данных и значениями построенной модели.

Для этого нужна функция, вычисляющая расстояние между прогнозными и реальными данными на основе входных параметров (функция расстояния) и алгоритм, который ищет минимум этой функции (алгоритм оптимизации).

Для оценки параметров широко применяется метод наименьших квадратов (МНК) [11], где расстояние рассчитывается по формуле

где Q — расстояние между двумя наборами данных, х — набор реальных значений,

f(a) — функция от набора неизвестных переменных. Далее задача сводится к минимизации суммы Q путем вариации набора неизвестных переменных а.

В качестве алгоритмов оптимизации можно выделить несколько: алгоритмы Бройдена — Флетчера — Голдфарба — Шанно (BFGS), BFGS с ограничением памяти (L-BFGS-B), сопряженные градиенты (CG) и алгоритмы Нелдера — Мида [12]. Однако алгоритм следует выбирать исходя из типа SIR-модели. В статье приводятся данные, согласно которым с задачей расчета параметров стандартной SIR-модели лучше всего справляется алгоритм Нелдера-Мида, а для расчета параметров SEIQR-модели (Suspectible-Exposed- Infectious-Quarantined-Recovered) лучше всего подходит алгоритм L-BFGS-B.

Далее следует отметить, что в случае с моделируемым распространением COVID-19 параметры модели не будут оставаться постоянными, так как течение заболеваемости строго контролировалось органами власти. Поэтому для получения точного прогноза предлагается оценивать параметры в рамках каждого отдельно взятого периода усиления или ослабления мер сдерживания распространения инфекции.

На рисунках 2, 3 и 4 представлены графики построенного Исаковым Ф.Е. прогноза для Москвы с помощью SIR, SEIR и SEIQR моделей соответственно в срок до 28.04.2021. Здесь и далее зеленый цвет обозначает количество выздоровевших, красный — количество инфицированных, синий — количество умерших. Сплошные линии — это данные, полученные с модели, точки в форме «х» — это реальные данные, на основе

(2.1) [15].

(2.1)

которых производилась оценка параметров, жирные точки — это тестовая выборка реальных данных, которая не использовалась при оценке параметров модели.

Динамика распространения СО\/Ю-19

>. 500000 -Ц

О

250000 -

Дата

Рис. 2. Прогноз динамики распространения COVID-19, построенный для Москвы

с помощью SIR-модели

Динамика распространения СОУЮ-19 ЭЕ1Р?

£ 500000 -

Дата

Рис. 3. Прогноз динамики распространения COVID-19, построенный для Москвы

с помощью SEIR-модели

Рис. 4. Прогноз динамики распространения COVID-19, построенный для Москвы с помощью SEIQR -модели

Так, сравнивая прогнозные значения со значениями тестовой выборки, можно сделать вывод об адекватности прогноза модели. Как видно из графиков выше, хуже всего соответствует реальности прогноз, построенный с помощью БШ-модели.

Для того, чтобы сравнить точность прогнозов БЕЖ и БЕ^Я моделей, рассмотрим только случаи инфицирования (рисунки 5 и 6 для БЕЖ и БЕ^Я моделей соответственно).

Из графиков видно, что в целом БЕШ-модель более точно отражает реальную динамику, БЕ^Я-модель же очевидно сильнее отклонилась от реального тренда несмотря на то, что предсказанное количество заболевших в первые 4 дня прогноза практически точно совпало с реальным количеством.

Стоит отметить, что обе модели смогли предсказать ожидаемый рост заболеваемости в апреле 2021 года несмотря на то, что параметры модели были откалиброваны на данных с нисходящим трендом.

Динамика распространения ССЛ/Ю-19 ЭЕ^

1е+05-

9е+04-

ц 8е+04-О

7е+04-

мар

Дата

апр

Рис. 5. Прогнозная динамика инфицированных индивидуумов для Москвы, построенная с помощью SEIR-модели в срок до 28.04.2021

Динамика распространения ССЛ/Ю-19 ЭЕЮГ^

1е+05-

9е+04-

!8е+04-

О

7е+04-

6е+04-

* \

\ • • *

- \

* • \ ...•• X

мар

Дата

апр

Рис. 6. Прогнозная динамика инфицированных индивидуумов для Москвы, построенная с помощью SEIQR-модели в срок до 28.04.2021

Запишем систему дифференциальных уравнений для БЕШ-модели (2.2) [13].

= т*Е(О -у*т (22)

ая(г) -1Г =

где Б^) — количество восприимчивых индивидуумов в заданный момент времени;

Е(Ь) — количество зараженных, но не заразных индивидуумов в заданный момент времени;

1(Ь) — количество заразных индивидуумов в заданный момент времени,

Я Ю — количество выздоровевших индивидуумов в заданный момент времени,

Э(Ь) — количество умерших от заболевания индивидуумов в заданный момент времени;

N = + Е(С) + 1(С) + И^) — это суммарное количество индивидуумов во всех отсеках, за исключением отсека Б [14];

д — это коэффициент летальности, который рассчитывается как обратно пропорциональный среднему количеству умерших от заболевания в день,

Р — это коэффициент перехода индивидуумов из отсека Б в отсек Е, обратно пропорциональный среднему количеству заболевших людей в день;

т — это обратно пропорциональное среднему количеству дней, соответствующих инкубационному периоду,

у — коэффициент выздоровления, обратно пропорциональный среднему количеству дней, необходимых для выздоровления.

Можно схематично представить переход индивидуумов в популяции между отсеками (рис. 7).

— R Recovered

S Suspectible Р , Е Exposed г I у г

* * 1 Infectious

— D Dead

р, Т, У, JJ - коэффициенты перехода индивидуумов из отсека в отсек

Рис. 7. Схема отсеков SEIR-модели

Стандартная система из трех дифференциальных уравнений расширилась еще двумя тем, что в систему включились отсеки Exposed и Dead. Помимо этого, добавились два новых параметра — д и т.

Таким образом, для построения прогнозов распространения COVID-19 разработана SEIR-модель.

Заключение

Для реализации веб-сервиса для прогнозирования COVID-19 используется веб-фреймворк Django [15]. Это фреймворк Python, который идеально подходит для небольших веб-приложений и поддерживает большое количество готовых библиотек. Он позволяет быстро разрабатывать надежные веб-сервисы с помощью языка программирования Python. Веб-сервис реализован с помощью Django-фреймворка и вспомогательных библиотек: FusionCharts и Bootstrap.

Преимущества разработанной модели прогнозирования распространения COVID-19:

1) Получение с её помощью прогнозов с точностью до 99.5 % как минимум на следующие 10 дней. Очевидно, что достижение подобной точности должно представлять особую важность, когда дело касается прогнозирования инфекционных заболеваний.

2) API позволяет легко интегрировать модель прогнозирования в любые сторонние сервисы.

3) Модель обладает способностью предсказывать количество заболевших по субъектам РФ в отличие от продуктов-конкурентов.

4) Модель отображает прогноз смертности.

Проведено тестирование работы веб-сервиса на примере Москвы. Анализ результатов прогнозов модели показал, что модель дает точные прогнозы (до 99.5 %) как минимум на следующие 10 дней.

Список литературы

1. Чучуева И.А. Модель прогнозирования временных рядов по выборке максимального подобия, диссертация... канд. тех. наук / Московский государственный технический университет им. Н.Э. Баумана. Москва, 2012.

2. Kane M. J. et al. Comparison of ARIMA and Random Forest time series models for prediction of avian influenza H5N1 outbreaks. // BMC bioinformatics. - 2014. -Vol. 15. №. 1. - Pp. 1-9.

3. Chadsuthi S., Modchang C., Lenbury Y., Iamsirithaworn S., Triampo W. Modeling seasonal leptospirosis transmission and its association with rainfall and temperature in Thailand using time-series and ARIMAX analyses. // Asian Pac J Trop Med. - 2012. -Vol. 5 (7). - Pp. 539-546. - DOI: 10.1016/S1995-7645(12)60095-9.

4. Hanf M. et al. The role of El Niño southern oscillation (ENSO) on variations of monthly Plasmodium falciparum malaria cases at the cayenne general hospital, 1996-2009, French Guiana. // Malaria journal. - 2011. - Vol. 10. No. 1. - Pp. 1-4.

5. Трегуб А.В., Трегуб И.В. Методика построения модели ARIMA для прогнозирования динамики временных рядов. // Вестник МГУЛ - Лесной вестник. - 2011. -№5. - URL: https://cyberleninka.ru/article/n7metodika-postroeniya-modeli-arima-dlya-prognozirovaniya-dinamiki-vremennyh-ryadov (дата обращения: 17.04.2021).

6. Кондратьев М.А. Методы прогнозирования и модели распространения заболеваний. // Компьютерные исследования и моделирование. - 2013. - Т. 5, № 5. -С. 863-882.

7. Van Mieghem P. Exact solution of the Kermack and McKendrick SIR differential equations. // arXiv preprint arXiv:2010.03253. - 2020.

8. Nepomuceno E.G., Takahashi R.H.C., Aguirre L.A. Individual-based model (IBM): an alternative framework for epidemiological compartment models. // Revista Bra-sileira de Biometria. - 2016. - Vol. 34. No. 1. - Pp. 133-162.

9. Hamzah F. B. et al. CoronaTracker: worldwide COVID-19 outbreak data analysis and prediction. // Bull World Health Organ. - 2020. - Vol. 1. No. 32.

10. Жуков А.О. Аналитический подход к оцениванию параметров некоторых математических моделей распространения эпидемий. // Современные технологии: актуальные вопросы, достижения и инновации. - 2021. - С. 8-11.

11. Мазуров Б.Т., Падве В.А. Метод наименьших квадратов (статика, динамика, модели с уточняемой структурой). // Вестник СГУГиТ. - 2017. - Т. 22. №. 2. - С. 22.

12. Rahimi I. et al. Analysis and Prediction of COVID-19 Using SIR, SEIQR and Machine Learning Models: Australia, Italy and UK Cases. // Information. - 2021. -Vol. 12. No. 3. - P. 109.

13. Roda W. C. et al. Why is it difficult to accurately predict the COVID-19 epidemic? // Infectious Disease Modelling. - 2020. - Vol. 5. - Pp. 271-281.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

14. Ma Y. et al. COVID-19 Spreading Prediction with Enhanced SEIR Model. // 2020 International Conference on Artificial Intelligence and Computer Engineering (ICAICE). - IEEE, 2020. - Pp. 383-386.

15. Leonenko V.N., Novoselova Y.K., Ong K.M. Influenza outbreaks forecasting in Russian cities: Is Baroyan-Rvachev approach still applicable? // Procedia Computer Science. - 2016. - Vol. 101. - Pp. 282-291.

16. Create a chart using Django | FusionCharts [Электронный ресурс]. - URL: https://www.fusioncharts.com/dev/getting-started/django/your-first-chart-using-django, (дата обращения: 02.05.2021).

i Надоели баннеры? Вы всегда можете отключить рекламу.