Научная статья на тему 'Регрессионные модели прогнозирования количества летальных исходов при новой коронавирусной инфекции'

Регрессионные модели прогнозирования количества летальных исходов при новой коронавирусной инфекции Текст научной статьи по специальности «Клиническая медицина»

CC BY
637
98
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОРОНАВИРУСНАЯ ИНФЕКЦИЯ / COVID-19 / SARS-COV-2 / ПРОГНОЗИРОВАНИЕ ИСХОДА ИНФЕКЦИИ / МНОГОМЕРНАЯ РЕГРЕССИОННАЯ МОДЕЛЬ / ПРОГНОЗИРОВАНИЕ ЛЕТАЛЬНОСТИ ИНФЕКЦИИ / CORONAVIRUS INFECTION / PREDICTION OF INFECTION OUTCOME / MULTIVARIATE REGRESSION MODEL / MORTALITY PREDICTION

Аннотация научной статьи по клинической медицине, автор научной работы — Мелик-гусейнов Д. В., Карякин Н. Н., Благонравова А. С., Климко В. И., Баврина А. П.

Прогнозирование развития эпидемического процесса новой коронавирусной инфекции COVID-19 на международном и государственном уровнях в настоящее время крайне востребовано для определения нужд практического здравоохранения и проведения эффективных противоэпидемических и профилактических мероприятий. С учетом быстро меняющейся исходной информации и неоднозначного качества данных, получаемых из различных источников, необходимо оперативно оптимизировать применяемые прогностические модели, в том числе с использованием более сложных алгоритмов. Цель исследования оценить возможности прогнозирования тенденций эпидемического процесса с помощью разработанных оригинальных математических алгоритмов. Материалы и методы. Для оценки ситуации в Китае, Италии и США использована первичная информация из открытых русскои англоязычных источников, доступ к которым осуществляли с официальных сайтов. Применяли общепринятые описательные статистики, математическое моделирование было основано на линейной регрессии. Статистическую обработку данных выполняли с помощью программ IBM SPSS Statistics 24.0 и R (RStudio) 3.6.0. Результаты. Установлены существенные эпидемиологические различия не только по формированию заболеваемости COVID-19 в рассматриваемых странах, но и по скорости появления летальных исходов. Особое внимание к риску возникновения смертей, ассоциированных с COVID-19, обусловлено существенным удельным весом тяжелых форм инфекции, появление которых фиксировалось во всех анализируемых странах. Построено две предварительные регрессионные модели. Первая, исходная, модель базировалась на приросте новых случаев инфекции данный фактор оказался статистически значимо связанным с исходом; регрессионный коэффициент составил 0,02 (95% ДИ 0,01-0,03). Во второй, расширенной, модели кроме прироста новых случаев также учитывали прирост числа тяжелых форм инфекции; регрессионные коэффициенты составили 0,017 (95% ДИ 0,012-0,022) и 0,01 (95% ДИ 0,008-0,011) соответственно. Добавление дополнительной переменной способствовало более полному описанию моделью имеющихся данных. Заключение. Разработанные регрессионные модели для контроля инфекции и прогнозирования числа летальных исходов можно вполне успешно использовать в условиях распространения заболеваний из группы «новых инфекций», когда происходит быстрая смена первичных данных, получаемых из разных источников, а также уточнение этой информации. При этом исходная модель может служить для ориентировочной оценки ситуации, а расширенная для повышения точности прогнозирования и совершенствования алгоритма анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

REGRESSION MODELS PREDICTING THE NUMBER OF DEATHS FROM THE NEW CORONAVIRUS INFECTION

Predicting the development of epidemic infection caused by the COVID-19 coronavirus is a matter of the utmost urgency for health care and effective anti-epidemic measures. Given the rapidly changing initial information and the ambiguous quality of data coming from various sources, it is important to quickly optimize the existing prognostic models by using more sophisticated algorithms. The aim of the study is to test the originally developed mathematical algorithms for predicting the development of the COVID-19 epidemic process. Materials and Methods. To assess the situation in China, Italy, and the USA, we used the information from Russianand English-language sources available in official websites. The generally accepted descriptive statistics were used; mathematical modeling was based on linear regression. Statistical data processing was performed using the IBM SPSS Statistics 24.0 and R (RStudio) 3.6.0. Results. We found significant differences not only in the incidence rate of COVID-19 in the countries in question, but also in the death rate. The risk of death associated with COVID-19 is high due to the high number of severe clinical cases of the disease reported from these countries. Two preliminary regression models were created. The first, initial model was based on the increase in new cases of infection this factor was significantly associated with the outcome; the regression coefficient was 0.02 (95% CI 0.01-0.03). In the second, expanded model, in addition to the increase in new cases, the increase in the number of severe forms of infection was also considered; the regression coefficients were 0.017 (95% CI 0.012-0.022) and 0.01 (95% CI 0.008-0.011), respectively. Adding the second variable contributed to a more accurate description of the available data by the model. Conclusion. The developed regression models for infection control and predicting the number of lethal outcomes can be successfully used under conditions of spreading diseases from the group of “new infections” when primary data received from various sourced are changing rapidly and updates of the information are continually required. In addition, our initial model can produce a preliminary assessment of the situation, and the expanded model can increase the accuracy and improve the analytic algorithm.

Текст научной работы на тему «Регрессионные модели прогнозирования количества летальных исходов при новой коронавирусной инфекции»

Д.В. Мелик-Гусейнов, к.фарм.н., зам. губернатора по социальной политике1; Н.Н. Карякин, д.м.н., ректор2;

A.С. Благонравова, д.м.н., проректор по научной работе2;

B.И. Климко, к.т.н., главный специалист3;

А.П. Баврина, к.б.н., доцент кафедры медицинской физики и информатики2;

О.В. Другова, к.б.н., доцент кафедры медицинской физики и информатики2;

Н.В. Саперкин, к.м.н., доцент кафедры эпидемиологии, микробиологии и доказательной медицины2;

О.В. Ковалишена, д.м.н., профессор, зав. кафедрой эпидемиологии, микробиологии

и доказательной медицины:

правительство Нижегородской области, Кремль, 1, Н. Новгород, 603082;

2Приволжский исследовательский медицинский университет, пл. Минина и Пожарского, 10/1,

Н. Новгород, 603005;

3ГК «МедИнвестГрупп», ул. Александра Солженицина, 27, Москва, 109004

Прогнозирование развития эпидемического процесса новой коронавирусной инфекции COVID-19 на международном и государственном уровнях в настоящее время крайне востребовано для определения нужд практического здравоохранения и проведения эффективных противоэпидемических и профилактических мероприятий. С учетом быстро меняющейся исходной информации и неоднозначного качества данных, получаемых из различных источников, необходимо оперативно оптимизировать применяемые прогностические модели, в том числе с использованием более сложных алгоритмов.

Цель исследования — оценить возможности прогнозирования тенденций эпидемического процесса с помощью разработанных оригинальных математических алгоритмов.

Материалы и методы. Для оценки ситуации в Китае, Италии и США использована первичная информация из открытых русско- и англоязычных источников, доступ к которым осуществляли с официальных сайтов. Применяли общепринятые описательные статистики, математическое моделирование было основано на линейной регрессии. Статистическую обработку данных выполняли с помощью программ IBM SPSS Statistics 24.0 и R (RStudio) 3.6.0.

Результаты. Установлены существенные эпидемиологические различия не только по формированию заболеваемости COVID-19 в рассматриваемых странах, но и по скорости появления летальных исходов. Особое внимание к риску возникновения смертей, ассоциированных с COVID-19, обусловлено существенным удельным весом тяжелых форм инфекции, появление которых фиксировалось во всех анализируемых странах.

Построено две предварительные регрессионные модели. Первая, исходная, модель базировалась на приросте новых случаев инфекции — данный фактор оказался статистически значимо связанным с исходом; регрессионный коэффициент составил 0,02 (95% ДИ 0,01-0,03). Во второй, расширенной, модели кроме прироста новых случаев также учитывали прирост числа тяжелых форм инфекции; регрессионные коэффициенты составили 0,017 (95% ДИ 0,012-0,022) и 0,01 (95% ДИ 0,008-0,011) соответственно. Добавление дополнительной переменной способствовало более полному описанию моделью имеющихся данных.

Заключение. Разработанные регрессионные модели для контроля инфекции и прогнозирования числа летальных исходов можно вполне успешно использовать в условиях распространения заболеваний из группы «новых инфекций», когда происходит быстрая смена первичных данных, получаемых из разных источников, а также уточнение этой информации. При этом исходная

Для контактов: Баврина Анна Петровна, e-mail: [email protected]

//////////////////////^^^^

6 СТМ I 2020 I тоМ 12 I №2 Д.В. Мелик-Гусейнов, Н.Н. Карякин, А.С. Благонравова, В.И. Климко, А.П. Баврина, ..., О.В. Ковалишена

2302010130010002

модель может служить для ориентировочном оценки ситуации, а расширенная — для повышения точности прогнозирования и совершенствования алгоритма анализа.

Ключевые слова: коронавирусная инфекция; COVID-19; SARS-CoV-2; прогнозирование исхода инфекции; многомерная регрессионная модель; прогнозирование летальности инфекции.

Как цитировать: Melik-Huseynov D.V., Karyakin N.N., Blagonravova A.S., Klimko V.I., Bavrina A.P., Drugova O.V., Saperkin N.V., Kovalishena O.V. Regression Models Predicting the number of deaths from the new coronavirus infection. Sovremennye tehnologii v medicine 2020; 12(2): 6-13, https://doi.org/10.17691/stm2020.12.2.01

English

Regression Models Predicting the Number of Deaths from the New Coronavirus Infection

D.V. Melik-Huseynov, PhD, Deputy Governor for Social Policy1;

N.N. Karyakin, MD, DSc, Rector2;

A.S. Blagonravova, MD, DSc, Vice-Rector for Science2;

V.I. Klimko, PhD, Chief Specialist3;

A.P. Bavrina, PhD, Associate Professor, Department of Medical Physics and Informatics2;

O.V. Drugova, PhD, Associate Professor, Department of Medical Physics and Informatics2;

N.V. Saperkin, MD, PhD, Associate Professor, Department of Epidemiology, Microbiology and Evidence-Based Medicine2;

О.V. Kovalishena, MD, DSc, Professor, Head of Department of Epidemiology, Microbiology and Evidence-Based Medicine2

Government of the Nizhny Novgorod Region, 1 Kremlin, Nizhny Novgorod, 603082, Russia;

2Privolozhsky Research Medical University, 10/1 Minin and Pozharsky Square, Nizhny Novgorod, 603005, Russia;

3GC "MedlnvestGroup", 27 Alexander Solzhenitsyn St., Moscow, 109004, Russia

Predicting the development of epidemic infection caused by the COVID-19 coronavirus is a matter of the utmost urgency for health care and effective anti-epidemic measures. Given the rapidly changing initial information and the ambiguous quality of data coming from various sources, it is important to quickly optimize the existing prognostic models by using more sophisticated algorithms.

The aim of the study is to test the originally developed mathematical algorithms for predicting the development of the COVID-19 epidemic process.

Materials and Methods. To assess the situation in China, Italy, and the USA, we used the information from Russian- and English-language sources available in official websites. The generally accepted descriptive statistics were used; mathematical modeling was based on linear regression. Statistical data processing was performed using the IBM SPSS Statistics 24.0 and R (RStudio) 3.6.0.

Results. We found significant differences not only in the incidence rate of COVID-19 in the countries in question, but also in the death rate. The risk of death associated with COVID-19 is high due to the high number of severe clinical cases of the disease reported from these countries.

Two preliminary regression models were created. The first, initial model was based on the increase in new cases of infection — this factor was significantly associated with the outcome; the regression coefficient was 0.02 (95% CI 0.01-0.03). In the second, expanded model, in addition to the increase in new cases, the increase in the number of severe forms of infection was also considered; the regression coefficients were 0.017 (95% CI 0.012-0.022) and 0.01 (95% CI 0.008-0.011), respectively. Adding the second variable contributed to a more accurate description of the available data by the model.

Conclusion. The developed regression models for infection control and predicting the number of lethal outcomes can be successfully used under conditions of spreading diseases from the group of "new infections" when primary data received from various sourced are changing rapidly and updates of the information are continually required. In addition, our initial model can produce a preliminary assessment of the situation, and the expanded model can increase the accuracy and improve the analytic algorithm.

Key words: coronavirus infection; COVID-19; SARS-CoV-2; prediction of infection outcome; multivariate regression model; mortality prediction.

Введение

Коронавирусная инфекция, получившая название COVID-19, заняла особое место в группе «новых инфекций» и вызвала огромный интерес не только среди медицинского сообщества, но и в обществе, а также со стороны средств массовой информации.

Заболевание это уже оказывает существенное влияние на социально-экономическое положение стран и ложится дополнительным бременем на их системы здравоохранения. Региональная эпидемическая ситуация, ограниченная юго-восточным Китаем, достаточно быстро вышла за пределы азиатского региона [1-3]. Интенсивный эпидемический процесс COVID-19

и существенная летальность в других государствах (Западная Европа, США, страны Персидского залива) в совокупности с продолжающимися заболеваниями в Китае дали повод ВОЗ определить данную патологию как чрезвычайную ситуацию в сфере общественного здоровья международного значения (30 января 2020 г), а с 11 марта 2020 г — говорить об этой инфекции в статусе пандемии [4].

Быстрое распространение COVID-19 на разных материках, в странах с разным уровнем дохода, в разных условиях (медицинские работники, пассажирские корабли), среди разных социальных и возрастных групп требует обеспечения готовности систем здравоохранения к адекватному ответу на данную угрозу [5, 6]. Эту задачу невозможно решить без разработки новых оптимальных методов прогнозирования дальнейшего развития ситуации, а также оценки факторов риска инфицирования, тяжести течения и летального исхода. Кроме того, достоверные научные факты в отношении этой инфекции позволяют снижать уровень социальной напряженности, бороться с дезинформацией и информационными «вбросами» в СМИ и Интернете, не допускать паники среди населения.

Проникновение вируса SARS-CoV-2, который и вызывает COVID-19, на территорию России 31 января 2020 г [5] было связано с заносом инфекции двумя гражданами Китая в Забайкалье и Тюменскую область (оба случая закончились выздоровлением). Кроме того, задокументировано несколько случаев заражения российских туристов, находившихся на кру-изном лайнере Diamond Princess. Постепенно стали регистрировать факты наличия COVID-19 у граждан России, возвратившихся из поездок в неблагополучные по коронавирусной инфекции страны, а также единичные первичные и вторичные случаи передачи инфекции [7].

В наши задачи входила разработка на основе современных математических алгоритмов оригинальных моделей, использование которых позволяет прогнозировать тенденции развития инфекции и количество летальных исходов.

Материалы и методы

Исследование носит ретроспективный популяци-онный характер. Необходимую первичную информацию извлекали из ежедневных отчетов ВОЗ об эпидемиологической ситуации, ежедневных отчетов Национальной комиссии по здравоохранению КНР, отчетов Минздрава России, а также из материалов, публикуемых Европейским центром по контролю и предупреждению заболеваний (ECDC) и Центром по контролю и предупреждению болезней США (CDC). Использованы данные из открытых источников, доступ к которым осуществляли через официальные сайты в Интернете. Регулярно просматривались релевантные выпуски новостных служб и пресс-релизы. В Российской Федерации в настоящий момент данные

по лицам с подтвержденным диагнозом COVID-19, по госпитализированным пациентам с признаками пневмонии, а также по людям, с ними контактировавшим, в целях предотвращения распространения коронавирусной инфекции заносятся медицинскими организациями в «Информационную систему учета информации», интегрированную в Единую государственную информационную систему в сфере здравоохранения (ЕГИСЗ) [8]. Собираемая информация охватывает данные о первичных и кумулятивных случаях COVID-19, приросте и кумулятивном числе летальных исходов, а также о приросте количества тяжелых форм инфекции среди заболевших.

Статистическую обработку данных проводили с помощью лицензионных программ IBM SPSS Statistics 24.0 и R (RStudio) 3.6.0. Проверку нормальности распределения осуществляли с помощью критерия Колмогорова-Смирнова. Для поиска различий между группами использовали непараметрический критерий Манна-Уитни, силу связи оценивали с помощью коэффициента корреляции Спирмена, характер связи — с помощью простой и множественной линейной регрессии. Сравнение моделей проводили по информационному критерию Акаике (AIC). Результаты представлены в виде Ме [МКИ], где Ме — медиана, МКИ — межквартильный интервал (Q1-Q3), и в виде абсолютных значений в арифметической и логарифмической шкалах. Различия считали статистически значимыми при р<0,05. Тот же уровень значимости принимали для корреляции. При необходимости рассчитывали 95% доверительный интервал (ДИ).

Результаты и обсуждение

По состоянию на 1 апреля 2020 г. в мире от COVID-19 пострадало 823 626 человек [9]. В России количество лабораторно подтвержденных случаев заболевания составило 3548 (с наибольшим числом выявленных в Москве — 2475), из них 235 человек выздоровело, в 30 случаях наступил летальный исход. Всего проведено 536 669 тестов [10]. Сравнение кумулятивных случаев COVID-19 (в период с середины января до конца марта 2020 г.) в Китае, Италии и США показало существенные эпидемиологические различия в формировании заболеваемости. Так, значительно отличалась по странам скорость накопления инфицированных новой коронавирусной инфекцией (рис. 1). В Китае наблюдалось медленное нарастание случаев COVID-19, которое вышло на плато через 42 дня после обнаружения первого случая, для Италии была характерна существенно большая интенсивность выявления случаев заболевания. В США зафиксирован особенно быстрый рост абсолютного числа заболеваний (в частности, с 26 марта 2020 г.). На момент проведения исследования в последних двух странах плато не было сформировано и происходило дальнейшее нарастание случаев коронавирусной инфекции.

//////////////////////^^^^

8 СТМ I 2020 I том 12 j №2 Д.В. Мелик-Гусейнов, Н.Н. Карякин, А.С. Благонравова, В.И. Климко, А.П. Баврина, ..., О.В. Ковалишена

140 000

120 000

§ 100 000 13

I 80 000

60 000

40 000

20 000

12 000

о 10 000

8000

6000

2 4000

2000

Летальность, как известно, является важным, однозначно оцениваемым исходом заболевания, который часто применяется в эпидемиологических исследованиях. Анализ случаев летальных исходов, ассоциированных с SARS-Со^2, также позволил выявить кумулятивные особенности, характерные для развития эпидемии в каждой стране (рис. 2).

Единичные летальные исходы в Китае стали выявляться с 20 января, но в течение 1-1,5 нед количество смертей показало тенденцию к экспоненциальному росту. Увеличение количества летальных исходов в Китае происходило практически в течение одного месяца (февраль), что, по всей вероятности, связано с несвоевременной диагностикой, поздним обращением за медицинской помощью и значительной долей тяжелых форм. Хотя с начала марта число ассоциированных с COVID-19 смертей удерживалось на высокой отметке (около 3 тыс.), последующего роста в динамике не отмечалось.

Существенные различия имела динамика выявления летальных исходов на территории Италии: за короткий промежуток времени число смертей превысило 1,5 тыс. и в дальнейшем имело выраженную тенденцию к росту, достигнув 11 591 случая.

В США для эпидемического процесса COVID-19 было характерно медленное нарастание случаев инфицирования, сочетающееся с достаточно медленным приростом числа летальных исходов, которое составило 2398 случаев.

Изучение инцидентных случаев коронавирусной инфекции в этом периоде позволило установить следующие закономерности распределения случаев заражения COVID-19 и новых (вновь выявленных) летальных исходов (табл. 1, рис. 3).

Распределение количества новых случаев заражения выявило наличие статистически значимых различий между всеми анализируемыми странами (р<0,0001). В то же время при изучении новых летальных исходов установлены статистически значимые различия только между Италией и остальными анализируемыми странами (р<0,001), ситуация в США и Китае статистически значимо не отличалась по этому показателю (р=0,09).

Кроме выявления статистически значимых разли-

Китай

| Италия

США

ммммммипппппппппп

Время наблюдения

Рис. 1. Кумулятивная заболеваемость СОМй-19 в разных странах (в абсолютных числах) с января по март 2020 г.

^-мммммммиммпппппппппп ооооооооооооооооосэооо Ыюоо^^^ооосососососогдюоо-^юоо-^ ч-ч-ч-одсдодод ч-ч-ч-ододсдсо

Время наблюдения

Рис. 2. Кумулятивная летальность, ассоциированная с SARS-CoV-2, в разных странах (в абсолютных числах) с января по март 2020 г.

чий в появлении новых летальных исходов между исследованными странами большой интерес представляет факт существования по данному признаку сильной положительной корреляции (рис. 4). Так, коэффициент корреляции в парах стран варьировал между 0,89 и 0,95 при р<0,001.

Таблица 1

Описательные статистики

для вновь выявленных случаев СОМР-19

Страны

Ме [МКИ]

Минимум Максимум

Китай

453,00 [105,50-1965,75]

11

3893

Италия: 23.02-7.03 8 03-31 03

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

245 4050

48 977

788 6557

США:

4.03-18.03 19.03-31.03

224 11123

19 3355

658 19 332

* — использование Ме и МКИ нецелесообразно для стран, не достигших пика заболеваемости.

Рис. 3. Характеристика распределения новых летальных исходов в рассматриваемых странах

Полученные положительные корреляции дают возможность говорить об однонаправленности появления новых летальных исходов во всех исследованных странах вне зависимости от различий по интенсивности эпидемического процесса. Данная особенность позволила провести регрессионный анализ на основе данных Китая с целью разработки модели, которую можно аппроксимировать на страны, не достигшие пика эпидемии. С помощью полученного регрессионного уравнения можно спрогнозировать количество новых летальных исходов в странах, в которых распространение инфекции на данный момент не имеет максимума, в том числе в России.

На начальном этапе регрессионного анализа была разработана первая, исходная, модель 1 (вариант 1), для которой были определены следующие константы регрессии — р0 и в (табл. 2). Данная модель имела критерий А1С, равный 709,6.

Рис. 4. Диаграммы рассеивания, характеризующие сильную положительную связь между новыми летальными случаями:

а — в Китае и Италии (р=0,81; 95% ДИ 0,55-0,94; логарифмическая шкала); б — в Китае и США (р=0,82; 95% ДИ 0,78-0,98; логарифмическая шкала); в — в Италии и США (р=0,96; 95% ДИ 0,86-0,98; логарифмическая шкала); р — величина коэффициента корреляции Спирмена

//////////////////////^^^^

10 СТМ | 2020 | том 12 | №2 Д.В. Мелик-Гусейнов, Н.Н. Карякин, А.С. Благонравова, В.И. Климко, А.П. Баврина, ..., О.В. Ковалишена

Общий вид уравнения линейной регрессии для этой модели таков:

У=Х-Р1+Ро.

В нашем исследовании в качестве зависимой переменной У выступило количество новых летальных исходов, в качестве независимой переменной X — количество новых случаев COVID-19. Таким образом, полученная модель 1 (вариант 1) на основе этого уравнения имеет следующий вид:

У=Х-0,02+31,02.

Важным здесь является факт, что полученная регрессионная модель характеризуется коэффициентом детерминации [=0,5, что говорит о корректном описании моделью исходных данных.

Следующим этапом регрессионного анализа было построение прогностической модели, в которой переменные прошли логарифмическое преобразование (модель 1, вариант 2), что позволяет с большей уверенностью говорить о выполнении условия линейности ассоциаций. В этом случае данные для построения модели будут иметь следующий вид (табл. 3).

В описываемом случае общий вид уравнения линейной регрессии для модели 1 (вариант 2) примет такой вид:

!П(У)=!П(Х)-Р1+Ро.

После подстановки коэффициентов имеем: 1П(У)=1П(Х)-0,44+0,86.

После процедуры преобразования переменных методом логарифмирования коэффициент детерминации Я регрессионной модели 1 (вариант 2) увеличился до 0,7, что

свидетельствует об улучшении ее предсказательной способности.

При выполнении анализа была проведена проверка наличия линейной ассоциации между независимой и зависимой переменными. Факт выполнения этого условия подтверждается соответствующими графиками о распределении нестандартизованных остатков (рис. 5).

Отражено равномерное распределение числовых данных, при котором дисперсия остатков существенно не меняется с увеличением предсказываемой величины, а значит, условие линейности ассоциаций для регрессионной модели выполняется.

Проверка полученных моделей показала, что расчет новых летальных исходов с высокой точностью становится возможен, когда начинает наблюдаться устойчивое появление новых случаев COVID-19 — свыше 50 ежедневно в течение 14 дней. Например, при выявлении 894 заболевших коронавирусной

Таблица 2

Результаты линейного регрессионного анализа (модель 1, вариант 1)

Константа Величина константы Стандартная ошибка Уровень значимости 95% ДИ

во 31,02 6,92 0,001 17,21-44,83

0,02 0,005 0,001 0,01-0,03

Таблица 3

Результаты линейного регрессионного анализа (модель 1, вариант 2)

Константа Величина константы Стандартная ошибка Уровень значимости 95% ДИ

во 0,86 0,36 0,021 0,14-1,59

в1 0,44 0,06 0,0001 0,32-0,56

Рис. 5. График квартилей ^-О-рЫ) для регрессионных остатков и распределение прогнозируемых значений в зависимости от остатков (для модели 1, вариант 2)

ется отсутствие временного сдвига выявления интересуемого исхода, что можно будет учитывать при дальнейшем развитии моделей.

Таблица 4

Результаты множественного регрессионного анализа (модель 2)

Константа Величина константы Стандартная ошибка Уровень значимости 95% ДИ

во -13,31 5,1 0,008 -24,1...-3,7

0,017 0,003 0,0001 0,012-0,022

р2 0,01 0,001 0,0001 0,008-0,011

инфекцией можно ожидать 49 новых летальных исходов, которые могли быть связаны с инфицированием SARS-CoV-2 (при этом допустим временной сдвиг выявления интересуемого исхода на 3-6 дней). В ситуации, когда X становится равен нулю, можно говорить о спаде интенсивности распространения инфекции, а также о выходе кумулятивной смертности на плато. Число новых случаев летальных исходов в течение некоторого времени сохранится на уровне, равном р0 (31 летальный исход), а затем постепенно приблизится к нулю.

После поступления информации о росте ежедневного абсолютного числа тяжелых форм COVID-19, зарегистрированных в Китае, было решено расширить модель путем добавления этого дополнительного фактора, что явилось следующим этапом исследования. Доля тяжелых форм течения патологического процесса считается важным фактором риска развития летального исхода, и в текущей эпидемиологической ситуации служба здравоохранении Китая проводила первичный учет таких случаев, хотя качество данных может служить предметом дискуссии.

Множественная регрессионная модель (модель 2) строилась на основании данных табл. 4. Эта модель имела критерий А1С, равный 625,78.

Общий вид уравнения множественной линейной регрессии (модель 2) будет следующим:

У=Р0+Х1-Р1+Х2-Р2,

где Х1 — количество инфицированных; Х2 — количество тяжелых случаев; У — количество новых летальных исходов.

После подстановки данных модель 2 примет следующий вид: У=Х1-0,017+Х2-0,01-13,31.

После модернизации модели 2 коэффициент детерминации [ увеличился до 0,8, что говорит о еще большем повышении ее точности.

Например, на пике эпидемии в Китае по состоянию на 4.02.2020 г. наблюдалось 64 летальных исхода и на 5.02.2020 г. — 66 летальных исходов. Подставляя результаты в разработанную модель, получаем:

У=3235 инфицированныхх0,017+2788 тяжелых случаев*0,01-13,31=69 летальных исходов.

Этот результат практически соответствует реальным значениям смертности в интервале 4.02-5.02.2020 г.

Кроме улучшения предсказательной способности важным достоинством расширенной модели 2 явля-

Заключение

Разработанные регрессионные модели для контроля инфекции и прогнозирования числа летальных исходов можно вполне успешно использовать и в России в условиях распространения заболеваний из группы «новых инфекций», когда происходят быстрая смена первичных данных, получаемых из разных источников, а также уточнение этой информации. При этом исходная модель может служить для ориентировочной оценки ситуации, а расширенная — для повышения точности прогнозирования и совершенствования алгоритма анализа.

Финансирование исследования и конфликт интересов. Исследование не финансировалось каким-либо источником, и конфликты интересов, связанные с данным исследованием, отсутствуют.

Литература/References

1. Huang C., Wang Y., Li X., Ren L., Zhao J., Hu Y., Zhang L., Fan G., Xu J., Gu X., Cheng Z., Yu T., Xia J., Wei Y., Wu W., Xie X., Yin W., Li H., Liu M., Xiao Y., Gao H., Guo L., Xie J., Wang G., Jiang R., Gao Z., Jin Q., Wang J., Cao B. Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China. Lancet 2020; 395(10223): 497506, https://doi.org/10.1016/s0140-6736(20)30183-5.

2. Verity R., Okell L.C., Dorigatti I., Winskill P., Whittaker C., Imai N., Cuomo-Dannenburg G., Thompson H., Walker P.G.T., Fu H., Dighe A., Griffin J.T., Baguelin M., Bhatia S., Boonyasiri A., Cori A., Cucunuba Z., FitzJohn R., Gaythorpe K., Green W., Hamlet A., Hinsley W., Laydon D., Nedjati-Gilani G., Riley S., van Elsland S., Volz E., Wang H., Wang Y., Xi X., Donnelly C.A., Ghani A.C., Ferguson N.M. Estimates of the severity of coronavirus disease 2019: a model-based analysis. Lancet Infect Dis 2020, https://doi. org/10.1016/s1473-3099(20)30243-7.

3. Wu J.T., Leung K., Bushman M., Kishore N., Niehus R., de Salazar P.M., Cowling B.J., Lipsitch M., Leung G.M. Estimating clinical severity of COVID-19 from the transmission dynamics in Wuhan, China. Nat Med 2020, https://doi. org/10.1038/s41591-020-0822-7.

4. World Health Organization. Coronavirus disease (COVID-19) outbreak situation. URL: https://www.who.int/ emergencies/diseases/novel-coronavirus-2019.

5. Распоряжение Правительства Российской Федерации от 30 января 2020 г. №140-р «О временном ограничении движения через пункты пропуска на отдельных участках государственной границы Российской Федерации с Китайской Народной Республикой».

Rasporyazhenie Pravitel'stva Rossiyskoy Federatsii ot 30 yanvarya 2020 g. No.140-r "O vremennom ogranichenii dvizheniya cherez punkty propuska na otdel'nykh uchastkakh gosudarstvennoy granitsy Rossiyskoy Federatsii s Kitayskoy Narodnoy Respublikoy" [Order of the Government of the

//////////////////////^^^^

12 СТМ | 2020 | том 12 j №2 Д.В. Мелик-Гусейнов, Н.Н. Карякин, А.С. Благонравова, В.И. Климко, А.П. Баврина, ..., О.В. Ковалишена

Russian Federation dated January 30, 2020 No.140-r "On the temporary restriction of traffic through checkpoints at certain sections of the state border of the Russian Federation with the People's Republic of China"].

6. Постановление Главного государственного санитарного врача Российской Федерации от 30 марта 2020 г. №9 «О дополнительных мерах по недопущению распространения COVID-19».

Postanovlenie Glavnogo gosudarstvennogo sanitarnogo vracha Rossiyskoy Federatsii ot 30 marta 2020 g. No.9 "O dopolnitel'nykh merakh po nedopushcheniyu rasprostraneniya COVID-19" [Decree of the Chief State Sanitary Doctor of the Russian Federation dated March 30, 2020 No.9 "On additional measures to prevent the spread of COVID-19"].

7. Министерство здравоохранения Российской Федерации. Профилактика, диагностика и лечение новой ко-ронавирусной инфекции (COVID-19). Временные методические рекомендации. Версия 4 (27.03.2020). URL: https://static-3.rosminzdrav.ru/system/attachments/attach-es/000/049/881/original/COVID19_recomend_v4.pdf.

Ministry of Health of the Russian Federation. Profilaktika,

diagnostika i lechenie novoy koronavirusnoy infektsii (COVID-19). Vremennye metodicheskie rekomendatsii. Versiya 4 (27.03.2020) [Prevention, diagnosis and treatment of new Coronavirus infection (COVID-19). Temporary guidelines. Version 4 (March 27, 2020)]. URL: https://static-3.rosminzdrav ru/system/attachments/attaches/000/049/881/original/ COVID19_recomend_v4.pdf.

8. Министерство здравоохранения Российской Федерации. URL: https://www.rosminzdrav.ru/.

Ministry of Health of the Russian Federation. URL: https:// www.rosminzdrav.ru/.

9. World Health Organization. Coronavirus disease 2019 (COVID-19). Situation report — 72. URL: https://www.who.int/ docs/default-source/coronaviruse/situation-reports/20200401-sitrep-72-covid-19.pdf?sfvrsn=3dd8971b_2.

10. Министерство здравоохранения Российской Федерации. Информационный ресурс о COVID-19. URL: https://covid19.rosminzdrav.ru/.

Ministry of Health of the Russian Federation. Informatsionnyy resurs o COVID-19 [Information resource about COVID-19]. URL: https://covid19.rosminzdrav.ru/.

i Надоели баннеры? Вы всегда можете отключить рекламу.