Научная статья на тему 'РОЛЬ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В ПРОГНОЗИРОВАНИИ ВСПЫШЕК ИНФЕКЦИЙ'

РОЛЬ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В ПРОГНОЗИРОВАНИИ ВСПЫШЕК ИНФЕКЦИЙ Текст научной статьи по специальности «Медицинские науки и общественное здравоохранение»

CC BY
37
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Большие данные / анализ данных / прогноз инфекции / Персональная информация / имитационное моделирование / системная динамика

Аннотация научной статьи по медицинским наукам и общественному здравоохранению, автор научной работы — Амирбекова Джамиля Ибрагим, Султанова Ахира Бахман

В научном сообществе инструменты искусственного интеллекта и больших данных широко используются для решения глобальных проблем и борьбы с потенциальными событиями. Одним из таких глобальных событий является пандемия короновируса, начавшаяся в начале 2020 года. Наука о данных дает возможность оценить влияние пандемии и предсказать распространение инфекции. Кроме того, расширение строящейся модели экономическими, социальными и инфраструктурными факторами позволяет прогнозировать изменения во всех сферах деятельности человека в постоянно меняющейся эпидемиологической обстановке. Данная статья посвящена использованию анонимных и персональных данных в прогнозировании распространения коронавирусной инфекции. Базовая модель «Восприимчивый-зараженный-зараженный выздоравливающий» была разработана с учетом многих административных и социальных факторов. Созданная модель разработана и более предсказуема, поэтому ее можно использовать для оценки и предотвращения воздействия любой пандемии, которая может возникнуть в будущем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским наукам и общественному здравоохранению , автор научной работы — Амирбекова Джамиля Ибрагим, Султанова Ахира Бахман

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «РОЛЬ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В ПРОГНОЗИРОВАНИИ ВСПЫШЕК ИНФЕКЦИЙ»

МЕДИЦИНСКИЕ НАУКИ

РОЛЬ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В ПРОГНОЗИРОВАНИИ

ВСПЫШЕК ИНФЕКЦИЙ

АМИРБЕКОВА ДЖАМИЛЯ ИБРАГИМ

ДОЦ. СУЛТАНОВА АХИРА БАХМАН

Азербайджанский Государственный Университет Нефти и Промышленности

Резюме

В научном сообществе инструменты искусственного интеллекта и больших данных широко используются для решения глобальных проблем и борьбы с потенциальными событиями. Одним из таких глобальных событий является пандемия короновируса, начавшаяся в начале 2020 года. Наука о данных дает возможность оценить влияние пандемии и предсказать распространение инфекции. Кроме того, расширение строящейся модели экономическими, социальными и инфраструктурными факторами позволяет прогнозировать изменения во всех сферах деятельности человека в постоянно меняющейся эпидемиологической обстановке. Данная статья посвящена использованию анонимных и персональных данных в прогнозировании распространения коронавирусной инфекции. Базовая модель «Восприимчивый-зараженный-зараженный выздоравливающий» была разработана с учетом многих административных и социальных факторов. Созданная модель разработана и более предсказуема, поэтому ее можно использовать для оценки и предотвращения воздействия любой пандемии, которая может возникнуть в будущем.

Ключевые слова: Большие данные; анализ данных; прогноз инфекции; Персональная информация; имитационное моделирование; системная динамика.

1.Бход

Главной из функций постоянно развивающихся технологий является их способность справляться с возникающими глобальными вызовами. Так, в качестве примера можно указать на пандемию COVID-19, которая долгое время находилась в центре внимания мирового сообщества. Пандемия превратилась в глобальную проблему с массовым воздействием на все сферы человеческой деятельности. Несмотря на то, что медицина, биохимия, молекулярная биология и иммунология находятся в центре внимания этой глобальной проблемы, социальные и экономические науки также работают над новыми проектами по прогнозированию вирусов и пандемий и минимизации последствий.

Информатика в основном выступает в качестве исследовательского инструмента, но область ее применения этим не ограничивается. Таким образом, информатика играет ряд важных ролей, таких как анализ анонимных и общих данных, ограничение масштабов распространения вируса и прогнозирование его распространения.

Искусственный интеллект — это область компьютерных наук, которая призвана решать перечисленные задачи, но отличается своими особенностями. Существует множество исследований, основанных на автоматическом обнаружении COVID-19 и других вирусов на основе симптомов или различных признаков. В этой статье описываются модели обнаружения COVID-19 и других вирусов на основе нейронных сетей, предназначенные для дальнейшего снижения бремени выявления случаев COVID-19.Самым важным инструментом обучения данным для прогнозирования распространения COVID-19 является моделирование. Помимо моделирования распространения COVID-19 на больших территориях и отдельных объектах, симуляции описывают структуры и поведение систем на разных уровнях.

ОФ "Международный научно-исследовательский центр "Endless Light in Science"

Традиционные методы прогнозирования заболеваний, такие как исторические аналогии, экспертные оценки и т. д., не учитывают сложность общества и различные факторы, влияющие на распространение вируса. Таким образом, исторические аналогии с SARS-CoV в 2002-2003 гг., пандемией гриппа H1N1 в 2009-2010 гг. или эпидемией лихорадки Эбола в 2014-2016 гг. игнорируют специфические характеристики SARS-CoV-2, повлиявшие на его развитие и распространение в обществе.

Хотя простые математические методы не способны предсказать распространение COVID-19 из-за их нелинейного характера, математическое описание зависимостей внутри системы может быть обоснованно использовано для имитационной модели. Система, в которой распространяется вирус, сложна и не может быть решена аналитическими методами. Потому что сложные системы имеют множество причинно-следственных связей, которые усиливают и уравновешивают петли обратной связи и задержки. 2. Материалы и методы 2.1 Инструменты моделирования

Моделирование рекомендуется как наиболее практичный способ охарактеризовать распространение COVID-19. Согласно методике имитационного моделирования реальная система (регион, учреждение) заменяется моделью этой системы, включающей в себя все признаки, влияющие на распространение COVID-19; в результате модель имитирует поведение системы в аналогичных ситуациях

Для моделирования распространения вируса используются два основных метода моделирования: системная динамика и агентное моделирование.Агентное моделирование описывает систему как набор агентов, способных выполнять условные действия, воздействующие на нее. Поскольку агентное моделирование предназначено для меньшего числа агентов, его целесообразнее применять на небольших предприятиях. Одним из преимуществ агентного моделирования является то, что оно позволяет исследователю добавлять к агенту свойства, определяющие его поведение в различных ситуациях. В отличие от агентного моделирования, системная динамика не опускается до уровня индивидуумов, а работает с высокоуровневыми и абстрактными данными. Динамическая модель системы структурно представлена совокупностью ресурсов, потоков и преобразователей. В математическом смысле системно-динамическая модель представляет собой систему дифференциальных уравнений, причем эта система может быть сколь угодно сложной.

Существует специальный класс моделей системной динамики, предназначенных для имитации распространения вирусов. Они называются моделями SIR, что расшифровывается как Susceptible — Infected — Recovered. Базовая модель SIR делит все население региона на 3 категории: восприимчивые (S), инфицированные (I) и выздоровевшие (R) лица, а также определяет правила высокого уровня для перехода между этими тремя группами. Различные типы моделей SIR используются для имитации распространения COVID-19, включая дополнительные группы лиц: экспонированные (E) - модели SEIR, умершие (D) - модели SIRD и повторно восприимчивые (D) - модели SIRS/SIS. . В качестве модели для проведения имитационного эксперимента используется модель SEIR, замененная на помещенных в карантин особей.Добавление новой группы особей соответствует процессу изоляции, позволяющему отличить неэкспонированных или зараженных особей от потенциально зараженных, но еще не выявленных особей.Это позволяет не только учитывать наличие инкубационного периода вируса CoV-2, но и строить разные сценарии снятия ограничений в разных отраслях.Структура модели представлена на рис.

Рисунок 1. Структура модифицированной модели SEIR с лицами, находящимися на

карантине

Данная модель предполагает последовательное перемещение между группами слева направо по маршруту "S-E-I-R" с возможностью временной изоляции ("Q") в карантине (рис. 1). На рисунке 1 9(t) и ro(t) обозначают сценарии создания и снятия ограничения соответственно. Скорость перехода особей по маршруту "S-E-I-R" определяется коэффициентами в, у и 5.

Алгоритмически эта модель представляет собой систему пяти дифференциальных уравнений, каждое из которых соответствует своей группе лиц. Процесс моделирования включает численное решение системы дифференциальных уравнений для заданного набора параметров. Процесс численного решения системы дифференциальных уравнений осуществляется на языке программирования Python, включая процесс подбора параметров при калибровке.

2.2 Ввод данных

Для калибровки модели использовались исторические данные о текущем количестве случаев заражения COVID-19 с 1 августа 2020 г. по 31 октября 2020 г. (три месяца) в Санкт-Петербурге, Россия. Этот временной интервал соответствует полному и непротиворечивому набору данных из двух официальных источников (подробнее об этом будет сказано ниже). Наборы данных состоят из одной переменной: текущего количества людей, инфицированных COVID-19 в регионе.

Источник данных 1: Официальная информация оперативного штаба Роспотребнадзора.

Источник данных 2: Официальные данные региональных органов исполнительной власти в области здравоохранения Санкт-Петербурга.

Источник 1 преимущественно собирается и обрабатывается в агрегированном виде, что исключает возможность нахождения там персональных данных. С другой стороны, данные из Источника 2 собираются с участием персональных данных перед обработкой и затем обезличиваются. По этой причине данные из Источника 2 потенциально более точны. На рис. 2 данные из источника 1 сравниваются с данными из источника 2.

20.000

Рисунок 2. Сравнение данных из Источника 1 и Источника 2

В данных из источника 2 больше колебаний, что объясняется различиями в методологии сбора и обработки данных. Одним из таких различий может быть, например, еженедельная сезонность или характеристики записей пациентов, которые приходят и уходят между точками фиксации данных. Этот результат применим только к моделям системной динамики, основанным на общих свойствах. При этом важность отдельных данных в классе агентных моделей может быть принципиально разной. Это связано с тем, что в моделях на основе агентов каждый человек моделируется как агент с определенными характеристиками, которые могут влиять на распространение инфекции в соответствии с целью исследователя.

Результат

Здесь мы предлагаем подход к оценке необходимости использования персональных данных для прогнозирования распространения инфекции. В рамках данного подхода был подготовлен прогноз текущего количества инфицированных COVID-19 в Санкт-Петербурге на основе двух баз данных. Первый набор данных сначала собирался и обрабатывался в агрегированном виде, а второй основывался на персональных данных. Для прогнозирования использовалась модифицированная модель SEIR с лицами, находящимися на карантине.Результаты моделирования показали, что использование персональных данных для прогнозирования распространения инфекции с использованием моделей системной динамики является завышенным, что объясняется особенностями моделирования системной динамики в целом. других классов моделей хотя и делает результат прогноза более точным, но увеличивает потребность в использовании персональных данных.

Мы используем нейронную сеть в программной части, гибридная программа Ап1^ использовалась с использованием больших данных и искусственного интеллекта и интеграции нейронной сети.

ЛИТЕРАТУРА

1. Ozturk, T.; Talo, M.; Yildirim, E.A.; Baloglu, U.B.; Yildirim, O.; Rajendra Acharya, U. Automated detection of COVID-19 cases using deep neural networks with X-ray images. Comput. Biol. Med. 2020, 121, 103792.

2. Loey, M.; Smarandache, F.; M. Khalifa, N.E. Within the Lack of Chest COVID-19 X-ray Dataset: A Novel Detection Model Based on GAN and Deep Transfer Learning. Symmetry 2020, 12, 651

3. Ardabili, S.F.;, A.; Ghamisi, P.;, F.; Varkonyi-Koczy, A.R.; Reuter, U.; Rabczuk, T.;, P.M. COVID-19 Outbreak Prediction with Machine Learning. Algorithms 2020, 13, 249

4. Currie, C.S.M.;, Monks, T.; Onggo, B.S.; Robertson, D.A.; Tako, A.A. How simulation modelling can help reduce the impact of COVID-19. J. Simul. 2020, 14, 83-97

5. Cuevas, E. An agent-based model to evaluate the COVID-19 transmission risks in facilities. Comput. Biol. Med. 2020, 121, 103827.

6. Ahmad, N.; Chauhan, P. State of Data Privacy During COVID-19. Computer 2020, 53, 119.

7. Salman, A.M.;, Scenario analysis of COVID-19 transmission dynamics in Malaysia with the possibility of reinfection and limited medical resources scenarios. Comput. Biol. Med. 2021,

8. Huang, H.; Zheng, X.; Zuo, X.; et al. COVID-19: A Call for Physical Scientists and Engineers. ACS Nano 2020, 14, 3747-3754.

9. Peter, O.; Shaikh, A.; Ibrahim, M.; Sooppy Nisar, K.; Baleanu, D.; Khan, I.; Abioye, A. Analysis and Dynamics of Fractional Order Mathematical Model of COVID-19 in Nigeria Using Atangana-Baleanu Operator. Comput. Mater. Contin. 2021, 66, 1823-1848

10. Santosh, K.C. COVID-19 Prediction Models and Unexploited Data. J. Med. Syst. 2020, 44,

i Надоели баннеры? Вы всегда можете отключить рекламу.