УДК 616.98-004.8:579-036.22
РОЛЬ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В ПРОГНОЗИРОВАНИИ ПРОБЛЕМ COVID-19:
АНАЛИТИЧЕСКИЙ ОБЗОР
А.М. ХАДЖИБАЕВ1, Ф.Т. АДЫЛОВА2, Х.М. КАСИМОВ1, В.Х. ШАРИПОВА1, Н.Б. ИСХАКОВ1
1 Республиканский научный центр экстренной медицинской помощи Минздрава Республики Узбекистан
2Институт математики им. В.И. Романовского Академии Наук Республики Узбекистан
Сегодня есть три проблемы пандемии COVID-19, на которых сосредоточены исследования передовых научных центров мира: прогноз распространения вируса, прогноз состояния пациентов с COVID-19, разработка противовирусной вакцины. Понятно, что каждая из этих проблем требует отдельного обсуждения, поскольку число публикаций превышает десятки тысяч только за последние несколько месяцев. Самое примечательное состоит в том, что все три проблемы в качестве инструмента исследования используют искусственный интеллект. Раннее прогнозирование динамики распространения вируса поможет снизить заболеваемость, а прогноз динамики состояния больного оптимизирует его лечение. Поэтому желательно иметь интеллектуальные инструменты прогнозирования для обоих случаев. Внедрение надежных моделей прогнозирования может помочь правительству в реализации более эффективных стратегий для предотвращения распространения вируса и снижения смертности.
В данной статье проведен сравнительный анализ применения методов ИИ (машинного и глубокого обучения), статистических и математических методов в прогнозировании двух аспектов COVID-19, заболеваемость и состояние пациента. Основная наша цель - представить различные подходы машинного обучения, используемые при прогнозировании распространения заболеваемости, и прогнозировании состояния пациентов c COVID-19 в отделениях интенсивной терапии.
Ключевые слова: распространение эпидемии, состояние пациентов, прогнозирование, искусственный интеллект.
Библ.: 47 наименований
THE ROLE OF ARTIFICIAL INTELLIGENCE IN PREDICTING COVID-19 PROBLEMS:
AN ANALYTICAL REVIEW
A.M. KHADJIBAEV1, F.T. ADILOVA2, KH.M. KASIMOV1, V.KH. SHARIPOVA1, N.B. ISKHAKOV1
Republican Scientific Center for Emergency Medicine of the Ministry of Health of the Republic of Uzbekistan
2V. I. Romanovsky Institute of Mathematics of the Academy of Sciences of the Republic of Uzbekistan
Today, there are three problems of the COVID-19 pandemic, on which studies of the world's leading scientific centers are concentrated: the prognosis of the spread of the virus, the prognosis of patients' status with COVID-19, and the development of an antiviral vaccine. It is clear that each of these problems requires a separate discussion, since the number of publications exceeds tens of thousands over the past few months alone. The most remarkable thing is that all three problems use artificial intelligence as a research tool. Early prediction of the dynamics of the spread of the virus will help reduce the incidence, and the prognosis of the dynamics of the patient's condition will optimize his treatment. Therefore, it is desirable to have intelligent forecasting tools for both cases. Implementing robust forecasting models can help governments develop more effective strategies to prevent the spread of the virus and reduce mortality.This article provides a comparative analysis of the application of AI methods (machine and deep learning), statistical and mathematical methods in predicting
two aspects of COVID-19: the incidence rate and forecastingthe state of patients. Our main goal is to present various machine learning approaches used in predicting the spread of morbidity and predicting the condition of patients with COVID-19in intensive care units.
Key words: epidemic spread, patient status, forecasting, artificial intelligence. Bibl.: 47 items.
ВВЕДЕНИЕ
Вспышка коронавирусной инфекции (БДКБ-Со^^) началась в декабре 2019 года (COVID-19) в Китае; последствия всемирной пандемии создали необычайную проблему для всего мира, которая имеет много уникальных и даже неизвестных особенностей, с которыми человек никогда не сталкивался [1-3].
Почти во всех странах, затронутых эпидемией, число инфицированных и умерших пациентов увеличивается с удручающей скоростью. Коэффициенты летальности при COVID-19 зависят от нескольких важных факторов, среди которых забота о критических пациентах - одна из самых важных [4].
Сегодня есть три проблемы, на которых сосредоточены силы многих передовых научных центров мира, прогноз распространения заболеваемости, прогноз состояния пациентов и разработка противовирусной вакцины. Понятно, что каждая из этих проблем требует отдельного обсуждения, поскольку число публикаций превышает десятки тысяч только за последние несколько месяцев. Но самое примечательное состоит в том, что все три проблемы в качестве инструмента исследования используют искусственный интеллект [5, 6].
Точный прогноз распространения вируса и упреждающее прогнозирование состояния пациентов может снизить заболеваемость и увеличить число положительных исходов, и потому разработка и внедрение эффективных математических моделей и искусственного интеллекта в этой области может помочь правительству в реализации более эффективных стратегий для предотвращения распространения вируса. Многие считают, что искусственный интеллект (ИИ) будет одним из наиболее мощных потенциальных арсеналов. Как ИИ может помочь?
В данной статье проведен сравнительный анализ применения методов ИИ (машинного и глубокого обучения), статистических и математических методов в прогнозировании двух аспек-
тов COVID-19 - заболеваемость и состояние пациента. Проблема разработки вакцины выходит за рамки данной работы. Основная наша цель - представить различные подходы машинного обучения, используемые при прогнозировании распространения заболеваемости, и прогнозировании состояния пациентов в отделениях интенсивной терапии при COVID-19 [6, 7].
Подходы в классификации, прогнозировании и профилактике COVID-19.
Из-за быстрого распространения SARS-CoV-2, врачи сталкиваются с чрезвычайными трудностями в диагностике COVID-19. Несмотря на то что метод полимеразной цепной реакции с обратной транскрипцией (RT-PCR) является стандартным методом, используемым в диагностике COVID-2019 [8], из-за пандемии он страдает от таких ограничений, как дефицит приборов, низкая чувствительность, временные затраты. В последние годы анализ медицинских изображений является одним из наиболее перспективных направлений исследований. Поэтому анализ медицинских изображений - рентген, компьютерная томография и сканеры, может преодолеть ограничения RT-PCR. Ниже остановимся на основных подходах искусственного интеллекта в исследованиях, связанных с пандемией.
Машинное обучение
Фундаментальная способность машинного обучения - это вывод прогностических моделей без знания основного механизма, который обычно неизвестен или недостаточно определен. В пандемии использовались различные подходы машинного обучения - машина опорных векторов, регрессия, случайный лес, K-средние и т. д. в прогнозировании и диагностике SARS-CoV-2. Кратко остановимся на двух наиболее широко используемых алгоритмах машинного обучения.
Случайный лес (Random Forest, RF)
Алгоритм случайного леса (RF) является одним из наиболее перспективных и признанных классификаторов, который использует несколько деревьев для обучения и прогнозирования данных. Для
точного и быстрого распознавания COVID-19 Wuet. al. [9] предложили инструмент, основанный на алгоритме случайного леса, для извлечения 11 ключевых характеристик крови из доступных клинических образцов. В этом исследовании алгоритм случайного леса используется в качестве инструмента выделения пациентов с симптомами COVID-19. Предложенный метод добился лучших результатов при прогнозировании COVID-19 с точностью 0,9795 для набора перекрестной проверки (cross-validation) и 0,9697 для тестового набора. Кроме того, алгоритм показал высокую чувствительность, специфичность и общую точность 0,9512, 0,9697 и 0,9595 соответственно на внешнем (external) наборе данных. После многочисленных проверок предложенный подход стал точным инструментом для распознавания инфекции COVID-19.
Большая международная группа ученых исследовала, почему некоторые люди страдают от тяжелых симптомов коронавируса вплоть до смертельного исхода. Предположили, что это может быть связано с группами крови и особенностями иммунных реакций. Ученые выделили генетические локусы, связанные с рисками заболевания. Авторы работы изучили почти 2000 тяжелых случаев коронавирусной инфекции в Испании и Италии, и сравнили геномы пациентов с геномами 2300 здоровых людей. Они искали вариации генома, которые были бы у больных, но отсутствовали у здоровых. Внимание уче-
ных привлекли генетические локусы 3p21.31 и 9q34.2. В первом располагаются гены, связанные с противовоспалительными белками, во втором — с группами крови. Исследователи выделили также генетические вариации, связанные с дыхательной недостаточностью. Именно новый локус 3p21.31, связанный с восприимчивостью к ко-ронавирусу, обеспечивает потенциальную связь групп крови и риска заражения [10].
Чтобы предсказать пребывание в больнице пациентов, инфицированных новым коронави-русом, Qiet. al. [11] предложил модель, основанную на линейной регрессии и случайном лесе. Предложенная модель, основанная на 6 характеристиках второго порядка, была уточнена с учетом признаков, полученных при поражениях пневмонией в наборах данных обучения. Кроме того, прогнозирующая эффективность была оценена с использованием тестового набора данных сначала только на уровне легких, а затем на уровне пациента. Оказалось, что модель была эффективной в разделении краткосрочного и долгосрочного пребывания пациентов в больнице. Кроме того, модель линейной регрессии продемонстрировала чувствительность и специфичность 1,0 и 0,89, в то время как модель случайного леса показала соответственно 0,75 и 1,0. В приведенной ниже таблице 1 показано использование метода случайного леса в прогнозе инфекции SARS-CoV-2.
Автор Модель Проблема Тип данных Дата Ссылка
Cobb et al. Random Forest Изучение влияния социального дистанцирования на распространение ШУЮ-19 в стране Данные Апрель, 2020 [12]
Shi et al. Random Forest Классификация ШУЮ-19 из КТ изображений КТ изображение груди Март, 2020 [13]
Tang et al. Random Forest model Оценка тяжести пациентов с ШУЮ-19 КТ изображение груди Март, 2020 [14]
Sarkar & Chakrabarti Random Forest Определение важных предикторов смертности пациентов с ШУЮ-19 Данные Январь, 2020 [15]
Chen et al. Random Forest Определение негативных факторов выведения вируса Данные Январь, 2020 [16]
Таблица 1. Применение метода RF в прогнозе инфекции SARS-CoV-2
Машина опорных векторов (SVM) Поскольку SVM используется в качестве мощного инструмента для регрессии и классификации данных, он имеет высокую производительность во многих реальных приложениях, таких как анализ медицинских изображений, по сравнению с другими подходами машинного обучения. Поэтому он был использован при классификации и анализе COVID-19. Чтобы предсказать угрозу положительного диагноза COVID-19, Бай$1ае1а!. [17] предложили различные подходы к машинному обучению - нейронные сети, КР, логистическую регрессию, машину опорных векторов для обучения. Эффективность различных подходов машинного обучения изучалась на данных произвольной выборки из 70% пациентов на обучении, и на 30% тестовых данных. Автор делает вывод о том, что алгоритм SVM превосходит
Таблица 2. Использование SVM для COVID-19
по AUC, чувствительности, специфичности оценку Brier на 0,85, 0,68, 0,85 и 0,16 соответственно, по сравнению с другими алгоритмами машинного обучения.
Для диагностики пациентов, инфицированных COVID-19, по рентгенограммам грудной клетки, Hassanienetal. [18] предложили модель машинного обучения, разработанную на многоуровневом пороговом уровне и SVM. Результаты показывают, что предложенная модель достигает лучших показателей при средней чувствительности 95,76%, специфичности 99,7% и точности 97,48% соответственно. В таблице 2 представлены работы по SVM.
Помимо методов случайного леса и опорных векторов, также использовались другие подходы машинного обучения - линейная и логистическая регрессия, XGBoost, K-средние, нейронная сеть.
Автор Модель Проблема Тип данных Дата Ссылка
Sonbhadra SVM Научные статьи по активно- ---- Апрель, 2020 [19]
et al. сти короновируса
Zhang et al. SVM Выявление тяжелобольных с COVID-19 с легкой степенью симптоматики Данные Апрель, 2020 [20]
Hassanien et SVM Прогноз выздоровления Данные Апрель, 2020 [21]
al. пациентов с COVID-19
Barstugan et SVM Классификация COVID-19 КТ изображе- Март, 2020 [22]
al. ние
Sethy et al. SVM с глубокими признаками Обнаружение короновируса Рентгено-граммма Март, 2020 [23]
Методы глу
Методы глубокого обучения - это алгоритмы, которые состоят из простых, но нелинейных модулей, используемых для преобразования представления на одном уровне в представление на нескольких более интеллектуальных уровнях [24]. Глубокая структурная природа сделала модели глубокого обучения способными решать сложные задачи искусственного интеллекта. Парадигмы глубокого обучения открывают новые возможности в области медицинской информатики благодаря ее функциям, таким как сквозное обучение с комбинированным обучением признаков, способность обрабатывать сложные и многомодальные данные и т.д.
го обучения
Методы глубокого обучения использовались в эффективной классификации и анализе медицинских изображений. Многие исследователи использовали различные методы глубокого обучения, такие как сверточная нейронная сеть (CNN), длинная кратковременная память (LSTM), генеративные состязательные сети (GAN), остаточная нейронная сеть (Residual Neuralnetwork, ResNet), автоенкодер для классификации и прогнозирования инфекции COVID-19.
Сверточная нейронная сеть (CNN) Сверточная (конволюционная) нейронная сеть оказалась одним из самых высокоточных алгоритмов анализа медицинских изображений.
Признаками для идентификации COVID-19 на медицинских изображениях являются двустороннее распределение пятнистых теней и прозрачность матового стекла. Abbas et. al. [25] разработали модель DeTraC, основанную на CNN, для классификации рентгеновских изображений грудной клетки с COVID-19; результаты показывают, что DeTraC достигла точности 95,12%. Для распознавания пациента с COVID-19 по рентгеновским снимкам грудной клетки, Narinet. al., предложили различные эволюционные структуры нейронной сети, а именно ResNet50, InceptionV3 и Inception - ResNetV2 [26].
Чтобы предсказать количество положительных случаев, Huanget.al. [27] предложили модель прогнозирования COVID-19, основанную на CNN. Точность различных алгоритмов сравнивалась по средней абсолютной (MAE) и среднеквадратичной ошибкам (RMSE). Результаты показывают, что CNN достигает наибольшей эффективности прогнозирования при сопоставлении с другими подходами глубокого обучения, такими как LSTM, GRU и MLP.
Наконец, для автоматического распознавания положительных по COVID-19 случаев из рентгенограмм грудной клетки, Mukherjee et al. [28] предложили адаптированную архитектуру мелкой сверточной нейронной сети; предлагаемый метод достиг точности, чувствительности и AUC 96,92%, 0,942 и 0,9869 соответственно.
Однако диагностика больных с COVID-19, в основном, идет как анализ КТ-изображений. Огромное число публикаций цитируется именно по этому направлению. Многозадачная модель глубокого обучения была предложена Amyar et al. [29] и выполняла автоматический скрининг и сегментацию КТ-изображений грудной клетки. Модель была оценена на данных из 1044 пациентов, которая включает 449 пациентов, страдающих COVID-19, 100 нормальных случаев, 98 пациентов с раком легких и 397 случаев различных типов патологии. Результаты показывают, что модель имеет лучшую производительность по сравнению с другими методами сегментации и классификации изображений.
Полностью автоматическая система глубокого обучения для диагностики и прогностического анализа COVID-19 с помощью регулярно используемой компьютерной томографии была разработана в [30] https://doi.org/10.1101/2020.03.24.20042317.
Ретроспективно собрали 5372 пациента с КТ-изображениями; при этом 4106 пациентов - с КТ-изображениями и информацией о генах были использованы для предварительной тренировки нейронной сети, что позволило изучить особенности легких. Впоследствии 1266 пациентов (924 с COVID-19, 471 имели последующее наблюдение в течение 5+ дней; 342 с другой пневмонией) были зарегистрированы для обучения и внешней проверки эффективности системы глубокого обучения. В 4 внешних наборах проверки система глубокого обучения достигла хороших показателей при различении COVID-19 от других пневмоний (AUC=0,87 и 0,88) и вирусных пневмоний (AUC = 0,86).
Кроме того, системе глубокого обучения удалось разделить пациентов на группы высокого и низкого риска, у которых время пребывания в стационаре имеет значительную разницу. Без помощи человека система глубокого обучения автоматически фокусировалась на аномальных участках, которые демонстрировали согласованные характеристики с сообщенными радиологическими данными. Например, удалось показать, что глубокое обучение обеспечивает удобный инструмент для быстрого скрининга COVID-19 и поиска потенциальных пациентов с высоким риском, что может быть полезно для оптимизации медицинских ресурсов и ранней профилактики.
Долгосрочная кратковременная память (LSTM)
Долгосрочная кратковременная память - это тип рекуррентной нейронной сети, которая может хранить знания о предыдущих состояниях и может быть подготовлена для работы, требующей памяти. LSTM является одной из эффективных моделей для прогнозирования последовательных данных временных рядов. Новая многомерная пространственно-временная модель была предложена Jana et. al. [31]. Эта модель использует ансамбль свёрточного LSTM для точного прогноза динамики передачи COVID-19 в большом географическом регионе. Модель обучалась на данных США и Италии.
Чтобы предсказать количество случаев COVID-19 в Индии, подход, основанный на LSTM, был предложен в [32]. Модель использовалась для оценки эффективности мер по социальному дистанцированию при распространении пандемии. Кроме того, полученные данные показывают
Таблица 3. Применение LSTM в решении проблем пандемии COVID-19
Автор Модель Проблема Дата Ссылка
Jelodar et al. NLP с использованием LSTM_RNN Классификация нового Апрель, 2020 [33]
Ibrahim et al. Вариационный-LSTM автоенкодер Прогноз распространения ШУЮ-19 Апрель,2020 [34]
Patankar LSTM Разработка вакцины Март, 2020 [35]
Yang et al. Модифицированный SEIR и LSTM Прогноз кривой эпидемии ШУЮ-19 Март, 2020 [36]
Kafieh et al. M-LSTM Прогноз числа случаев в Иране Январь, 2020 [37]
RNN-LSTM Прогноз распространения
ШУЮ-19 Январь, 2020 [38]
Kolozsvari et
al. LSTM-GRU на основе
RNN Прогноз количества положитель- Январь, 2020 [39]
ных, отрицательных случаев
Ayyoubzadeh et al. LSTM и линейная регрессия Прогноз заболеваемости ШУЮ-19 в Иране 2020 [40]
точность предлагаемого подхода в прогнозировании числа положительных и выздоровевших
случаев в Индии. Таблица 3 показывает применимость LSTM в решении проблем пандемии.
Другие подходы глубокого обучения
Было также использовано несколько других подходов глубокого обучения, таких как генеративные состязательные сети (GAN) и «Автоэнко-дер», которые состоят из двух нейронных сетей, называемых генератором и дискриминатором, для создания новых синтетических экземпля-
ров данных из реальных соединений, которые никогда ранее не наблюдались. GAN широко используются при создании изображений, видео и голосовых сообщений. Автоэнкодер - это своего рода искусственная нейронная сеть, используемая для эффективного кодирования данных.
Математические и
Начиная с нескольких последних пандемий, математические и статистические модели успешно использовались при оценке человеческих потерь, а также в прогнозировании общего количества смертей до определенного периода или конца пандемии. Ряд исследований проводился на данных эпидемии в Китае [41-43]. Отметим, что модель прогнозирования дает лучшую точность прогнозирования смертности при оценке основных показателей состояний здоровья - сердечно-сосудистые заболевания, диабет, возраст пациента [44].
Эффективность подходов искусственного интеллекта Был проведен систематический анализ статей, связанных с COVID-19, использовавших различные подходы искусственного интеллекта.
статистические методы
Очевидно, что подходы машинного и глубокого обучения были успешно использованы при интерпретации медицинских изображений из-за извлечения признаков из мультимодального клинического набора данных, способности различать бактериальную и вирусную пневмонию, обнаруживать различные признаки на компьютерной томографии грудной клетки и эффективно обнаруживать эпидемические паттерны. Поэтому данные, полученные с использованием этих подходов, могут помочь врачам и исследователям в понимании и прогнозировании инфекции COVID-19 на ранней стадии.
Подходы машинного обучения
Подходы машинного обучения эффективно использовались при прогнозировании и диагностике COVID-19. Среди доступных подходов
машинного обучения для распознавания новой вспышки COVID-19 были использованы в основном два алгоритма - SVM, RF. Поскольку SVM является одним из лучших алгоритмов-классификаторов с минимальным уровнем ошибок и максимальной точностью, он дает лучшие результаты прогнозирования.
Случайный лес использует многократные ветви для идентификации образцов и устойчив к шуму, он широко используется при классификации медицинских изображений. Кроме того, подход случайного леса подходит для задачи с несколькими классами, тогда как SVM подходит для задач с двумя классами. Из анализа стало очевидным, что большинство подходов машинного обучения основываются на небольших наборах данных; имеющиеся ограничения предоставляют исследователям возможность разработать более точные модели прогнозирования.
Подходы глубокого обучения
В связи с преимуществами подходов глубокого обучения по сравнению с подходами машинного обучения, такими как отличная производительность, извлечение признаков без вмешательства человека и комплексная обработка, было проведено больше исследований в области диагностики инфекции COVID-19 с использованием методов глубокого обучения. Из систематического обзора видно, что CNN является одним из наиболее часто используемых подходов глубокого обучения для прогнозирования пандемии по медицинским изображениям по сравнению с другими подходами благодаря его способности автоматически извлекать признаки.
Пр<
В этом разделе рассматриваются некоторые из проблем, которые возникали при внедрении интеллектуальных инструментов для прогнозирования COVID-19.
Ограничение данных
Внедрение инструментов прогнозирования с использованием глубокого и машинного обучения требует огромного объема данных. Несмотря на то что наборы данных медицинских изображений являются общедоступными, эти наборы данных являются небольшими по сравнению с потребностями подходов глубокого обучения. Основной причиной недостатка измеренных данных является разделение данных по
Производительность методов может быть улучшена путем рассмотрения некоторых аспектов, таких как наличие экспертных знаний о решаемой задаче, дополнения и предварительная обработка, оптимизация гиперпараметров и т.д.
Что касается прогностического аспекта моделей, - с начала вспышки COVID-19 несколько групп исследователей и моделировщиков по всему миру разработали большое количество моделей прогнозирования, используя математические и интеллектуальные вычислительные подходы для прогнозирования тенденций COVID-19 в различных регионах мира. Список попыток прогнозирования COVID-19 во всем мире с использованием различных статистических моделей общедоступен https://ddi.sutd.edu.sg/
Результаты моделирования позволили получить прогнозную информацию о тенденциях COVID -19 во всем мире, например, случаи заражения, будущие случаи смерти, выздоровления, влияние социального дистанцирования, ограничения на поездки и так далее.
Однако эти модели показали широкий диапазон вариаций в прогнозах из-за неопределенности данных. Было обнаружено, что проблемы также наблюдались в наиболее цитируемой методике прогнозирования 1МНЕ [45, 46]. Поэтому, чтобы сделать более точные прогнозы в будущем, необходимо провести дополнительные исследования по совершенствованию инструментов и моделей прогнозирования для больших объемов биологической и эпидемиологической информации.
различным географическим регионам. Поэтому выравнивание источников данных является одной из ключевых проблем, которые необходимо решить.
Еще одно ограничение возникает при разработке качественных наборов данных, поскольку наборы данных в реальном времени содержат плохо выраженные смещения. Хотя трансферное обучение позволяет моделям быть конкретными с региональными характеристиками, выбор моделей затруднен из-за быстро меняющегося характера данных. Поэтому разработка аналитического подхода для преодоления этих ограничений также является одной из ключевых за-
дач. Большинство исследователей сталкиваются с проблемой нехватки реальных данных. Эта проблема может быть решена путем создания реальных наборов данных с обновляемыми данными. Еще одна проблема, которую необходимо учитывать, — это слабое участие врачей в исследованиях.
Точность прогноза
В любой научной работе существует скрытый риск, так как большинство методов в исследовании основаны на статистическом обучении на определенных наборах данных. Результаты исследования могут иметь предубеждения, которые могут повлиять на политику, проводимую правительством в борьбе с распространением болезней. Правильность данных может быть обеспечена путем предоставления воспроизводимых выводов. Это, в свою очередь, создает проблему баланса требований со срочностью получения результатов.
Использование предварительных подходов
Некоторые методы исследования данных, такие как ультразвуковое сканирование и магнитно-резонансная томография (МРТ), имеют ограниченное применение в борьбе с COVID-19. Несмотря на то что ультразвуковое сканирование показало хорошие результаты, как и при КТ грудной клетки, ни одно исследование не изучало использование ультразвукового сканирования в прогнозе COVID-19. Хотя некоторые исследования [47] показали эффективное использование МРТ для прогнозирования COVID-19-инфекций, тем не менее этот подход оставался неизученным из-за нехватки адекватных данных для обучения. Поэтому задача состоит в том, чтобы разработать аннотированный набор данных, на котором можно потенциально использовать новые подходы в прогнозировании инфекции COVID-19.
Необходимость современных интеллектуальных систем для идентификации COVID-19 на основе симптомов
Большинство исследований проведено только с учетом характеристик COVID-19 и других пневмоний. Результаты этих исследований могут не дать точных результатов, так как они не учитывают влияние других факторов, таких как возраст, пол, диабет, гипертония, хронические заболевания печени и почек и т.д. Поэтому для точного прогнозирования необходимо провести
дополнительные исследования по выявлению симптомов COVID-19.
Помимо моделей, основанных на прогнозировании, будущие исследования требуют большего внимания к проблемам классификации COVID -19 с помощью различных симптомов для простой и быстрой диагностики. Точный прогноз числа заболевших и смертей с использованием метода машинного обучения имеет первостепенное значение. Поскольку большинство моделей машинного обучения являются высокоточными с большим объемом данных, возможно, стоит отметить, что с увеличением количества данных и наборов данных COVID, многие высокоточные модели будут разработаны в качестве ведущего решения.
ЗАКЛЮЧЕНИЕ
В последние дни инфекция, вызванная SARS -CoV2, является одной из самых новых областей исследований, поскольку за короткий промежуток времени она затронула миллионы человек в различных странах. В этой статье было представлено состояние работ по прогнозированию инфекции COVID-19 с использованием различных интеллектуальных подходов. SARS-CoV-2 заразил около 8,9 млн и привел к 468,331 смертельным исходам по состоянию на 21 июня 2020 года, согласно данным ВОЗ.
Подходы глубокого и машинного обучения полезны для прогнозирования кризисного воздействия COVID-19 на различные сектора экономики и социума, что может помочь правительствам в реализации надлежащих стратегий по их преодолению. Из систематического анализа видно, что подходы, такие как ML, DL, математические и статистические подходы, были эффективно использованы для прогнозирования распространения пандемии COVID-19 и лечения пациентов в палатах интенсивной терапии.
Несмотря на это, все же существуют определенные барьеры, такие как ограниченная доступность аннотированных медицинских изображений, обучение на небольших наборах данных и ошибки в данных. Поэтому необходимо сосредоточиться на разработке более точных моделей, однако исследователи во всем мире в настоящее время сталкиваются с проблемой нехватки данных. Следовательно, для разработки более точных моделей прогнозирования необхо-
димо создать реальные наборы данных. Кроме того, точность инструментов прогнозирования может быть повышена за счет использования методов оптимизации, использования нейрон-
ЛИТ
1. Wu F., Zhao S., Yu B., Chen Y.M., Wang W., Song Z.G., et. al. A new Coronavirus associated with human respiratory disease in China. Nature. 2020;579(7798):265-9.
2. Paules C.I., Marston H.D., Fauci A.S. Coronavirus Infections-More Than Just the Common Cold. JAMA. 2020.
3. Takian A., Raoofi A., Kazempour-Ardebili S. COVID-19 battle during the toughest sanctions against Iran. Lancet. 2020:1.
4. Namendys-Silva S.A. Respiratory support for patients with COVID-19 infection. Lancet Respir Med. 2020.).
5. Alimadadi A., Aryal S., Manandhar I., Munroe P.B., Joe B., Cheng X. Artificial Intelligence and Machine Learning to Fight COVID-19. Physiol Genomics. 2020.
6. ShahabedinRahmatizadeh, Saeideh Valizadeh-Haghi, Ali DabbaghThe Role of Artificial Intelligence in Management of Critical COVID-19 Patients J Cell MolAnesth. 2020;5(1):16-22.
7. SwapnarekhaHanumanthu. Role of Intelligent Computing in COVID-19 Prognosis: AState-of-the-Art Review Chaos, Solitons and Fractals (2020), https://doi.org/10.1016/j. chaos.2020.109947
8. Xu, Xiaowei, et. al. «Deep learning system to screen coronavirus disease 2019 pneumonia.» arciv preprint a™iv:2002.09334 (2020)
9. Wu, Jiangpeng, et. al. «Rapid and accurate identification of COVID-19 infection through machine learning based on clinical available blood test results.» medRxiv (2020)]
10. David Ellinghaus, Ph.D., FraukeDegenhardt, M.Sc., Luis Bujanda, M.D.,Ph.D., Maria Buti, M.D., Ph.D., Agustin Albillos, M.D., Ph.D., Pietro Invernizzi, M.D., Ph.D., Javier Fernandez, M.D., Ph.D., Daniele Prati, M.D., Guido Baselli, Ph.D., Rosanna Asselta, Ph.D., Marit M. Grimsrud, M.D., Chiara Milani, Ph.D., Fatima Aziz, B.S., Jan Kassens,Ph.D.,et al Genomewide Association Study of Severe Covid-19 with Respiratory Failure The New England Journal of Medicine, June 18, 2020
ных сетей более высокого порядка в скрининге и прогнозировании COVID-19, который рассматривается в качестве дальнейшего направления исследований.
ГУРА
11. Qi, Xiaolong, et. al. «Machine learning-based CT radiomics model for predicting hospital stay in patients with pneumonia associated with SARS-CoV-2 infection: A multicenter study.» medRxiv (2020).
12. Cobb, J.S., and M.A.Seale. «Examining the Effect of Social Distancing on the Compound Growth Rate of SARS-CoV-2 at the County Level (United States) Using Statistical Analyses and a Random Forest Machine Learning Model.» Public Health (2020).
13. Shi, Feng, et. al. «Large-scale screening of covid-19 from community acquired pneumonia using infection size-aware classification.» arXiv preprint arXiv:2003.09860 (2020).
14. Tang, Zhenyu, et. al. «Severity assessment of coronavirus disease 2019 (COVID-19) using quantitative features from chest CT images.» arXiv preprint arXiv:2003.11988 (2020).
15. Sarkar, Jit and ParthaChakrabarti. «A Machine Learning Model Reveals Older Age and Delayed Hospitalization as Predictors of Mortality in Patients with COVID- 19.» medRxiv (2020).
16. Chen, Xiaoping, et. al. «Hypertension and diabetes delay the viral clearance in COVID- 19 patients.» medRxiv (2020).
17. De Moraes Batista, Andre Filipe, et al. «COVID-19 diagnosis prediction in emergency care patients: a machine learning approach.» medRxiv (2020).]
18. Hassanien, Aboul Ella, et. al. «Automatic X-ray COVID-19 Lung Image Classification System based on Multi-Level Thresholding and Support Vector Machine.» medRxiv (2020).]
19. Sonbhadra, Sanjay Kumar, Sonali Agarwal, and P. Nagabhushan. «Target specific mining of COVID-19 scholarly articles using one-class approach.» arXiv preprint arXiv:2004.11706 (2020).
20. Zhang, Nan, et. al. «Severity Detection For the Coronavirus Disease 2019 (COVID-19) Patients Using a Machine Learning Model Based on the Blood and Urine Tests.»(2020).
21. Hassanien, Aboul Ella, AyaSalama, and Ashraf Darwsih. Artificial Intelligence Approach to
Predict the COVID-19 Patient>s Recovery. No. 3223. EasyChair, 2020.
22. Barstugan, Mucahid, UmutOzkaya and Saban-Ozturk. «Coronavirus (COVID-19) classification using ct images by machine learning methods.» arXiv preprint arXiv:2003.09424 (2020).
23. Sethy, Prabira Kumar, and Santi Kumari Behera. «Detection of coronavirus disease (COVID-19) based on deep features.» Preprints 2020030300 (2020): 2020.
24. LeCun, Yann, YoshuaBengio and Geoffrey Hinton. «Deep learning. Nature 521.» (2015): 530-531
25. Abbas, Asmaa, Mohammed M.,Abdelsamea and Mohamed Medhat Gaber.»Classification of COVID-19 in chest X-ray images using DeTraC deep convolutional neural network.» arXiv preprint arXiv:2003.13815 (2020).
26. Narin, Ali, Ceren Kaya and ZiynetPamuk. «Automatic detection of coronavirus disease (covid-19) using x-ray images and deep convolutional neural networks.» arXiv preprint arXiv:2003.10849 (2020).
27. Huang, Chiou-Jye, et al. «Multiple-Input Deep Convolutional Neural Network Model for COVID-19 Forecasting in China.» medRxiv (2020)
28. Mukherjee, Himadri, et. al. «Shallow Convolutional Neural Network for COVID-19 Outbreak Screening using Chest X-rays.» (2020).]
29. Amyar, Amine, RomainModzelewski and SuRuan. «Multi-task Deep Learning Based CT Imaging Analysis For COVID-19: Classification and Segmentation.» medRxiv (2020).
30. Shuo Wang, YunfeiZha, Weimin Li, Qingxia Wu, Xiaohu Li, Meng et al A Fully Automatic Deep Learning System for 1 COVID-19 Diagnostic and Prognostic Analysis https://doi. org/10.1101/2020.03.24.20042317
31. Jana, Saikat, and ParamaBhaumik. «A multivariate spatiotemporal spread model of COVID-19 using ensemble of ConvLSTM networks.» medRxiv (2020)
32. Tomar, Anuradha and Neeraj Gupta. «Prediction for the spread of COVID-19 in India and effectiveness of preventive measures.» Science of The Total Environment (2020):138762.
33. Jelodar, Hamed et. al. «Deep Sentiment Classification and Topic Discovery on Novel Coronavirus or COVID-19 Online Discussions:
NLP Using LSTM Recurrent Neural Network Approach.» arXiv preprint arXiv:2004.11695 (2020).
34. Ibrahim, Mohamed R., et. al. «Variational-LSTM Autoencoder to forecast the spread of coronavirus across the globe.» medRxiv (2020).
35. Patankar, Sayalee. «Deep learning-based computational drug discovery to inhibit the RNA Dependent RNA Polymerase: application to SARS-CoV and C0VID-19.»(2020).
36. Yang, Zifeng, et al. «Modified SEIR and AI prediction of the epidemics trend of C0VID-19 in China under public health interventions.» Journal of Thoracic Disease 12.3 (2020): 165.
37. Kafieh, Rahele, et al. «COVID-19 in Iran: A Deeper Look Into The Future.» medRxiv (2020).
38. Kolozsvari, Laszlo Robert, et al. «Predicting the epidemic curve of the coronavirus (SARS-CoV-2) disease (COVID-19) using artificial intelligence.» medRxiv (2020).
39. Bandyopadhyay, Samir Kumar, and Shawni Dutta. «Machine Learning Approach for Confirmation of COVID-19 Cases: Positive, Negative, Death and Release.» medRxiv (2020).
40. Ayyoubzadeh, Seyed Mohammad, et al. «Predicting COVID-19 Incidence Through Analysis of Google Trends Data in Iran: Data Mining and Deep Learning Pilot Study.» JMIR Public Health and Surveillance 6.2 (2020): e18828.
41. Xu, Hui, et. al. «Analysis and Prediction of False Negative Results for SARS-CoV-2 Detection with Pharyngeal Swab Specimen in COVID-19 Patients: A Retrospective Study.» MedRxiv (2020).
42. Zhong, Linhao, et. al. «Early Prediction of the 2019 Novel Coronavirus Outbreak in the Mainland China Based on Simple Mathematical Model.» IEEE Access 8 (2020): 51761-51769.
43. Gao, Yuanyuan, et al. «Forecasting the cumulative number of COVID-19 deaths in China: a Boltzmann function-based modeling study.» Infection Control & Hospital Epidemiology (2020): 1-16.
44. Banerjee, Amitava et. al. «Estimating excess 1-year mortality from COVID-19 according to underlying conditions and age in England: a rapid analysis using NHS health records in 3.8 million adults.» medRxiv (2020)].
45. Woody, Spencer, et. al. «Projections for first-wave COVID-19 deaths across the US using social-distancing measures derived from mobile phones.» medRxiv (2020).
47. Poyiadji, Neo, et. al. «COVID-19-associated acute hemorrhagic necrotizingencephalopathy: CT and MRI features.» Radiology (2020): 201187.
Evaluation Model for predicting the course of the COVID-19 pandemic.» Annals of Internal Medicine (2020).
46. Jewell, Nicholas P., Joseph A.,Lewnard, and Britta L., Jewell. «Caution warranted: using the Institute for Health Metrics and
«СУНЪИЙ ИНТЕЛЛЕКТНИНГ COVID-19 МУАММОЛАРИНИ БАШОРАТ ЦИЛИШДАГИ РОЛИ»
А.М. ХАДЖИБАЕВ1, Ф.Т. АДЫЛОВА2, Х.М. КАСИМОВ1, В.Х. ШАРИПОВА1, Н.Б. Исхаков1
Республика шошилинч тиббий ёрдам илмий маркази 2В. И. Романовский номидаги математика институти
Бугунги кунда COVID-19 пандемиясининг учта муаммоси мавжуд, улар буйича дунё-нинг етакчи илмий марказлари изланишлари жамланган: вирус тарцалишининг прогнози, COVID-19 билан касалланган беморлар холатининг прогнози ва вирусга царши эмлашнинг ри-вожланиши. Ушбу муаммоларнинг хар бири алохида мухокама цилишни талаб цилиши аниц, чунки сунгги бир неча ой ичида нашрларнинг сони ун мингдан ошиб кетди. Энг диццатга са-зовор томони шундаки, учта муаммонинг хаммаси тадцицот воситаси сифатида сунъий ин-теллектдан фойдаланади. Вирус тарцалиш динамикасини олдиндан башорат цилиш касалла-нишни камайтиришга ёрдам беради ва беморнинг холати динамикасининг прогнози унинг даволанишини оптималлаштиради. Шунинг учун иккала холатда хам прогнозлашнинг ацлли воситаларига эга булиш мацсадга мувофицдир.
Прогнознинг ишончли моделларини яратиш хукуматларга вирус тарцалишининг ол-дини олиш ва улимни камайтириш учун янада самарали стратегияларни амалга ошириш-га ёрдам бериши мумкин. Ушбу мацола COVID-19нинг икки томонини: беморнинг касалли-ги ва холатини башорат цилишда сунъий интеллект (СИ) усулларини (машинада ва чуцур урганиш), статистик ва математик усулларни цуллашнинг циёсий тахлилини тацдим этади. Бизнинг асосий мацсадимиз интенсив терапия булимларида касалликнинг тарцалишини ва COVID-19 билан зарарланган беморларнинг холатини башорат цилишда ишлатиладиган тур-ли хил механизмларни урганиш усулларини тацдим этиш.
Калит сузлар: эпидемия тарщлиши, беморнинг холати, прогнозлаш, сунъий интеллект. Библ.: 47манба
Сведения об авторах:
Хаджибаев Абдухаким Муминович - д.м.н., профессор, заместитель министра здравоохранения Республики Узбекистан, генеральный директор Республиканского научного центра экстренной медицинской помощи
Адылова Фатима Туйчиевна - д.т.н., профессор, заведующая лабораторией биологической и медицинской кибернетики Института математики им. В.И. Романовского АН РУз
Касимов Хамит Махмудович - к.т.н., заместитель директора РНЦЭМП по инновациям. тел. 90 1743922, email: medkib@mail.ru
Шарипова Висолат Хамзаевна - д.м.н., руководитель научно-клинического отдела «Анестезиология и реаниматология» РНЦЭМП
Исхаков Нурбек Баркамолович - заведующий информационно-аналитическим отделом РНЦЭМП. ishakovn@mail.ru.