Научная статья на тему 'Классификация рентгеновских изображений грудной клетки больных вирусной пневмонией и COVID-19 с помощью нейронных сетей'

Классификация рентгеновских изображений грудной клетки больных вирусной пневмонией и COVID-19 с помощью нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
560
101
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
обработка рентгенографических изображений / сверточная нейронная сеть / классификация / COVID-19. / X-ray image processing / convolutional neural network / classification / COVID-19.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — В.Г. Ефремцев, Н.Г. Ефремцев, Е.П. Тетерин, П.Е. Тетерин, Е.С. Базавлук

В статье рассматривается применение нейронных сетей для классификации рентгенографических изображений больных пневмонией и COVID-19. Для выбора наилучших параметров изменения размеров и адаптивного выравнивания гистограммы яркости изображений, а также оптимальной архитектуры нейронной сети и ее гиперпараметров использовались precision, recall и f1-score. Высокие значения этих метрик качества классификации (> 0,91) убедительно свидетельствуют о надежном разграничении рентгенографических изображений больных пневмонией от больных COVID-19. Это открывает возможность создания модели c хорошей предсказательной способностью без привлечения готовых сложных моделей и без предварительного обучения на сторонних данных. Полученные результаты дают хорошие перспективы разработки чувствительных и надежных экспресс-методов диагностики заболевания COVID-19.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — В.Г. Ефремцев, Н.Г. Ефремцев, Е.П. Тетерин, П.Е. Тетерин, Е.С. Базавлук

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Chest X-ray image classification for viral pneumonia and Сovid-19 using neural networks

В статье рассматривается применение нейронных сетей для классификации рентгенографических изображений больных пневмонией и COVID-19. Для выбора наилучших параметров изменения размеров и адаптивного выравнивания гистограммы яркости изображений, а также оптимальной архитектуры нейронной сети и ее гиперпараметров использовались precision, recall и f1-score. Высокие значения этих метрик качества классификации (> 0,91) убедительно свидетельствуют о надежном разграничении рентгенографических изображений больных пневмонией от больных COVID-19. Это открывает возможность создания модели c хорошей предсказательной способностью без привлечения готовых сложных моделей и без предварительного обучения на сторонних данных. Полученные результаты дают хорошие перспективы разработки чувствительных и надежных экспресс-методов диагностики заболевания COVID-19.

Текст научной работы на тему «Классификация рентгеновских изображений грудной клетки больных вирусной пневмонией и COVID-19 с помощью нейронных сетей»

Классификация рентгеновских изображений грудной клетки больных вирусной пневмонией и COVID-19 с помощью нейронных сетей

В.Г. Ефремцев1, Н.Г. Ефремцев1, Е.П. Тетерин 2, П.Е. Тетерин 3, Е. С. Базавлук1 1 Независимый исследователь;

2Ковровская государственная технологическая академия им. В.А. Дегтярева, Россия, Владимирская обл., г. Ковров;

3 Национальный исследовательский ядерный университет «МИФИ», 115409, Россия, г. Москва

Аннотация

В статье рассматривается применение нейронных сетей для классификации рентгенографических изображений больных пневмонией и COVID-19. Для выбора наилучших параметров изменения размеров и адаптивного выравнивания гистограммы яркости изображений, а также оптимальной архитектуры нейронной сети и ее гиперпараметров использовались precision, recall и f1-score. Высокие значения этих метрик качества классификации (> 0,91) убедительно свидетельствуют о надежном разграничении рентгенографических изображений больных пневмонией от больных COVID-19. Это открывает возможность создания модели c хорошей предсказательной способностью без привлечения готовых сложных моделей и без предварительного обучения на сторонних данных. Полученные результаты дают хорошие перспективы разработки чувствительных и надежных экспресс-методов диагностики заболевания COVID-19.

Ключевые слова: обработка рентгенографических изображений, сверточная нейронная сеть, классификация, COVID-19.

Цитирование: Ефремцев, В.Г. Классификация рентгеновских изображений грудной клетки больных вирусной пневмонией и COVID-19 с помощью нейронных сетей / В.Г. Ефремцев, Н.Г. Ефремцев, Е.П. Тетерин, П.Е. Тетерин, Е.С. Базавлук // Компьютерная оптика. - 2021. -Т. 45, № 1. - С. 149-153. - DOI: 10.18287/2412-6179-CO-765.

Citation: Efremtsev VG, Efremtsev NG, Teterin EP, Teterin PE, Bazavluk ES. Chest x-ray image classification for viral pneumonia and Covid-19 using neural networks. Computer Optics 2021; 45(1): 149-153. DOI:W.18287/2412-6179-CO-765.

Введение

Быстрое распространение по всему миру короно-вируса 8ЛЯ8-СоУ-2 и связанного с ним заболевания СОУГО-19 [1, 2] в значительной степени объясняется отсутствием оперативной диагностики. Наибольшей достоверностью обладают методы на основе полиме-разной цепной реакции, но результат, как правило, готов через несколько часов при обеспечении довольно высоких требований к соблюдению технологии анализа и к профессионализму медперсонала. Поэтому разработка быстрых и надежных систем обнаружения СОУГО-19 необходима для предотвращения пандемии этого заболевания.

Наиболее сильно при СОУГО-19 поражаются легкие [3]. Для распознавания пневмонии, вызванной различными вирусами, широко применяется компьютерная томография с анализом полученных изображений методами глубокого обучения [4, 5]. Рентгенологическая диагностика, хотя и обладает меньшей разрешающей способностью, является более распространенной из-за большей доступности рентгеновских аппаратов и оказывает меньшее радиационное воздействие на пациентов. В настоящее время появляются работы, в которых предлагается использовать нейронные сети (НС) для обнаружения СОУГО-19 на основе анализа рентгенографических изображений

(РИ) [6 - 8]. В [9] сверточную нейронную сеть вначале обучали на внешнем наборе данных ImageNet, а затем дообучали, используя 13800 РИ, из которых 183 были с COVID-19. В работе [10] для выявления заболеваний COVID-19 была создана НС путем уменьшения слоев и фильтров уже существующей DarkNet, и для получения модели применялось 127 рентгенограмм с диагнозом COVID-19. В [11] и [12] показана возможность применения готовых НС Alexnet, Googlenet, Resnet18 и Truncated Inception Net для диагностики COVID-19, используя всего 307 РИ, и отмечено преимущество Googlenet в некоторых сценариях. В этих исследованиях показана перспективность данного направления и подчеркнуто, что его развитие сдерживает крайне малое количество РИ с COVID-19, находящихся в открытом доступе. В [13], применяя предварительно обученные модели, показано, что из VGG19, MobileNet v2 Inception, Xception, Inception и ResNet v2 лучшие результаты дает MobileNet v2, при этом отмечается, что точность классификации сильно зависит от количества образцов, представленных в каждом классе. В работе [14] особое внимание уделяется предварительной обработке данных для повышения точности классификации.

Целью данного исследования является разработка классификатора РИ больных вирусной пневмонией и COVID-19 на базе наиболее простой НС, без исполь-

зования готовых моделей других разработчиков и без предварительного обучения на сторонних данных, имея только небольшой набор РИ.

Предварительная обработка изображений и движение информационных потоков

Основные этапы подготовки данных и движения информационных потоков приведены на рис. 1. Рентгеновские снимки были получены из источника [15], где они находились в открытом доступе в виде архива, содержащего 219 РИ формата PNG больных COVID-19 и 1341 РИ больных вирусной пневмонией, с размером 1024 х 1024 пикселей. В сопроводительном файле указано происхождение РИ: "We have developed the database of COVID-19 x-ray images from Italian Society of Medical and Interventional Radiology (SIRM) COVID-19 DATABASE, Novel Corona Virus 2019 Dataset developed by Joseph Paul Cohen and Paul Morrison and Lan Dao in GitHub and images extracted from 43 different publications". Все исходные РИ на первом этапе были разделены на две группы по классификационному признаку и помещены в соответствующие папки. В папке COV_ALL поместились РИ больных COVID-19, а в папке VPN_ALL были размещены РИ больных пневмонией, и далее они поступали в блок предварительной обработки (блок PREPROCESSING).

Рис. 1. Схема предварительной обработки изображений и движения информационных потоков

Предварительный анализ РИ показал, что по краям некоторых снимков находятся служебные символы, которые в закодированном виде могут нести информацию о принадлежности изображения к тому или иному классу.

Чтобы НС искала информационные признаки именно на изображениях легких, посредством опера-

ции CROP на всех исходных снимках было удалено по 10 % периферийной части изображения. Так как изображение математически представляет собой матрицу, то вырезанное изображение получается путем копирования матрицы, пропуская по 10 % первых и последних строк, а также пропуская по 10 % левых и правых колонок изображений. На языке Python эта математическая операция формализуется следующим образом:

im_crop = im[102:922,102:922],

где

im - матрица исходного изображения, im_crop - матрица обрезанного изображения. Дальнейший визуальный анализ РИ показал, что они крайне неоднородны по яркости. В информационно важных областях легких наблюдались или излишние затемнения, или осветления, т. е. значения пикселей были ограничены небольшим диапазоном и, соответственно, присутствовал узкий пик на гистограмме яркости. Простое растяжение гистограммы для всего изображения может привести к нежелательному изменению яркости. Поэтому для лучшего проявления информационных признаков к РИ была применена операция адаптивного выравнивания гистограммы посредством функции CLAHE библиотеки компьютерного зрения OpenCV.

В этом алгоритме изображения разбиваются на прямоугольные участки и для каждого рассчитывается функция распределения яркости пикселей, как функция относительного числа пикселей от конкретных значений яркости. Преобразованное изображение получается изменением яркости каждого пикселя Rj входного изображения в значение яркости Sk соответствующего пикселя выходного изображения, рассчитанное по формуле [16]:

sk , j_0 n

где

k - номер пикселя, изменяется от 0 до L-1, L - максимальное число градации яркости, а j изменяется от 0 до k; nj - число пикселей с яркостью Rj, n - общее число пикселей изображения. Затем для удаления артефактов на границах участков в виде эффекта шахматного поля применяется билинейная интерполяция, т.е. вычисление средневзвешенного значения яркости пикселей путем линейной интерполяции сначала в одном диагональном направлении, а затем в другом.

Для получения изображений необходимого размера, согласно рекомендации разработчиков библиотеки OpenCV, применялась функция cv2.imresize() с алгоритмом интерполяции cv2.INTER_AREA, так как применение этого алгоритма исключает появление искажений типа «муар».

Далее для каждого класса (блок SPLIT) формировались выборки обучения (train), проверки (val) и тестирования (test) НС. Для этого все РИ перемешивалась случайным образом при помощи функции Python3 random.shuffle(). В этом случае модуль random генерирует случайные числа, а расширение shuffle() обеспечивает случайное перемешивание снимков.

Затем в каждом классе также случайно выбиралось по 10 % РИ, и они помещались в тестовые выборки (блоки TEST_COV и TEST_VPN).

Оставшиеся данные для каждого класса были снова в случайном порядке разделены на два независимых набора в соотношении 90 % и 10 % для обучения (блоки TRAIN_COV, TRAIN_VPN) и проверки (блоки VAL_COV и VAL_VPN). После этого все данные были нормализованы. Для того, чтобы каждый снимок попадал в тестовую выборку, все расчеты и соответственно случайные перемешивания были выполнены 50 раз.

Для уменьшения переобучения и частичной компенсации дисбаланса количество изображений в каждом классе для обучающей выборки было увеличено до 10000 путем добавления трансформированных снимков (блок AUGM). Трансформации представляли собой изменения в случайном порядке следующих параметров: поворот в интервале от +15 и до -15 градусов, сдвиг влево и вправо в интервале от 1 и до 15 пикселей, изменение масштаба и яркости в интервале от 0 и до 10 %, поворот вокруг горизонтальной оси в интервале от 1 и до 180 градусов, что обеспечивалось функцией ImageDataGenerator, входящей в библиотеку Keras.

Далее слиянием соответствующих выборок двух классов были сформированы полные выборки обучения, проверки и тестирования (блоки TRAIN_ALL, VAL_ALL и TEST_ALL).

Для обучения НС (блок FIT) на ее вход подаются полные выборки обучения и проверки, а также метки классов этих выборок (блоки LABEL_TRAIN и LABEL_VAL). Результатом обучения является модель НС.

Для тестирования этой модели она поступает на блок PREDICT, куда также поступает полная выборка для тестирования (TEST_ALL) и соответствующий набор меток классов (блок LABEL_TEST).

Блок REPORT показывает результат работы модели на тестовых данных. По каждому классу выводится информация по основным критериям классификации: precision, recall и f1-score. Также показывается количество РИ в каждом классе.

Precision = TP / (TP + FP) показывает, сколько из предсказанных положительных результатов являются действительно положительными.

Recall = TP / (TP + FN) показывает, сколько от общего числа фактических положительных результатов было предсказано как положительные.

F1-score - среднее гармоническое precision и recall и применяется для расчета сбалансированного среднего результата.

Где TP, TN, FP и FN - истинно-положительный, истинно-отрицательный, ложно-положительный и ложно-отрицательный результат.

Для формирования отчета применялась функция classification_report библиотеки машинного обучения scikit-learn.

Структура сверточной нейронной сети

Для разработки классификатора РИ использовалась сверточная НС, на вход которой подаются РИ. Результатом работы обученной НС является метка, которая относит изображение к тому или иному классу. Методы перекрестной проверки и решетчатого поиска показали, что лучшие результаты дает НС, состоящая из пяти следующих друг за другом сверточ-ных слоев (рис. 2). Эти слои имели 32, 64, 128, 192 и 256 фильтров для первого и последующих сверточ-ных слоев и одинаковые размеры ядра (3 х 3). Подробное описание других слоев приведено в [17].

Рис. 2. Архитектура и основные параметры свёрточной НС

При обучении использовался оптимизатор Adam (lr = 0.001, beta_1 = 0.9, beta_2 = 0.999). В нашем случае лучшие результаты были получены, когда в качестве функции потерь использовалась не бинарная, а категориальная кросс-энтропия. Обучение проводили при 350 эпохах. Для предотвращения переобучения применялась регуляризация.

При выборе архитектуры и гиперпараметров НС использовалась метрика

accuracy = (TP + TN) / (TP + TN + FP + FN),

отражающая количество верно классифицированных результатов, поделенное на их общее количество [18].

Характер изменения значений accuracy и loss-функции для Train и Val выборок (рис. 3) указывает на отсутствие переобучения модели НС.

Качество классификатора оценивалось на тестовом наборе по наиболее часто используемым метрикам Precision, Recall и F1-score [18, 19].

Loss/Accuracy

Epoch

Рис. 3. Изменение accuracy и loss-функции в процессе обучения свёрточной нейронной сети

Выбор наилучшей архитектуры и гиперпараметров НС осуществлялся по максимальным значениям этих метрик и по их равномерности для каждого класса.

Анализ полученных результатов

Для оценки предсказательной способности полученного классификатора были выбраны снимки с размером: 768 х 768, 512 х 512, 224 х 224, 112 х 112 и 64 х 64 пикселей. Лучшие результаты были получены на снимках с размером 224 х 224, и далее приведены результаты обработки этих изображений.

В табл. 1 для тестовой выборки представлены значения метрик качества этого классификатора для больных пневмонией и СОУГО-19.

Табл. 1. Метрики точности классификатора

precision recall f1-score Кол-во РИ

Пневмония 0,99 0,99 0,99 134

COVID-19 0,91 0,95 0,93 21

Приведённые высокие значения критериев классификации (> 0,91) убедительно свидетельствуют о надежной классификации, т.е. о надежном отличии РИ больных пневмонией от РИ больных COVID-19.

Высокие значения precision, приведенные в табл. 1 (0,99 для пневмонии и 0,91 для COVID-19), указывают на небольшое количество ложно-положительных обнаружений этих заболеваний, а высокие величины recall (0,99 для пневмонии и 0,95 для COVID-19) свидетельствуют, что классификатор дает неверный результат не более чем в 5% случаев с COVID-19. Более высокие значения метрик для пневмонии возмож-

но связаны со значительно большим количеством РИ с этим заболеванием.

Все показатели, приведенные в табл. 1, указывают на высокое качество классификации, что однозначно свидетельствуют о возможности применения НС для обнаружения случаев COVID-19 по РИ грудной клетки.

Программные средства: Win 10x64, Python 3.7, Numpy 1.16.5, OpenCV 4.2.0, Matplotlib 3.1.1, Tensorflow 2.1.0, Scikit-Learn 0.22.

Аппаратные средства: Intel Corei i7-7700, 32GB DDR3, SSD Samsung 970 Pro 512GB, NVIDIA GeForce GTX 1080.

Выводы

Оценка предсказательной способности представленной НС показала, что при оптимальных пробопод-готовке и выборе архитектуры, а также правильном подборе гиперпараметров существует возможность создания классификатора РИ больных вирусной пневмонией и COVID-19 без привлечения готовых сложных моделей и без предварительного обучения на сторонних данных.

Увеличение количества РИ больных COVID-19 приведет к повышению предсказательной способности классификатора и созданию чувствительных и надежных экспресс-методов диагностики, что уменьшит нагрузку на систему здравоохранения.

Сознавая острую необходимость создания высокоточных и практических решений по оперативному обнаружению COVID-19, авторы готовы предоставить всю информацию, полученную в ходе выполнения данной работы, в т.ч. и исходный код НС, научному сообществу и заинтересованным разработчикам.

Благодарности

Работа выполнена при поддержке программы «Повышение конкурентоспособности ведущих университетов РФ» (проект 5-100), контракт №02.a 03.21.0005, 27.08.2013.

Литература

1. Wu, F. A new Coronavirus associated with human respiratory disease in China / F. Wu, S. Zhao, B. Yu [et al.] // Nature. - 2020. - Vol. 579, Issue 7798. - P. 265-269.

2. World Health Organization. Pneumonia of unknown cause -China [Electronical Resource] - 2020. - URL: https://www.who.int/csr/don/05-january-2020-pneumonia-of-unkown-cause-china/en/ (request data 2.11.2020).

3. Веселова, Е.И. Новая коронавирусная инфекция / Е.И. Веселова, А.Е. Русских, Г. Д. Каминский, О.В. Ловачева, А.Г. Самойлова, И.А. Васильева // Туберкулёз и болезни лёгких. - 2020. - Т. 98, № 4. - С. 614. - DOI: 10.21292/2075-1230-2020-98-4-6-14.

4. Пашина, Т.А Сравнение алгоритмов выделения области интереса на компьютерных томограммах лёгких / Т.А. Пашина, А.В. Гайдель, П.М. Зельтер, А.В. Капиш-ников, А.В. Никоноров // Компьютерная оптика. - 2020. -Т. 44, № 1. - С. 74-81. - DOI: 10.18287/2412-6179-CO-659.

5. Li, L. Using artificial intelligence to detect COVID-19 and community-acquired pneumonia based on pulmonary CT: Evaluation of the diagnostic accuracy / L. Li [et al.] // Radiology. - 2020. - Vol. 296, Issue 2. - P. E65-E71. - DOI: 10.1148/radiol.2020200905.

6. Nath, M. Automatic detection of pneumonia from chest X-Rays using deep learning / M. Nath, C. Choudhury. - In: Machine learning, image processing, network security and data sciences / ed. by A. Bhattacharjee, S. Borgohain, B. Soni, G. Verma, X.-Z. Gao. - Singapore: Springer, 2020.

- P. 175-182. - DOI: 10.1007/978-981-15-6315-7_14.

7. Okeke, S. An efficient deep learning approach to pneumonia classification in healthcare / S. Okeke [et al.] // Journal of Healthcare Engineering. - 2019. - Vol. 2019. - 4180949.

- DOI: 10.1155/2019/4180949.

8. Swapnarekha, H. Role of intelligent computing in COVID-19 prognosis: A state-of-the-art review / H. Swapnarekha [et al.] // Chaos, Solitons & Fractals. - 2020. - Vol. 138. -109947. - DOI: 10.1016/j.chaos.2020.109947.

9. Wang, L. COVID-Net: A tailored deep convolutional neural network design for detection of COVID-19 cases from chest X-Ray images [Electronical Resource] / L. Wang, A. Wong // arXiv preprint. - 2020. - URL: https://arxiv.org/abs/2003.09871 (request data 2.11.2020).

10. Ozturk, T. Automated detection of COVID-19 cases using deep neural networks with X-ray images / T. Ozturk [et al.] // Computers in Biology and Medicine. - 2020. - Vol. 121.

- 103792. - DOI: 10.1016/j.compbiomed.2020.103792.

11. Loey, M. Within the lack of chest COVID-19 X-Ray dataset: A novel detection model based on GAN and deep transfer learning / M. Loey, F. Smarandache, N.E.M. Khalifa // Symmetry. - 2020. - Vol. 12. - 651. -DOI: 10.3390/sym12040651.

12. Das, D. Truncated inception net: COVID-19 outbreak screening using chest X-Rays / D. Das, K.C. Santosh, U. Pal // Physical and Engineering Sciences in Medicine. - 2020. - Vol. 43, Issue 3. - P. 915-925. - DOI: 10.1007/s13246-020-00888-x.

13. Apostolopoulos, ID. COVID-19: automatic detection from X-Ray images utilizing transfer learning with convolutional neural networks / I.D. Apostolopoulos, T.A. Mpesiana // Physical and Engineering Sciences in Medicine. - 2020. - Vol. 43, Issue 2. -P. 635-640. - DOI: 10.1007/s13246-020-00865-4.

14. Tuncer, T. An automated residual exemplar local binary pattern and iterative relieff based COVID-19 detection method using chest X-Ray image / T. Tuncer, S. Dogan, F. Ozyurt // Chemometrics and Intelligent Laboratory Systems. - 2020. - Vol. 203. - 104054. - DOI: 10.1016/j.chemolab.2020.104054.

15. CoronaHack -Chest X-Ray-Dataset. Classify the X-Ray image which is having Corona [Electronical Resource]. -2020. - URL: https://www.kaggle.com/praveengovi/ coronahack-chest-xraydataset (request data 2.11.2020).

16. Гонсалес, Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. - Москва: Техносфера, 2005. -1072 с.

17. Шолле, Ф. Глубокое обучение на Python. - СПб.: Питер, 2018.

18. Мюллер, А. Введение в машинное обучение с помощью Python / А. Мюллер, С. Гвидо. - М.: Вильямс, 2016.

19. Жерон, О. Прикладное машинное обучение с помощью Scikit-Learn и TensorFlow: концепции, инструменты и техники для создания интеллектуальных систем / О. Жерон; пер. с англ. - СпБ.: ООО "Альфа-книга", 2018.

Сведения об авторах

Ефремцев Вадим Григорьевич, 1950 года рождения, в 1972 году окончил Коломенский педагогический институт по специальности «Физика», к.ф.-м.н. (1981). Область научных интересов: компьютерная обработка изображений, программирование, нейронные сети. E-mail: evadim07@smail.com .

Ефремцев Николай Григорьевич, 1950 года рождения, в 1972 году окончил Коломенский педагогический институт по специальности «Физика». Область научных интересов: компьютерная обработка изображений, программирование, нейронные сети. E-mail: enick07@smail.com .

Тетерин Евгений Петрович, 1948 года рождения, в 1974 году окончил Всесоюзный заочный машиностроительный институт по специальности «Приборы точной механики», зав. кафедрой физики Ковровской государственной технологической академии им. В.А. Дегтярева, д.т.н. (2004 г.). Область научных интересов: электромагнитное поле во взаимодействии с веществом, физика жидкого состояния, нейронные сети. E-mail: phys-tep@mail. ru .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Тетерин Петр Евгеньевич, 1987 года рождения, в 2010 году окончил Национальный исследовательский ядерный университет «МИФИ» по специальности «Физика конденсированного состояния вещества», к.ф.-м.н. (2013), работает ведущим инженером в НИЯУ МИФИ. Область научных интересов: детекторы элементарных частиц, осаждение тонких пленок, нейронные сети. E-mail: peteterin@mephi.ru .

Базавлук Егор Сергеевич, 2008 года рождения. Физико-математический лицей «Вторая школа», г. Москва. Область научных интересов: компьютерная обработка изображений, программирование, нейронные сети. E-mail: bazavluk2008@smail.com .

ГРНТИ: 28.23.15

Поступила в редакцию 13 июня 2020 г. Окончательный вариант - 9 декабря 2020 г.

Chest x-ray image classification for viral pneumonia and ^vid-19

using neural networks

V.G. Efremtsev1, N.G. Efremtsev1, E.P. Teterin 2, P.E. Teterin 3, E.S. Bazavluk1

1 Independent researcher

2 Kovrov State Technological Academy named after VA.Degtyarev, Kovrov, Vladimir region, Russia;

3 National Research Nuclear University "MEPhI", Moscow, Russia

Abstract

The use of neural networks to detect differences in radiographic images of patients with pneumonia and COVID-19 is demonstrated. For the optimal selection of resize and neural network architecture parameters, hyperparameters, and adaptive image brightness adjustment, precision, recall, and f1-score metrics are used. The high values of these metrics of classification quality (> 0.91) strongly indicate a reliable difference between radiographic images of patients with pneumonia and patients with COVID-19, which opens up the possibility of creating a model with good predictive ability without involving ready-to-use complex models and without pre-training on third-party data, which is promising for the development of sensitive and reliable COVID-19 express-diagnostic methods.

Keywords: X-ray image processing, convolutional neural network, classification, COVID-19.

Citation: Efremtsev VG, Efremtsev NG, Teterin EP, Teterin PE, Bazavluk ES. Chest x-ray image classification for viral pneumonia and Covid-19 using neural networks. Computer Optics 2021; 45(1): 149-153. DOI:10.18287/2412-6179-CO-765.

Acknowledgements The authors thank for the support from the National Research Nuclear University MEPhI in the framework of the Russian Academic Excellence Project (contract No. 02.a03.21.0005, 27.08.2013).

References

[1] Wu F, Zhao S, Yu B, et al. A new coronavirus associated with human respiratory disease in China. Nature 2020; 579(7798): 265.

[2] World Health Organization. Pneumonia of unknown cause -China. Source: (https://www.who.int/csr/don/05-january-2020-pneumonia-of-unkown-cause-china/en/).

[3] Veselova EI, Russkikh AE, Kaminskiy GD, Lovacheva OV, Samoylova AG, Vasilyeva IA. Novel coronavirus infection [In Russian]. Tuberculosis and Lung Diseases 2020; 98(4): 6-14. DOI: 10.21292/2075-1230-2020-98-46-14.

[4] Pashina TA, Gaidel AV, Zelter PM, Kapishnikov AV, Ni-konorov AV. Automatic highlighting of the region of interest in computed tomography images of the lungs. Computer Optics 2020; 44(1): 74-81. DOI: 10.18287/2412-6179-CO-659.

[5] Li L, et al. Using artificial intelligence to detect COVID-19 and community-acquired pneumonia based on pulmonary CT: Evaluation of the diagnostic accuracy. Radiology 2020; 296(2): E65-E71. DOI: 10.1148/radiol.2020200905.

[6] Nath M, Choudhury C. Automatic detection of pneumonia from chest X-Rays using deep learning. In Book: Bhattacharjee A, Borgohain S, Soni B, Verma G, Gao X-Z, eds. Machine learning, image processing, network security and data sciences. Singapore: Springer; 2020: 175-182. DOI: 10.1007/978-981-15-6315-7_14.

[7] Okeke S, et al. An efficient deep learning approach to pneumonia classification in healthcare. J Healthc Eng 2019; 2019: 4180949. DOI: 10.1155/2019/4180949.

[8] Swapnarekha H, et al. Role of intelligent computing in COVID-19 prognosis: A state-of-the-art revie. Chaos Solitons Fractals 2020; 138: 109947. DOI: 10.1016/j.chaos.2020.109947.

[9] Wang L, Wong A. COVID-Net: A tailored deep convolutional neural network design for detection of COVID-19 cases from chest X-Ray images. 2020. Source: (https://arxiv.org/abs/2003.09871).

[10] Ozturk T, et al. Automated detection of COVID-19 cases using deep neural networks with X-ray images. Comput Biol Med 2020; 121: 103792. DOI: 10.1016/j.compbiomed.2020.103792.

[11] Loey M, Smarandache F, Khalifa NEM. Within the lack of chest COVID-19 X-Ray dataset: A novel detection model based on GAN and deep transfer learning. Symmetry 2020; 12: 651. DOI: 10.3390/sym12040651.

[12] Das D, Santosh KC, Pal U. Truncated inception net: COVID-19 outbreak screening using chest X-Rays. Phys Eng Sci Med 2020; 43(3): 915-925. DOI: 10.1007/s13246-020-00888-x.

[13] Apostolopoulos ID, Mpesiana TA. COVID-19: automatic detection from X-Ray images utilizing transfer learning with convolutional neural networks. Phys Eng Sci Med 2020; 43(2): 635-640. DOI: 10.1007/s13246-020-00865-4.

[14] Tuncer T, Dogan S, Ozyurt F. An automated residual exemplar local binary pattern and iterative relieff based COVID-19 detection method using chest X-Ray image. Chemom Intell Lab Syst 2020; 203: 104054. DOI: 10.1016/j.chemolab.2020.104054.

[15] CoronaHack -Chest X-Ray-Dataset. Classify the X-Ray image which is having Corona. Source: (https://www.kaggle.com/praveengovi/coronahack-chest-xraydataset)

[16] Gonzalez RC, Woods RE. Digital image processing. 3rd ed. Pearson Education Inc; 2008.

[17] Chollet F. Deep learning with Python. New York: Manning Publications; 2017.

[18] Müller AC, Guido S. Introduction to machine learning with Python: A guide for data scientists. OReilly Media; 2016.

[19] Géron A. Hands-on machine learning with Scikit-Learn intelligent systems. Sebastopol, CA: O'Reilly Media; 2017.

and TensorFlow: Concepts, tools, and techniques to build

Authors' information

Vadim Grigorievich Efremtsev, (b.1950) graduated from Kolomna Pedagogical Institute in 1972 with a degree in Physics. Ph.D. (1981). Research interests: computer image processing, programming, neural networks. E-mail: evadim07@gmail.com .

Nikolay Grigorievich Efremtsev, (b.1950) graduated from Kolomna Pedagogical Institute in 1972 with a degree in Physics. Research interests: computer image processing, programming, neural networks. E-mail: enick07@gmail.com .

Evgeniy Petrovich Teterin, (b.1948) graduated from the All-Union Correspondence Mechanical Engineering Institute in 1974 with a degree in Precision Mechanics Devices. Currently he works as head of Physics department in Kovrov State Technological Academy named after V.A. Degtyarev. Dr. of Science (2004). Research interests: electromagnetic fields incl. backgrounds and interaction with matter, liquid state physics, acoustics, neural networks. E-mail: phys-tep@mail.ru .

Petr Evgenyevich Teterin (b. 1987) graduated from National Research Nuclear University "MEPhl" in 2010, Solid State Physics department. Ph.D. (2013). He works as the lead engineer at MEPhl. Research interests are currently focused on elementary particle detectors, thin film deposition, data analysis, neural networks. E-mail peteterin@mephi.ru .

Egor Sergeevich Bazavluk (b. 2008) student of a physics and mathematics lyceum "2nd school", Moscow. Research interests: computer image processing, programming, neural networks. E-mail: bazavluk2008@gmail.com .

Received June 13, 2020. The final version - December 9, 2020.

i Надоели баннеры? Вы всегда можете отключить рекламу.