Научная статья на тему 'РАЗРАБОТКА ЭФФЕКТИВНОЙ АРХИТЕКТУРЫ CNN ДЛЯ КЛАССИФИКАЦИИ СНИМКОВ РЕНТГЕНОГРАММ С COVID-19'

РАЗРАБОТКА ЭФФЕКТИВНОЙ АРХИТЕКТУРЫ CNN ДЛЯ КЛАССИФИКАЦИИ СНИМКОВ РЕНТГЕНОГРАММ С COVID-19 Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
108
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАССИФИКАЦИЯ ИЗОБРАЖЕНИЙ / СВЁРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ / COVID-19 / РЕНТГЕНОВСКИЕ СНИМКИ / АРХИТЕКТУРА CNN

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Викулова Анастасия Александровна, Гришина Любовь Сергеевна, Болодурина Ирина Павловна

В течение последних нескольких лет человечество борется с новой коронавирусной инфекцией COVID-19. С целью снижения нагрузки на специалистов-рентгенологов актуальна разработка программного продукта, способствующего эффективному обнаружению заболевания COVID-19 по рентгеновским снимкам грудной клетки. Одним из подходов к созданию данной программы является использование свёрточных нейронных сетей. В данной статье рассмотрена задача классификации рентгеновских снимков для построения наиболее эффективной архитектуры CNN и увеличения точности результата определения COVID-19; исследованы 4 архитектуры нейронных сетей, содержащие различное количество слоёв свёртки и нейронов в них. Итоговое решение в выборе архитектуры CNN принято на основе f1-меры - наиболее точной метрики оценки качества классификатора. Наилучшие результаты показала модель Net1 с 5-ю слоями свёртки, точность составила 98 %.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Викулова Анастасия Александровна, Гришина Любовь Сергеевна, Болодурина Ирина Павловна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF AN EFFICIENT CNN ARCHITECTURE FOR CLASSIFYING X-RAY IMAGES WITH COVID-19

Over the past few years, humanity has been struggling with the new coronavirus infection COVID-19. In order to reduce the burden on radiologists, it is urgently necessary to develop a software product that contributes to the effective detection of COVID-19 disease using chest radiography. One of the approaches to creating this program is the use of convolutional neural networks. This article discusses the problem of classification of X-ray images to build the most efficient CNN architecture and improve the accuracy of the COVID-19 determination result; 4 neural network architectures containing different numbers of convolution layers and neurons in them are investigated. The final decision in choosing the CNN architecture was made on the basis of the f1 indicator - the most accurate metric for assessing the quality of the classifier. The best results were shown by the Net1 model with 5 convolution layers, the accuracy was 98%.

Текст научной работы на тему «РАЗРАБОТКА ЭФФЕКТИВНОЙ АРХИТЕКТУРЫ CNN ДЛЯ КЛАССИФИКАЦИИ СНИМКОВ РЕНТГЕНОГРАММ С COVID-19»

Шаг в науку • № 4, 2022

УДК 004.93

РАЗРАБОТКА ЭФФЕКТИВНОЙ АРХИТЕКТУРЫ CNN ДЛЯ КЛАССИФИКАЦИИ СНИМКОВ РЕНТГЕНОГРАММ С COVID-19

Викулова Анастасия Александровна, студент, направление подготовки 01.03.02 Прикладная математика и информатика, Оренбургский государственный университет, Оренбург e-mail: nastja.vik@mail.ru

Гришина Любовь Сергеевна, аспирант, направление подготовки 02.06.01 Компьютерные и информационные науки, Оренбургский государственный университет, Оренбург e-mail: zabrodina97@inbox.ru

Научный руководитель: Болодурина Ирина Павловна, доктор технических наук, профессор, заведующий кафедрой прикладной математики, Оренбургский государственный университет, Оренбург e-mail: prmat@mail.osu.ru

Аннотация. В течение последних нескольких лет человечество борется с новой коронавирусной инфекцией COVID-19. С целью снижения нагрузки на специалистов-рентгенологов актуальна разработка программного продукта, способствующего эффективному обнаружению заболевания COVID-19 по рентгеновским снимкам грудной клетки. Одним из подходов к созданию данной программы является использование свёрточных нейронных сетей. В данной статье рассмотрена задача классификации рентгеновских снимков для построения наиболее эффективной архитектуры CNN и увеличения точности результата определения COVID-19; исследованы 4 архитектуры нейронных сетей, содержащие различное количество слоёв свёртки и нейронов в них. Итоговое решение в выборе архитектуры CNN принято на основе fl-меры - наиболее точной метрики оценки качества классификатора. Наилучшие результаты показала модель Netl с 5-ю слоями свёртки, точность составила 98 %.

Ключевые слова: классификация изображений, свёрточные нейронные сети, COVID-19, рентгеновские снимки, архитектура CNN.

Благодарности: статья подготовлена в рамках исследования, проводимого в ходе реализации стратегического проекта «Технологии и кадры для ОПК», выполняемого по программе стратегического академического лидерства «Приоритет-2030».

Для цитирования: Викулова А. А., Гришина Л. С. Разработка эффективной архитектуры CNN для классификации снимков рентгенограмм с COVID-19 // Шаг в науку. - 2022. - № 4. - С. 35-40.

DEVELOPMENT OF AN EFFICIENT CNN ARCHITECTURE FOR CLASSIFYING

X-RAY IMAGES WITH COVID-19

Vikulova Anastasia Aleksandrovna, student, training program 01.03.02 Applied Mathematics and Computer Science, Orenburg State University, Orenburg e-mail: nastja.vik@mail.ru

Grishina Lyubov Sergeevna, postgraduate student, training program 02.06.01 Computer and Information Sciences, Orenburg State University, Orenburg e-mail: zabrodina97@inbox.ru

Research advisor: Bolodurina Irina Pavlovna, Doctor of Technical Sciences, Professor, Head of the Department of Applied Mathematics, Orenburg State University, Orenburg email: prmat@mail.osu.ru

Abstract. Over the pastfew years, humanity has been struggling with the new coronavirus infection COVID-19. In order to reduce the burden on radiologists, it is urgently necessary to develop a software product that contributes to the effective detection of COVID-19 disease using chest radiography. One of the approaches to creating this program is the use of convolutional neural networks. This article discusses the problem of classification of X-ray images to build the most efficient CNN architecture and improve the accuracy of the COVID-19 determination

Контент достутен под лицензией Creative Commons Attribution 4.0 International License. This work is licensed under a Creative Commons Attribution 4.0 International License. © А. А. Викулова, Л. С. Гришина, 2022

result; 4 neural network architectures containing different numbers of convolution layers and neurons in them are investigated. The final decision in choosing the CNN architecture was made on the basis of the f1 indicator - the most accurate metric for assessing the quality of the classifier. The best results were shown by the Netl model with 5 convolution layers, the accuracy was 98%.

Key words: image classification, convolutional neural networks, COV1D-19, X-ray images, CNN architecture.

Acknowledgements: this article was prepared as part of research conducted during the implementation of the strategic project «Technologies and personnel for the defense industry», carried out under the program of strategic academic leadership «Priority 2030».

Cite as: Vikulova, A. A., Grishina, L. S. (2022) [Development of an efficient CNN architecture for classifying X-ray images with COVID-19]. Shag v nauku [Step into science]. Vol. 4, pp. 35-40.

Введение

С самого зарождения человечество борется с опасными вирусными инфекциями, в 2019 году появилась новая коронавирусная инфекция COVID-19. В течение последних нескольких лет, специалисты здравоохранения стремятся осуществить комплекс противоэпидемиологических мероприятий [3, 5], результат которых во многом зависит от лучевых методов диагностики и оценки динамики COVID-19. Основными методами диагностики являются рентген и компьютерная томография, но в силу широкой доступности, легкости и безопасности проведения исследования, наиболее распространенным методом является рентгенологическое обследование. Врачи-рентгенологи работают с повышенной нагрузкой, из-за чего наблюдаются неизбежные ошибки при формировании медицинских заключений. Одним из решений данной проблемы является разработка качественного программного обеспечения, способствующего эффективному обнаружению заболеваний по рентгеновским снимкам грудной клетки.

1. Обзор исследований

Исследованиями в области построения интеллектуальных систем поддержки принятия врачебных решений занимаются по всему миру, в том числе разработкой новых методов диагностики и лечения COVID-19.

В статье [1] проводится диагностика пневмонии по рентгеновским снимкам с помощью нейронных сетей, автор использует различные функции активации [6] (Softmax, Sigmoid) и методы оптимизации (Adam, RMSProp). Для увеличения количества данных была применена аугментация1 данных. Наилучшие значения показателей точности получены со следующими параметрами: функция активации - Sigmoid, метод оптимизации - алгоритм RMSProp и равны: precision - 89%, accuracy - 82%, recall - 93%, т. е. диагнозы 89% людей тестовой выборки определены правильно.

Авторы работы [4] решают задачу классификации патологий головного мозга человека на сним-

ках МРТ с помощью трех методов классификации: классификация изображений по базовым примитивам контура, метод на основе свёрточной нейронной сети с бинарным классификатором и метод классификации на основе свёрточной предобучен-ной нейронной сети Xception. Использование второго метода позволяет сократить время на обучение и достичь наилучшую точность классификатора 91.4% на тестовой выборке.

В исследовании [2] авторы создают классификатор рентгеновских снимков больных вирусной пневмонией и COVID-19 без привлечения готовых сложных моделей и без предварительного обучения на сторонних данных и получают небольшое количество ложно-положительных обнаружений заболеваний (0,99 для вирусной пневмонии и 0,91 для COVID-19).

Таким образом, обзор современных исследований показал, что использование свёрточных нейронных сетей для разработки интеллектуальной системы поддержки принятия решений для диагностики тяжести заболеваний на текущий момент является актуальной темой исследований.

В данной работе рассмотрена задача классификации рентгеновских снимков для построения наиболее эффективной архитектуры свёрточной нейронной сети и увеличения точности результата определения COVID-19 по изображениям рентгенограмм.

2. Постановка задачи и описание набора данных

Пусть X - множество изображений рентгенограмм; Y = {0,1,2} - множество классов, характеризующее заключение рентгеновских снимков, где 0 -COVID-19; 1 - Normal; 2 - Pneumonia. Существует неизвестная целевая зависимость - отображение у':Х -» Y.

Дано: {xll...,xl} с X - обучающая выборка; У* = У&ОЛ = l,i — известные ответы, где xt - изображение 512 X 512 пикселей, заданное матрицей значений цветов.

1 Это нужно знать: Ключевые рекомендации по глубокому обучению (Часть 1). [Электронный ресурс]. - Режим доступа:

http://datareview.info/article/eto-nuzhno-znat-klyuchevyie-rekomendatsii-po-glubokomu-obucheniyu-chast-l (дата обращения: 24.03.2022).

Требуется построить алгоритм а. X —> У . способный классифицировать произвольный объект

х ЕХ.

Для практической реализации используемых алгоритмов и проведения экспериментов использовался объединенный набор2 данных3 с сайта Kaggle.

Набор содержит 10 908 размеченных рентгеновских снимков, которые представлены в фор-

мате PNG с глубиной цвета 8 бит и разрешением 512x512 пикселей. Среди них 2 440 снимков, содержащих информацию о легких с признаками COVID-19, 6 689 снимков, содержащих информацию о легких без патологий и 1 779 изображений с диагнозом вирусная пневмония.

Пример снимков COVID-19, нормальных легких и вирусной пневмонии представлен на рисунке 1.

(a) COVID-19

(b) Без патологии

(c) Вирусная пневмония

Рисунок 1. Пример снимков из набора данных

Источник: заимствовано из набора2 данных3 с сайта Kaggle

3. Нейросетевое решение задачи классификации рентгенограмм 3.1. Архитектура

Для решения задачи классификации изображений рентгенограмм была выбрана сверточная нейронная сеть, имеющая следующую архитектуру:

Входной слой X: X - множество значений пикселей рентгенограмм. На входе 4096 = 64 • 64 нейрона, каждый подключен к одному из пикселей изображения.

Сверточная нейронная сеть содержит 6 свер-точных слоев, 9 слоев нормализациии, 6 слоев под-

выборки и 4 полносвязных слоя.

Выходной слой Y: На выходе слой с 3 нейронами по одному на каждый класс.

3.2. Подбор наилучшей архитектуры нейронной сети с целью увеличения точности результата классификации

Для проведения классификации рентгеновских снимков исследуем различные архитектуры нейронных сетей, которые содержат различное количество слоев свёртки и нейронов в них. Характеристики архитектур CNN представлены в таблице 1.

Таблица 1. Характеристики архитектур нейронных сетей

Модель Количество слоёв свертки Количество нейронов на слоях

Net 4 conv_layer(in_features=1, out_ features=8) conv_layer(in_features=8, out_ features=16) conv_layer(in_features=16, out_ features=32) conv_layer(in_features=32, out_ features=64) Linear(in features=1024, out features=64) BatchNorm1d(64) Linear(in features=64, out features=16) BatchNorm1d(16) Linear(in features=16, out features=8) BatchNorm1d(8) Linear(in_features=8, out_ features=3)

2 COVID-19 Dataset. [Электронный ресурс]. - Режим доступа: https://www.kaggle.com/datasets/updater/covid19-dataset (дата обращения: 09.04.2022).

3 COVID-19 and Pneumonia Chest X-Rays Dataset. [Электронный ресурс]. - Режим доступа: https://www.kaggle.com/datasets/ lelpresidente/covid19-and-pneumonia-chest-xrays-dataset?select=train (дата обращения: 09.04.2022).

Продолжение таблицы 1

Модель Количество слоёв свертки Количество нейронов на слоях

Net 1 5 conv_layer(in_features=1, out_ features=8) conv_layer(in_features=8, out_ features=16) conv_layer(in_features=16, out_ features=32) conv_layer(in_features=32, out_ features=64) conv_layer(in_features=64, out_ features=128) Linear(in features=512, out features=128) BatchNorm1d(128) Linear(in features=128, out features=64) BatchNorm1d(64) Linear(in features=64, out features=8) BatchNorm1d(8) Linear(in_features=8, out_ features=3)

Net 2 5 conv_layer(in_features=1, out_ features=8) conv_layer(in_features=8, out_ features=16) conv_layer(in_features=16, out_ features=32) conv_layer(in_features=32, out_ features=64) conv_layer(in_features=64, out_ features=128) Linear(in features=512, out features=256) BatchNorm1d(256) Linear(in features=256, out features=64) BatchNorm1d(64) Linear(in features=64, out features=8) BatchNorm1d(8) Linear(in_features=8, out_ features=3)

Net 3 6 conv_layer(in_features=1, out_ features=8) conv_layer(in_features=8, out_ features=16) conv_layer(in_features=16, out_ features=32) conv_layer(in_features=32, out_ features=64) conv_layer(in_features=64, out_ features=128) conv_layer(in_features=128, out_ features=256) Linear(in features=256, out features=128) BatchNorm1d(128) Linear(in features=128, out features=32) BatchNorm1d(32) Linear(in features=32, out features=8) BatchNorm1d(8) Linear(in_features=8, out_ features=3)

Источник: разработано авторами

В таблице 2 представлены основные метрики оценки качества для рассматриваемых архитектур CNN. Таблица 2. Значения метрик для различных архитектур CNN

Модель Precision Recall F1-score Accuracy F1-score

0 1 2 0 1 2 0 1 2

Net 0.95 0.94 0.93 0.94 0.98 0.79 0.94 0.96 0.85 94% 0.94

Net 1 0.99 0.97 0.98 0.98 0.99 0.92 0.98 0.98 0.95 97.8% 0.98

Net 2 0.97 0.97 0.97 0.98 0.99 0.87 0.97 0.98 0.92 96.8% 0.97

Net 3 0.97 0.97 0.97 0.98 0.99 0.90 0.98 0.98 0.93 97.1% 0.97

Источник: разработано авторами

Согласно данным таблицы 2, можно сделать следующие выводы:

1) Наилучшую, по метрике F1-score, точ-

ность классификации рентгеновских снимков c COVID-19 показали модели Net 1 с 5 слоями свертки, из которых на последнем 64 канала на входном

изображении и 128 каналов, создаваемых сверткой и Net 3 с 6 слоями свертки, из которых на последнем 128 каналов на входном изображении и 256 каналов, создаваемых сверткой (98%), снимков без патологий - 5-ти слойные модели Net 1 и Net 2 со 128 и 256 каналами выходного изображения соответственно на первом полносвязном слое и модель Net 3 с 6 слоями свертки (98%), изображений с пневмонией - 5-ти слойная модель Net 1 (95%).

2) Наихудшую точность классификации рен-

тгенограмм во всех классах по метрике F1-score показала модель Net с 4 слоями свёртки: изображений с COVID-19 - 94%, изображений нормальных легких - 96%, снимков с пневмонией - 85%.

На рисунке 2 представлен график потерь на этапе валидации для всех рассмотренных моделей CNN. Наибольшей скоростью снижения валидаци-онной ошибки в зависимости от количества эпох обладает модель Net 3 с 6-ю слоями свёртки, после 18 эпохи обучения зафиксирована val loss = 0.0213.

Рисунок 2. График зависимости валидационной ошибки различных архитектур нейронной сети от количества эпох

Источник: разработано авторами

Поскольку fi-мера [7] является наиболее точной метрикой оценки качества классификатора, будем принимать конечное решение в выборе архитектуры CNN, опираясь на значение f1-score. Наилучшие результаты классификации показала модель Net 1 с 5-ю слоями свёртки, из которых на последнем 64 канала на входном изображении и 128 каналов, создаваемых сверткой, а первый полносвязный слой имеет параметры in_features = 512 и out_ features=128 (98%), поэтому в основе интеллектуальной системы поддержки принятия решений для диагностики тяжести заболеваний будет использована архитектура Net 1 для CNN.

Заключение

В результате проведенного исследования

была разработана интеллектуальная система распознавания изображений рентгенограмм для диагностики тяжести заболеваний в условиях эпидемии COVID-19. Кроме того, проведен ряд экспериментов по подбору архитектуры CNN с целью увеличения точности результата классификации. Наилучшие результаты классификации показала модель Net 1 с 5-ю слоями свёртки, из которых на последнем 64 канала на входном изображении и 128 каналов, создаваемых сверткой, а первый полносвязный слой имеет параметры in_features = 512 и out_ features = 128 (98°%), поэтому в дальнейшем для интеллектуальной системы будет использована данная архитектура свёрточной нейронной сети.

Литература

1. Арбузова А. А. Диагностика пневмонии по рентгеновским снимкам с помощью сверточных нейронных сетей // Модели, системы, сети в экономике, технике, природе и обществе. - 2021. - № 2(38). -С. 107-114, https://doi.org/10.21685/2227-8486-2021-2-7.

2. Классификация рентгеновских изображений грудной клетки больных вирусной пневмонией и COVID-19 с помощью нейронных сетей / В. Г. Ефремцев [и др.] // Компьютерная оптика. - 2021. - Т. 45 -№ 1. - С. 149-153, https://doi.org/10.18287/2412-6179-CO-765.

3. Коэльо Л. П. Построение систем машинного обучения на языке Python / Л. П. Коэльо, В. Ричарт; пер. с англ. А. А. Слинкина. - 2-е изд. - М.: ДМК Пресс, 2016. - 302 с.

4. Министерство здравоохранения Российской Федерации. Временные методические рекомендации.

Профилактика, диагностика и лечение новой коронавирусной инфекции (COVID-19). - URL: https://static-0. minzdrav.gov.ru/system/attachments/attaches/000/058/211/original/BMP-13.pdf (дата обращения: 09.04.2022).

5. Михелев В. М., Мирошниченко А. С. Решение задачи классификации патологий головного мозга человека на снимках МРТ // Научный результат. Информационные технологии. - 2019 - Т. 4. - № 2. -С. 43-52. https://doi.org/10.18413/2518-1092-2019-4-2-0-5

6. Руководство по профилактике и лечению новой коронавирусной инфекции COVID-19 / Х. Цай [и др.] // под ред. проф. Тинбо Лян. -Университетская школа медицины провинции Чжэцзян (перевод на русский язык). - М.: Изд-во МИА «Россия сегодня». - 94 с.

7. Соснин А. С., Суслова И. А. Функции активации нейросети: сигмоида, линейная, ступенчатая, relu, tanh // Наука. Информатизация. Технологии. Образование: Материалы XII международной научно-практической конференции, Екатеринбург, 25 февраля - 01 марта 2019 года. - Екатеринбург: Российский государственный профессионально-педагогический университет, 2019. - С. 237-246.

Статья поступила в редакцию: 26.05.2022; принята в печать: 25.10.2022.

Авторы прочитали и одобрили окончательный вариант рукописи.

i Надоели баннеры? Вы всегда можете отключить рекламу.