АРХИТЕКТУРА И АЛГОРИТМ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ ДЛЯ РАСПОЗНАВАНИЯ СЕРДЕЧНЫХ ЗАБОЛЕВАНИЙ ЧЕЛОВЕКА

Зеленский А.Д.

УДК 004.42

Зеленский А.Д.

бакалавр

Национальный исследовательский университет ИТМО (г. Санкт-Петербург, Россия)

АРХИТЕКТУРА И АЛГОРИТМ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ ДЛЯ РАСПОЗНАВАНИЯ СЕРДЕЧНЫХ ЗАБОЛЕВАНИЙ ЧЕЛОВЕКА

Аннотация: в статье представлены методы реализации и обучения смешанной модели нейронной сети для диагностирования сердечно-сосудистых заболеваний по снимкам МРТ. Модель базируется на архитектурах Unet++ и DenseNet. Основа подхода заключается в декомпозиции задачи диагностирования на 2 подзадачи: сегментация изображений и классификация. Это позволило достичь высокой точности и оптимального потребления вычислительных ресурсов.

Ключевые слова: сердечно-сосудистые заболевания, снимки МРТ, сверточные нейронные сети, архитектура U-net++, архитектура DenseNet.

По данным Всемирной организации здравоохранения сердечнососудистые заболевания (ССЗ) являются основной причинной смерти населения в мире. Предложенные в работе методы позволят повысить эффективность существующих моделей нейронных сетей (НС) для распознавания и анализа медицинских изображений, что упростит диагностирование заболеваний сердца.

Основа подхода - это разделение основной задачи распознавания заболеваний по снимкам МРТ на 2 подзадачи. Первая подзадача это сегментация изображений, а вторая подзадача классификация уже предобработанных (сегментированных) изображений (рисунок 1). Такой подход позволяет повысить эффективность относительно моделей с

односложными структурами. Так же это позволяет значительно расширить базу изображений для обучения моделей, так как декомпозиция первоначальной задачи сильно снижает требования к входным данным, что положительно сказывается на точности работы итоговой программы.

МШ ¡плаце

MR] imaqe

Рисунок 1 - визуализация архитектуры декомпозированной модели

В качестве объекта исследования выступают наборы данных (датасеты) со снимками МРТ сердечной мышцы человека на основе анализа которых и будет выноситься вердикт о предполагаемом заболевании. Использовались датасеты Data Science Bowl Cardiac Challenge Data[1] и Sunnybrook Cardiac Data[2] из открытых источников.

В наборе данных Data Science Bowl Cardiac Challenge Data представлены МРТ снимки сердца 1580 пациентов. Данные представлены в двух различных проекциях: снимки сечения по короткой оси левого желудочка и снимки четырехкамерного сечения. Так же набор содержит соответствующую разметку левого желудочка и коронарных сосудов для каждого снимка. Набор Sunnybrook Cardiac Data содержит медицинские снимки МРТ сердца 45 пациентов в различных сечениях в формате DICOM: по короткой оси левого желудочка и четырёхкамерное сечение. Так же содержит заключение врача-диагноста по заболеванию выявленному у пациента.

Всего представлено 6 соответвующих меток диагнозов: Normal, Hypertrophy, Hypertension, Heart deseas, Heart failure without infarct и Heart failure with infarct.

Для сегментации изображений была выбрана архитектура Unet++ [3], так как она хорошо зарекомендовала себя в задачах распознавания медицинских изображений.

Модель сегментации содержит 4 блока энкодеров и соответствующее количество декодеров. Восстанавливающие блоки применялись на каждом уровне пропускных связей. Такое построение архитектуры позволило достичь точности сегментации левого желудочка сердца и коронарных сосудов с точностью 91% на тестовой выборке.

Для обучения модели выбран модификатор градиентного спуска Mini-batch SGD [6] (Mini-batch Stochastic gradient descent), так как имеет более предсказуемое поведение расчета градиента в отличие от модификации SGD, но как и предшественник позволяет избегать локальных минимумов при обучении.

В качестве функции потерь использовалась Binary Cross-Entropy Loss (1).

Lbce = -Ii=itilog(pi) = -[tilog(vi) + tz^CPz)] (1)

, где ti -верный индекс класса, pt - Softmax встречаемость i-го класса Обучение проводилось на выборке Data Science Blow Cardiac Challenge Data из 1500 серий снимков в 2х проекциях: по короткой стороне левого желудочка и четырёхкамерном сечении. Обучение достигло отметки в 92% на валидационной выборке к 46 эпохе.

Модель классификации основывается на архитектуре DenseNet, так как она имеет методы борьбы с затуханием градиента, наблюдаемом на моделях большой сложности, а также хорошо показывает себя в задачах со сравнительно малой обучающей выборкой.

Была разработана модель архитектуры DenseNet, состоящая из 4 плотных блоков, как показано на рисунке 2. Каждый плотный блок включает повторяющиеся плотные слои, которые последовательно соединены слоями конкатенации.

При обучении так же использовался модификатор Mini-batch SGD, однако в качестве функции потерь была выбрана Categorical Cross-Entropy Loss Function (2)

Lce = -ZUTilogQi) (2)

, где Ti -верный индекс класса, 5j - Softmax встречаемость i-го класса Обучение проходило на данных Sunnybrook Cardiac Data, содержащие информацию по заболеванию и серии снимков для 45 пациентов. К данным были применены методы автоматического расширения выборки, такие как: Random rotation, Width shift и Height shift. За счёт применённых методов удалось расширить датасет до 450 примеров.

Рисунок 2 - модель плотного блока сети DenseNet

Перед подачей в модель DenseNet[5] данные сегментировались моделью Ц^++, что позволяло выбирать из изображений только контуры левого желудочка и коронарных сосудов, за счёт чего упрощалась задача классификации [4].

После обучения в течении 50 эпох модель достигла точности в 81% на тестовой выборке, метрики обучения можно увидеть на рисунке 3.

NN metrics

Accuracy Loss

0 10 20 30 40 50 0 10 20 30 40 50

Epochs Epochs

Рисунок 3 - метрики обучения итоговой модели

Полученная модель имеет относительно небольшую сложность, среднее время обработки запроса составило около 7 секунд при довольно высоком показатели точности. Таки результаты подтверждают обоснованность и эффективность предложенного подхода по решению сложных задач распознавания и классификации изображений.

СПИСОК ЛИТЕРАТУРЫ:

1. Cardiac Atlas Project//https://www.cardiacatlas.org/sunnybrook-cardiac-data/

2. Data Science Bowl Cardiac Challenge Data https://www.kaggle.com/c/second-annual-data-science-bowl

3. Olaf Ronneberger, Philipp Fischer, Thomas Brox "U-Net: Convolutional Networks for Biomedical Image Segmentation"// conditionally accepted at MICCAI 2015. URL: https://arxiv.org/abs/1505.04597

4. Н. В. Решетникова, Л. А. Жуков Изучение упрощения нейросетей по медицинским данным // Новые информационные технологии в автоматизированных системах.№7. URL:

https://cyberleninka.ru/article/n/izuchenie-uproscheniya-neyrosetey-po-meditsinskim-dannym

5. Xiao-Yun Zhou, Jian-Qing Zheng, Peichao Li, Guang-Zhong Yang ACNN: a Full Resolution DCNN for Medical Image Segmentation URL: https://arxiv.org/abs/1901.09203

6. Онищенко П. С., Клышников К. Ю., Овчаренко Е. А. ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ В КАРДИОЛОГИИ: АНАЛИЗ ГРАФИЧЕСКИХ ДАННЫХ // Бюллетень сибирской медицины. 2021. №4. URL: https://cyberleninka.ru/article/n/iskusstvennye-neyronnye-seti-v-kardiologii-analiz-graficheskih-dannyh.

Zelensky A.D.

ITMO National Research University (Saint Petersburg, Russia)

NEURAL NETWORK LEARNING ARCHITECTURE AND ALGORITHM FOR HUMAN HEART DISEASE RECOGNITION

Abstract: the article presents methods for implementing and training a mixed neural network model for diagnosing cardiovascular diseases from MRI images. The model is based on the Unet++ and DenseNet architectures. The basis of the approach is the decomposition of the diagnostic task into 2 subtasks: image segmentation and classification. This made it possible to achieve high accuracy and optimal consumption of computing resources.

Keywords: cardiovascular diseases, MRI scans, convolutional neural networks, Unet+ + architecture, DenseNet architecture.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зеленский А.Д.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Зеленский А.Д.

NEURAL NETWORK LEARNING ARCHITECTURE AND ALGORITHM FOR HUMAN HEART DISEASE RECOGNITION

Текст научной работы на тему «АРХИТЕКТУРА И АЛГОРИТМ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ ДЛЯ РАСПОЗНАВАНИЯ СЕРДЕЧНЫХ ЗАБОЛЕВАНИЙ ЧЕЛОВЕКА»