УДК 004.42
Зеленский А.Д.
бакалавр
Национальный исследовательский университет ИТМО (г. Санкт-Петербург, Россия)
АРХИТЕКТУРА И АЛГОРИТМ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ ДЛЯ РАСПОЗНАВАНИЯ СЕРДЕЧНЫХ ЗАБОЛЕВАНИЙ ЧЕЛОВЕКА
Аннотация: в статье представлены методы реализации и обучения смешанной модели нейронной сети для диагностирования сердечно-сосудистых заболеваний по снимкам МРТ. Модель базируется на архитектурах Unet++ и DenseNet. Основа подхода заключается в декомпозиции задачи диагностирования на 2 подзадачи: сегментация изображений и классификация. Это позволило достичь высокой точности и оптимального потребления вычислительных ресурсов.
Ключевые слова: сердечно-сосудистые заболевания, снимки МРТ, сверточные нейронные сети, архитектура U-net++, архитектура DenseNet.
По данным Всемирной организации здравоохранения сердечнососудистые заболевания (ССЗ) являются основной причинной смерти населения в мире. Предложенные в работе методы позволят повысить эффективность существующих моделей нейронных сетей (НС) для распознавания и анализа медицинских изображений, что упростит диагностирование заболеваний сердца.
Основа подхода - это разделение основной задачи распознавания заболеваний по снимкам МРТ на 2 подзадачи. Первая подзадача это сегментация изображений, а вторая подзадача классификация уже предобработанных (сегментированных) изображений (рисунок 1). Такой подход позволяет повысить эффективность относительно моделей с
односложными структурами. Так же это позволяет значительно расширить базу изображений для обучения моделей, так как декомпозиция первоначальной задачи сильно снижает требования к входным данным, что положительно сказывается на точности работы итоговой программы.
МШ ¡плаце
MR] imaqe
Рисунок 1 - визуализация архитектуры декомпозированной модели
В качестве объекта исследования выступают наборы данных (датасеты) со снимками МРТ сердечной мышцы человека на основе анализа которых и будет выноситься вердикт о предполагаемом заболевании. Использовались датасеты Data Science Bowl Cardiac Challenge Data[1] и Sunnybrook Cardiac Data[2] из открытых источников.
В наборе данных Data Science Bowl Cardiac Challenge Data представлены МРТ снимки сердца 1580 пациентов. Данные представлены в двух различных проекциях: снимки сечения по короткой оси левого желудочка и снимки четырехкамерного сечения. Так же набор содержит соответствующую разметку левого желудочка и коронарных сосудов для каждого снимка. Набор Sunnybrook Cardiac Data содержит медицинские снимки МРТ сердца 45 пациентов в различных сечениях в формате DICOM: по короткой оси левого желудочка и четырёхкамерное сечение. Так же содержит заключение врача-диагноста по заболеванию выявленному у пациента.
Всего представлено 6 соответвующих меток диагнозов: Normal, Hypertrophy, Hypertension, Heart deseas, Heart failure without infarct и Heart failure with infarct.
Для сегментации изображений была выбрана архитектура Unet++ [3], так как она хорошо зарекомендовала себя в задачах распознавания медицинских изображений.
Модель сегментации содержит 4 блока энкодеров и соответствующее количество декодеров. Восстанавливающие блоки применялись на каждом уровне пропускных связей. Такое построение архитектуры позволило достичь точности сегментации левого желудочка сердца и коронарных сосудов с точностью 91% на тестовой выборке.
Для обучения модели выбран модификатор градиентного спуска Mini-batch SGD [6] (Mini-batch Stochastic gradient descent), так как имеет более предсказуемое поведение расчета градиента в отличие от модификации SGD, но как и предшественник позволяет избегать локальных минимумов при обучении.
В качестве функции потерь использовалась Binary Cross-Entropy Loss (1).
Lbce = -Ii=itilog(pi) = -[tilog(vi) + tz^CPz)] (1)
, где ti -верный индекс класса, pt - Softmax встречаемость i-го класса Обучение проводилось на выборке Data Science Blow Cardiac Challenge Data из 1500 серий снимков в 2х проекциях: по короткой стороне левого желудочка и четырёхкамерном сечении. Обучение достигло отметки в 92% на валидационной выборке к 46 эпохе.
Модель классификации основывается на архитектуре DenseNet, так как она имеет методы борьбы с затуханием градиента, наблюдаемом на моделях большой сложности, а также хорошо показывает себя в задачах со сравнительно малой обучающей выборкой.
Была разработана модель архитектуры DenseNet, состоящая из 4 плотных блоков, как показано на рисунке 2. Каждый плотный блок включает повторяющиеся плотные слои, которые последовательно соединены слоями конкатенации.
При обучении так же использовался модификатор Mini-batch SGD, однако в качестве функции потерь была выбрана Categorical Cross-Entropy Loss Function (2)
Lce = -ZUTilogQi) (2)
, где Ti -верный индекс класса, 5j - Softmax встречаемость i-го класса Обучение проходило на данных Sunnybrook Cardiac Data, содержащие информацию по заболеванию и серии снимков для 45 пациентов. К данным были применены методы автоматического расширения выборки, такие как: Random rotation, Width shift и Height shift. За счёт применённых методов удалось расширить датасет до 450 примеров.
Рисунок 2 - модель плотного блока сети DenseNet
Перед подачей в модель DenseNet[5] данные сегментировались моделью Ц^++, что позволяло выбирать из изображений только контуры левого желудочка и коронарных сосудов, за счёт чего упрощалась задача классификации [4].
После обучения в течении 50 эпох модель достигла точности в 81% на тестовой выборке, метрики обучения можно увидеть на рисунке 3.
NN metrics
Accuracy Loss
0 10 20 30 40 50 0 10 20 30 40 50
Epochs Epochs
Рисунок 3 - метрики обучения итоговой модели
Полученная модель имеет относительно небольшую сложность, среднее время обработки запроса составило около 7 секунд при довольно высоком показатели точности. Таки результаты подтверждают обоснованность и эффективность предложенного подхода по решению сложных задач распознавания и классификации изображений.
СПИСОК ЛИТЕРАТУРЫ:
1. Cardiac Atlas Project//https://www.cardiacatlas.org/sunnybrook-cardiac-data/
2. Data Science Bowl Cardiac Challenge Data https://www.kaggle.com/c/second-annual-data-science-bowl
3. Olaf Ronneberger, Philipp Fischer, Thomas Brox "U-Net: Convolutional Networks for Biomedical Image Segmentation"// conditionally accepted at MICCAI 2015. URL: https://arxiv.org/abs/1505.04597
4. Н. В. Решетникова, Л. А. Жуков Изучение упрощения нейросетей по медицинским данным // Новые информационные технологии в автоматизированных системах.№7. URL:
https://cyberleninka.ru/article/n/izuchenie-uproscheniya-neyrosetey-po-meditsinskim-dannym
5. Xiao-Yun Zhou, Jian-Qing Zheng, Peichao Li, Guang-Zhong Yang ACNN: a Full Resolution DCNN for Medical Image Segmentation URL: https://arxiv.org/abs/1901.09203
6. Онищенко П. С., Клышников К. Ю., Овчаренко Е. А. ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ В КАРДИОЛОГИИ: АНАЛИЗ ГРАФИЧЕСКИХ ДАННЫХ // Бюллетень сибирской медицины. 2021. №4. URL: https://cyberleninka.ru/article/n/iskusstvennye-neyronnye-seti-v-kardiologii-analiz-graficheskih-dannyh.
Zelensky A.D.
ITMO National Research University (Saint Petersburg, Russia)
NEURAL NETWORK LEARNING ARCHITECTURE AND ALGORITHM FOR HUMAN HEART DISEASE RECOGNITION
Abstract: the article presents methods for implementing and training a mixed neural network model for diagnosing cardiovascular diseases from MRI images. The model is based on the Unet++ and DenseNet architectures. The basis of the approach is the decomposition of the diagnostic task into 2 subtasks: image segmentation and classification. This made it possible to achieve high accuracy and optimal consumption of computing resources.
Keywords: cardiovascular diseases, MRI scans, convolutional neural networks, Unet+ + architecture, DenseNet architecture.