Научная статья на тему 'ТРАНСФЕРНОЕ ОБУЧЕНИЕ В НЕЙРОСЕТЕВОЙ ОБРАБОТКЕ ДАННЫХ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ СВЕРТОЧНЫХ СЕТЕЙ'

ТРАНСФЕРНОЕ ОБУЧЕНИЕ В НЕЙРОСЕТЕВОЙ ОБРАБОТКЕ ДАННЫХ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ СВЕРТОЧНЫХ СЕТЕЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
59
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТРАНСФЕРНОЕ ОБУЧЕНИЕ / ОБУЧЕНИЕ НЕЙРОСЕТИ / VGG16 / КЛАССИФИКАЦИЯ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Петров А.И., Белов Ю.С.

В этой статье представлен краткий обзор процесса обучения нейронной сети для классификации медицинских изображений с использованием трансферного обучения. В статье рассматриваются шаги, связанные с предварительной обработкой данных, выбором модели. В статье также рассматривается архитектура используемой модели, в том числе потребность в больших и разнообразных наборах данных, важность интерпретируемости и прозрачности в классификации медицинских изображений, а также потенциал трансферного обучения для повышения эффективности и действенности медицинских диагнозов, что делает его ценным ресурсом для исследователей и практиков в области медицинской визуализации и машинного обучения. В целом, статья представляет собой информативное руководство по обучению нейронной сети для классификации медицинских изображений и должна представлять интерес для исследователей, практикующих врачей и студентов, изучающих медицинские изображения и машинное обучение.This article provides a brief overview of the neural network learning process for classifying medical images using transfer learning. The article discusses the steps related to data preprocessing, model selection. The article also discusses the architecture of the model used, including the need for large and diverse data sets, the importance of interpretability and transparency in the classification of medical images, as well as the potential of transfer learning to improve the efficiency and effectiveness of medical diagnoses, which makes it a valuable resource for researchers and practitioners in the field of medical imaging and machine learning. In general, the article is an informative guide to training a neural network for classifying medical images and should be of interest to researchers, practitioners and students studying medical images and machine learning.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Петров А.И., Белов Ю.С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ТРАНСФЕРНОЕ ОБУЧЕНИЕ В НЕЙРОСЕТЕВОЙ ОБРАБОТКЕ ДАННЫХ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ СВЕРТОЧНЫХ СЕТЕЙ»

УДК 004.93

Информационные технологии

Петров Артем Ильич, студент-магистр, Калужский филиал ФГБОУ ВО «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)» Белов Юрий Сергеевич, к.ф. -м.н., доцент, Калужский филиал ФГБОУ ВО «Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет)»

ТРАНСФЕРНОЕ ОБУЧЕНИЕ В НЕЙРОСЕТЕВОЙ ОБРАБОТКЕ ДАННЫХ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ

СВЕРТОЧНЫХ СЕТЕЙ

Аннотация: В этой статье представлен краткий обзор процесса обучения нейронной сети для классификации медицинских изображений с использованием трансферного обучения. В статье рассматриваются шаги, связанные с предварительной обработкой данных, выбором модели. В статье также рассматривается архитектура используемой модели, в том числе потребность в больших и разнообразных наборах данных, важность интерпретируемости и прозрачности в классификации медицинских изображений, а также потенциал трансферного обучения для повышения эффективности и действенности медицинских диагнозов, что делает его ценным ресурсом для исследователей и практиков в области медицинской визуализации и машинного обучения. В целом, статья представляет собой информативное руководство по обучению нейронной сети для классификации медицинских изображений и должна представлять интерес для исследователей, практикующих врачей и студентов, изучающих медицинские изображения и машинное обучение.

Ключевые слова: трансферное обучение, обучение нейросети, vgg-16, классификация медицинских изображений.

Abstract: This article provides a brief overview of the neural network learning process for classifying medical images using transfer learning. The article discusses the steps related to data preprocessing, model selection. The article also discusses the architecture of the model used, including the need for large and diverse data sets, the importance of interpretability and transparency in the classification of medical images, as well as the potential of transfer learning to improve the efficiency and effectiveness of medical diagnoses, which makes it a valuable resource for researchers and practitioners in the field of medical imaging and machine learning. In general, the article is an informative guide to training a neural network for classifying medical images and should be of interest to researchers, practitioners and students studying medical images and machine learning.

Keywords: transfer learning, neural network training, vgg-16, classification of medical images.

Введение.

Обучение нейронной сети для классификации медицинских изображений является сложной и важной задачей в области медицинской визуализации. С увеличением доступности данных медицинских изображений и растущим спросом на точные и эффективные медицинские диагнозы разработка нейронных сетей для классификации медицинских изображений стала важнейшей областью исследований и практики.

Однако обучение нейронной сети классификации медицинских изображений требует тщательного планирования, предварительной обработки данных и тонкой настройки для достижения оптимальной производительности и точности. В этой статье будет рассмотрен процесс обучения нейронной сети для классификации медицинских изображений с этапами предварительной обработки данных.

Модель и архитектура VGG-16

Модель VGG-16 начинается с входного слоя, который принимает

изображение размером 224x224 пикселей [1]. Затем входное изображение проходит через ряд конволюционных слоев (см. рис. 1), каждый из которых применяет набор обучаемых фильтров к входному изображению и создает набор карт признаков. Затем карты признаков пропускаются через функцию активации ректифицированного линейного блока (ReLU), которая вносит нелинейность в сеть.

После прохождения через несколько сверточных слоев карты признаков уплощаются и проходят через ряд полностью связанных слоев [2]. Эти слои отвечают за обучение высокоуровневых характеристик входного изображения и выдачу конечного результата, который соответствует предсказанной метке класса.

Кллгспфижятлр

Рис. 1 - Архитектура VGG-16 для трансферного обучения

Датасет

Набор данных МРТ-изображений с различными типами опухоли головного мозга представляет собой набор медицинских изображений, помеченных соответствующим типом опухоли головного мозга [3]. Набор данных включает различные типы опухолей, такие как глиобластома, менингиома и аденома гипофиза (см. рис. 2 - 4).

Изображения МРТ в наборе данных представляют собой высококачественные трехмерные изображения, полученные с использованием технологии магнитно-резонансной томографии. Изображения обычно имеют

оттенки серого и разрешение около 256x256 пикселей или выше.

Каждое изображение в наборе данных помечено соответствующим типом опухоли головного мозга. Этикетки обычно предоставляются экспертами -радиологами или другими медицинскими работниками, которые изучили изображения и диагностировали тип опухоли.

Набор данных может также включать дополнительную информацию, такую как возраст пациента, пол и другие клинические данные. Эту информацию можно использовать для анализа взаимосвязи между типом опухоли и другими факторами, такими как демографические данные пациента или симптомы.

Набор данных МРТ-изображений с различными типами опухолей головного мозга является ценным ресурсом для разработки и оценки моделей машинного обучения для классификации опухолей головного мозга. Обучая модели машинного обучения на этом наборе данных, исследователи и медицинские работники могут разрабатывать более точные и эффективные инструменты для диагностики и лечения опухолей головного мозга.

В целом набор данных МРТ-изображений с различными типами опухолей головного мозга является важным ресурсом для медицинских исследований и может помочь повысить точность и эффективность диагностики и лечения опухолей головного мозга.

Рис. 2 - Изображения глиобластомы из используемого датасета

Рис. 3 - Изображения менингиомы из используемого датасета

Рис. 4 - Изображения аденомы гипофиза из используемого датасета

Была оценена прогностическая эффективность модели с независимым набором данных. Модель обучена исходному и дополненному набору данных об опухоли головного мозга и проверена с помощью независимого набора данных МРТ-изображений головного мозга. Модель сконфигурирована с необходимыми гиперпараметрами, такими как оптимизатор SGD со скоростью обучения 0.0001, эпохами 100 и размером пакета 120. Для оценки эффективности модели использовались различные оценочные матрицы [4].

Экспериментальные результаты модели приведены в таблице 1. В таблице показано, что предложенная модель CNN получила точность 94.77%, специфичность 96.30%, чувствительность 94.67%, прецизионность 93.43%, MCC 91.90% и оценку F1 96.61% при обучении на исходном наборе данных МРТ-изображений опухоли головного мозга и подтверждена независимым

набором данных.

С другой стороны, модель достигла 95,97% точности, 96,95% специфичности, 99,40% чувствительности, 96,84% прецизионности, 92,98% МСС и 96,80% F1-балла при обучении с использованием расширенного набора данных и валидации с помощью независимого набора данных. Следовательно, исходя из результатов эксперимента, заметно, что способность модели к прогнозированию и обобщению улучшилась при обучении и валидации с использованием независимых наборов данных.

Таблица 1. Оценка показателей Модель Датасет Время ЬЯ Метрики оценки

Лее Бр Би Рг МСС П-Б (%) (%) (%) (%) (%) (%)

Исходный 0.0001 94.77 96.30 94.67 93.43 91.90 96.61

УОО-16 Дополненны 3 02 ч

0.0001 95.97 96.95 99.40 96.84 92.98 96.80

й

Предобработка данных и обучение нейросети

Предварительная обработка данных является важным шагом в разработке классификатора медицинских изображений с использованием трансферного обучения [5]. Цель предварительной обработки данных состоит в том, чтобы убедиться, что данные находятся в подходящем формате для обучения модели трансфертного обучения (см. рис. 5).

Вот шаги, связанные с процессом предварительной обработки данных:

1. Сбор данных. Первый шаг включает в себя сбор большого набора данных медицинских изображений, которые имеют отношение к задаче классификации. Изображения должны быть помечены соответствующим классом, к которому они принадлежат.

2. Очистка данных. Собранный набор данных может содержать изображения с различными артефактами и шумами, что может негативно

сказаться на производительности модели. Поэтому набор данных необходимо очистить, удалив изображения с низким качеством и артефактами.

3. Нормализация данных. Следующим шагом является нормализация значений пикселей изображений, чтобы обеспечить их согласованность во всем наборе данных. Нормализация включает в себя масштабирование значений пикселей в диапазоне от 0 до 1 или от -1 до 1.

4. Увеличение данных. Увеличение данных включает в себя создание новых изображений путем применения различных преобразований, таких как вращение, отражение и масштабирование. Этот процесс может увеличить размер и разнообразие набора данных, что может повысить производительность модели [6].

5. Разделение данных. Набор данных необходимо разделить на наборы для обучения, проверки и тестирования. Набор для обучения используется для обучения модели, набор для проверки используется для настройки гиперпараметров, а набор для тестирования используется для оценки производительности модели.

6. Предварительная обработка данных. Предварительно обученная модель, такая как VGG-16 или ResNet-50, требует, чтобы входные изображения имели определенный размер и формат. Следовательно, изображения необходимо изменить до соответствующего размера и формата, прежде чем загружать их в модель.

В целом предварительная обработка данных является важным шагом в разработке классификатора медицинских изображений с использованием трансферного обучения [7]. Предварительно обрабатывая данные, модель может учиться на высококачественных, непротиворечивых и разнообразных данных, что может повысить точность и производительность модели.

Рис. 5 - Предобработка данных

Обучение нейронной сети для классификации медицинских изображений с помощью трансферного обучения [8] включает следующие шаги (см. рис. 6):

1. Выбор предварительно обученной модели: первым шагом в трансферном обучении является выбор предварительно обученной модели, которая была обучена на большом наборе данных, например, ImageNet. Предварительно обученная модель должна иметь схожую архитектуру с моделью, которую вы хотите обучить, и быть способной извлекать соответствующие характеристики из входных изображений.

2. Удаление последнего слоя: последний слой предварительно обученной модели обычно представляет собой слой классификации, специфичный для исходного набора данных. Этот слой необходимо удалить, чтобы модель можно было переобучить на новом наборе данных медицинских изображений.

3. Добавление нового слоя: В предварительно обученную модель

необходимо добавить новый слой классификации для классификации медицинских изображений. Этот новый слой должен иметь такое же количество выходных классов, как и количество классов в наборе данных медицинских изображений.

4. Замораживание предварительно обученных слоев: предварительно обученные слои модели обычно замораживаются во время обучения, чтобы предотвратить их изменение. Это позволяет новому слою классификации изучить соответствующие признаки для набора данных медицинских изображений, не переписывая предварительно обученные признаки.

5. Обучение нового слоя: новый слой классификации обучается на наборе данных медицинских изображений с помощью обратного распространения и градиентного спуска. Это включает подачу медицинских изображений в модель, вычисление потерь между предсказанными и реальными метками и настройку весов нового слоя для минимизации потерь.

6. Тонкая настройка предварительно обученных слоев: после того как новый слой обучен, предварительно обученные слои могут быть точно настроены для улучшения работы модели. Для этого необходимо разморозить предварительно обученные слои и обучить их на наборе данных медицинских изображений, используя меньшую скорость обучения, чем новый слой.

7. Оценка модели: после обучения и тонкой настройки модели ее необходимо оценить на отдельном наборе данных для проверки, чтобы убедиться, что она может обобщать новые изображения. Эффективность модели можно оценить с помощью такого показателя, как точность.

8. Развертывание модели: обученная модель может быть развернута для использования в клинической практике или медицинских исследованиях. Это может включать интеграцию модели в более крупную систему, такую как система поддержки принятия клинических решений, или ее использование для анализа новых медицинских изображений в режиме реального времени.

Рис. 6 - Процесс обучения

Заключение

В целом, трансфертное обучение — это мощный метод обучения нейронных сетей для классификации медицинских изображений. Используя предварительно обученные модели и настраивая их на новых наборах данных медицинских изображений, трансфертное обучение позволяет сократить объем данных, необходимых для обучения новых моделей, и повысить их точность и эффективность. Однако важно тщательно оценить производительность моделей трансферного обучения и сравнить их с традиционными моделями глубокого обучения, чтобы убедиться, что они подходят для решения конкретной задачи.

Библиографический список:

1. Петров А.И., Белов Ю.С. Трансферное обучение модели VGG-16 // Региональная научно-техническая конференция. - 2023. - Т.2. - С.57-61.

2. Пеников А.А., Белов Ю.С. Обзор архитектур свёрточных нейронных сетей для решения задачи семантической сегментации медицинских изображений // В сборнике: Фундаментальные и прикладные исследования. Актуальные проблемы и достижения. сборник избранных статей

Всероссийской (национальной) научной конференции. Санкт-Петербург, 2022. С. 18-21.

3. Menze B.H. The Multimodal Brain Tumor Image Segmentation Benchmark (BRATS) // IEEE Trans. Med. Imaging. Oct. 2015, vol. 34, no. 10, pp. 1993-2024.

4. Bingol, H. & Alatas, B. Classification of Brain Tumor Images using Deep Learning Methods. Turkish Journal of Science and Technology, 2021, 16 (1), 137-143.

5. Титова А.А., Козина А.В., Белов Ю.С. Модель пограничных блоков для распознавания объектов // Научное обозрение. Технические науки. 2021. № 3. С. 61-65.

6. Kim, H.E., Cosa-Linan, A., Santhanam, N. et al. Transfer learning for medical image classification: a literature review // BMC Med Imaging 2022, 69. https://doi.org/10.1186/s12880-022-00793-7.

7. M. Raghu, C. Zhang, J. Kleinberg, and S. Bengio, "Transfusion: Understanding transfer learning for medical imaging," in Advances in Neural Information Processing Systems, vol. 32. Curran Associates, Inc., 2019, pp. 33473357.

8. Valverde JM, Imani V, Abdollahzadeh A, De Feo R, Prakash M, Ciszek R, et al. Transfer learning in magnetic resonance brain imaging: a systematic review. J Imaging. 2021.

i Надоели баннеры? Вы всегда можете отключить рекламу.