Научная статья на тему 'ИСПОЛЬЗОВАНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ СЕГМЕНТАЦИИ УЛЬТРАЗВУКОВЫХ ИЗОБРАЖЕНИЙ СКЕЛЕТНОЙ МЫШЦЫ'

ИСПОЛЬЗОВАНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ СЕГМЕНТАЦИИ УЛЬТРАЗВУКОВЫХ ИЗОБРАЖЕНИЙ СКЕЛЕТНОЙ МЫШЦЫ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
33
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
машинное обучение / скелетная мышца / сегментация ультразвуковых изображений / сверточная нейронная сеть / machine learning / skeletal muscle / ultrasound images segmentation / convolutional neural network

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мищенко Евгения Алексеевна, Демин Игорь Юрьевич

В данной статье рассмотрены вопросы применения методов машинного обучения для сегментации ультразвуковых изображений скелетных мышц человека. Актуальность данного исследования заключается в сложности и длительности расшифровки медицинских материалов, а также субъективности и ошибках. Целью статьи является создание точной и эффективной модели сегментации здоровых скелетных мышц с использованием машинного обучения для метода ультразвукового исследования медицинской визуализации. Для построения модели сегментации скелетных мышц использовались архитектура U-net с различным количеством сверточных слоев, а также сеть U-net++, которая представляет собой модификацию классической U-net. Для обучения нейронной сети был использован набор данных ультразвуковых снимков скелетных мышц из открытых источников, для проверки были использованы ультразвуковые изображения скелетных мышц добровольцев с помощью акустической системы Verasonics. Были проведены обучение, анализ и тестирование модели нейросети, сравнение результатов обучения при различных модификациях и гиперпараметрах. Основным результатом исследования является получение эффективной модели нейросети и подтверждение потенциала ее применения для сегментирования ультразвуковых изображений скелетных мышц.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мищенко Евгения Алексеевна, Демин Игорь Юрьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLYING MACHINE LEARNING FOR SEGMENTATION OF SKELETAL MUSCLE ULTRASOUND IMAGES

This paper discusses the use of machine learning techniques for segmenting ultrasound images of human skeletal muscles. Ultrasound is a non-invasive diagnostic tool that provides ample information about the structure and condition of organs and tissues. It is widely used in diagnostics, and modern ultrasound machines can produce high-resolution scans. The study’s significance lies in the difficulty and time required to interpret medical materials, as well as the potential for subjectivity and errors. One promising approach to assist clinicians is the use of machine learning models and methods. These techniques are commonly employed for tasks such as data analysis, diagnosis and prognosis, and medical material classification and segmentation. Machine learning models can aid inexperienced practitioners and expedite the provision of high-quality medical care. The aim of the paper is to create an accurate and efficient healthy skeletal muscle segmentation model using machine learning for medical imaging ultrasound method. Convolutional neural networks were used to build a model for segmentation of ultrasound images of skeletal muscles. U-net network architecture with different number of convolutional layers was used, as well as U-net++ network, which is a modification of the classical U-net. The U-Net architecture is one of the classical CNNs for image segmentation tasks, and it has been actively applied to biomedical images. Among the main advantages of the network is its ability to train well on a small amount of data. The U-Net++ network was proposed as a modification of the U-Net network architecture, which was designed to improve the network performance on medical image segmentation tasks. U-Net++ is based on the idea that the model will be more efficient and faster trained if the feature maps of the encoder and decoder are semantically similar. To train the neural network, a dataset of ultrasound images of healthy skeletal muscles from open sources was used, because to obtain a high-quality model it is not only necessary to tune the neural network competently, but also to train it on a sufficient, high quality and diverse dataset. The images were annotated manually using binary masks to indicate muscle tissue boundaries. A binary mask was created for each image, replacing the muscle layer boundaries with white pixels and the rest with black pixels. These masks serve as truth labels when training neural networks. The dataset was divided into training and validation samples, and the training data was augmented. To prevent data leakage, augmentation is performed after dividing the data into samples. Increasing the validation sample is not recommended as it will not improve the training accuracy. The final model was tested using a dataset of ultrasound images of skeletal muscles of volunteers obtained using a Verasonics acoustic system. The results of segmentation using the U-Net network, U-Net++ network, and their variants with increased number of convolution layers were compared. All training processes used the same dataset of skeletal muscle ultrasound images, which was divided into training and validation in the ratio of 8/2. Accuracy and IoU were used as metrics for evaluation. Callbacks such as Early Stopping, which stops training when the validation error is unchanged and ReduceLROnPlateau designed to adaptively adjust the learning rate when there is no improvement on the monitored metric were used, both calls track the required parameters for a certain number of epochs. These callbacks were used to prevent overlearning. In the context of this work, where the task was to classify a small number of classes and small size images were used, the three-convolution network did not perform better than the twoconvolution network. This is because the more complex features that a three-convolution network can learn were not necessary for the task at hand. Under such conditions, the simpler two convolution network can learn more efficiently because it has fewer parameters and requires less computational resources. In addition, the simpler network is less prone to overlearning, which is an important factor in tasks with small amounts of data. A neural network model was trained, analyzed and tested, and a model that can segment ultrasound images of skeletal muscles was developed. In this study, it was shown that neural networks of U-Net and U-Net++ architectures can be effectively used for segmentation of ultrasound images of skeletal muscles. The main result of the study is to obtain an effective neural network model and to confirm the potential of its application for segmenting ultrasound images of skeletal muscles. The application of neural networks in medicine has a number of advantages, including improved diagnostic accuracy, reduced labour costs for physicians and increased speed of data processing. Further development of training and testing of neural networks will allow to expand the possibilities of their application in medicine in the future, for example, for diagnosing complex diseases or developing new treatment methods.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ СЕГМЕНТАЦИИ УЛЬТРАЗВУКОВЫХ ИЗОБРАЖЕНИЙ СКЕЛЕТНОЙ МЫШЦЫ»

APPLYING MACHINE LEARNING FOR SEGMENTATION OF SKELETAL MUSCLE ULTRASOUND IMAGES

E. A. Mischenko, I. Yu. Demin

Lobaehevsky State University, 603022, Xizhny Novgorod, Russia

DOI: 10.24412/2073-0667-2024-3-47-57 EDX: LTKQYZ

This paper discusses the use of machine learning techniques for segmenting ultrasound images of human skeletal muscles. Ultrasound is a non-invasive diagnostic tool that provides ample information about the structure and condition of organs and tissues. It is widely used in diagnostics, and modern ultrasound machines can produce high-resolution scans. The study's significance lies in the difficulty and time required to interpret medical materials, as well as the potential for subjectivity and errors. One promising approach to assist clinicians is the use of machine learning models and methods. These techniques are commonly employed for tasks such as data analysis, diagnosis and prognosis, and medical material classification and segmentation. Machine learning models can aid inexperienced practitioners and expedite the provision of high-quality medical care. The aim of the paper is to create an accurate and efficient healthy skeletal muscle segmentation model using machine learning for medical imaging ultrasound method.

Convolutional neural networks were used to build a model for segmentation of ultrasound images of skeletal muscles. U-net network architecture with different number of convolutional layers was used, as well as U-net++ network, which is a modification of the classical U-net. The U-Nct architecture is one of the classical CNNs for image segmentation tasks, and it has been actively applied to biomedical images. Among the main advantages of the network is its ability to train well on a small amount of data. The U-Net++ network was proposed as a modification of the U-Nct network architecture, which was designed to improve the network performance on medical image segmentation tasks. U-Nct++ is based on the idea that the model will be more efficient and faster trained if the feature maps of the encoder and decoder are semantically similar.

To train the neural network, a dataset of ultrasound images of healthy skeletal muscles from open sources was used, because to obtain a high-quality model it is not only necessary to tune the neural network competently, but also to train it on a sufficient, high quality and diverse dataset. The images were annotated manually using binary masks to indicate muscle tissue boundaries. A binary mask was created for each image, replacing the muscle layer boundaries with white pixels and the rest with black pixels. These masks serve as truth labels when training neural networks. The dataset was divided into training and validation samples, and the training data was augmented. To prevent data leakage, augmentation is performed after dividing the data into samples. Increasing the validation sample is not recommended as it will not improve the training accuracy. The final model was tested using a dataset of ultrasound images of skeletal muscles of volunteers obtained using a Verasonics acoustic system.

The results of segmentation using the U-Nct network, U-Net++ network, and their variants with increased number of convolution layers were compared. All training processes used the same dataset

The work was carried out with the support of the Ministry of Science and Higher Education of the Russian Federation (state assignment N FSWR-2023-0031).

© E. A. Mischenko, I. Yu. Demin, 2024

of skeletal muscle ultrasound images, which was divided into training and validation in the ratio of 8/2. Accuracy and IoU were used as metrics for evaluation. Callbacks such as Early Stopping, which stops training when the validation error is unchanged and ReduceLROnPlateau designed to adaptivelv adjust the learning rate when there is no improvement on the monitored metric were used, both calls track the required parameters for a certain number of epochs. These callbacks were used to prevent overlearning. In the context of this work, where the task was to classify a small number of classes and small size images were used, the three-convolution network did not perform better than the two-convolution network. This is because the more complex features that a three-convolution network can learn were not necessary for the task at hand. Under such conditions, the simpler two convolution network can learn more efficiently because it has fewer parameters and requires less computational resources. In addition, the simpler network is less prone to overlearning, which is an important factor in tasks with small amounts of data.

A neural network model was trained, analyzed and tested, and a model that can segment ultrasound images of skeletal muscles was developed. In this study, it was shown that neural networks of U-Net and U-Net++ architectures can be effectively used for segmentation of ultrasound images of skeletal muscles. The main result of the study is to obtain an effective neural network model and to confirm the potential of its application for segmenting ultrasound images of skeletal muscles. The application of neural networks in medicine has a number of advantages, including improved diagnostic accuracy, reduced labour costs for physicians and increased speed of data processing. Further development of training and testing of neural networks will allow to expand the possibilities of their application in medicine in the future, for example, for diagnosing complex diseases or developing new treatment methods.

Key words: machine learning, skeletal muscle, ultrasound images segmentation, convolutional neural network.

References

1. Shah P. et al. Artificial intelligence and machine learning in clinical development: a translational perspective // NPJ digital medicine. 2019. T. 2. N 1. P. 69.

2. Hill K., Bjember Dzh., Haar G. Ul'trazvuk v medicine. Fizicheskie osnovv primenenija: uchebnik. Moscow: Fizmatlit, 2008. 544 p.

3. Prakticheskoe rukovodstvo po ul'trazvukovoj diagnostike. Obshhaja ul'trazvukovaja diagnostika. In V. V. Mit'kova (es). Moscow: Vidar-M, 2011. 720 p.

4. Vasil'ev A. Ju. i dr. Artefaktv v ul'trazvukovoj diagnostike. Moscow: FGOU VUNMC Roszdrava. 2006.

5. Cronin N. J., Finni T., Sevnnes O. Fully automated analysis of muscle architecture from B-mode ultrasound images with deep learning // arXiv preprint arXiv:2009.04790. 2020.

6. Maveuf-Louchart A. et al. MuscleJ: a high-content analysis method to study skeletal muscle with a new Fiji tool // Skeletal muscle. 2018. T. 8. P. 1-11.

7. Mischenko E. A., Demin I. Yu. Ispol'zovanie mashinnogo obuchenija dlja segmentacii UZI izobrazhenij skeletnoj myshcv // Trudy XXIII Mezhdunarodnoj konferencii (N. Novgorod, 13-16 nojabrja 2023 g.). Nizhnij Novgorod: Publ. Nizhegorodskogo universiteta, 2023. P. 106-111.

8. Avetisjan M. S. Segmentirovanie ob'emnvh medicinskih izobrazhenij s ispol'zovaniem svertochnvh nejronnvh setej. Master's degree, MGU im. Lomonosova Fakul'tet VMK. 2018. P. 58.

9. Ronneberger O., Fischer P., Brox T. U-net: Convolutional networks for biomedical image segmentation // Medical Image Computing and Computer-Assisted Intervention-MICCAI 2015: 18th International Conference, Munich, Germany, October 5-9, 2015, Proceedings, Part III 18. Springer International Publishing, 2015. P. 234-241.

10. Punn N. S., Agarwal S. Modality specific U-Net variants for biomedical image segmentation: a survey //Artificial Intelligence Review. 2022. T. 55. N 7. P. 5845-5889.

11. Zhou Z. et al. Unet++: A nested u-net architecture for medical image segmentation // Deep Learning in Medical Image Analysis and Multimodal Learning for Clinical Decision Support: 4th International Workshop, DLMIA 2018, and 8th International Workshop, ML-CDS 2018, Held in Conjunction with MICCAI 2018, Granada, Spain, September 20, 2018, Proceedings 4. Springer International Publishing, 2018. P. 3-11.

12. Hoorali F., Khosravi H., Moradi B. Automatic microscopic diagnosis of diseases using an improved UNet++ architecture // Tissue and Cell. 2022. T. 76. P. 101816.

13. Kozlova O. V., Kunica E. Ju., Lukashevich M. M. U-net dlja reshenija zadachi segmentacii medicinskih izobrazhenij // Pjataja Mezhdunarodnaja nauchno-prakticheskaja konferencija "BIG DATA and Advanced Analytics. BIG DATA i analiz vvsokogo urovnja". Minsk, Respublika Belarus'. 2019.

14. Kalackaja L. V., Novikov V. A., Sadov V. S. Organizacija i obuchenie iskusstvennvh nejronnvh setej: Jeksperimental'noe uchebnoe posobie / Minsk: Publ BGU. 2003. P. 52-72.

ИСПОЛЬЗОВАНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ СЕГМЕНТАЦИИ УЛЬТРАЗВУКОВЫХ ИЗОБРАЖЕНИЙ

СКЕЛЕТНОЙ МЫШЦЫ

Е. А. Мищенко, И. Ю. Демин

Нижегородский государственный университет им, Н, И, Лобачевского, 603022, Нижний Новгород, Россия

УДК 004.85

DOI: 10.24412/2073-0667-2024-3-47-57 EDX: LTKQYZ

В данной статье рассмотрены вопросы применения методов машинного обучения для сегментации ультразвуковых изображений скелетных мышц человека. Актуальность даннох'о исследования заключается в сложности и длительности расшифровки медицинских материалов, а также субъективности и ошибках. Целью статьи является создание точной и эффективной модели сегментации здоровых скелетных мышц с использованием машинного обучения для метода ультразвукового исследования медицинской визуализации. Для построения модели сегментации скелетных мышц использовались архитектура U-net с различным количеством сверточных слоев, а также сеть U-net++, которая представляет собой модификацию классической U-net. Для обучения нейронной сети был использован набор данных ультразвуковых снимков скелетных мышц из открытых источников, для проверки были использованы ультразвуковые изображения скелетных мышц добровольцев с помощью акустической системы Verasonics. Были проведены обучение, анализ и тестирование модели нейроеети, сравнение результатов обучения при различных модификациях и гиперпараметрах. Основным результатом исследования является получение эффективной модели нейроеети и подтверждение потенциала ее применения для сегментирования ультразвуковых изображений скелетных мышц.

Ключевые слова: машинное обучение, скелетная мышца, сегментация ультразвуковых изображений, еверточная нейронная сеть.

Введение. Ультразвук широко используется в медицине благодаря хорошему распространению в мягких тканях, его относительной безвредности и простоте использования. УЗИ позволяет получить достаточную информацию о структуре и состоянии органов и тканей, а, благодаря своей неинвазивности, активно используется в широком диагностическом спектре. Однако, ультразвук имеет ряд ограничений, таких как специфичность изображений, зависимость качества снимков от аппаратуры и оператора, а также вариабельность в расшифровке изображений. Современные УЗ аппараты позволяют получить сканы хорошего разрешения, однако все еще стоит проблема быстрой и качественной расшифровки материалов, которую необходимо преодолеть дня повышения качества анализа и постановки диагноза. Одним из перспективных методов поддержки клиницистов является использование моделей и методов машинного обучения |1|, Данные методы широко

Работа выполнена при поддержке Министерства науки и высшего образования РФ (государственное задание № FSWR-2023-0031).

(с) Е. А. Мищенко, И. Ю. Демин, 2024

Рис. 1. УЗ скан. взятый с поверхности бедра

используются для анализа данных, постановки диагноза и составления прогнозов, а также дня задач классификации и сегментации медицинских материалов. Модели, основанные на машинном обучении, могут помочь начинающим специалистам, а также ускорить процессы получения качественной медицинской помощи. Цолыо данной работы было получение модели, построенной на архитектуре сверточных нейронных сетей, способной качественно и точно сегментировать УЗ изображения скелетной мышцы.

1. Объект исследования.

1.1. Ультразвук. Ультразвуковые волны являются продольными акустическими волнами, в которых направление смещения отдельных частиц среды параллельно направлению распространения волн. Колебания рабочей поверхности УЗ датчика передаются биологическим тканям, частицы среды начинают колебаться относительно своего равновесного состояния, вызывая вмещение соседних частиц |2|. Таким образом, колебания распространяются вглубь тканей. Дня проведения ультразвуковых исследований используют ультразвук высокой частоты (до сотен МГц), а дня достижения безвредности дня организма используют малой интенсивности.

1.2. УЗ изображения. В УЗ диагностических системах используется эхолокациохшый принцип получения информации об органах и структурах, который заключается в периодическом излучении УЗ импульсов во внутренние структуры организма и приеме сигналов, отраженных акустическими неоднородностями структур. Совокупность принятых эхо-сигналов позволяет построить акустическое изображение исследуемой биологической среды |3|. На экране прибора принятые сигналы представляются в виде двумерного изображения в серой шкале. На рис. 1 изображен типичный УЗ скан, взятый с поверхности бедра.

Величина эхо-сигналов определяется отражающими свойствами на границах раздана сред. Чем больше разница между средами, тем ярче будет это отражено на скане, В воздухе затухание сигналов резко возрастает, что может привести не только к образованию артефактов на сканах, но и порче аппаратуры. Дня предотвращения этого используют специальные акустические голи, хорошо проводящие ультразвук. Это приводит к предотвращению потери мощности. Однако УЗ изображения обладают определенными особенностями, такими как шум и артефакты, а также большой вариабельностью между снимками

Рис. 2. Изображение; из набора данных и соответствующая ему маска

с разного оборудования |4|, Эта специфика приводит к трудностям при расшифровке и высоким требованиям к квалификации, а также опыту у клинициста.

1.3. Набор данных. Дня получения качественной модели необходимо не только грамотно настроить нейронную сеть, но и обучить ее на достаточном, качественном и разнообразном наборе данных. Дня обучения был использован набор данных из открытых источников данных X. J. Cronin'a, содержащий большое количество одиночных изображений здоровых скелетных мышц |5|, Все изображения были вручную аннотированы с помощью бинарных масок, обозначающих границы мышечной ткани. Дня этого было использовано программное обеспечение Fiji — дня каждого изображения создавалась бинарная маска, где нужная структура — границы мышечного слоя — были заменены белыми пикселями, остальные — черными |6|. На рис. 2 приведены пример скана и соответствующая ему бинарная маска. Маски используются в качестве меток истины при обучении нейронных сетей.

После деления набора данных на обучающую и валидациошшую выборки, была произведена аугментация обучающих данных. Аугментация происходит после разделения на выборки дня предотвращения утечки данных, а увеличение валидациошюй выборки нецелесообразно, так как это не приведет к улучшению точности обучения. Дня тестирования готовой модели был использован набор данных УЗ изображений скелетных мышц добровольцев, полученных с помощью акустической системы Verasonics, расположенной в лаборатории MedLab Нижегородского университета |7|. Данные изображения использовались дня оценки окончательной производительности модели. Пример скана из тестовой выборки приведен на рис. 3.

Сканы представляют собой УЗ изображения здоровых мышц, аналогичные тем, что использовались дня обучения модели. Способность корректно расшифровать новые изображения является признаком хорошей обучаемости модели |8|.

2. Применение сверточных нейросетей для сегментации УЗ изображений.

2.1. U-Net. Архитектура U-Xet является одной из классических СХХ дня задач сегментации изображений, она активно применяется дня биомедицинских изображений. Среди главных преимуществ сети можно выделить способность хорошо обучаться на небольшом количество данных. Структура сети представлена на рис. 4.

Рис. 3. Скаи из тестовой выборки

Рис. 4. Иллюстрация архитектуры

Архитектура и-ХсТ, представляет собой сверточпую нейронную сеть с симметричной структурой кодер-декодер с пропуском соединений, что позволяет сети собирать как локальную, так и глобальную контекстную информацию. Кодирующая часть и-ХсТ, состоит из нескольких сверточных слосчз, которые постепенно уменьшают пространственное разрешение входного изображения, увеличивая при этом количество карт признаков. За каждым сверточным слоем следуют функция активации выпрямленной линейной единицы (ЯеХи) и операция максимального объединения, которая уменьшает выборку карт объектов |9|,

Декодерная часть и-ХсЧ, состоит из нескольких слоев развертки, которые постепенно увеличивают пространственное разрешение карт объектов, уменьшая при этом их количество. За каждым слоем развертки следует операция объединения карт объектов из соответствующего с.ноя кодировщика с картами объектов с повышенной дискретизацией из предыдущего слоя с использованием пропускных соединений. Объединенные карты объектов затем обрабатываются сверточным слоем и функцией активации Яе.Ы1.

х0-1 = Н[х°*\ и(х1Л)] = Н[хад,хи1,и(х'-1)] х^=Н[х°^х01>х^,и(х13)]

Рис. 5. Архитектура --. в которой черный цвет обозначает исходную зеленый и синий

плотные блоки свертки па пропускаемых путях, а красный глубокий контроль. Красный, зеленый и

синий компоненты отличают --от

Пропущенные соединения в архитектуре U-Xet позволяют сети сохранять детали входного изображения с высоким разрешением, а также получать контекстную информацию из уменьшенных карт объектов. Это особенно полезно дня сегментации ультразвуковых изображений, когда структуры часто бывают небольшими и сложными, и дня точной сегментации требуется информация как о локальном, так и о глобальном контексте |10|,

2.2. U-Net++. Сеть U-Xet--была предложена как модификация архитектуры сети

U-Xet, которая была разработана дня улучшения производительности сети на задачах сегментации медицинских изображений |11|, Детальная иллюстрация U-Xet--архитектуры приведена на рис. 5.

В основе U-Xet--.нежит идея о том, что модель будет эффективнее и быстрее обучаться, если карты признаков кодера и декодера будут семантически схожи. Структура

U-Xet--, аналогично классической U-Xet, является сверточной нейронной сетью тина

кодер-декодер, где они соединены через ряд вложенных плотных сверточных блоков. U-

Xet--имеет переработанные пути пропуска, где карты функций кодера подвергаются

плотному блоку свертки, необходимому дня семантической близости карт кодера и декодера, а значит оптимизатору будет проще работать. Глубокий контроль, реализованный

в U-Xet--, позволяет модели работать в двух режимах: (1) точный режим, в котором

выходные данные всех ветвей сегментации усредняются; (2) быстрый режим, в котором окончательная карта сегментации выбирается только из одной из ветвей сегментации, выбор которой определяет степень сокращения модели и прирост скорости |12|,

Таблица 1

Точность сегментации сетей U-Net++ с разным количеством слоев

Сеть

Точность (Accuracy)

IoU (IoU curve)

U-Net 2 слоя U-Net 3 слоя

0.9593 0.9562 0.9646 0.9565

0.9891 0.9879 0.9907 0.9877

U-Net++ 2 слоя U-Net++ 3 слоя

3. Результаты.

3.1. Детали реализации. Было проведено сравнение результатов сегментации с помощью сети U-Net, сети U-Net++, а также их варианты с увеличенным количеством евер-точных слоев. Во всех процессах обучения использовался одинаковый набор данных изображений УЗИ скелетных мышц, который был разделен на обучающий и валидационный в соотношении 8/2. В качестве метрик для оценки использовались следующие метрики:

— Accuracy, которая показывает, насколько часто модель правильно классифицирует объекты. Данная метрика является простой и интуитивно понятной, однако ее главный недостаток — неучет важности различных типов ошибок;

— IoU (Intersection-over-Union) — это метрика, используемая для оценки качества работы модели детектирования объектов. Данная метрика измеряет степень перекрытия между предсказанной и истинной рамками и лежит в диапазоне от 0 до 1, где 1 соответствует идеальному обнаружению.

Были использованы обратные вызовы, такие как ранняя остановка (Early Stopping), который прекращает обучение при неизменности ошибки валидации, и уменьшение скорости обучения на плато (RedueeLROnPlateau), предназначенный для адаптивной корректировки скорости обучения при отсутствии улучшения по контролируемой метрике, оба вызова отслеживают необходимые параметры в течение определенного количества эпох. Данные обратные вызовы использовались для предотвращения переобучения. В таблице 1 приведены значения метрик Accuracy и IoU обученных моделей для каждой конфигурации сетей.

Согласно результатам эксперимента, сеть U-Net++ с двумя свертками быстрее обучается и обеспечивает более высокую точность сегментации (0,9646 точности и 0,9907 IoU), чем сети U-Net++ с тремя свертками, U-Net с двумя свертками и U-Net с тремя свертками. Это свидетельствует о том, что сеть U-Net++ с двумя свертками лучше подходит для сегментации областей на данных изображениях.

В контексте данной работы, где стояла задача классификации небольшого количества классов и использовались изображения небольшого размера, сеть с тремя свертками не показала лучших результатов, чем сети с двумя свертками. Это связано с тем, что более сложные функции, которые может изучать сеть с тремя свертками, не были необходимы для решения поставленной задачи. В таких условиях более простая сеть с двумя свертками может учиться более эффективно, так как она имеет меньше параметров и требует меньше вычислительных ресурсов. Кроме того, более простая сеть менее подвержена переобучению, что является важным фактором в задачах с небольшим количеством данных

3.2. Результаты сегментирования. В результате этой работы была разработана модель, которая может сегментировать УЗ изображения скелетных мышц. На вход модели

[14]

О 50 100 150 200 250 0 50 100 150 200 250

Рис. 6. Сегментация УЗ изображения

подастся новое УЗ изображение скелетной мышцы, модель анализирует его и на выход выдает сегментированное изображение с выделенными границами. Результат сегментирования изображения из тестовой выборки приведен на рис. 6.

Заключение. В этом исследовании было показано, что нейронные сети архитектур U-

Net и U-Xet--могут быть эффективно использованы дня сегментации УЗ изображений

скелетных мышц. В ходе исследования были протестированы различные конфигурации нейросетей, и было обнаружено, что сеть U-Xet--с двумя свертками обеспечивает наилучшие результаты. Тестирование готовой модели на реальных изображениях показало, что модель эффективно справляется с поставленной задачей.

Применение нейросетей в медицине имеет ряд преимуществ, в том число улучшение точности диагностики, снижение трудозатрат врачей и повышенно скорости обработки данных. Дальнейшее развитие процессов обучения и тестирования нейросетей позволит в будущем расширить возможности их применения в медицине, например, дня диагностики сложных заболеваний или разработки новых методов лечения.

Список литературы

1. 1. Shah P. ct al. Artificial intelligence and machine learning in clinical development: a translational perspective /7 NP.J digital medicine. 2019. T. 2. № 1. P. 69.

2. Хилл К., Бэмбер Дж., Хаар Г. Ультразвук в медицине. Физические основы применения: учебник. Москва: Физматлит, 2008. 544 с.

3. Практическое руководство но ультразвуковой диагностике. Общая ультразвуковая диагностика / иод ред. В. В. Митькова. Москва: Видар-М, 2011. 720 с.

4. Васильев А. Ю. и др. Артефакты в ультразвуковой диагностике /7 М.: ФГОУ ВУНМЦ Росздрава. 2006.

5. Cronin N. J., Finni Т., Sevnnes О. Fully automated analysis of muscle architecture from B-modc ultrasound images with deep learning /7 arXiv preprint arXiv:2009.04790. 2020.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Maveuf-Louchart A. ct al. MuseleJ: a high-content analysis method to study skeletal muscle with a new Fiji tool /7 Skeletal muscle. 2018. T. 8. P. 1 11.

7. Мищенко E. А., Демин И. Ю. Использование машинного обучения для сегментации УЗИ изображений скелетной мышцы /7 Математическое моделирование и сунеркомньютсрные технологии. Труды XXIII Международной конференции (Н. Новгород, 13 16 ноября 2023 г.) / Под

ред. проф. Д. В. Баландина. Нижний Новгород: Изд-во Нижегородского университета, 2023. С. 106-111.

8. Аветисян М. С. Сегментирование объемных медицинских изображений с использованием сверточных нейронных сетей. Магистерская диссертация // МГУ им. Ломоносова, Факультет ВМК. 2018. С. 58.

9. Ronneberger О., Fischer P., Brox Т. U-net: Convolutional networks for biomedical image segmentation // Medical Image Computing and Computer-Assisted Intervention-MICCAI 2015: 18th International Conference, Munich, Germany, October 5-9, 2015, Proceedings, Part III 18. Springer International Publishing, 2015. P. 234-241.

10 Punn N. S., Agarwal S. Modality specific U-Net variants for biomedical image segmentation: a survey // Artificial Intelligence Review. 2022. T. 55. № 7. P. 5845-5889.

11. Zhou Z. et al. Unet++: A nested u-net architecture for medical image segmentation // Deep Learning in Medical Image Analysis and Multimodal Learning for Clinical Decision Support: 4th International Workshop, DLMIA 2018, and 8th International Workshop, ML-CDS 2018, Held in Conjunction with MICCAI 2018, Granada, Spain, September 20, 2018, Proceedings 4. Springer International Publishing, 2018. P. 3-11.

12 Hoorali F., Khosravi H., Moradi B. Automatic microscopic diagnosis of diseases using an improved UNet++ architecture // Tissue and Cell. 2022. T. 76. P. 101816.

13. Козлова О. В., Куница Е. Ю., Лукашевич М. М. U-net для решения задачи сегментации медицинских изображений // Пятая Международная научно-практическая конференция «BIG DATA and Advanced Analytics. BIG DATA и анализ высокого уровня» / Минск, Республика Беларусь. 2019.

14. Калацкая Л. В., Новиков В. А., Садов В. С. Организация и обучение искусственных нейронных сетей: Экспериментальное учебное пособие // Минск: Изд-во БГУ. 2003. С. 52-72.

Мищенко Евгения

Алексеевна — магистрант 1 года обучения кафедры акустики Радиофизического факультета Нижегородского государственного университета им. Н. И. Лобачевского, e-mail: j [email protected]. Область научных интересов: ультразвуковые исследования для задач медицинской диагностики, машинное обучение. Является соавтором нескольких научных работ в указанных областях.

Evgeniya A. Mischenko — 1st year master's student of Acoustics Department Lobachevsky State University of Nizhny Novgorod, e-mail: j anel4122000@yandex. ru. Research interests: computer modeling in acoustics, ultrasound for medical diagnostic, machine learning. She is coauthor of the several papers in these areas.

Демин Игорь Юрьевич — канд. физ.-мат. наук, доцент, доцент кафедры акустики Радиофизического факультета Нижегородского государственного университета им. H.H. Лобачевского, e-mail: [email protected]. Область научных интересов: численное моделирование в акустике, ультразвуковые исследования для задач медицинской диагностики, машинное обучение. Является соавтором более 150 научных и учебно-методических публикаций.

Igor Yu. Demin — PhD in Physical and Mathematical Sciences. Associate professor at the Acoustics Department Lobachevsky State University of Nizhny Novgorod, e-mail: demin® rf . unn. ru. Research interests: computer modeling in acoustics, ultrasound for medical diagnostic, machine learning. He is a co-author of more than 150 scientific and educational publications.

Дата поступления — 31.01.2024

i Надоели баннеры? Вы всегда можете отключить рекламу.