Научная статья на тему 'СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ ДЛЯ ЗАДАЧИ ДИАГНОСТИКИ ПЛОСКО-ВАЛЬГУСНОЙ ДЕФОРМАЦИИ СТОП'

СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ ДЛЯ ЗАДАЧИ ДИАГНОСТИКИ ПЛОСКО-ВАЛЬГУСНОЙ ДЕФОРМАЦИИ СТОП Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
18
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
сегментация / нейронная сеть / пороговая обработка / segmentation / neural network / threshold processing

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Недопекин Александр Евгеньевич, Жилин Валентин Валерьевич

Плоско-вальгусная деформация стопы (ПВДС) является распространенным состоянием, которое может привести к различным проблемам со здоровьем, таким как болевые синдромы и искривление позвоночника. Для эффективной диагностики при помощи программных средств требуется точная сегментация заднего отдела стопы на изображениях. В данном исследовании было проведено сравнение двух методов сегментации изображений: пороговая обработка и модель на основе сверточной нейронной сети (CNN), а именно архитектуры U-Net. Пороговая обработка, хотя и проста в реализации, не всегда эффективна на изображениях с неравномерной яркостью или шумами. В то время как модель на основе нейронной сети представляет собой более сложный, но более точный метод, способный адаптироваться к различным условиям изображений. Проведенное исследование показало, что модель на основе нейронной сети демонстрирует высокую точность сегментации заднего отдела стопы на изображениях различных пациентов. Точность этой модели составила 97% на тестовых данных и 95% на валидационных данных, что подтверждает ее эффективность. Модель на основе сверточной нейронной сети, такая как архитектура U-Net, представляет собой предпочтительный выбор для сегментации изображений заднего отдела стопы. Ее способность адаптироваться к различным условиям изображений, и высокая точность делают ее эффективным инструментом в клинической практике.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Недопекин Александр Евгеньевич, Жилин Валентин Валерьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IMAGE SEGMENTATION FOR THE TASK OF DIAGNOSING FLAT-VALGUS DEFORMITY OF THE FEET

Flat-valgus deformity of the foot is a common condition that can lead to various health problems such as pain syndromes and curvature of the spine. For effective diagnosis using software tools, accurate segmentation of the posterior part of the foot in the images is required. In this study, two image segmentation methods were compared: threshold processing and a model based on a convolutional neural network (CNN), namely the U-Net architecture. Threshold processing, although easy to implement, is not always effective on images with uneven brightness or noise. Whereas a neural network-based model is a more complex but more accurate method capable of adapting to different image conditions. The study showed that the neural network-based model demonstrates high accuracy of posterior foot segmentation in images of various patients. The accuracy of this model was 97% on test data and 95% on validation data, which confirms its effectiveness. A convolutional neural network-based model, such as the U-Net architecture, is the preferred choice for image segmentation of the hindfoot. Its ability to adapt to different imaging conditions and high accuracy make it an effective tool in clinical practice.

Текст научной работы на тему «СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ ДЛЯ ЗАДАЧИ ДИАГНОСТИКИ ПЛОСКО-ВАЛЬГУСНОЙ ДЕФОРМАЦИИ СТОП»

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

ИСКУССТВЕННЫМ ИНТЕЛЛЕКТ И ПРИНЯТИЕ РЕШЕНИИ ARTIFICIAL INTELLIGENCE AND DECISION MAKING

УДК 004.934.5 DOI: 10.18413/2518-1092-2024-9-1-0-6

Недопекин А.Е. СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ ДЛЯ ЗАДАЧИ

Жилин В.В. ДИАГНОСТИКИ ПЛОСКО-ВАЛЬГУСНОЙ

ДЕФОРМАЦИИ СТОП

Марийский государственный университет, пл. Ленина, 1, г. Йошкар-Ола, Республика Марий Эл, 424000, Россия

e-mail: agasfer911@yandex.ru, zhilin.valentin.72@gmail.com

Аннотация

Плоско-вальгусная деформация стопы (ПВДС) является распространенным состоянием, которое может привести к различным проблемам со здоровьем, таким как болевые синдромы и искривление позвоночника. Для эффективной диагностики при помощи программных средств требуется точная сегментация заднего отдела стопы на изображениях. В данном исследовании было проведено сравнение двух методов сегментации изображений: пороговая обработка и модель на основе сверточной нейронной сети (CNN), а именно архитектуры U-Net. Пороговая обработка, хотя и проста в реализации, не всегда эффективна на изображениях с неравномерной яркостью или шумами. В то время как модель на основе нейронной сети представляет собой более сложный, но более точный метод, способный адаптироваться к различным условиям изображений. Проведенное исследование показало, что модель на основе нейронной сети демонстрирует высокую точность сегментации заднего отдела стопы на изображениях различных пациентов. Точность этой модели составила 97% на тестовых данных и 95% на валидационных данных, что подтверждает ее эффективность. Модель на основе сверточной нейронной сети, такая как архитектура U-Net, представляет собой предпочтительный выбор для сегментации изображений заднего отдела стопы. Ее способность адаптироваться к различным условиям изображений, и высокая точность делают ее эффективным инструментом в клинической практике. Ключевые слова: сегментация; нейронная сеть; пороговая обработка

Для цитирования: Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. - Т.9, №1, 2024. - С. 46-57. DOI: 10.18413/2518-1092-2024-9-1-0-6

Nedopekin A.E. Zhilin V.V.

IMAGE SEGMENTATION FOR THE TASK OF DIAGNOSING FLAT-VALGUS DEFORMITY OF THE FEET

Man State University, Lenin Square, 1, Yoshkar-Ola, Republic of Man El, 424000, Russia e-mail: agasfer911@yandex.ru, zhilin.valentin.72@gmail.com

Abstract

Flat-valgus deformity of the foot is a common condition that can lead to various health problems such as pain syndromes and curvature of the spine. For effective diagnosis using software tools, accurate segmentation of the posterior part of the foot in the images is required. In this study, two image segmentation methods were compared: threshold processing and a model based on a convolutional neural network (CNN), namely the U-Net architecture. Threshold processing, although easy to implement, is not always effective on images with uneven brightness or noise. Whereas a neural network-based model is a more complex but more accurate method capable of adapting to different image conditions. The study showed that the neural network-based model

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

demonstrates high accuracy of posterior foot segmentation in images of various patients. The accuracy of this model was 97% on test data and 95% on validation data, which confirms its effectiveness. A convolutional neural network-based model, such as the U-Net architecture, is the preferred choice for image segmentation of the hindfoot. Its ability to adapt to different imaging conditions and high accuracy make it an effective tool in clinical practice. Keywords: segmentation; neural network; threshold processing

For citation: Nedopekin A.E., Zhilin V.V. Image segmentation for the task of diagnosing flat-valgus deformity of the feet // Research result. Information technologies. - T. 9, №1, 2024. -P. 46-57. DOI: 10.18413/2518-1092-2024-9-1-0-6

ВВЕДЕНИЕ

Плоско-вальгусная деформация стопы (ПВДС) является распространенным состоянием, характеризующимся плоскостью или выпуклостью стопы. Стоит отметить, что ПВДС может быть, как самостоятельным состоянием, так и одним из симптомов других медицинских проблем, таких как плоскостопие, артрит или деформации костей [16]. Данная патология особенно часто встречается у взрослых, но не обходит стороной и детей разных возрастных групп [3, 6]. При деформации стопы снижается опорная и рессорная функции, что приводит к различным проблемам со здоровьем, таким как болевые синдромы в суставах, искривление позвоночника, нарушение осанки, частая усталость и утомленность [19].

По данным Всемирной Организации Здравоохранения (ВОЗ), более половины населения Земли имеет плоскостопие разной степени. На долю женщин приходится 90% заболеваемости плоскостопием. На территории России данная проблема у 60% населения [18].

Причиной развития деформации стопы являются наследственные болезни, слабость мышц и связок или их перенапряжение. Неправильно подобранная обувь также является одним из немаловажных факторов развития болезни. Большая подверженность женщин плоскостопию вызвана тем, что часто они с ранних лет носят обувь с высокими каблуками, в тот период, когда еще стопа окончательно не сформировалась [13].

Своевременная диагностика заболевания и принятие соответствующих мер имеют решающее значение для своевременного лечения ПВДС. Определение ПВДС на ранней стадии позволяет предпринять эффективные меры для предотвращения прогрессирования заболевания и минимизации его последствий для здоровья.

Одним из способов установления степени плоскостопия является, определение углов заднего отдела стоп. Суть заключается в проведении двух осей, первая ось обозначена как кп, а вторая ось кк, на рисунке 1. После того как оси были проведены, производится вычисление угла между кп и кк. Также угол без привязки к конкретным числовым диапазонам называют углом пронации [2]. Угол принято считать вальгусным или варусным, в зависимости от направления его отклонения от нормального положения. Если угол между осями кп и кк превышает 6°, то он считается вальгусным. Если угол меньше -6°, то его считают варусным [12]. Данный метод является важным инструментом для определения степени плоскостопия и позволяет оценить структурные особенности стопы для выбора наиболее эффективного лечения.

Целью данной работы является разработка программного решения (модели) для сегментации изображения с последующей подготовкой его для дальнейшей обработки. Конкретно, целью является подготовка изображения для использования в алгоритме автоматической диагностики плоско-вальгусной деформации стопы (ПВДС). Для достижения этой цели требуется провести сбор, анализ и обработку набора данных, а также реализовать программное решение (модель) для сегментации заднего отдела стопы.

НАУЧНЫЙ РЕЗУЛЬТАТ

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

Рис. 1. Пример осей для определения угла пронации Fig. 1. Example of axes for determining the pronation angle

Автоматизация процесса диагностики предполагает обработку фотоизображения заднего отдела стопы и вывод результата. Результат обработки включает в себя рассчитанный угол пронации, степень плоскостопия, а также исходное фотоизображение с размеченными точками и значениями углов.

Для минимизации ошибок необходимо провести обработку входящего изображения. Обработка включает в себя сегментацию изображения, что означает удаление заднего фона и выделение объекта интереса. В данном случае объектом является задний отдел стопы.

ОБЗОР МЕТОДОВ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ

Сегментация изображения - это процесс выделения и классификации объектов интереса на изображении путем разделения его на несколько сегментов или регионов. Цель сегментации состоит в том, чтобы выделить объекты или области на изображении, которые представляют интерес для дальнейшего анализа или обработки [8].

Сегментация играет важную роль в обработке изображений и компьютерном зрении, поскольку позволяет автоматически выделять объекты, определять их контуры, а также проводить качественный анализ структуры и свойств объектов на изображении [12].

Существует несколько методов сегментации изображений, каждый из которых имеет свои преимущества и недостатки, и выбор конкретного метода зависит от характеристик изображений и целей исследования.

Пороговая обработка - это метод сегментации изображения, основанный на установлении порогового значения яркости или цвета, выше или ниже которого все пиксели изображения классифицируются как объекты или фон [9].

Принцип работы пороговой обработки заключается в том, что пиксели, значения яркости или цвета которых превышают заданный порог, считаются объектами интереса, в то время как остальные пиксели считаются фоновыми. Порог может быть выбран вручную или автоматически на основе характеристик изображения [17].

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

Основные преимущества пороговой обработки включают ее простоту и высокую скорость работы. Этот метод легко реализуется и быстро выполняется на практике. Он также обладает низкими требованиями к вычислительным ресурсам и может быть применен к изображениям в реальном времени.

Однако пороговая обработка может быть неэффективной в случае изображений с неравномерной яркостью или наличием шумов. В таких случаях выбор оптимального порога может быть затруднительным, что может привести к неправильной сегментации объектов или неполному выделению деталей на изображении.

Для улучшения эффективности пороговой обработки можно использовать различные методы предварительной обработки изображения, такие как сглаживание или фильтрация, для устранения шумов или улучшения равномерности яркости. Также можно применять адаптивную пороговую обработку, которая позволяет автоматически выбирать пороговые значения в зависимости от характеристик каждой области изображения [ 1].

В целом, пороговая обработка остается одним из наиболее простых и широко используемых методов сегментации изображений, несмотря на свои ограничения. Она находит применение во многих областях, включая медицинскую диагностику, компьютерное зрение, а также в обработке изображений и видео.

Методы, использующие машинное обучение, представляют собой класс алгоритмов сегментации, которые основаны на обучении моделей машинного обучения для автоматического выделения объектов на изображении. Эти методы отличаются от классических подходов к сегментации, таких как пороговая обработка или алгоритмы активных контуров [10], тем, что они способны обучаться на больших наборах, размеченных данных и адаптироваться к различным типам изображений и объектов.

Одним из наиболее популярных методов машинного обучения для сегментации изображений является сегментация с использованием сверточных нейронных сетей (CNN). CNN - это класс нейронных сетей, специально разработанный для обработки изображений. Они состоят из нескольких слоев, включая сверточные слои, слои подвыборки и полносвязанные слои, которые позволяют модели извлекать иерархические признаки из изображений и использовать их для точного выделения объектов [7].

Преимущества методов, использующих машинное обучение, включают их способность к обучению на больших объемах данных и адаптацию к различным типам изображений и объектов. Однако для их эффективной работы требуется наличие больших размеченных наборов данных для обучения моделей. Также эти методы могут потребовать значительных вычислительных ресурсов для обучения и прогнозирования моделей, особенно в случае использования CNN [11].

Одной из самых популярных архитектур для сегментации медицинских изображений является U-Net [4]. Он состоит из энкодера, который сжимает изображение и извлекает признаки, и декодера, который восстанавливает размер изображения и производит пиксельную классификацию. U-Net хорошо работает с небольшими объемами данных и имеет хорошую способность к обучению на малом количестве размеченных изображений [15].

Каждый из этих методов имеет свои особенности и может быть применен в зависимости от конкретной задачи и требований к точности и скорости обработки данных. Важно выбрать подходящий метод сегментации, который обеспечит наиболее качественный результат.

АНАЛИЗ И ПОДГОТОВКА НАБОРА ДАННЫХ

Для обучения моделей сегментации изображений требуются размеченные наборы данных, состоящие из пар изображений и соответствующих им масок сегментации. Изображения могут быть различного разрешения и содержать объекты разных размеров и форм. Чем больше и разнообразнее набор данных, тем лучше модель сможет обучиться и обобщить свои знания на новые изображения. Также важно провести предварительную обработку данных, такую как изменение размера

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

изображений, нормализация и аугментация данных, чтобы улучшить качество обучения и повысить устойчивость модели.

Необработанный (или исходный) набор данных состоит из 355 фотоизображений. Изображение содержит задний отдел стоп, пациентов разной возрастной категории. Пример изображен на рисунке 2.

Данные были получены в рамках исследовательской работы по диагностике ПВДС. Среди исходных данных присутствуют изображения заднего отдела стопы как здоровых пациентов, так и пациентов с ярков выраженной деформацией стопы и с большим отклонением от нормального положения угла.

шшш

Рис. 2. Пример исходного изображения Fig. 2. An example of the original image

Если в случае обработки данных традиционными алгоритмами компьютерного зрения, количество данных несущественно, то для обучения модели нейронной сети для сегментации изображения на архитектуре U-Net, имеющееся количество данных является недостаточным.

Одним из вариантов решения данной проблемы является аугментация данных. Аугментация данных - это процесс создания новых обучающих примеров путем применения различных трансформаций к существующим изображениям. Применение аугментации данных позволяет создать больше разнообразных обучающих примеров из ограниченного набора данных, что может значительно улучшить качество и обобщающую способность модели [5]. Однако при выборе конкретных трансформаций для аугментации данных важно учитывать особенности задачи и требования к конечной модели.

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

В рамках обучения модели нейронной сети для сегментации изображений на архитектуре и-Net были проведены различные трансформации данных. Схематичное представление изображено на рисунке 3.

Рис. 3. Схема аугментации изображения Fig. 3. Pipeline of Image Augmentation

Эти трансформации включали:

1. Зашумление: Добавление случайного шума к изображениям, чтобы модель могла обучаться на изображениях с различными уровнями шума, что помогает ей стать более устойчивой к шуму в реальных условиях.

2. Размытие: Применение различных фильтров размытия к изображениям, чтобы модель могла обучаться на изображениях с различными уровнями резкости, что помогает ей лучше обнаруживать границы объектов.

3. Изменение яркости и контрастности: Изменение яркости и контрастности изображений, чтобы модель могла обучаться на изображениях с различными уровнями освещенности и контраста.

4. Отражение: Применение отражений по горизонтали или вертикали к изображениям, чтобы модель могла обучаться на изображениях с различными зеркальными отражениями.

5. Повороты: Повороты изображений на различные углы, чтобы модель могла обучаться на изображениях с различными ориентациями объектов.

6. Масштабирование: Увеличение или уменьшение размера изображений, чтобы модель могла обучаться на изображениях с различными масштабами объектов.

Применение методов аугментации данных позволило увеличить количество доступных данных до 5 тысяч изображений. Это значительное увеличение объема данных способствует более эффективному обучению модели нейронной сети для сегментации изображений стопы на архитектуре и-№1 Большее количество разнообразных данных помогает модели лучше обобщить особенности объектов и сделать более точные прогнозы при сегментации новых изображений.

Для обучения модели помимо аугментации данных требуется провести аннотацию, то есть создать маски сегментации, которые точно определяют задний отдел стопы на каждом изображении. Эти маски затем используются в качестве размеченных данных для обучения нейронной сети. Процесс аннотации данных включает в себя создание точных контуров объектов

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

на изображениях, что играет ключевую роль в обучении модели и повышении ее эффективности при сегментации. Для этой цели был использован сервис CVAT.ai. Результат аннотации изображен на рисунке 4, представляет из себя бинарную маску исходного изображения.

Рис. 4. Результат аннотации исходного изображения Fig. 4. The result of the annotation of the original image

Для реализации сегментации заднего отдела стопы на изображениях была использована модель на основе архитектуры U-Net. Модель состоит из восьми сверточных слоев, включая слои субдискретизации, пространственного отсева и транспонированных сверток. Активация LeakyReLU (Rectified Linear Unit) применяется для большинства слоев, за исключением последнего, где используется сигмоидальная функция активации для получения бинарных масок сегментации. Для обучения модели был использован оптимизатор Adam и функция потерь бинарная кросс энтропия.

Входной слой принимает изображения заднего отдела стопы, а выходной слой генерирует соответствующие маски сегментации. Обучение проводилось в среде Google Colab, что обеспечило доступ к вычислительным ресурсам в облаке и ускорило процесс обучения. Для обучения модели были использованы следующие гиперпараметры: размер изображений составлял 640x640 пикселей, при этом тестовая выборка составляла 85%, а валидационная - 15%. Размер пакета данных был установлен на уровне 64, и число эпох составило 25. Эти гиперпараметры были настроены для оптимального обучения модели сегментации заднего отдела стопы на основе архитектуры U-Net.

АНАЛИЗ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ РАЗЛИЧНЫХ МЕТОДОВ СЕГМЕНТАЦИИ

ИЗОБРАЖЕНИЙ

В результате обучения данная модель показала высокую точность сегментации, достигнув значений 97% на тестовых данных и 95% на валидационных данных, что подтверждает ее

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

эффективность в выделении интересующих объектов, в данном случае заднего отдела стопы. Точность сегментации была вычислена с использованием формулы (1), где TP (True Positive) -количество пикселей, которые были правильно классифицированы моделью как принадлежащие объекту интереса (задний отдел стопы), а FP (False Positive) - количество пикселей, которые модель неправильно классифицировала как принадлежащие объекту интереса при этом они к нему не относятся.

Accuracy =

TP

(1)

ТР+РР

Для достижения положительных результатов с помощью пороговой обработки требуется правильно выбрать пороговое значение яркости или цвета, учитывая особенности изображения и цели сегментации. Кроме того, может потребоваться предварительная обработка изображения, такая как сглаживание или фильтрация, для уменьшения шумов или улучшения равномерности яркости. Но даже после ряда обработок желаемый результат едва достигается. При использовании пороговой обработки в данном случае было достигнуто приблизительно 82% точности. Для расчета точности, также была применена формула (1).

Пороговое значение для сегментации было выбрано адаптивно с использованием метода Отцу (Otsu), реализованного в библиотеке OpenCV. Этот метод автоматически определяет оптимальный порог для бинаризации изображения, учитывая его гистограмму интенсивности пикселей в градациях серого.

Проанализировав результаты, полученные с помощью пороговой обработки и нейронной сети, можно выделить их основные отличия и преимущества. Пороговая обработка, хотя и проста в реализации и имеет высокую скорость работы, часто оказывается неэффективной на изображениях с неравномерной яркостью или шумами, что может привести к недостаточной точности сегментации. Результат пороговой обработки изображен на рисунке 5.

Рис. 5. Результат пороговой обработки Fig. 5. The result of threshold processing

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

В то время как пороговая обработка имеет свои ограничения, модель на основе нейронной сети продемонстрировала хорошие результаты. Результат выполнения изображен на рисунке 6. Оно содержит тестовое изображение, две маски (soft и binary) и изображение с наложенной маской.

Рис. 6. Результат сегментации Fig. 6. The result of segmentation

Первая маска (soft mask), полученная с помощью нейронной сети, представляет собой мягкую маску, где каждый пиксель имеет значение от 0 до 1, отражающее степень уверенности модели в том, что данный пиксель принадлежит объекту интереса. Это позволяет учитывать плавные переходы и размытость в выделении объектов.

Вторая маска (binary mask) является бинарной маской, где каждый пиксель может быть представлен только в двух состояниях: 0 или 1. Значения 1 обозначают пиксели, принадлежащие объекту интереса, в то время как значения 0 обозначают пиксели фона. Эта маска обеспечивает более четкое разделение между объектом и фоном, что полезно при определении точных контуров объектов для последующего анализа.

Изображение с наложенной маской представляет собой результат наложения бинарной маски на тестовое изображение. Это позволяет визуализировать, какие части изображения были выделены как объект интереса моделью на основе нейронной сети.

Полученные результаты на новых данных свидетельствует о высокой эффективности модели в точной сегментации заднего отдела стопы на изображениях различных пациентов. Она успешно справилась с разнообразными условиями освещения, шумами и другими искажениями, что подтверждает ее способность адаптироваться к различным типам изображений и объектов. Такие высокие показатели точности делают модель на основе нейронной сети предпочтительным выбором для сегментации.

ЗАКЛЮЧЕНИЕ

В представленном исследовании было проведено сравнение методов пороговой и нейросетевой сегментации применительно к изображениям заднего отдела стоп. Пороговая обработка, хотя и обладает простотой и высокой скоростью работы, часто неэффективна на изображениях с неравномерной яркостью или шумами, в то время как модель на основе нейронной сети продемонстрировала высокую точность сегментации заднего отдела стопы на изображениях различных пациентов, достигнув точности в 97% на тестовых данных и 95% на валидационных данных. Это подтверждает превосходство модели нейронной сети в обработке изображений с различными условиями освещения и шумами, делая ее предпочтительным выбором для сегментации.

Список литературы

1. Балсаидов А.Ш. Предварительная обработка изображений для наилучшего распознавания текста // Компьютерная обработка тюркских языков. TURKLANG 2022: ТРУДЫ X Международной конференции, Нур-Султан, 16-18 июня 2022 года. - Нур-Султан: ИП «Булатов А.Ж.», 2022. - С. 84-91. - ББК 1№Т0Б2А.

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

2. Боровлева А.В., Дубровин Г.М. Результаты лечения мобильной плоско-вальгусной деформации стоп у детей // Молодежь - практическому здравоохранению: XIII Всероссийская с международным участием научная конференция студентов и молодых ученых-медиков, Иваново, 13 ноября 2019 года. - Иваново: Ивановская государственная медицинская академия, 2019. - С. 164-168. - EDN FMKDYN.

3. Борзунов А.В. Распространенность плоскостопия у детей и взаимосвязь плоскостопия и гипермобильного синдрома // Вестник физиотерапии и курортологии. - 2015. - Т. 21, № 2. - С. 106a-106. -EDN YRGSAT.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Бруттан Ю.В., Новиков А. Исследование нейронных сетей для анализа медицинских изображений // Вестник Псковского государственного университета. Серия: Технические науки. - 2020. - № 11. - С. 49-54. - EDN JPRRRZ.

5. Дементьев В.Е., Андриянов Н.А., Васильев К.К. Использование аугментации изображений и реализация дважды стохастических моделей для повышения эффективности нейросетевых алгоритмов распознавания образов в сверточных нейронных сетях // Системы синхронизации, формирования и обработки сигналов. - 2020. - Т. 11, № 5. - С. 15-22. - EDN NVNEJT.

6. Дубровин Г.М., Бакурская Е.С. Особенности скрининговой оценки мобильной плоско-вальгусной деформации стоп и способ ее коррекции у детей // Весенние дни ортопедии: Тезисы Международного конгресса, Москва, 01-02 марта 2019 года / Под редакцией Н.В. Загороднего. - Москва: Российский университет дружбы народов (РУДН), 2019. - С. 66-69. - EDN XTCLHO.

7. Дычков И.Н. Сверточные нейронные сети // Тенденции развития науки и образования. - 2021. -№ 73-1. - С. 38-41. - DOI 10.18411/lj-05-2021-08. - EDN MQYWDB.2

8. Купоросов А.А. Сегментация изображения на основе метода оптимизация роя частиц // Информатика, управляющие системы, математическое и компьютерное моделирование (ИУСМКМ-2019): Материалы студенческой секции X Международной научно-технической конференции в рамках V Международного Научного форума Донецкой Народной Республики, Донецк, 22-24 мая 2019 года. -Донецк: Донецкий национальный технический университет, 2019. - С. 262-266. - EDN MEUIHM.

9. Метод пороговой сегментации изображений морских судов / Ш.С. Фахми, С.А. Селиверстов,

B.В. Вислогузов, В.В. Крымский // Морские интеллектуальные технологии. - 2019. - № 4-2(46). - С. 69-78. -EDN JJWOZE.

10. Модель обучаемого активного контура для сегментации гистологических изображений / А.В. Хвостиков, А.С. Крылов, И.А. Михайлов, П.Г. Мальков // Научная визуализация. - 2019. - Т. 11, № 3. -

C. 64-75. - EDN WKQNJU.

11. Муаль М.Н.Б., Козырев Д.В. Применение сверточных нейронных сетей для обнаружения и распознавания изображений на основе самописного генератора // Современные информационные технологии и ИТ-образование. - 2022. - Т. 18, № 3. - С. 507-515. - DOI 10.25559/SITIT0.18.202203.507-515.

12. Ортопедическая диагностика: Руководство-справочник / Маркс В.О. Минск: Наука и техника; 1978.

512 с.

13. Самойлова Р.С., Самойлов С.П., Самойлова А.С. Стопа - фундамент тела // Авиценна. - 2018. -№ 16. - С. 35-38. - EDN YSWFZU.

14. Сегментация изображений микрообъектов / В.С. Пятлин, Е.И. Лойко, В.Ю. Цвирко, Д.С. Дулевич // Научные горизонты. - 2019. - № 4(20). - С. 187-192. - EDN GHXEBE.

15. Система распознавания повреждений металлических конструкций / В.Е. Дементьев, Р.А. Савинов, М.Н. Суетин, А.Г. Подлобошников // Автоматизация процессов управления. - 2021. - № 2(64). - С. 40-45. -DOI 10.35752/1991-2927-2021-2-64-40-45.

16. Теплов П.А. От плоскостопия к здоровой стопе // Глобальные проблемы современности. - 2022. -Т. 3, № 2. - С. 46-48. - EDN JDNOGZ.

17. Тимофеев Б.С., Мотыко А.А. Адаптивная локальная бинаризация изображений // Телевидение: передача и обработка изображений. - 2016. - Т. 1. - С. 109-114. - EDN XINNZH.

18. Чемеричина А.А. Профилактика нарушений опорно-двигательного аппарата у детей и подростков в школьных образовательных учреждениях // Молодежь и наука: шаг к успеху: Сборник научных статей 6-й Всероссийской научной конференции перспективных разработок молодых ученых, в 3-х томах, Курск, 2223 марта 2022 года. Том 2. - Курск: Юго-Западный государственный университет, 2022. - С. 426-430. - EDN PGONXE.

19. Шевелева Н.И., Дубовихин А.А., Минбаева Л.С. Проблема плоскостопия на современном этапе // Вопросы практической педиатрии. - 2020. - Т. 15, № 2. - С. 68-74. - DOI 10.20953/1817-7646-2020-2-68-74.

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

References

1. Balsaidov A.S. Preliminary image processing for the best text recognition // Computer processing of Turkic languages. TURKLANG 2022: PROCEEDINGS OF the X International Conference, Nur Sultan, June 16-18, 2022. -Nur Sultan: IP Bulatov A.Zh., 2022. - pp. 84-91. - EDN WTODZA.

2. Borovleva A.V., Dubrovin G.M. Results of treatment of mobile flat-valgus deformity of feet in children // Youth - practical healthcare: XIII All-Russian scientific conference of students and young medical scientists with international participation, Ivanovo, November 13, 2019. - Ivanovo: Ivanovo State Medical Academy, 2019. -pp. 164-168. - EDN FMKDYN.

3. Borzunov A.V. The prevalence of flat feet in children and the relationship between flat feet and hypermobility syndrome // Bulletin of Physiotherapy and Balneology. - 2015. - vol. 21, No. 2. - pp. 106a-106. -EDN YRGSAT.

4. Bruttan Yu.V., Novikov A. The study of neural networks for the analysis of medical images // Bulletin of the Pskov State University. Series: Technical Sciences. - 2020. - No. 11. - pp. 49-54. - EDN JPRRRZ.

5. Dementiev V.E., Andrianov N.A., Vasiliev K.K. The use of image augmentation and the implementation of doubly stochastic models to improve the efficiency of neural network algorithms for pattern recognition in convolutional neural networks // Systems of synchronization, signal generation and processing. - 2020. - Vol. 11, No. 5. - pp. 15-22. - EDN NVNEJT.

6. Dubrovin G.M., Bakurskaya E.S. Features of screening assessment of mobile flat-valgus deformity of the feet and the method of its correction in children // Spring Days of Orthopedics: Abstracts of the International Congress, Moscow, March 01-02, 2019 / Edited by N.V. Zagorodny. - Moscow: Peoples' Friendship University of Russia (RUDN), 2019. - pp. 66-69. - EDN XTCLHO.

7. Dychkov I.N. Convolutional neural networks // Trends in the development of science and education. -2021. - No. 73-1. - pp. 38-41. - DOI 10.18411/lj-05-2021-08. - EDN MQYWDB.2

8. Kuporosov A.A. Image segmentation based on the particle swarm optimization method // Informatics, control systems, mathematical and computer modeling (IUSMKM-2019): Materials of the student section of the X International Scientific and Technical Conference within the framework of the V International Scientific Forum of the Donetsk People's Republic, Donetsk, May 22-24, 2019. - Donetsk: Donetsk National Technical University, 2019. - pp. 262-266. - EDN MEUIHM.

9. The method of threshold segmentation of images of marine vessels / S.S. Fahmi, S.A. Seliverstov, V.V. Visloguzov, V.V. Krymsky // Marine intelligent technologies. - 2019. - № 4-2(46). - Pp. 69-78. - EDN JJWOZE.

10. The model of the trained active contour for segmentation of histological images / A.V. Khvostikov, A.S. Krylov, I.A. Mikhailov, P.G. Malkov // Scientific visualization. - 2019. - Vol. 11, No. 3. - pp. 64-75. - EDN WKQNJU.

11. Mual M.N.B., Kozyrev D.V. Application of convolutional neural networks for image detection and recognition based on a self-written generator // Modern information technologies and IT education. - 2022. - Vol. 18, No. 3. - pp. 507-515. - DOI 10.25559/SITITO.18.202203.507-515.

12. Orthopedic diagnostics: Handbook / Marx V.O. Minsk: Science and technology; 1978. 512 p.

13. Samoilova R.S., Samoilov S.P., Samoilova A.S. Foot - the foundation of the body // Avicenna. - 2018. -No. 16. - pp. 35-38. - EDN YSWFZU.

14. Segmentation of images of microobjects / V.S. Pyatlin, E.I. Loiko, V.Yu. Tsvirko, D.S. Dulevich // Scientific horizons. - 2019. - № 4(20). - Pp. 187-192. - EDN GHXEBE.

15. The system for recognizing damage to metal structures / V.E. Dementiev, R.A. Savinov, M.N. Suetin, A G. Podloboshnikov // Automation of control processes. - 2021. - № 2(64). - Pp. 40-45. - DOI 10.35752/19912927-2021-2-64-40-45.

16. Teplov P.A. From flat feet to a healthy foot // Global problems of modernity. - 2022. - Vol. 3, No. 2. -pp. 46-48. - EDN JDNOGZ.

17. Timofeev B.S., Motyko A.A. Adaptive local image binarization // Television: transmission and image processing. - 2016. - Vol. 1. - pp. 109-114. - EDN XINNZH.

18. Chemerichina A.A. Prevention of disorders of the musculoskeletal system in children and adolescents in school educational institutions // Youth and science: a step to success: A collection of scientific articles of the 6th All-Russian Scientific Conference of promising developments of young scientists, in 3 volumes, Kursk, March 2223, 2022. Volume 2. - Kursk: Southwestern State University, 2022. - pp. 426-430. - EDN PGONXE.

Недопекин А.Е., Жилин В.В. Сегментация изображений для задачи диагностики плоско-вальгусной деформации стоп // Научный результат. Информационные технологии. -Т.9, №1,2024

19. Sheveleva N.I., Dubovikhin A.A., Minbayeva L.S. The problem of flat feet at the present stage // Questions of practical pediatrics. - 2020. - Vol. 15, No. 2. - pp. 68-74. - DOI 10.20953/1817-7646-2020-2-68-74.

Недопекин Александр Евгеньевич, кандидат физико-математических наук, доцент, доцент кафедры прикладной

математики и информатики

Жилин Валентин Валерьевич, магистрант

Nedopekin Alexander Evgenievich, Candidate of Physical and Mathematical Sciences, Associate Professor, Associate Professor of the Department of Applied Mathematics and Computer Science Zhilin Valentin Valeryevich, master's degree

i Надоели баннеры? Вы всегда можете отключить рекламу.