Научная статья на тему 'ВЫЯВЛЕНИЕ ГРАНИЦ ОРГАНОВ ВОЗДУШНОГО ДЫХАНИЯ НА СНИМКАХ КОМПЬЮТЕРНОЙ ТОМОГРАФИИ С ПОМОЩЬЮ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ АРХИТЕКТУРЫ U-NET'

ВЫЯВЛЕНИЕ ГРАНИЦ ОРГАНОВ ВОЗДУШНОГО ДЫХАНИЯ НА СНИМКАХ КОМПЬЮТЕРНОЙ ТОМОГРАФИИ С ПОМОЩЬЮ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ АРХИТЕКТУРЫ U-NET Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
53
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ / АРХИТЕКТУРА U-NET / ГЛУБОКОЕ ОБУЧЕНИЕ / РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ / MACHINE LEARNING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Евсина В.А., Жжонов В.А., Широбокова С.Н.

В данной статье рассматривается проблематика определения органов воздушного дыхания на снимках компьютерной томографии с помощью сверточных нейронных сетей архитектуры U-NET. Описаны перспективы использования нейронных сетей при анализе медицинских снимков, а также использование архитектуры U-NET для семантической сегментации изображений. Производится формирование структуры искусственной нейронной сети на базе архитектуры U-NET. Визуализируется строение слоев данной сети и описаны составные части данной структуры. Особое внимание уделяется описанию и реализации процесса свертки. Представлена формула определения весовых коэффициентов границы разделения. Предложены алгоритмы формирования модели искусственной нейронной сети и алгоритм построения слоев. Рассматривается способ увеличения данных для обучающей выборки изображений медицинских снимков. Представлено изображение результата определения органов грудной клетки и соответствующая маска.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Евсина В.А., Жжонов В.А., Широбокова С.Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IDENTIFICATION OF THE BOUNDARIES OF AIR BREATHING ORGANS ON COMPUTED TOMOGRAPHY IMAGES USING CONVOLUTIONAL NEURAL NETWORKS OF THE U-NET ARCHITECTURE

This article discusses the problems of determining the organs of air respiration on computed tomography images using convolutional neural networks of the U-NET architecture. The prospects of using neural networks in the analysis of medical images, as well as the use of the U-NET architecture for semantic segmentation of images are described. The structure of an artificial neural network based on the U-NET architecture is being formed. The structure of the layers of this network is visualized and the components of this structure are described. Special attention is paid to the description and implementation of the convolution process. The formula for determining the weight coefficients of the separation boundary is presented. Algorithms for the formation of an artificial neural network model and an algorithm for constructing layers are proposed. A method of increasing data for a training sample of images of medical images is considered. The image of the result of the determination of the chest organs and the corresponding mask are presented.

Текст научной работы на тему «ВЫЯВЛЕНИЕ ГРАНИЦ ОРГАНОВ ВОЗДУШНОГО ДЫХАНИЯ НА СНИМКАХ КОМПЬЮТЕРНОЙ ТОМОГРАФИИ С ПОМОЩЬЮ СВЕРТОЧНЫХ НЕЙРОННЫХ СЕТЕЙ АРХИТЕКТУРЫ U-NET»

Выявление границ органов воздушного дыхания на снимках компьютерной томографии с помощью сверточных нейронных сетей

архитектуры U-NET

В.А. Евсина, В.А. Жжонов, С.Н. Широбокова

Южно-Российский государственный политехнический университет (НПИ) имени М.И. Платова, Новочеркасск

Аннотация: В данной статье рассматривается проблематика определения органов воздушного дыхания на снимках компьютерной томографии с помощью сверточных нейронных сетей архитектуры U-NET. Описаны перспективы использования нейронных сетей при анализе медицинских снимков, а также использование архитектуры U-NET для семантической сегментации изображений. Производится формирование структуры искусственной нейронной сети на базе архитектуры U-NET. Визуализируется строение слоев данной сети и описаны составные части данной структуры. Особое внимание уделяется описанию и реализации процесса свертки. Представлена формула определения весовых коэффициентов границы разделения. Предложены алгоритмы формирования модели искусственной нейронной сети и алгоритм построения слоев. Рассматривается способ увеличения данных для обучающей выборки изображений медицинских снимков. Представлено изображение результата определения органов грудной клетки и соответствующая маска.

Ключевые слова: сверточные нейронные сети, архитектура U-NET, глубокое обучение, распознавание изображений, machine learning.

Наиболее точный метод исследования заболевания легких -компьютерная томография. Для определения и выявления заболеваний необходимо в первую очередь определить границы органов воздушного дыхания. Для работы со снимками компьютерной томографии, наиболее подходящим является аппарат сверточных нейронных сетей, который позволяет обрабатывать медицинские снимки томографа с высокой долей точности. Сверточные нейронные сети являются наиболее перспективными при анализе изображений [1,2], подробнее о нейронных сетях в [3,4]. Для выявления легочной ткани на изображении может быть использована архитектура U-NET [5,6], которая создавалась для семантической сегментации медицинских изображений. В дальнейшем данная архитектура получила широкое применение в различных областях жизнедеятельности.

М Инженерный вестник Дона, №1 (2023) ivdon.ru/ru/magazine/arcliive/nly2023/8151

Сеть и~ЫЕТ используется для сегментации изображения и отнесения каждого сегмента к определенному классу. Архитектура сети представлена на рис. 1. Она состоит из кодера, использующегося для понижения частоты дискретизации и декодера, для повышения частоты дискретизации с пропускными соединениями. Кодер представляет собой сужающийся путь -последовательность двух слоев свертки 2x2, субдискретизации и функции активации ЯвЬы. Формула функции ЯвЬы имеет следующую форму:

/ (2 ) = шах(0, г ),

где 2 - выходное значение нейрона, за счет чего происходит уменьшение размерности изображения и формируется карта признаков. На каждом этапе происходит удваивание каналов свойств. Декодер представляет расширяющийся путь. Он состоит из повышающей дискретизации карты признаков, процесса свертки, размерности 2x2, конкатенация кодера с декодером для улучшения обучения за счет обратного потока градиентов и процесс свертки 3x3. На последнем слое применяется операция свертки 1x1, для сопоставления каждого нейрона с соответствующим классом.

1 64 64 128 64 1

Рис. 1. - Архитектура сети и~ЫЕТ

На вход нейронной сети подается изображение, размерности 512x512, которое подвергается операции свертки, подробнее о которых в [7-9]. Для обучения сети используется метод стохастического градиентного спуска. Визуальный пример операции свертки представлен на рис. 2.

Рис. 2. - Реализация операции свертки Вычисление границы разделения происходит с использованием морфологических операций. Весовые коэффициенты вычисляются по следующей формуле:

г ^ (х) + ^ (х) ^

w(х) = ^ (х) + w0 * ехр

2а2

где ^ - карта весовых коэффициентов для балансировки частот классов, w0 - начальная инициализация весовых коэффициентов, ^, ^ - расстояния до границ первой и второй ближайших ячеек, а - параметр оптимизации.

Архитектура модели представляет собой комплексный подход к глубокому обучению для сегментации легочных узлов, также обладает выдающейся производительностью и точностью в разных задачах медицинской сегментации. При определении патологий легких человека данная сеть является неотъемлемым помощником, сокращающим время постановки диагноза человеком. При обучении модели распознавания легочных заболеваний необходимо использовать слой отключения 10%

и

нейронов для предотвращения ошибки переобучения, а также бинарную кросс энтропию, подробнее о которой в [10], представленную формулой:

Loss = -(y log (p) + (1 - y )log (1 - p)),

где p - это предсказанное значение на выходе модели, y - это, соответственно, истинное значение.

Набор снимков, обучающих данных о грудной клетке ограничен медицинскими организациями, что представляет риск недостаточного обучения модели. При обучении для каждого изображения необходима маска входного изображения, по которым сеть будет учиться определять легкие человека. Увеличение данных улучшает способность сети к обобщению данных, что является важным фактором при внедрении модели в медицинские рентгенографы. Одним из способов увеличить базовый набор данных стала деформация имеющихся снимков: переворот, сдвиг, масштабирование, поворот, за счет чего достигается разнообразие в обучающем наборе данных. Для реализации данной системы использованы аффинные преобразования изображения.

Алгоритм обучения нейронной сети представлен на рис. 3.

Начало

Первичная инициализация обучающего набора

Для каждого изображения

I

1

Формирование модели обучения

Обучение модели

Сохранение файла с обученной моделью

I Конец I

Рис. 3. - Алгоритм обучения нейронной сети архитектуры и~ЫЕТ Алгоритм построения слоев сети и~ЫЕТ представлен на рис. 4.

К

Формирование модели обучения

Внесение данных по обучению нейронной сети

i=0,3

Создание слоя C[4]: Слой свертки с 256 нейронами. Активационная функция relu. Слой свертки с 256 нейронами. Активационная функция relu.

1

i=0,3

>1

Создание слоя C[i+1]: Слой свертки с 2A(i)*16 нейронами. Активационная функция relu. Слой отключения 10% нейронов. Слой свертки с 2A(i)* 16 нейронами. Активационная функция relu. Слой максимального пула.

Создание слоя U[6+i]: Слой свертки с 2A(4-i)*16 нейронами и ядром свертки 2х2. Активационная функция relu. Слой отключения 10% нейронов. Слой свертки с 2A(4-i)*16 нейронами. Активационная функция relu. Слой максимального пула. Конкатенация слоев U[6+i];C[4-i] Активационная функция sigmoid

^^ Конец ^^^

Рис. 4. - Алгоритм построения слоев нейронной сети архитектуры

П-ЫЕТ

Пример определения маски легких представлен на рисунке 5.

Рис. 5. - Определение маски органов дыхания Таким образом, реализован модуль определения границ органов воздушного дыхания на снимках компьютерной томографии. Данный модуль может быть внедрен в программу анализа снимков томографии.

Литература

1. Евсин В.А., Широбокова С.Н., Жжонов В.А., Евсина В.А. Моделирование и реализация процесса распознавания знаков дорожного

движения при определении ситуации на дороге с помощью искусственных нейронных сетей // Инженерный вестник Дона. 2022. №4. URL: ivdon.ru/ru/magazine/archive/n4y2022/7587.

2. Параскевопуло К.М., Наркевич А.Н. Применение классических нейронных сетей для распознавания злокачественных новообразований на цифровых изображениях кожи // Инженерный вестник Дона, 2021, №5. URL: ivdon.ru/uploads/article/pdf/IVD_31_5_Paraskevopulo.pdf_70f8c97ba7.pdf.

3. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия. Телеком, 2002. 382 с.

4. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия. - Телеком, 2006. 383 с.

5. Albishri A.A., Shah S.J.H., Kang S.S. AM-UNet: automated mini 3D end-to-end U-net based network for brain claustrum segmentation // Multimed Tools Appl, 2022. DOI: doi.org/10.1007/s11042-021-11568-7.

6. Rajamani K.T., Rani P., Siebert H. Attention-augmented U-Net (AA-U-Net) for semantic segmentation. SIViP, 2022. DOI: doi.org/10.1007/s11760-022-02302-3

7. Хайкин С. Нейронные сети. Полный курс. 2 изд. М.: Издательский дом "Вильямс", 2006. 1104 с.

8. Dean J. Big Data, Data Mining, and Machine Learning. Value Creation for Business Leaders and Practitioners. New Jersey: John Wiley & Sons Limited, 2014. 208 p.

9. Микеллучи, У. Прикладное глубокое обучение. Подход к пониманию глубоких нейронных сетей на основе метода кейсов. СПб.: БХВ-Петербург, 2020. 368 c.

10. Kline D.M., Berardi V.L. Revisiting squared-error and cross-entropy functions for training neural network classifiers // Neural Comput and Applic, 2005, № 14. DOI: doi.org/10.1007/s00521-005-0467-y.

References

1. Evsina V.A., Evsin V.A., SHirobokova S.N., Zhzhonov V.A. Inzenemyj vestnik Dona, 2022, №4. URL: ivdon.ru/ru/magazine/archive/n4y2022/7587.

2. Paraskevopulo K.M., Narkevich A.N. Inzenernyj vestnik Dona, 2021, №5 URL:ivdon.ru/uploads/article/pdf/IVD_31_5_Paraskevopulo.pdf_70f8c97ba7.pdf

3. Kruglov V.V., Borisov V.V. Iskusstvennye nejronnye seti. Teorija i praktika. [Artificial neural network. Theory and practice.] M.: Hotline. Telekom, 2002. 382p.

4. Rutkovskaja D., Pilin'skij M., Rutkovskij L. Nejronnye seti, geneticheskie algoritmy i nechetkie sistemy. [Neural networks, genetic algorithms and fuzzy systems] M.: Gorjachaja linija. Telekom, 2006. 383 p.

5. Albishri A.A., Shah S.J.H., Kang S.S. Multimed Tools Appl, 2022. DOI: doi.org/10.1007/s11042-021-11568-7.

6. Rajamani K.T., Rani P., Siebert H. SIViP, 2022. DOI: doi.org/10.1007/s 11760-022-02302-3

7. Hajkin S. Nejronnye seti. Polnyj kurs. [Neural networks. A Comprehensive Foundation]. 2 vol. M.: Williams Publishing House, 2006. 1104p.

8. Dean J. Big Data, Data Mining, and Machine Learning. Value Creation for Business Leaders and Practitioners. New Jersey: John Wiley & Sons Limited, 2014. 208 p.

9. Mikelluchi, U. Prikladnoe glubokoe obuchenie. Podhod k ponimaniyu glubokih nejronnyh setej na osnove metoda kejsov [Applied deep learning. An approach to understanding deep neural networks based on the case method]. SPb.: BHV-Peterburg, 2020. 368p.

10. Kline D.M., Berardi V.L. Neural Comput and Applic, 2005, № 14. DOI: doi.org/10.1007/s00521 -005-0467-y.

i Надоели баннеры? Вы всегда можете отключить рекламу.