Выявление границ органов воздушного дыхания на снимках компьютерной томографии с помощью сверточных нейронных сетей
архитектуры U-NET
В.А. Евсина, В.А. Жжонов, С.Н. Широбокова
Южно-Российский государственный политехнический университет (НПИ) имени М.И. Платова, Новочеркасск
Аннотация: В данной статье рассматривается проблематика определения органов воздушного дыхания на снимках компьютерной томографии с помощью сверточных нейронных сетей архитектуры U-NET. Описаны перспективы использования нейронных сетей при анализе медицинских снимков, а также использование архитектуры U-NET для семантической сегментации изображений. Производится формирование структуры искусственной нейронной сети на базе архитектуры U-NET. Визуализируется строение слоев данной сети и описаны составные части данной структуры. Особое внимание уделяется описанию и реализации процесса свертки. Представлена формула определения весовых коэффициентов границы разделения. Предложены алгоритмы формирования модели искусственной нейронной сети и алгоритм построения слоев. Рассматривается способ увеличения данных для обучающей выборки изображений медицинских снимков. Представлено изображение результата определения органов грудной клетки и соответствующая маска.
Ключевые слова: сверточные нейронные сети, архитектура U-NET, глубокое обучение, распознавание изображений, machine learning.
Наиболее точный метод исследования заболевания легких -компьютерная томография. Для определения и выявления заболеваний необходимо в первую очередь определить границы органов воздушного дыхания. Для работы со снимками компьютерной томографии, наиболее подходящим является аппарат сверточных нейронных сетей, который позволяет обрабатывать медицинские снимки томографа с высокой долей точности. Сверточные нейронные сети являются наиболее перспективными при анализе изображений [1,2], подробнее о нейронных сетях в [3,4]. Для выявления легочной ткани на изображении может быть использована архитектура U-NET [5,6], которая создавалась для семантической сегментации медицинских изображений. В дальнейшем данная архитектура получила широкое применение в различных областях жизнедеятельности.
М Инженерный вестник Дона, №1 (2023) ivdon.ru/ru/magazine/arcliive/nly2023/8151
Сеть и~ЫЕТ используется для сегментации изображения и отнесения каждого сегмента к определенному классу. Архитектура сети представлена на рис. 1. Она состоит из кодера, использующегося для понижения частоты дискретизации и декодера, для повышения частоты дискретизации с пропускными соединениями. Кодер представляет собой сужающийся путь -последовательность двух слоев свертки 2x2, субдискретизации и функции активации ЯвЬы. Формула функции ЯвЬы имеет следующую форму:
/ (2 ) = шах(0, г ),
где 2 - выходное значение нейрона, за счет чего происходит уменьшение размерности изображения и формируется карта признаков. На каждом этапе происходит удваивание каналов свойств. Декодер представляет расширяющийся путь. Он состоит из повышающей дискретизации карты признаков, процесса свертки, размерности 2x2, конкатенация кодера с декодером для улучшения обучения за счет обратного потока градиентов и процесс свертки 3x3. На последнем слое применяется операция свертки 1x1, для сопоставления каждого нейрона с соответствующим классом.
1 64 64 128 64 1
Рис. 1. - Архитектура сети и~ЫЕТ
На вход нейронной сети подается изображение, размерности 512x512, которое подвергается операции свертки, подробнее о которых в [7-9]. Для обучения сети используется метод стохастического градиентного спуска. Визуальный пример операции свертки представлен на рис. 2.
Рис. 2. - Реализация операции свертки Вычисление границы разделения происходит с использованием морфологических операций. Весовые коэффициенты вычисляются по следующей формуле:
г ^ (х) + ^ (х) ^
w(х) = ^ (х) + w0 * ехр
2а2
где ^ - карта весовых коэффициентов для балансировки частот классов, w0 - начальная инициализация весовых коэффициентов, ^, ^ - расстояния до границ первой и второй ближайших ячеек, а - параметр оптимизации.
Архитектура модели представляет собой комплексный подход к глубокому обучению для сегментации легочных узлов, также обладает выдающейся производительностью и точностью в разных задачах медицинской сегментации. При определении патологий легких человека данная сеть является неотъемлемым помощником, сокращающим время постановки диагноза человеком. При обучении модели распознавания легочных заболеваний необходимо использовать слой отключения 10%
и
нейронов для предотвращения ошибки переобучения, а также бинарную кросс энтропию, подробнее о которой в [10], представленную формулой:
Loss = -(y log (p) + (1 - y )log (1 - p)),
где p - это предсказанное значение на выходе модели, y - это, соответственно, истинное значение.
Набор снимков, обучающих данных о грудной клетке ограничен медицинскими организациями, что представляет риск недостаточного обучения модели. При обучении для каждого изображения необходима маска входного изображения, по которым сеть будет учиться определять легкие человека. Увеличение данных улучшает способность сети к обобщению данных, что является важным фактором при внедрении модели в медицинские рентгенографы. Одним из способов увеличить базовый набор данных стала деформация имеющихся снимков: переворот, сдвиг, масштабирование, поворот, за счет чего достигается разнообразие в обучающем наборе данных. Для реализации данной системы использованы аффинные преобразования изображения.
Алгоритм обучения нейронной сети представлен на рис. 3.
Начало
Первичная инициализация обучающего набора
Для каждого изображения
I
1
Формирование модели обучения
Обучение модели
Сохранение файла с обученной моделью
I Конец I
Рис. 3. - Алгоритм обучения нейронной сети архитектуры и~ЫЕТ Алгоритм построения слоев сети и~ЫЕТ представлен на рис. 4.
К
Формирование модели обучения
Внесение данных по обучению нейронной сети
i=0,3
Создание слоя C[4]: Слой свертки с 256 нейронами. Активационная функция relu. Слой свертки с 256 нейронами. Активационная функция relu.
1
i=0,3
>1
Создание слоя C[i+1]: Слой свертки с 2A(i)*16 нейронами. Активационная функция relu. Слой отключения 10% нейронов. Слой свертки с 2A(i)* 16 нейронами. Активационная функция relu. Слой максимального пула.
Создание слоя U[6+i]: Слой свертки с 2A(4-i)*16 нейронами и ядром свертки 2х2. Активационная функция relu. Слой отключения 10% нейронов. Слой свертки с 2A(4-i)*16 нейронами. Активационная функция relu. Слой максимального пула. Конкатенация слоев U[6+i];C[4-i] Активационная функция sigmoid
^^ Конец ^^^
Рис. 4. - Алгоритм построения слоев нейронной сети архитектуры
П-ЫЕТ
Пример определения маски легких представлен на рисунке 5.
Рис. 5. - Определение маски органов дыхания Таким образом, реализован модуль определения границ органов воздушного дыхания на снимках компьютерной томографии. Данный модуль может быть внедрен в программу анализа снимков томографии.
Литература
1. Евсин В.А., Широбокова С.Н., Жжонов В.А., Евсина В.А. Моделирование и реализация процесса распознавания знаков дорожного
движения при определении ситуации на дороге с помощью искусственных нейронных сетей // Инженерный вестник Дона. 2022. №4. URL: ivdon.ru/ru/magazine/archive/n4y2022/7587.
2. Параскевопуло К.М., Наркевич А.Н. Применение классических нейронных сетей для распознавания злокачественных новообразований на цифровых изображениях кожи // Инженерный вестник Дона, 2021, №5. URL: ivdon.ru/uploads/article/pdf/IVD_31_5_Paraskevopulo.pdf_70f8c97ba7.pdf.
3. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия. Телеком, 2002. 382 с.
4. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия. - Телеком, 2006. 383 с.
5. Albishri A.A., Shah S.J.H., Kang S.S. AM-UNet: automated mini 3D end-to-end U-net based network for brain claustrum segmentation // Multimed Tools Appl, 2022. DOI: doi.org/10.1007/s11042-021-11568-7.
6. Rajamani K.T., Rani P., Siebert H. Attention-augmented U-Net (AA-U-Net) for semantic segmentation. SIViP, 2022. DOI: doi.org/10.1007/s11760-022-02302-3
7. Хайкин С. Нейронные сети. Полный курс. 2 изд. М.: Издательский дом "Вильямс", 2006. 1104 с.
8. Dean J. Big Data, Data Mining, and Machine Learning. Value Creation for Business Leaders and Practitioners. New Jersey: John Wiley & Sons Limited, 2014. 208 p.
9. Микеллучи, У. Прикладное глубокое обучение. Подход к пониманию глубоких нейронных сетей на основе метода кейсов. СПб.: БХВ-Петербург, 2020. 368 c.
10. Kline D.M., Berardi V.L. Revisiting squared-error and cross-entropy functions for training neural network classifiers // Neural Comput and Applic, 2005, № 14. DOI: doi.org/10.1007/s00521-005-0467-y.
References
1. Evsina V.A., Evsin V.A., SHirobokova S.N., Zhzhonov V.A. Inzenemyj vestnik Dona, 2022, №4. URL: ivdon.ru/ru/magazine/archive/n4y2022/7587.
2. Paraskevopulo K.M., Narkevich A.N. Inzenernyj vestnik Dona, 2021, №5 URL:ivdon.ru/uploads/article/pdf/IVD_31_5_Paraskevopulo.pdf_70f8c97ba7.pdf
3. Kruglov V.V., Borisov V.V. Iskusstvennye nejronnye seti. Teorija i praktika. [Artificial neural network. Theory and practice.] M.: Hotline. Telekom, 2002. 382p.
4. Rutkovskaja D., Pilin'skij M., Rutkovskij L. Nejronnye seti, geneticheskie algoritmy i nechetkie sistemy. [Neural networks, genetic algorithms and fuzzy systems] M.: Gorjachaja linija. Telekom, 2006. 383 p.
5. Albishri A.A., Shah S.J.H., Kang S.S. Multimed Tools Appl, 2022. DOI: doi.org/10.1007/s11042-021-11568-7.
6. Rajamani K.T., Rani P., Siebert H. SIViP, 2022. DOI: doi.org/10.1007/s 11760-022-02302-3
7. Hajkin S. Nejronnye seti. Polnyj kurs. [Neural networks. A Comprehensive Foundation]. 2 vol. M.: Williams Publishing House, 2006. 1104p.
8. Dean J. Big Data, Data Mining, and Machine Learning. Value Creation for Business Leaders and Practitioners. New Jersey: John Wiley & Sons Limited, 2014. 208 p.
9. Mikelluchi, U. Prikladnoe glubokoe obuchenie. Podhod k ponimaniyu glubokih nejronnyh setej na osnove metoda kejsov [Applied deep learning. An approach to understanding deep neural networks based on the case method]. SPb.: BHV-Peterburg, 2020. 368p.
10. Kline D.M., Berardi V.L. Neural Comput and Applic, 2005, № 14. DOI: doi.org/10.1007/s00521 -005-0467-y.