Научная статья на тему 'АЛГОРИТМ ПОДГОТОВКИ НАБОРА ДАННЫХ ДЛЯ ОБУЧЕНИЯ НЕЙРОННЫХ СЕТЕЙ НА ПРИМЕРЕ ЗАДАЧИ АНАЛИЗА РАДИОЛОГИЧЕСКИХ ИЗОБРАЖЕНИЙ ЛЁГКИХ'

АЛГОРИТМ ПОДГОТОВКИ НАБОРА ДАННЫХ ДЛЯ ОБУЧЕНИЯ НЕЙРОННЫХ СЕТЕЙ НА ПРИМЕРЕ ЗАДАЧИ АНАЛИЗА РАДИОЛОГИЧЕСКИХ ИЗОБРАЖЕНИЙ ЛЁГКИХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
144
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СВЁРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ / ПОДГОТОВКА ОБУЧАЮЩЕЙ ВЫБОРКИ / НОРМАЛИЗАЦИЯ ДАННЫХ / МОДАЛЬНОСТЬ РАДИОЛОГИЧЕСКИХ ИЗОБРАЖЕНИЙ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Косарева А.А.

Рассмотрена методика подготовки данных для обучения нейронных сетей на примере решения задач определения модальностей радиологических изображений: трёхмерных изображений компьютерной томографии и двумерных рентгенографических изображений. Предложен алгоритм подготовки данных для обучения свёрточных нейронных сетей. Дана оценка влияния этапов (разметки изображений, нормализации данных, определения динамического диапазона изображения, состава обучающей выборки) алгоритма на результат обучения. Наибольшее влияние при решении задачи проверки модальности оказывает выбор оптимальных значений динамического диапазона. Изменение состава обучающей выборки позволяет повысить точность классификации на 0,0073. При решении задачи проверки модальности изображений компьютерной томографии наибольшее влияние на результат обучения нейронной сети оказывает наличие этапа нормализации данных. Выдвигается предположение о наличии особых признаков изображений этой модальности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Косарева А.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE ALGORITHM FOR PREPARING A SET OF DATA FOR TEACHING NEURAL NETWORKS ON THE EXAMPLE OF THE TASK TO ANALYZE THE RADIOLOGICAL IMAGES OF LUNGS

The methodology for preparing data for teaching neural networks is considered in solving two problems: checking the modality of computed tomography and checking the modality of radiographic images. The algorithm for preparing data for neural networks training is proposed. The influence of the stages (marking of images, normalization of data, determining the dynamic image range, the composition of the training sample) of the algorithm for the learning result is evaluated. The greatest influence in solving the task of modality verification of modality was the choice of optimal values of the dynamic range. The change in the composition of the training sample made it possible to increase the accuracy of the classification by 0.0073. When solving the task of checking the modality of images of computed tomography, the most impact on the result of the training of the neural network had the stage of data normalization. The assumption is put forward that there are special signs of images of this modality.

Текст научной работы на тему «АЛГОРИТМ ПОДГОТОВКИ НАБОРА ДАННЫХ ДЛЯ ОБУЧЕНИЯ НЕЙРОННЫХ СЕТЕЙ НА ПРИМЕРЕ ЗАДАЧИ АНАЛИЗА РАДИОЛОГИЧЕСКИХ ИЗОБРАЖЕНИЙ ЛЁГКИХ»

(ее)]

http://dx.doi.org/10.35596/1729-7648-2023-21-1-66-73

Оригинальная статья Original paper

УДК 004.048'11

Поступила в редакцию 03.11.2022

© Белорусский государственный университет информатики и радиоэлектроники, 2023 Belarusian State University of Informatics and Radioelectronics, 2023

Аннотация. Рассмотрена методика подготовки данных для обучения нейронных сетей на примере решения задач определения модальностей радиологических изображений: трёхмерных изображений компьютерной томографии и двумерных рентгенографических изображений. Предложен алгоритм подготовки данных для обучения свёрточных нейронных сетей. Дана оценка влияния этапов (разметки изображений, нормализации данных, определения динамического диапазона изображения, состава обучающей выборки) алгоритма на результат обучения. Наибольшее влияние при решении задачи проверки модальности оказывает выбор оптимальных значений динамического диапазона. Изменение состава обучающей выборки позволяет повысить точность классификации на 0,0073. При решении задачи проверки модальности изображений компьютерной томографии наибольшее влияние на результат обучения нейронной сети оказывает наличие этапа нормализации данных. Выдвигается предположение о наличии особых признаков изображений этой модальности.

Ключевые слова: свёрточные нейронные сети, подготовка обучающей выборки, нормализация данных, модальность радиологических изображений.

Конфликт интересов. Автор заявляет об отсутствии конфликта интересов.

Благодарности. Работа выполнена при поддержке Белорусского республиканского фонда фундаментальных исследований (проект № Т22МВ-026). Автор выражает благодарность и глубокую признательность к. т. н. Эдуарду Витальевичу Снежко; к. т. н., доценту Василию Алексеевичу Ковалёву и к. т. н., доценту Павлу Викторовичу Камлачу за ценные рекомендации и замечания при работе над статьей.

Для цитирования. Косарева, А. А. Алгоритм подготовки набора данных для обучения нейронных сетей на примере задачи анализа радиологических изображений лёгких / А. А. Косарева // Доклады БГУИР. 2023. Т. 21, № 1. С. 66-73. http://dx.doi.org/10.35596/1729-7648-2023-21-1-66-73.

THE ALGORITHM FOR PREPARING A SET OF DATA FOR TEACHING NEURAL NETWORKS ON THE EXAMPLE OF THE TASK TO ANALYZE THE RADIOLOGICAL IMAGES OF LUNGS

ALEKSANDRA A. KOSAREVA

Belarusian State University of Informatics and Radioelectronics (Minsk, Republic of Belarus)

Abstract. The methodology for preparing data for teaching neural networks is considered in solving two problems: checking the modality of computed tomography and checking the modality of radiographic images. The algorithm for preparing data for neural networks training is proposed. The influence of the stages (marking of images, normalization of data, determining the dynamic image range, the composition of the training sample) of the algorithm for the

Submitted 03.11.2022

learning result is evaluated. The greatest influence in solving the task of modality verification of modality was the choice of optimal values of the dynamic range. The change in the composition of the training sample made it possible to increase the accuracy of the classification by 0.0073. When solving the task of checking the modality of images of computed tomography, the most impact on the result of the training of the neural network had the stage of data normalization. The assumption is put forward that there are special signs of images of this modality.

Keywords: convolutional neural network, training data preparation, normalization of data, modality of radiological images.

Conflict of interests. The author declares no conflict of interests.

Gratitudes. This work was supported by the Belarusian Republican Foundation for Fundamental Research (project No T22MV-026). The author expresses his gratitude and deep gratitude to Cand. of Sci. Eduard Vitalievich Snezhko; Cand. of Sci., Associate Professor Vassili Alekseevich Kovalev and Cand. of Sci., Associate Professor Pavel Viktorovich Kamlach for valuable advice and comments when working on article.

For citation. Kosareva A. A. (2023) The Algorithm for Preparing a Set of Data for Teaching Neural Networks on the Example of the Task to Analyze the Radiological Images of Lungs. Doklady BGUIR. 21 (1), 66-73. http:// dx.doi.org/10.35596/1729-7648-2023-21-1-66-73 (in Russian).

Введение

Предварительная подготовка набора данных представляет собой процесс их очистки и обработки для решения ряда задач с использованием как традиционных методов, так и методов машинного обучения. Тщательная подготовка данных является ключевым компонентом дальнейшего их успешного анализа и имеет важное значение для извлечения точных и значимых признаков. Достоверность и успешность обучения нейронных сетей зависят от качества подготовки данных на ранних стадиях. При несбалансированности обучающей выборки результаты предсказания обученной нейросетевой модели могут некорректно относить входное изображение к одному из классов. Кроме того, наличие изображений-артефактов в наборе данных сильно влияет на весовые коэффициенты при обучении модели и вносит погрешность при предсказании класса входного изображения.

Этапы подготовки данных зависят от условия поставленной задачи. При подготовке обучающей выборки велика вероятность допуска ошибки, влияющей на временные показатели и качество выполняемого исследования.

Исследование проводилось при подготовке данных для решения задач определения модальностей радиологических изображений: трёхмерных изображений компьютерной томографии (КТ) и двумерных рентгенографических изображений. Это обуславливалось сложностью в подготовке обучающей выборки, которая содержала изображения разных типов, отличающиеся по способу получения и содержанию. Под модальностью подразумевается разделение медицинских изображений по методу их получения.

Методика проведения эксперимента

Для решения задачи определения модальности изображений компьютерной томографии был подготовлен набор данных, включавший в себя 226 трёхмерных изображений (113 изображений компьютерной томографии и 113 изображений других модальностей: магнитно-резонансную томографию (МРТ), бинарные маски, позитронно-эмиссионную томографию (ПЭТ), трёхмерные ультразвуковые и рентгенографические). Решение задачи определения модальности рентгенографических изображений выполняли при наборе данных, включавшем 2036 двумерных изображений (1018 рентгенографических и 1018 изображений других модальностей: МРТ, бинарные маски, ПЭТ, трёхмерные ультразвуковые, SCOUT-изображения, КТ) [1].

При решении обеих задач процесс подготовки исходных данных для обучения классификационных моделей включал следующие этапы:

- разметку изображений по заранее определенным признакам;

- определение уникальных числовых параметров изображения, значимых при решении поставленной задачи;

- преобразование изображений набора данных в соответствии с определенными числовыми параметрами;

- нормализацию изображений;

Доклады БГУИР DokladyBGUIR

Т. 21, № 1 (2023) V. 21, No 1 (2023)

- расширение обучающей выборки (аугментацию) изображений для достижения инвариантности обучаемой модели к преобразованию поворота входного изображения [2].

Разметка изображений. При разметке данных могут использоваться текстовые аннотации, структурированные метки, сегментированные участки изображений и электронные фенотипы [3]. В рассматриваемом случае разметка основывалась на интерпретации экспертов и аннотированном отнесении изображений к определенному классу. Важно понимать, что при экспертной разметке в области анализа медицинских изображений невозможно достичь стопроцентной точности. К примеру, при разметке новообразования в лёгком тремя независимыми медицинскими экспертами итоговая выделенная область отличалась [4]. Стоит отметить, что эти различия были невелики и не имели клинического значения. Вероятность «пропуска» искомого признака при экспертной разметке сохраняется, поэтому на этапе разметки медицинских данных важно получить обобщенное экспертное мнение нескольких специалистов.

Определение уникальных числовых параметров изображения

Уникальные числовые параметры КТ-изображений

После этапа разметки данных каждое изображение компьютерной томографии было представлено как трёхмерный числовой массив. При работе с данным числовым массивом важно помнить, что каждый его элемент связан с физической величиной радиоденсивности ткани, представленной в значениях по шкале Хаунсфилда. Уровень окна WL являлся средней точкой диапазона отображаемых чисел на КТ-изображении. При уменьшении уровня яркости КТ-изо-бражения визуализировались разные группы тканей [5] (табл. 1). Зная ширину окна WW и WL определенных типов тканей, можно вычислить верхний и нижний пределы по шкале уровней серого в изображении. При этом для верхнего х и нижнего y пределов значение уровня серого рассчитывалось по следующим формулам:

WW

y = WL +—; (1)

WW

У = WL - — (2)

Таблица 1. Значения радиоденсивности для выбора окна значений КТ-изображения Table 1. Values of radiodense for selecting a window of values for a CT image

Часть тела / Part of the body Окно радиоденсивности, HU / Radiodensity window, HU

WW WL

Мозг 80 40

Мягкие ткани 400 50

Лёгкие 1500 -600

Кости 1800 400

Печень 150 30

Зону интереса представляли изображения, значения которых располагались в диапазонах:

(-1350 Ни, +150 Ни) - для лёгких;

(-150 Ни, +250 Ни) - для мягких тканей;

(-50 Ни, +850 Ни) - для костных структур.

В данном исследовании решалась задача классификации модальностей изображений компьютерной томографии. Значения каждого трёхмерного изображения находились в диапазоне (-4000 Ни, 4000 Ни). При этом значения изображений других модальностей были разрознены и непредсказуемы. Было решено использовать квартилизацию массива элементов трёхмерного изображения. В случае КТ-изображений при таком преобразовании сохранилась информация о структурах лёгких, мягких и костных тканей. При квартилизации значений изображений других модальностей отсеивались нежелательные выбросы значений яркости.

Уникальные числовые параметры рентгенографических изображений

При работе с двумерными рентгенографическими изображениями не было определенного диапазона значений, связанного с физическим параметром процесса получения рентгенографи-

ческого изображения. Это обусловлено различием в изображениях, полученных аппаратами разных производителей. Также при подготовке наборов данных попадались позитивные и негативные рентгенографические изображения, что существенно усложняло процесс анализа. В большинстве своем (87 % обучающей выборки) рентгенографические изображения имели значения яркости пикселей в пределах от 0 до 255, так как это соответствовало сохранению изображения в 8-битном формате. При квартилизации терялось бы много важной информации. Поэтому произвели отсечение одного процента значений по каждому краю гистограммы яркости при условии, если разброс между минимальными и максимальными значениями был больше 256.

Нормализация изображений. Нормализация необходима для дальнейшей подачи на вход сети однородных значений. Изображения были нормализованы в диапазонах [-1, 1], [0, 1].

Расширение обучающей выборки (аугментация) изображений. Использовался алгоритм аугментации, включающий в себя вращение изображения, его отражения вдоль осей, а также инвертирование значений (применялось только для двумерных рентгенографических изображений).

Выбор архитектуры свёрточной нейронной сети для обучения. Для решения задачи определения модальности КТ-изображения использовалась простая свёрточная нейронная сеть. Ее архитектура включала последовательность таких слоев, как Conv3D, MaxPool3D, Dropout, GlobalAveragePooling3D. Входной вектор нейронной сети имел размерность 64^64^64 значения. При решении задачи проверки модальности рентгенографических изображений использовалась модель EfficientNetB0 [6, 7].

Результаты исследований и их обсуждение

Нормализация изображений. Для выбора диапазона нормализации провели предварительное исследование. Из подготовленного набора данных случайным образом выделяли 600 изображений (по 300 для каждого класса). Обучение проводилось на 60 эпохах три раза, набор данных на этапе обучения и валидации каждый раз менялся. В табл. 2 представлен усредненный результат доли правильных ответов алгоритма (Accuracy) и значений функции потерь (Loss) при трёхкратном обучении моделей решения задачи проверки модальности радиологических изображений для разных диапазонов нормализации. Усреднение значений по итогам обучения моделей позволило избежать влияния состава набора данных на результаты исследования.

Таблица 2. Усредненный результат доли правильных ответов алгоритма (Accuracy)

и значений функции потерь (Loss) для разных диапазонов нормализации Table 2. The average result of the share of correct answers of the algorithm (Accuracy) and the values of the loss function (Loss) for different normalization ranges

Тип/Type Этап/Stage Диапазон [0, 1]/ Range [0, 1] Диапазон [-1, 1]/ Range [-1, 1] Без нормализации/ Without normalization

Accuracy Loss Accuracy Loss Accuracy Loss

КТ Обучение 1,0000 0,00031 1,0000 0,00020 0,5008 да

Валидация 1,0000 0,00034 1,0000 0,00022 0,4884 да

Рентген Обучение 0,9894 0,02860 0,9879 0,03320 0,9126 0,22770

Валидация 0,9711 0,09240 0,9796 0,07200 0,8580 0,26323

В результате оказалось, что при работе с трёхмерными изображениями компьютерной томографии оптимально использовать приведение значений к диапазону от [-1, 1], а при работе с рентгенографическими - к диапазону от [0, 1]. При этом обучение на не нормализированном наборе данных показало наихудший результат. В случае КТ-изображений функция потерь достигла максимального машинного значения, а точность определения класса при бинарной классификации оказалась равной 0,5. Это означает, что нейронная сеть не смогла обучиться и в результате классифицировала входные данные случайным образом.

При решении данных задач влияние выбора диапазона нормализации оказалось несущественным. Однако в сложных и масштабных задачах такое влияние может усилиться, и это подтверждает необходимость выбора способа нормализации данных [8, 9].

Влияние выбора оптимальных значений. Для оценки важности выбора оптимальных значений изображений провели следующие эксперименты. Использовали два способа ограничения диапа-

зона входных значений: квартилизацию и перцентилизацию по одному проценту (при этом в ходе исследования сравнивалась перцентилизация по пяти, трём и одному проценту; перцентилизация по одному проценту показала наилучший результат при дальнейшем обучении нейронной сети). Исследование проводилось с применением оптимальных параметров нормализации (табл. 2). Результаты обучения моделей представлены в табл. 3 при разных способах ограничения диапазонов значений.

Таблица 3. Результаты обучения моделей при разных способах ограничения диапазонов значений Table 3. The result training models of limiting the ranges of values

Тип/Type Этап/Stage Ограничение диапазона значений по 1 и 4 квартилю / Limiting the range of values by 1st and 4th quartiles Ограничение диапазона значений по 1 и 100 проценту / Limiting the range of values to 1 and 100 percent Без ограничения/ Without limiting

Accuracy Loss Accuracy Loss Accuracy Loss

КТ Обучение 1,0000 0,00020 1,0000 0,00016 1,0000 0,00017

Валидация 1,0000 0,00022 1,0000 0,00020 1,0000 0,00018

Рентген Обучение 0,5069 да 0,9894 0,02860 0,5076 да

Валидация 0,5063 да 0,9711 0,09240 0,5069 да

При определении модальности КТ-изображений выбор границ диапазона не слишком влиял на результат обучения модели. Это можно объяснить тривиальностью задачи, поскольку изображение компьютерной томографии изначально имеет ряд физических маркеров, отличающих его от других типов изображений. Для рентгенографических изображений выбор оптимальных границ диапазонов значений оказал огромное влияние на результат обучения модели. Без ограничения диапазона значений, а также при существенном его ограничении (как было в случае квар-тилизации рентгенографических изображений) результаты обучения модели оказались неудовлетворительными. В рассматриваемом случае это объясняется тем, что на вход нейронной сети поступали изображения разных типов и различного содержания. Минимумы и максимумы таких изображений, диапазон и среднее значение сильно варьировались от изображения к изображению. При работе с более сложной задачей выбор оптимальных значений существенно повлияет на дальнейшее обучение модели.

Влияние равномерности данных на результаты обучения модели. При решении задачи проверки модальности КТ-изображений подготовленный набор данных содержал в себе всего 226 изображений, поскольку для такой задачи этого оказалось достаточно. В отличие от этого, задача проверки модальности рентгенографических изображений потребовала расширения обучающей выборки, а также пересмотра составляющих ее изображений. Содержание рентгенографического изображения сильно зависело от изображенной на нем части тела.

Провели несколько экспериментов, в которых параметры выбора граничных значений и диапазона нормализации соответствовали оптимальным (табл. 2, 3). Были сформированы два набора данных. Первый набор в равномерном соотношении включал изображения разных модальностей для класса «Не-рентген»: бинарные маски; аксиальные, сагиттальные, корональные слои КТ-изо-бражений головы, всего тела, брюшной области, грудной клетки; МРТ-изображения мозга, простаты, молочной железы; ультразвуковые изображения простаты, фантомов детей, печени. Также в равном соотношении использовали рентгенографические изображения лёгких, конечностей, молочных желёз, зубов для класса «Рентген». Второй набор данных содержал неравномерность изображений разных модальностей и частей тела (табл. 4). В качестве теста использовался тестовый набор данных, включавший примеры изображений всех типов модальностей и частей тела (3000 изображений).

Как видно из табл. 4, изменение состава набора данных повлияло на вероятность правильного ответа при тестировании обученной модели. При этом одна модель имела лучшие показатели при предсказании рентгенографических изображений конечностей, но совершала ошибки при предсказании изображений молочных желёз (маммографий и МРТ), некоторых изображений лёгких. Вторая модель не допускала ошибок предсказания изображений молочных желёз и имела лучшие показатели предсказания рентгенографических изображений лёгких, но хуже относила изображения конечностей к верному классу.

Таблица 4. Описание состава набора данных и ошибок определения моделью класса модальности изображения Table 4. Description of the composition of the data set and errors in determining the image modality

class by the model

Состав набора данных / Composition of the dataset Вероятность правильного ответа / Probability of corrent response Ошибка определения класса модальности изображения / Image modality class definition errors

Класс «Рентген» / X-ray class Класс «Не-рентген» / Non-X-ray class

25 % рентгенографических изображений каждой части тела ~11 % изображений каждого типа модальности 0,9780 7 изображений маммографии, 3 рентгенографических изображений грудной клетки, 20 изображений конечностей, 30 изображений МРТ груди, 3 артефактных КТ-изображений

20 % рентгенографических изображений конечностей 20 % рентгенографических изображений зубов 30 % рентгенографических изображений лёгких 30 % рентгенографических изображений молочных желёз ~11 % изображений каждого типа модальности 0,9853 1 рентгенографическое изображение грудной клетки, 40 изображений конечностей, 3 артефактных КТ-изображений

Это обусловлено тем, что конечности заполняли изображения примерно на 50 %, остальная часть изображения была представлена в виде белой или черной рамки. Аналогичную рамку имели неверно определенные изображения лёгких.

Наличие рамки сильно влияло на правильное отнесение к классу. Для того чтобы доказать это, построили тепловую карту областей интереса нейронной сети (рис. 1) [10]. Красным цветом на рис. 1 выделены области, внесшие наибольший вклад при итоговом предсказании отнесения к одному из двух классов. Из построенной тепловой карты видно, что при правильном определении модальности рентгенографического изображения зона интереса концентрировалась в области лёгких, а при ошибочном определении - в области границ окружающей изображение рамки.

Рис. 1. Тепловая карта областей интереса нейронной сети при определении модальности рентгенографического изображения лёгких: a - правильном; b - неправильном Fig. 1. Heat map of the areas of interest of the neural network in determining the modality of the radiographic image of the lung: a - correct; b - incorrect

Исходя из полученных результатов, можно сделать вывод, что равномерность выборки обучающего набора данных должна варьироваться в зависимости от целей использования модели в дальнейшем. Данную модель применяли для работы с изображениями грудной клетки с выбором второго варианта формирования обучающей выборки.

Обобщенный алгоритм подготовки данных для решения задачи классификации медицинских изображений представлен на рис. 2.

Рис. 2. Алгоритм подготовки данных для обучения нейронных сетей Fig. 2. Algorithm for preparing data for training neural networks

Заключение

1. Процесс подготовки данных на каждом из своих этапов существенно влияет на результаты обучения нейронных сетей. Предложенный алгоритм поможет облегчить процесс подготовки, позволит избежать ошибок при формировании обучающей выборки. Этап визуального и автоматического контроля необходим для перепроверки исследователем данных перед их подачей на вход нейронной сети. При малом количестве данных это можно сделать визуально, при большом - полуавтоматически, на основе выборочной проверки или тривиальных подсчётов (например, по среднему, минимальному и максимальному значениям изображений).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. При решении задачи определения модальности КТ-изображений на результат обучения модели сильно влияло наличие нормализации данных. В отличие от выбора границ динамического диапазона и диапазона нормализации, что может указывать на наличие особых признаков изображений данной модальности.

3. В случае решения задачи определения модальности рентгенографических изображений наибольшее влияние на результат обучения нейронной сети оказал выбор оптимальных значений. При перцентилизации точность классификации на валидационном наборе данных составила 0,9711. Изменение состава обучающей выборки позволило повысить точность классификации тестового набора данных на 0,0073. При этом улучшилась точность определения класса модальности изображений лёгких, но ухудшилась точность определения класса изображений конечностей.

4. Исходя из проведенных исследований, можно сделать вывод, что небольшие отклонения на каждом из этапов алгоритма способны повлиять на суммарный вклад в точность обучения нейронных сетей. Поэтому вопросу подготовки данных должно уделяться особое внимание.

Список литературы

1. The Cancer Imaging Archive (TCIA): Maintaining and Operating a Public Information Repository / K. Clark [et al.] // Journal of Digital Imaging. 2013. Vol. 26, No 6. Р. 1045-1057. https://doi.org/10.1007/s10278-013-9622-7.

2. Solem, J. E. Programming Computer Vision with Python / J. E. Solem. 2012. 300 р. https://www.sema-nticscholar.org/paper/Programming-Computer-Vision-With-Python-Solem/838f0c5eb0958e88c91ced3e743b 951b050a5c79.

3. Validation of Electronic Medical Record-based Phenotyping Algorithms: Results and Lessons Learned from the eMERGE Network / K. M. Newton [et al.] // Journal Am Med Inform Assoc. 2013. No 20(e1). Р. e147-e154.

4. Preparing Medical Imaging Data for Machine Learning / M. J. Willemink [et al.] // Radiology. 2020. Vol. 295, No 1. Р. 4-15. doi:10.1148/radiol.2020192224.

5. Murphy, A. Windowing (CT) [Electronic Resource] / А. Murphy, Y. Baba // Radiopaedia. Mode of access: https://radiopaedia.org/articles/52108. Date of access: 04.06.2022.

6. Mingxing, Tan. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks / Mingxing Tan, Quoc V. Le // In Proceedings of International Conference on Machine Learning (ICML), 2019.

7. Поиск схожих анатомических областей на КТ-изображениях лёгких с использованием свёрточных нейронных сетей / А. А. Косарева [и др.] // BIG DATA и анализ высокого уровня: сб. науч. ст. VIII Междунар. науч.-практ. конф., Минск, 11-12 мая 2022 г. / Белорусский государственный университет информатики и радиоэлектроники; редкол.: В. А. Богуш [и др.]. Минск, 2022. С. 476-482.

8. Bhanja, S. Impact of Data Normalization on Deep Neural Network for Time Series Forecasting [Electronic Resource] / S. Bhanja, A. Das. 2018. doi: 10.48550/ARXIV.1812.05519.

9. Influence of Data Scaling and Normalization on Overall Neural Network Performances in Photoacoustics / Miroslava Ivko Jordovic Pavlovic [et al.] // PREPRINT (Version 1) Available at Research Square, 18 October 2021. https://doi.org/10.21203/rs.3.rs-942309/v1.

10. Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization / R. Selvaraju Ramprasaath [et al.]. 2019. https://arxiv.org/pdf/1610.02391.pdf.

References

1. Clark K., Vendt B., Smith K., Freymann J., Kirby J., Koppel P., Moore S., Phillips S., Maffitt D., Pringle M., Tarbox L., Prior F. (2013) The Cancer Imaging Archive (TCIA): Maintaining and Operating a Public Information Repository. Journal of Digital Imaging. 26 (6), 1045-1057. https://doi.org/10.1007/s10278-013-9622-7.

2. Solem J. E. (2012) Programming Computer Vision with Python. 300. https://www.semanticscholar.org/paper/ Programming-Computer-Vision-With-Python-Solem/838f0c5eb0958e88c91ced3e743b951b050a5c79.

3. Newton K. M., Peissig P. L., Kho A. N. [et al.] (2013) Validation of Electronic Medical Record-based Phenotyping Algorithms: Results and Lessons Learned from the eMERGE Network. Journal Am Med Inform Assoc. 20 (e1), e147-e154.

4. Willemink M. J., Koszek W. A., Hardell C. [et al.] (2020) Preparing Medical Imaging Data for Machine Learning. Radiology. 295 (1), 4-15. doi: 10.1148/radiol.2020192224.

5. Murphy A., Baba Y. (2022) Windowing (CT). Radiopaedia. Available: https://radiopaedia.org/articles/52108. (Accessed 4 June 2022).

6. Mingxing Tan, Quoc V. Le (2019) EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks.

In Proceedings of International Conference on Machine Learning (ICML).

7. Kosareva А. А., Kamlach P. V., Kovalev V. A., Snezhko E. V., Radzhabov A. G. (2022) Finding a Similar Anatomical Area on the Lung's CT-Image Using EfficientNet. BIG DATA and Advanced Analysis: Collection of Scientific Articles of the VIII Inter. Scient. and Pract. Conf., Minsk, May 11-12, 2022. 476-482 (in Russian).

8. Bhanja S., Das A. (2018) Impact of Data Normalization on Deep Neural Networkfor Time Series Forecasting. doi: 10.48550/ARXIV. 1812.05519.

9. Miroslava Ivko Jordovic Pavlovic, Katarina Djordjevic, Zarko Cojbasic [et al.] (2021) Influence of Data Scaling and Normalization on Overall Neural Network Performances in Photoacoustics. PREPRINT (Version 1) Available at Research Square, 18 Oct. 2021. https://doi.org/10.21203/rs.3.rs-942309/v1.

10. Ramprasaath R. Selvaraju [et al.] (2019) Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization. https://arxiv.org/pdf/1610.02391.pdf.

Вклад автора / Authors' contribution

Автор разработала методику сравнительного анализа, реализовала алгоритмы, провела эксперименты, интерпретировала результаты и подготовила рукопись статьи / The author developed a comparative analysis technique, implemented algorithms, conducted experiments, interpreted the results and prepared the manuscript of the article.

Сведения об авторе Information about the author

Косарева А. А., ассистент кафедры электронной техники и технологии Белорусского государственного университета информатики и радиоэлектроники

Адрес для корреспонденции

220013, Республика Беларусь,

г. Минск, ул. П. Бровки, 6

Белорусский государственный университет

информатики и радиоэлектроники

Тел.: +375 17 293-88-60

E-mail: kosareva@bsuir.by

Косарева Александра Андреевна

Kosareva A. A., Assistant at the Electronic Engineering and Technology Department of the Belarusian State University of Informatics and Radioelectronics

Address for correspondence

220013, Republic of Belarus, Minsk, P. Brovka St., 6 Belarusian State University of Informatics and Radioelectronics Tel.: +375 17 293-88-60 E-mail: kosareva@bsuir.by Kosareva Aleksandra Andreevna

i Надоели баннеры? Вы всегда можете отключить рекламу.