Научная статья на тему 'ДЕТЕКТИРОВАНИЕ НОВООБРАЗОВАНИЙ НА КОМПЬЮТЕРНЫХ ТОМОГРАММАХ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ'

ДЕТЕКТИРОВАНИЕ НОВООБРАЗОВАНИЙ НА КОМПЬЮТЕРНЫХ ТОМОГРАММАХ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
140
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДЕТЕКТИРОВАНИЕ ОБЪЕКТОВ / ОБРАБОТКА ИЗОБРАЖЕНИЙ / НЕЙРОННЫЕ СЕТИ / YOLO

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гиниятова Динара Халиловна, Лапинский Василий Александрович

Представлены результаты применения нейронных сетей (НС) для задачи детектирования новообразований на компьютерных томограммах легких в условиях ограниченного количества данных. Большое внимание уделено анализу и предварительной обработке изображений, как фактору, повышающему качество работы НС. Рассмотрена проблема переобучения НС и способы ее решения. Результаты представленных экспериментов позволили сделать вывод об эффективности использования отдельных архитектур НС в совокупности с методами предварительной обработки данных для задач детектирования даже в случаях ограниченного набора обучающей выборки и малого размера детектируемых объектов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ДЕТЕКТИРОВАНИЕ НОВООБРАЗОВАНИЙ НА КОМПЬЮТЕРНЫХ ТОМОГРАММАХ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ»

ISSN 2079-3316 ПРОГРАММНЫЕ СИСТЕМЫ: ТЕОРИЯ И ПРИЛОЖЕНИЯ т. 13, №3(54), с. 61-79 научная статья искусственный интеллект, интеллектуальные системы, нейронные сети

УДК 519.68+004.89

d 10.25209/2079-3316-2022-13-3-61-79

Детектирование новообразований на компьютерных томограммах с использованием нейронных сетей

Динара Халиловна Гиниятова1^, Василий Александрович Лапинский2

Казанский (Приволжский) федеральный университет, Казань, Россия

1 normaliti@gmail.com (подробнее об авторах на с.79)

Аннотация. Представлены результаты применения нейронных сетей (НС) для задачи детектирования новообразований на компьютерных томограммах легких в условиях ограниченного количества данных. Большое внимание уделено анализу и предварительной обработке изображений, как фактору, повышающему качество работы НС. Рассмотрена проблема переобучения НС и способы ее решения.

Результаты представленных экспериментов позволили сделать вывод об эффективности использования отдельных архитектур НС в совокупности с методами предварительной обработки данных для задач детектирования даже в случаях ограниченного набора обучающей выборки и малого размера детектируемых объектов.

Ключевые слова и фразы: детектирование объектов, обработка изображений, нейронные сети, YOLO

Благодарности: работа выполнена за счет средств Программы стратегического академического лидерства Казанского (Приволжского) федерального университета (ПРИОРИТЕТ-2030)

Для цитирования: Гиниятова Д.Х., Лапинский В.А. Детектирование новообразований на компьютерных томограммах с использованием нейронных сетей // Программные системы: теория и приложения. 2022. Т. 13. № 3(54). С. 61—79. http://psta.psiras.ru/read/psta2022_3_61-79.pdf

© Гиниятова Д.Х., Лапинский В.А. 2022 ©Ф

This Article in English: http://psta.psiras.ru/read/psta2022_3_81-98.pdf

Введение

Своевременное обнаружение мелких узловых новообразований в легочной ткани дает шанс пациентам выявить опухоль на самых ранних стадиях. По данным Всемирной организации здравоохранения'""L в 2020 году рак легких возглавил рейтинг онкологических заболеваний, став самой частой причиной смерти. От заболевания умерли около 1,8 миллиона человек. Поздняя постановка диагноза во многом снижает эффективность лечения, поэтому важно разрабатывать автоматические методы качественного поиска патологических зон, что позволит специалистам оперативно и точно выявлять легочные новообразования.

В последние годы с использованием постоянно развивающихся технологий и алгоритмов машинного обучения разрабатываются высокотехнологичные решения для медицинских задач. В частности, реализованы нейронные сети (НС), способные с высокой точностью выявлять меланому на дерматоскопических изображениях [1] или прогнозировать выживаемость у пациентов с раком легких на основе рентгенологических заключений [2]. Многочисленные исследования показывают, что системы, разработанные на базе технологий искусственного интеллекта в ряде случаев дают более точные прогнозы, чем это делают врачи-рентгенологи. Например, представленная в работе [3] нейронная сеть для диагностики рака молочной железы показала результаты выше, чем у 61,4% рентгенологов. Все это указывает на перспективность использования глубокого обучения для автоматического скрининга, определения стадии заболевания, прогнозирования эффекта лечения и исхода болезни.

Задачи анализа медицинских изображений (УЗИ-снимков, рентгенографий, магнитно-резонансных и компьютерных томограмм) можно разделить на несколько типов —классификация, детектирование и сегментация. В задачах классификации определяется к какому из предложенных классов принадлежит изображение, например, можно классифицировать наличие или отсутствие заболевания (бинарная классификация). Задача детектирования, как правило, предполагает наличие нескольких объектов на изображении, в отличии от локализации, и заключается в нахождении ограничивающего прямоугольника (bounding box) для каждого из объектов и присвоении ему метки класса. К такому классу задач относится детектирование всевозможных аномалий на медицинских снимках. Сегментация — это разбиение изображения на непересекающиеся области, где присвоение метки класса осуществляется попиксельно. Популярным направлением является, например, сегментация кровеносных сосудов на изображениях сетчатки глаза.

Целью данной работы является исследование методов решения задачи детектирования с помощью нейронных сетей на примере детектирования узелковых новообразований (nodules) на компьютерных томограммах органов грудной клетки.

1. Анализ и предварительная обработка данных

Одна из главных проблем при решении задач анализа медицинских изображений с помощью нейронных сетей—набор данных. Как правило, найти размеченные данные с необходимым описанием болезней не всегда возможно, либо данных крайне мало, а для их разметки необходимо собирать консилиум специалистов, на что требуются значительные временные и материальные ресурсы.

Существует несколько методов преодоления данной проблемы. Первый—использование слаборазмеченных данных, в которых информация о размерах и местоположении аномалии частично или полностью отсутствует, а известен лишь статус пациента (болен/здоров). Второй предполагает использование различных инструментов предварительной обработки и аугментации данных, которые в совокупности позволяют повысить качество и увеличить исходный набор. В данном исследовании мы использовали второй подход.

В качестве исходных данных был использован датасет NODE21 U"L, который собран из нескольких других датасетов, ChestX-ray8 [4], PadChest [5], JSRTmL, ()jn n I . Названный выше базовый датасет был предложен организаторами соревнования NODE21 — Grand ChallengeURL. Набор NODE21mL состоит из 4882 компьютерных томограмм (КТ) в формате MHA, из которых только 1134 имеют какие-либо новообразования. Всего на томографиях обнаружено 1476 новообразований.

На рисунке 1 представлены примеры КТ из набора NODE21mL, а

Рисунок 1. Примеры цифровых томограмм из датасета NODE21U,L

на рисунке 2—пример с отмеченными новообразованиями.

Рисунок 2. Пример выделения новообразований

Таблица 1 содержит информацию о распределении количества новообразований по количеству изображений. Из таблицы видно, что большинство изображений имеет только одно новообразование, а максимальное количество новообразований на томограмме равно 3.

Таблица 1. Количество изображений к количеству новообразований

Кол-во новообразований 1 2 3

Кол-во изображений 893 140 101

На рисунке 3 представлена тепловая карта (heatmap) распределения новообразований по КТ в рассматриваемом датасете. По полученному распределению можно сказать, что узелковые новообразования распределены равномерно по всей плоскости легких, наиболее часто новообразования расположены в центральной части.

Рисунок 3. Распределение новообразований по площади легких в датасете NODE21

Как было отмечено выше, для подготовки данных для обучения нейронных сетей важным этапом является предварительная обработка. Далее будут описаны основные подходы к предобработке изображений для датасета NODE21.

Изображения без искомых объектов не представляют большой ценности, так как метрики качества оценивают точность расположения bounding box, что предохраняет от случайных детекций. Поэтому в качестве предобработки было решено отбросить чистые томограммы, не содержащие данные об искомых объектах. Кроме того, для обучения были использованы снимки, для которых повышена контрастность и обрезаны части изображения, не принадлежащие легким. Такие области не несут полезной информации для решения рассматриваемой задачи, а меньший размер изображений позволит ускорить процесс обучения.

Следующим важным этапом предобработки данных является аугментация с целью увеличения количества данных и повышения устойчивости модели. После анализа датасета было решено применить пять алгоритмов аугментации: гауссовский шум, размытие при движении, зеркальные отражения и преобразования перспективы.

Гауссовский шум - это случайный шум, который имеет гауссовское распределение. Пример изображения с гауссовским шумом представлен на рисунке 4 а. Данный алгоритм применяется, чтобы сделать нейронную сеть устойчивой к случайным шумам, возникающих на изображениях.

Применение размытия при движении необходимо, чтобы смоделировать смазанные снимки. В нашем случае применялся шум с небольшой силой, для того чтобы сделать алгоритм устойчивым к небольшим сдвигам. Пример изображения с размытием при движении показан на рисунке 4 б.

(а) гауссовский шум (б) с эффектом размытия

при движении

Рисунок 4. Примеры изображения с шумом

В задачах детектирования объектов преобразование, заданное зеркальными отражениями по вертикали и горизонтали (см. рисунок 5) дает возможность сети обучиться на одном и том же объекте с учетом возможных переворотов рентгеновской пленки, тем самым сделав ее устойчивой к подобным изменениям.

(а) исходное (б) отражение (в) отражение

изображение по горизонтали по вертикали

Рисунок 5. Зеркальные отражения рисунка

Проективное преобразование со случайными параметрами (перспектива) применяется с той же целью, что и повороты. Пример применения перспективы приведен на рисунке 6.

(а) исходное изображение

(б) результат преобразования

Рисунок 6. Пример применения перспективы

2. Метрики качества в задачах детектирования объектов на медицинских изображениях

Для оценки качества детектирования были использованы показатели истинно положительных и ложно положительных результатов. С их помощью были рассчитаны точность (Precision) и полнота (Recall) по следующим формулам:

TP

(1)

Precision =

TP + FP

TP

(2) Recall = Tp-+-FN’

где TP означает количество истинно положительных результатов, FP -количество ложно положительных решений и FN — количество ложно отрицательных результатов.

Метрика Precision отражает надежность модели при классификации положительных результатов, а Recall измеряет способность модели обнаруживать выборки, относящиеся к положительному классу. Также для анализа качества работы алгоритма используется Precision — Recall (PR) кривая и метрика AveragePrecision (AP), которая вычисляется как площадь под Precision — Recall кривой.

Дополнительно были рассчитаны метрики, используемые организаторами соревнования NODE‘21 — Grand Challengeдля оценки решений участников, а именно, TruePositiveRate:

TP

(3) TPR = TruePositiveRate = Recall = ,

v ' TP + FN

и FalsePositiveRate:

FP

(4) FPR = FalsePositiveRate = ^ ^,

где TN —количество истинно отрицательных результатов, Receiver Operating Characteristic (ROC) кривая, которая является отношением TPR к FPR, и Free Response Operating Characteristic (FROC) кривая, которая является соотношением TPR к среднему количеству ложно положительных обнаружений.

Итоговая целевая метрика вычисляется по формуле

(5) TargetMetric = 0.75AUC + 0.25FROC @0.25,

где AUC —площадь под кривой ROC, FROC@а есть величина FROC, вычисленная с порогом уверенности, равным а.

3. Выбор арихитектуры нейронной сети

В настоящее время задачи детектирования объектов решаются с помощью самых разных архитектур нейронных сетей, каждая из которых имеет свои особенности. С рядом задач успешно справляются сверточные нейронные сети [6], для других же требуются более сложные архитектуры или даже ансамбли из нескольких нейронных сетей. Для решения поставленной задачи были выбраны две актуальные архитектуры НС и проведен их сравнительный анализ.

3.1. Архитектура DETR

В качестве первой НС рассмотрим алгоритм машинного обучения End-to-End Object Detection with Transformers [7] или сокращенно «DETR». Алгоритм DETR был представлен в 2020 году. Его выход пришелся на начало широкого развития НС типа «трансформер» [8] в задачах обработки речи. Несмотря на то, что изначально трансформе-ры нашли свое применение в обработке последовательностей, из-за их отличных результатов исследователи искали пути применить трасн-формеры и в других областях машинного обучения. Так, нейронная сеть DETR стала эталонным образцом применения трансформеров в области компьютерного зрения и, в частности, для детектирования объектов. Для решения задачи детектирования новообразований использовалась сеть DETR-R50, предварительно обученная на наборе данных COCO [9]. В этой сети в качестве сверточных слоев выступает архитектура ResNet-50 [ ]. Общее число обучаемых параметров

приблизительно равно 41 миллиону.

Было проведено 10 эпох обучения, что в общей сложности заняло порядка 10 часов в облачном сервисе Google Colaboratory с подключением GPU. В результате сеть показала следующие результаты на валидационной выборке: Precision = 0.09, Recall = 0.33, AP = 0.055, PR кривая представлена на рисунке 7.

Recall

Рисунок 7. Кривая Precision-Recall на валидационной выборке

Для повышения качества предсказательной способности сети можно отбросить предсказания с низкой уверенностью. В качестве порога была взята 50% уверенность. На рисунке 8 представлены

примеры детектирования новообразований в легких без и с фильтрацией по уверенности.

(а) без фильтрации (б) с фильтрацией

Рисунок 8. Пример фильтрации по уверенности

После фильтрации по уверенности сеть показала следующие результаты на валидационной выборке: Precision = 0.09, Recall = 0.36, AP = 0.059, PR кривая представлена на рисунке 9.

10.8CL

0.40.20—,

0 0.2 0.4 0.6 0.8 1

Recall

Рисунок 9. Кривая Precision-Recall на валидационной выборке с 50% порогом уверенности для предсказаний

Согласно результатам, полученным на валидационной выборке, данная сеть показывает низкую точность. Первой возможной причиной неудовлетворительных результатов является все еще недостаточный набор данных. В качестве второй причины можно назвать специфичность самой задачи. Представленная архитектура плохо справляется с детектированием малых объектов, какими являются узелковые новообразования в легких.

3.2. Архитектура YOLOv5

Нейронная сеть YOLOv5WL является усовершенствованной пятой версией алгоритма YOLO™, реализованной на фреймворке PyTorch. Алгоритм YOLO («You Only Look Once») стал одной из наиболее популярных архитектур из-за хорошего сочетания точности детектирования и низкого потребления ресурсов. Как показали исследования, он эффективен и для ряда медицинских задач, в частности, при исследовании маммографий на наличие подозрительных поражений [11].

Для решения поставленной задачи нами была использована сеть YOLOv5s6, предварительно обученная на наборе данных COCO. Эта нейронная сеть принимает на вход изображения размером 1280x1280 пикселей и содержит около 12,6 миллиона обучаемых параметров.

Для сравнения с архитектурой DETR также было проведено 10 эпох обучения, что заняло около 4 часов. На валидационной выборке были получены следующие результаты: Precision = 0.65, Recall = 0.67, AP = 0.25, PR кривая представлена на рисунке 10.

Recall

Рисунок 10. Кривая Precision-Recall после 10 эпох обучения

Для повышения качества детектирования были также отброшены предсказания с низкой уверенностью. С фильтрацией по уверенности с порогом в 50% были достигнуты следующие результаты: Precision = 0.67, Recall = 0.81, AP = 0.31 и PR кривая представлена на рисунке 11.

Дополнительно был проведен эксперимент на той же модели, но уже на 20 эпохах. Он показал следующие результаты с фильтрацией

Recall

Рисунок 11. Кривая Precision-Recall после 10 эпох обучения и фильтрации 50%-уверенности

по уверенности в 50%: Precision = 0.71, Recall = 0.81, AP = 0.31 и PR кривая изображена на рисунке 12.

Recall

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рисунок 12. Кривая Precision-Recall после 20 эпох обучения и фильтрации 50%-уверенности

Версия YOLOv5 позволяет собирать данные о процессе обучения и метриках на каждой эпохе. Рассмотрим подробнее процесс обучения на 20 эпохах, представленный на рисунке 13.

Анализ графиков функций потерь на тестовой и валидационной выборках показывает, что нейронная сеть начинает переобучаться после 10-й эпохи. Это говорит о количественном недостатке и все

Рисунок 13. Графики функции потерь в процессе обучения на 20 эпохах

еще слабой аугментации имеющихся данных, из-за чего пока нельзя учитывать результаты, полученные в данном эксперименте.

3.3. Сравнительный анализ архитектур

Выше были рассмотрены две архитектуры нейронных сетей применительно к задаче детектирования узелковых новообразований на компьютерных томографиях. В одинаковых условиях были задействованы два алгоритма DETR и YOLOv5 с целью сравнения их эффективности и возможности дальнейшего использования для решения рассматриваемых задач.

Для наглядности значения целевых метрик для рассматриваемых нейронных сетей приведены в таблице 2.

Таблица 2. Результаты нейронных сетей на валидационной выборке после 10 эпох обучения

Архитектура Precision Recall AP

DETR 0.09 0.36 0.059

YOLOv5 0.67 0.81 0.31

Из полученных результатов следует, что нейронная сеть YOLOv5 демонстрирует более высокую точность в сравнении с архитектурой DETR. В первую очередь, это связано с разностью подходов к задаче

детектирования и специфичностью данных, на которых обучаются нейронные сети. Нейронная сеть DETR использует архитектуру типа «трансформер», которая, как уже было сказано, очень требовательна к объему данных. Из-за этого архитектура YOLO решает данную задачу значительно лучше.

Основываясь на полученных результатах, для дальнейшего исследования была выбрана архитектура YOLOv5. Однако текущее решение с использованием этой нейронной сети и набора данных не является удовлетворительным, так как нейронная сеть склонна к быстрому переобучению. Поэтому необходимо решить проблему переобучения с целью повышения обобщающей способности и качества детектирования выбранной модели на имеющихся данных.

3.4. Решение проблемы переобучения

Одним из способов решения проблемы переобучения является увеличение обучающей выборки. Это может быть достигнуто либо дополнительным набором данных, либо поиском схожих изображений, однако в силу специфичности рассматриваемой задачи такой вариант увеличения текущего датасета не подходит.

Другим подходом к решению данной проблемы является применение более «сильных» алгоритмов аугментации и дополнительной фильтрации изображений. Для повышения контрастности и нормализации данных использовался фильтр CLAHE [12], который является вариантом адаптивного выравнивания гистограммы, в котором усиление контрастности ограничено во избежание возникновения или усиления шумов на изображении. Далее были использованы дополнительные алгоритмы аугментации. Модель YOLOv5 предоставляет возможность исследователям аугментировать изображения прямо во время загрузки данных. Такой способ позволяет каждый раз генерировать новые изображения, повышая обобщающую способность модели, при этом нет необходимости хранить много данных на диске и все операции происходят без большого ущерба производительности. В дополнение к уже рассмотренным алгоритмам аугментации (отражения по вертикали и горизонтали —flipud, fliplr, сдвиги—translate, масштабирование —scale) были добавлены следующие:

• hsv_h—HSV-Hue аугментация,

• hsv_s —HSV-Saturation аугментация,

• hsv_v—HSV-Value аугментация,

• mosaic — mosaic аугментация,

• mixup — mixup аугментация,

• copy_paste — наложение случайных сегментов между изображениями.

Для иллюстрации работы указанных алгоритмов возьмем исходное изображение рисунка 14а, для которого уже был применен фильтр CLAHE. Алгоритмы HSV-Hue, HSV-Saturation, HSV-Value осуществляют сдвиги в пространстве цветовой модели HSV, примеры показаны на рисунке 14.

(а) Стандартизированное изображение

(б) HSV-Hue

(в) HSV-Saturation (г) HSV-Value

Рисунок 14. сдвиги в пространстве цветовой модели HSV

Алгоритм mosaic осуществляет случайное перемещение элементов изображения (см. рисунок 15а). Алгоритмы mixup и copy_paste осуществляют наложение элементов между изображениями, только mixup также осуществляет случайные преобразования смешиваемых элементов; пример работы этого алгоритма представлен на рисунке 15б.

(а) mosaic (б) mixup

Рисунок 15. Пример работы алгоритмов

В результате экспериментов были выбраны следующие значения параметров аугментации, которые указываются в конфигурационном файле:

• hsv_h: 0.015, • scale: 0.9,

• hsv_s: 0.7, • flipud: 0.5,

• hsv_v: 0.4, • fliplr: 0.5,

• translate: 0.1,

4. Результаты

В проведенных исследованиях в качестве обучаемой модели была взята нейронная сеть YOLOv5s6, описанная выше. Алгоритмы и параметры аугментации были подобраны таким образом, чтобы модель не была склонна к быстрому переобучению. Обучение проводилось на 300 эпохах. Процесс обучения представлен на рисунке 16.

Результаты работы сети представлены на рисунке 17.

• mosaic: 1.0,

• mixup: 0.1,

• copy_paste: 0.1.

tratn/box loss

train/objjoss —•— results

metrics/precision

200

val/cls_loss

rr

0 200 0 200 metrics/mAP 0.5 metrics/mAP_0.5:0.95

rr

0 200

0 200

0 200

Рисунок 16. Графики функций потерь и метрик точности итоговой модели

Рисунок 17. Примеры работы обученной нейронной сети YOLOv5

Как можно видеть из полученных данных, проблему с переобучением удалось решить с помощью аугментации.

При фильтрации по уверенности с порогом равным 0.5 на вали-дационной выборке модель демонстрирует следующие показатели: Precision = 0.70, Recall = 0.90, AP = 0.38, на рисунке 18 представлена соответствующая PR кривая.

Дополнительно вычислим метрики, используемые для оценки качества решений участников NODE21 — Grand ChallengeМетрика AUC = 0.898, FROC@0.25 = 0.741, TargetMetric = 0.859, ROC кривая

Recall

Рисунок 18. Кривая Precision-Recall на валидационной выборке после 300 эпох обучения

представлена на рисунке 19.

AUC=0.898

Рисунок 19. кривая ROC на валидационной выборке

Уточним, что значение целевой метрики у лидеров соревнования лежит в диапазоне от 0.801 до 0.839 NODE21“У

Заключение

Рассмотрены подходы к решению задачи детектирования узелковых новообразований в области грудной клетки человека на его компьютерных томограммах с помощью нейронных сетей. В качестве набора данных использован датасет NODE21mL. Проведен сравнительный анализ двух актуальных архитектур DETR и YOLO, который

показал, что недостаточный набор данных и его специфичность влияют на качество детектирования и склонность модели к переобучению. Алгоритм YOLO продемонстрировал лучшие результаты и был выбран в качестве основного для решения поставленной задачи. Проблема переобучения была решена с помощью более сильных алгоритмов аугментации и дополнительной фильтрации изображений. Полученные значения целевых метрик указывают на возможность использования нейронных сетей для решения задачи детектирования новообразований и других сходных задач анализа медицинских изображений.

Список литературы

[1] Wei L., Ding K., Hu H. Automatic skin cancer detection in dermoscopy images based on ensemble lightweight deep learning network // IEEE Access.- 2020.-Vol. 8.- pp. 99633-99647. d 62

[2] Kehl K. L., Elmarakeby H., Nishino M., Van Allen E. M., Lepisto E. M., Hassett M. J., Johnson B. J., Schrag D. Assessment of deep natural language processing in ascertaining oncologic outcomes from radiology reports // JAMA Oncol..- 2019,- Vol. 5,- No. 10,- pp. 1421-1429. d 62

[3] Rodriguez-Ruiz A., Lang K., Gubern-Merida A., Broeders M., Gennaro G.,

Clauser P., Helbich Th. H., Chevalier M., Tan T., Mertelmeier Th., Wallis M. G., Andersson I., Zackrisson S., Mann R. M., Sechopoulos I. Stand-Alone artificial intelligence for breast cancer detection in mammography: Comparison with 101 radiologists // Journal of the National Cancer Institute.- Vol. 111.- No. 9.-pp. 916-922. t62

[4] Wang X., Peng Y., Lu L., Lu Z., Bagheri M., Summers R. M. ChestX-ray8: Hospital-scale chest X-ray database and benchmarks on weakly-supervised

classification and localization of common thorax diseases, 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).- pp. 2097-2106. % 63

[5] Bustos A., Pertusa A., Salinas J.-M., de la Iglesia-Vaya M. PadChest: A large chest x-ray image dataset with multi-label annotated reports // Med. Image Anal..- 2020,- Vol. 66,- 101797. d ф5з

[6] Д. И. Калиев, О. Я. Швец Сверточные нейронные сети для решения задач обнаружения пожаров по данным аэрофотосъемки // Программные системы: теория и приложения.- 2022.- Т. 13.- № 1.- с. 195-213. шц ет

[7] Carion N., Massa F., Synnaeve G., Usunier N., Kirillov A., Zagoruyko S.

DE'.TR: End-to-end object detection with transformers, GitHub. url 68

[8] Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A. N., Kaiser L., Polosukhin I. Attention is all you need // Advances in Neural Information Processing Systems 30, 31st Conference on Neural Information Processing Systems (NIPS 2017) (Long Beach, CA, USA), eds. I. Guyon, U. Von Luxburg, S. Bengio, H. Wa.Ua.ch, R. Fergus, S. Vishwanathan, R. Garnett.- 2017.- ISBN 9781510860964.- pp. 6000-6010. @ 68

[9] Lin T.-Y., Maire M., Belongie S., Hays J., Perona P., Ramanan D., Dollar P., Zitnick C. L. Microsoft COCO: common objects in context, Computer Vision - ECCV 2014, Lecture Notes in Computer Science.- vol. 8693, eds. Fleet D., Pajdla T., Schiele B., Tuytelaars T., Cham: Springer.- 2014.-ISBN 978-3-319-10601-4,- pp. 740-755. d 68

[10] He K., Zhang X., Ren Sh., Sun J. Deep residual learning for image recognition-2015.- 12 pp. arXivM 1512.03385 [cs.CV] I 1 68

[11] Kolchev A., Pasynkov D., Egoshin I., Kliouchkin I., Pasynkova O., Tumakov D.

YOLOvf-based CNN model versus nested contours algorithm in the suspicious lesion detection on the mammography image: A direct comparison in the real clinical settings // Journal of Imaging.- 2022 - Vol. 8.- No. 4.- 88. t70

[12] Pizer S.M., Amburn E.P., Austin J.D., Cromartie R., Geselowitz A., Greer T., ter Haar Romeny B., Zimmerman J. B., Zuiderveld K. Adaptive histogram equalization and its variations j j Computer Vision, Graphics and Image Processing.- 1987 - Vol. 39.- No. 3.- pp. 355-368. d 73

Поступила в редакцию 17.06.2022;

одобрена после рецензирования 12.08.2022;

принята к публикации 10.09.2022.

Рекомендовал к публикации д.ф.-м.н. А. М. Елизаров

Информация об авторах:

Динара Халиловна Гиниятова

Старший преподаватель кафедры прикладной математики и искусственного интеллекта ИВМиИТ КФУ. Область научных интересов —высокопроизводительные вычисления, машинное обучение, электродинамика, математическое моделирование, программирование

В 0000-0002-0853-0984 e-mail: normaliti@gmail.com

Василий Александрович Лапинский

Студент 4 курса бакалавриата ИВМиИТ КФУ. Область научных интересов - машинное обучение, обработка изображений, высокопроизводительные вычисления

В 0000-0003-2880-9218 e-mail: vasilylapinsky@gmail.com

Все авторы сделали эквивалентный вклад в подготовку публикации. Авторы заявляют об отсутствии конфликта интересов.

i Надоели баннеры? Вы всегда можете отключить рекламу.