DOI: 10.24412/2413-2527-2022-230-41-47
Применение нейронной сети YOLO для распознавания дефектов
Э. А. Брехт, к.т.н. В. Н. Коншина Петербургский государственный университет путей сообщения Императора Александра I
Санкт-Петербург, Россия [email protected]
Аннотация. В статье рассматривается пример использования нейронной сети YOLO для распознавания и визуализации дефектов на изображении, полученном в процессе ультразвукового контроля дифракционно-временным методом. Из 110 дефектограмм, содержащих изображения дефектов, 100 использовались для обучения нейронной сети, 10 — для проверки. Показана возможность распознавания дефектов нейронной сетью с достаточной точностью для повседневной практики неразрушающего контроля.
Ключевые слова: нейронная сеть, контроль, дефектограммы, распознавание.
ультразвуковой
Введение
В ультразвуковом контроле больше всего возможностей для реализации методов искусственного интеллекта. В первую очередь это связано с тем, что при ультразвуковом контроле информация с первичных преобразователей поступает в виде сигналов, которые можно непосредственно обрабатывать, а не в виде визуальных изображений, как, например, в радиографии. Кроме того, ультразвуковой контроль реализуется различными методами (метод отраженного излучения (эхо-метод), метод прошедшего излучения и т. д.) [1], для каждого из которого характерны свои измеряемые характеристики дефектов [2], а также варианты методов, отличающиеся значениями основных параметров. Многообразие вариантов метода способствует появлению новых задач, связанных с представлением и обработкой информации о процессе контроля. Кроме того, существуют и направления классификации методов по назначению: обнаружение дефектов, выявление коррозии, определение структуры металла, оценка качества сварных швов, измерения толщины и т. д.
На сегодняшний день известно о следующих задачах применительно к ультразвуковому контролю, в рамках которых были предприняты попытки использовать нейронные сети [3]: распознавание образов, разделение сигналов от дефектов различного типа, автоматизированный анализ дефектограмм.
Для решения приведенных выше задач использовались уникальные архитектурно-программные решение (программы для работы с технологией искусственного интеллекта), что в свою очередь и является недостатком, так как в настоящее время большинство упомянутых в [3] решений не используется, поскольку современные решения [4] имеют сравнительно более высокий уровень адаптивности (гибкости). Основной особенностью и преимуществом нейронных сетей перед традиционными алгоритмами — это возможность обучения. В процессе обучения нейронная сеть способна выявлять сложные зависимости между входными и выходными данными, а также выполнять
обобщение. То есть, при успешном обучении, сеть позволит получить результат на основании данных, которые отсутствовали в обучающей выборке, а также в случае представления неполных и/или «зашумленных», частично искаженных данных.
Архитектура нейронной сети YOLO является примером современного гибкого решения задач по распознаванию и анализу дефектов. Стоит также отметить, что в сравнении с упомянутыми в [3] технологиями нейронная сеть YOLO продолжает развиваться и является системой с открытым исходным кодом, то есть бесплатной.
Постановка задачи по распознаванию дефектов
Задачи по распознаванию дефектов являются наиболее популярными и актуальными в рамках ультразвукового контроля, позволяя повысить достоверность его результатов за счет снижения субъективности. В развертке типа B (зависимость амплитуды от времени прихода сигнала) оценить наличие дефекта можно по геометрическим и амплитудным признакам, что в свою очередь дает возможность для применения нейронных сетей. В рамках данной работы были использованы результаты контроля дифракционно-временным методом.
Задачей работы являлась разработка программы, способной определять и визуализировать наличие дефекта на дефектограмме с развёрткой типа B, полученной при контроле дифракционно-временным методом.
Дефектограмма, полученная в процессе проведения контроля, приведена на рисунке 1.
вда
¡¡SSflC ,
Ш т ; л1
Л/Шш " Ш ^
Шм \
Рис. 1. Дефектограмма, полученная в результате контроля дифракционно-временным методом
Intellectual Technologies on Transport. 2022. No 2
Как указано выше, необходимо оценить наличие дефекта по геометрическим признакам. Таким образом необходимо выделить геометрическую форму, по которой можно оценить наличие дефекта (рис. 2).
эффективности, так как она имеет лучшие значения по соотношению между скоростью и точностью [6]. На рисунке 3 графически представлены возможности четвертой версии нейронной сети УОЬО.
Рис. 2. Пример геометрической формы распознаваемого дефекта
На изображении отмечены не все видимые дефекты, однако в данном случае отмеченный дефект иллюстрирует постановку задачи, а не конечный результат.
Особенности работы нейронной сети YOLO
Существует немало архитектур нейронных сетей, позволяющих распознавать сущности (дефекты) на изображении [5]. Большинство из них представляют собой двухуровневые нейронные сети, когда одна нейронная сеть сочетает в себе несколько более простых. Основной принцип работы таких нейронных сетей заключается в разделении всего изображения на регионы или клетки, после чего происходит анализ каждого региона.
У двухуровневых нейронных сетей есть две существенные проблемы: изображение анализируется не целиком, а только выделенные регионы, а скорость работы таких нейронных сетей значительно ниже. Первый недостаток связан с принципом работы, упомянутым ранее. Зачастую каждый регион обрабатывается последовательно с помощью сверточной нейронной сети. Результат, полученный сверточной нейронной сетью, передается в полносвязную для определения класса и размеров области, внутри которой находится искомый объект. Далее нейронная сеть обрабатывает следующий регион, и алгоритм повторяется.
Однако существует нейронная сеть, которая лишена этих недостатков. Выбранная нейронная сеть YOLO (You Only Look Once) [6] представляет собой двухуровневую нейронную сеть, преимущественно со сверточными слоями. Забегая вперед, можно отметить, что YOLO способна обрабатывать все регионы, из которых состоит изображение, за один раз. Главная причина, по которой была выбрана именно эта нейронная сеть, заключается в ее
MS COCO Object Detection
It JU It 19 ЯР JU 1Ъ1
fT${Y]MJ)
Рис. 3. Сравнение эффективности нейронных сетей
По оси абсцисс на рисунке 3 отложена скорость работы нейронной сети (частота кадров в секунду), по оси ординат — точность (измеряется с помощью специального коэффициента для измерения точности детекторов объекта [7]). Как видно из графика, четвертая версия YOLO существенно превосходит аналоги и показывает более стабильные значения.
Чтобы понять, каким образом нейронная сеть смогла достичь столь высоких показателей в соотношении «скорость — точность», необходимо рассмотреть уникальные особенности, которыми обладает данная нейронная сеть.
Функционирование нейронной сети YOLO основывается на работе с представленными на рисунке 4 клетками. Каждая клетка является «якорем», к которому прикрепляется рамка, в которой находится выделенный объект.
Рис. 4. Разделение исходного изображения на клетки
Для разделения загружаемого изображения на равные части необходимо, чтобы размер был кратным 32. Рекомендованным значением является 416 пикселей в длину и ширину. При большем разрешении увеличивается время обучения нейронной сети, однако это также положительно влияет на качество работы нейронной сети. Помимо этого, соблюдение данного требования позволяет загружать партию изображений в нейронную сеть за один раз, после чего применяется технология параллельных вычислений.
Распознав искомый участок на изображении, нейронная сеть рисует вокруг «якорной» клетки, в пределах которой находится искомый участок, несколько прямоугольников разного размера (рис. 5).
Рис. 5. Пример отрисовки прямоугольников
В первую очередь стоит определиться с размерами прямоугольников, внутри которых может находиться искомый объект. Максимальное и минимальное значения прямоугольников можно настроить в параметрах нейронной сети, указав конкретные значения, или позволив нейронной сети выбрать размеры из обучающей выборки. Как правило, применяют второй вариант.
Координаты рамок определяются несколько сложней. Вначале нейронная сеть рассчитывает центр искомой области внутри «якорной» клетки, далее относительно этого центра определяются координаты рамки (рис. 6). Для расчета нейронная сеть использует координату левой верхней «якорной» клетки, на которую попадает рамка.
Как было упомянуто ранее, нейронная сеть рисует несколько рамок вокруг искомого объекта, это необходимо для более точного выделения области, в которой находится объект. В результате проведения всех операций у одной выделенной области может быть несколько подходящих для финального отображения рамок (рис. 7).
Для оптимизации рамок с целью оставить только одну рамку для одного объекта (рис. 8) используется алгоритм обработки NMS (Non-Maximum Suppression), описанный в [8].
Если сравнить нейронную сеть YOLO с другими примерами нейронных сетей, то главной особенностью является принцип разделения всего изображения на секции, которыми являются «якорные» клетки.
Рис. 6. Выделение распознаваемых областей
Рис. 7. Пример изображения с несколькими рамками распознанных объектов
Рис. 8. Рамки распознанных объектов после применения алгоритма NMS
Если сравнить нейронную сеть YOLO с другими примерами нейронных сетей, то главной особенностью является принцип разделения всего изображения на секции, которыми являются «якорные» клетки.
Нейронная сеть EfficientDet [9] обладает хорошим показателем точности. Это достигается с помощью ее уникальной структуры, в основе которой использован принцип одноуровневой нейронной сети. Признаки, по которым нейронная сеть распознает объекты, передаются сразу по нескольким направлениям (в других нейронных сетях эта реализация более линейна). Очевидно, что для таких операций потребуется больше переменных, а также уникальные правила для обработки признаков.
Нейронная сеть ATSS (Adaptive Training Sample Selection) [10] является прямым противопоставлением нейронной сети YOLO, поскольку изначально создавалась как нейронная сеть для распознавания, которая не использует принцип «якорных» клеток. Вместо этого данная нейронная сеть использует точки. После того как искомый объект отмечен точками, производятся математические вычисления, определяющие размер рамки, внутри которой находится объект. Эта нейронная сеть может обрабатывать только одно изображение за один раз, что и является главным недостатком.
Нейронная сеть ASFF (Adaptively Spatial Feature Fusion) [11] является аналогом нейронной сети YOLO. Основные принципы работы схожи. Главное отличие заключается в математическом принципе, по которому нейронная сеть обрабатывает признаки для последующего распознавания объектов. В случае с YOLO обработка происходит по жестко заданным алгоритмам, в ASFF это происходит адаптивно.
Нейронная сеть CenterMask [12] с точки зрения технологий является предшественником YOLO. Основные принципы схожи с работой нейронной сети YOLO. Однако CenterMask более проста в исполнении и имеет меньший программный функционал. В первую очередь нейронная сеть обладает сравнительно меньшими сверточными слоями, что вынуждает использовать более сложные схемы для обработки признаков. В связи с упомянутыми факторами в нейронной сети CenterMask отсутствует возможность обрабатывать несколько изображений за один раз.
Рассмотрев все ранее упомянутые архитектуры нейронных сетей, можно выделить общую закономерность: скорость работы нейронной сети является не только явным преимуществом, но и образующим фактором, который определяет структуру и принцип работы нейронной сети.
Применение нейронной сети YOLO
Весь процесс работы нейронной сети YOLO можно разделить на следующие этапы:
1. Изображение подается на вход нейронной сети.
2. Изображение анализируется сверточной нейронной сетью, на выходе которой формируются карты признаков — значения, по которым нейронная сеть сопоставляет искомые области с участками, из которых состоит входное изображение.
3. Определяются места (регионы), в которых с высокой вероятностью находятся объекты, которые необходимо распознать.
4. Классифицируются участки, внутри которых находятся распознанные объекты.
Неотъемлемой частью работы нейронной сети является процесс обучения. Для того чтобы обучить нейронную сеть, необходимо иметь обучающую выборку. В данном случае использовалось 110 изображений, 100 из которых были выделены для обучения и 10 — для проверки точности. Важно отметить, что нейронные сети работают только с числами, поэтому на входе и выходе нейронной сети указываются соответствующие числа. В качестве числовых значений на вход подается матрица чисел, где каждому элементу матрицы соответствует значение яркости пикселя. В случае если изображение цветное, на вход подается три матрицы, по одной на каждый из основных цветов (красный, зеленый, синий). На выходе нейронная сеть возвращает массив значений, состоящий из координат области, в которой находится распознанный объект. Если объектов несколько, то на выходе — матрица значений, в которой количество рядов соответствует количеству распознанных объектов.
Выходные значения для обучающей выборки необходимо записать вручную, поскольку от точности выходных значений обучающей выборки напрямую зависит точность работы нейронной сети. Это легко сделать с помощью программы, позволяющей визуально выделить области на изображении и получить координаты выделенных областей (рис. 9).
Рис. 9. Выделение распознаваемых областей
Технология параллельных вычислений, которую поддерживает YOLO, позволяет очень быстро провести процесс обучения.
Процесс обучения нейронной сети можно отслеживать с помощью графика, который представлен на рисунке 10. По оси абсцисс отмечено количество итераций, а по оси ординат — значение ошибки (разница между истинным выходным значением и значением, которое рассчитала нейронная сеть).
Чтобы не столкнуться с эффектом переобучения, нейронная сеть автоматически сохраняет (обновляет) значения параметров, при которых нейронная сеть имеет минимальное значение ошибки.
Рис. 10. График обучения нейронной сети
Как видно из графика, значение ошибки составляет 0,0991, что примерно соответствует 10 %. Однако стоит учитывать тот факт, что данный показатель основывается на данных, представленных для обучения, иными словами, параметры нейронной сети имеют такие значения, которые позволяют распознавать объекты на изображениях, представленных для обучения с вероятностью ошибки в 10 %. В связи с этим после обучения нейронной сети необходимо проверить эффективность работы на проверочной выборке, которая в данном случае состоит из 10 изображений.
Так как нейронная сеть на входе и выходе имеет числовые значения, то для визуализации полученного результата необходимо использовать программу, способную работать с этими числами. В данном примере была написана программа на языке Python, которая позволила задействовать конфигурацию обученной нейронной сети. Примеры использования программы и нейронной сети приведены на рисунках 11 и 12. Изображения различного качества были взяты намеренно, чтобы еще раз убедиться в эффективности работы нейронной сети.
Рис. 12. Второй пример результата распознавания дефектов
Ранее было отмечено, что для обучения нейронной сети необходимо использовать изображения определенного размера. Однако когда нейронная сеть обучена, использовать изображения определенного размера необязательно. При этом стоит помнить, что размер изображения будет влиять на скорость распознавания.
Одним из требований к исходным данным для обучения нейросети является их однозначность и непротиворечивость, чтобы нейросеть не выдавала высокие вероятности отнесения одного объекта к нескольким классам.
Распознанные области выделяются рамкой. Текст, указанный над рамкой, является названием класса, к которому относится распознанный объект. Расположенные рядом с текстом цифры характеризуют точность. Как можно заметить, вероятность распознавания превышает 90 %. Аналогичные результаты распознавания получены и на оставшихся восьми изображениях. Анализируя результаты, стоит упомянуть о возможности верифицировать распознанный объект, задавая минимальное значение вероятности распознавания. Если указать минимальное значение вероятности распознавания, то все распознанные объекты, вероятность распознавания которых будет меньше заданного минимума, не будут отображаться на итоговом изображении.
Применение данного программного решения не ограничивается распознаванием и классификацией объектов на изображении. Спектр задач, которые возможно решить с помощью данной нейронной сети, напрямую зависит от программы, которая будет с ней взаимодействовать. Поскольку имеется возможность получить координаты рамок, возможно использовать данную информацию для последующих задач. В качестве примера можно отметить возможность представления информации в более понятном для человека виде, например, в какой части контролируемого объекта находится дефект.
Рис. 11. Первый пример результата распознавания дефектов
Использование нейронной сети YOLO в режиме
реального времени
Как отмечено ранее, нейронная сеть YOLO обладает преимуществом в соотношении скорости и точности. Результаты, представленные на рисунке 2, позволяют утверждать, что нейронная сеть способна работать в режиме реального времени. Кроме того, с точки зрения архитектуры в данном программном решении заложены специальные математические концепции, позволяющие отслеживать перемещение объекта на видео.
Для нейронной сети стоит задача не просто определить объекты на кадре, но еще и связать информацию с предыдущих кадров таким образом, чтобы не потерять объект или сделать его уникальным. Первый этап задачи сводится к выполнению рассмотренного ранее алгоритма. Однако ситуация сильно осложняется в случае необходимости передачи информации от кадра к кадру. Для решения данной задачи в архитектуру нейронной сети были заложены два математических аспекта — расстояние Махаланобиса [13] и фильтр Калмана [14].
Используя математические вычисления, нейронная сеть добавляет дополнительные параметры к распознанным на первом кадре объектам. Добавляется новая метрика, позволяющая последовательно идентифицировать объекты на каждом кадре.
Чтобы использовать нейронную сеть YOLO в режиме реального времени, требуется значительно большее количество вычислительных ресурсов, чем для распознавания объектов на изображении, что усложняет применение данной технологии в режиме реального времени.
Заключение
Нейронной сети YOLO удалось распознать дефекты на изображениях с точностью выше 90 %, что подтверждает возможность ее применения для задач дефектоскопии.
Данное решение более пригодно в рамках автоматизации процесса контроля, но внедрение этой технологии ограничивается тем, что нейронная сеть представляет собой вероятностный метод решения задач. Поэтому эффективнее использовать ее для более прикладных задач, связанных с распознаванием дефектов. С учетом изложенного, предполагается увеличить объем используемых дефекто-грамм, а также продолжить исследования в части не только обнаружения дефектов, но и определения их типа.
Литература
1. Кретов, Е. Ф. Ультразвуковая дефектоскопия в энергомашиностроении. — 4-е изд., перераб. — Санкт-Петербург: СВЕН, 2014. — 312 с. — (Методы и средства нераз-рушающего контроля) (Библиотека «В мире неразрушаю-щего контроля).
2. ГОСТ Р 55724-2013. Контроль неразрушающий. Соединения сварные. Методы ультразвуковые = Non-Destructive Testing. Welded Joints. Ultrasonic Methods: национальный стандарт Российской Федерации: утвержден и введен в действие Приказом Федерального агентства по техническому регулированию и метрологии от 8 ноября 2013 года № 1410-ст: дата введения 2015-07-01. — Москва: Стандар-тинформ, 2014. — 44 с.
3. Назаренко, С. Ю. Применение искусственных нейронных сетей в радиационном неразрушающем контроле / C. Ю. Назаренко, В. А. Удод // Дефектоскопия. 2019. № 6. С. 5364. DOI: 10.1134/S013030821906006X.
4. Ревякин, А. М. Подходы к разработке системы распознавания для решения задачи определения контента цифровых изображений / А. М. Ревякин, А. В. Скурнович // Интернет-журнал «Науковедение». 2016. Т. 8, № 4. Статья № 30TVN416. 14 c. URL: http://naukovedenie.ru/PDF/ 30TVN416.pdf (дата обращения 06.06.2022).
5. Mask R-CNN: архитектура современной нейронной сети для сегментации объектов на изображениях // NanoNewsNet — Сайт о нанотехнологиях № 1 в России. — 2018. — 27 августа. URL: http://www.nanonewsnet.ru/ news/2018/mask-r-cnn-arkhitektura-sovremennoi-neironnoi-seti-dlya-segmentatsii-obektov-na-izobrazhen (дата обращения 06.06.2022).
6. Bochkovskiy, A. YOLOv4: Optimal Speed and Accuracy of Object Detection / A. Bochkovskiy, C.-Y. Wang, H.-Y. M. Liao // ArXiv. 2020. Vol. abs/2004.10934. 17 p.
URL: http://arxiv.org/abs/2004.10934 (дата обращения 06.06.2022).
7. mAP (mean Average Precision) в детекции объектов // Neti ML — Machine Learning Neti. Умная видеоаналитика. URL: http://ml.i-neti.ru/map-mean-average-precision (дата обращения 06.06.2022).
8. Принцип и реализация немаксимального подавления NMS (Non-Maximum Suppression) // Русские Блоги. URL: http://russianblogs.com/article/79711224579 (дата обращения 06.06.2022).
9. Tan, M. EfficientDet: Scalable and Efficient Object Detection / M. Tan, R. Pang, Q. V. Le // Proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2020) (Seattle, WA, USA, 13-19 June 2020). — Institute of Electrical and Electronics Engineers, 2020. — Pp. 10778-10787. DOI: 10.1109/CVPR42600.2020.01079.
10. Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection / S. Zhang, C. Chi, Y. Yao, [et al.] // Proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2020) (Seattle, WA, USA, 13-19 June 2020). — Institute of Electrical and Electronics Engineers, 2020. — Pp. 9756-9765. DOI: 10.1109/CVPR42600.2020.00978.
11. Liu, S. Learning Spatial Fusion for Single-Shot Object Detection / S. Liu, D. Huang, Y. Wang // ArXiv. 2019. Vol. abs/1911.09516. 10 p. DOI: 10.48550/arXiv.1911.09516.
12. Lee, Y. CenterMask: Real-Time Anchor-Free Instance Segmentation / Y. Lee, J. Park // Proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2020) (Seattle, WA, USA, 13-19 June 2020). — Institute of Electrical and Electronics Engineers, 2020. — Pp. 13903-13912. DOI: 10.1109/CVPR42600.2020.01392.
13. Расстояние Махаланобиса // Портал знаний StatSoft. URL: http://statistica.ru/theory/rasstoyanie-makhalonobisa/ (дата обращения 06.06.2022).
14. Kalman, R. E. A New Approach to Linear Filtering and Prediction Problems // Journal of Basic Engineering. 1960. Vol. 82, Is. 1. Pp. 35-45. DOI: 10.1115/1.3662552.
DOI: 10.24412/2413-2527-2022-230-41-47
Application of YOLO Neural Network for Defect
Recognition
E. A. Breht, PhD V. N. Konshina Emperor Alexander I St. Petersburg State Transport University Saint Petersburg, Russia [email protected]
Abstract. The article considers an example of using the YOLO neural network to recognize and visualize defects in an image obtained in the process of ultrasonic testing by time-of-flight diffraction method. Of the 110 defect-grams containing images of defects, 100 of them were used to train the neural network, 10 - for verification. The possibility of recognition of defects by a neural network with sufficient accuracy for everyday practice of non-destructive testing is shown.
Keywords: neural network, ultrasonic testing, defectograms, recognition.
References
1. Kretov E. F. Ultrasonic flaw detection in power engineering [Ultrazvukovaya defektoskopiya v energomashinostroenii]. St. Petersburg, SVEN Publishing House, 2014, 312 p.
2. GOST R 55724-2013. Non-Destructive Testing. Welded Joints. Ultrasonic Methods [GOST R 55724-2013. Kontrol ne-razrushayushchiy. Soedineniya svarnye. Metody ultrazvu-kovye]. Effective from July 01, 2015. Moscow, Standartlnform Publishing House, 2014, 44 p.
3. Nazarenko S. Yu., Udod V. A. Application of Artificial Neural Networks in Radiation Non-Destructive Testing [Prime-nenie iskusstvennykh neyronnykh setey v radiatsionnom ne-razrushayushchem kontrole], Nondestructive Testing [Defektoskopiya], 2019, No. 6, Pp. 53-64.
DOI: 10.1134/S013030821906006X.
4. Revyakin A. M., Skurnovich A. V. Approaches to the Development of a Recognition System to Solve the Problem of Determining the Content of Digital Images [Podkhody k raz-rabotke sistemy raspoznavaniya dlya resheniya zadachi opre-deleniya kontenta tsifrovykh izobrazheniy], Online Journal Nau-kovedenie [Internet-zhurnal «Naukovedenie»], 2016, Vol. 8, No. 4. Art. No. 30TVN416. 14 p. Available at: http://nau-kovedenie.ru/PDF/30TVN416.pdf (accessed 06 June 2022).
5. Mask R-CNN: Modern Neural Network Architecture for Object Segmentation in Images [Mask R-CNN: arkhitektura sovremennoy neyronnoy seti dlya segmentatsii obektov na izo-brazheniyakh], NanoNewsNet — Nanotechnologies News from Russia [NanoNewsNet — Sayt o nanotekhnologiyakh № 1 v Rossii]. Published online at August 27, 2018. Available at: http://www.nanonewsnet.ru/news/2018/mask-r-cnn-arkhitektura-sovremennoi-neironnoi-seti-dlya-segmentatsii-obektov-na-izo-brazhen (accessed 06 June 2022).
6. Bochkovskiy A., Wang C.-Y., Liao H.-Y. M. YOLOv4: Optimal Speed and Accuracy of Object Detection, ArXiv, 2020, Vol. abs/2004.10934, 17 p. Available at: http://arxiv.org/abs/ 2004.10934 (accessed 06 June 2022).
7. mAP (mean Average Precision) in Object Detection [mAP (mean Average Precision) v detektsii obektov], Neti ML — Machine Learning Neti. Smart VideoAnalytics [Neti ML — Machine Learning Neti. Umnaya videoanalitika.]. Available at: http://ml.i-neti.ru/map-mean-average-precision (accessed 06 June 2022).
8. The Principle and Implementation of Non-Maximum Suppression NMS [Printsip i realizatsiya nemaksimalnogo podavleniya NMS (Non-Maximum Suppression)], Russian Blogs [Russkie Blogi]. Available at: http://russianblogs.com/ article/79711224579 (accessed 06 June 2022).
9. Tan M., Pang R., Le Q. V. EfficientDet: Scalable and Efficient Object Detection, Proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2020), Seattle, WA, USA, June 13-19, 2020. Institute of Electrical and Electronics Engineers, 2020, Pp. 10778-10787. DOI: 10.1109/CVPR42600.2020.01079.
10. Zhang S., Chi C., Yao Y., et al. Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection, Proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2020), Seattle, WA, USA, June 13-19, 2020. Institute of Electrical and Electronics Engineers, 2020, Pp. 9756-9765. DOI: 10.1109/CVPR42600.2020.00978.
11. Liu S., Huang D., Wang Y. Learning Spatial Fusion for Single-Shot Object Detection, ArXiv, 2019, Vol. abs/1911.09516, 10 p. DOI: 10.48550/arXiv.1911.09516.
12. Lee Y., Park J. CenterMask: Real-Time Anchor-Free Instance Segmentation, Proceedings of the 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2020), Seattle, WA, USA, June 13-19, 2020. Institute of Electrical and Electronics Engineers, 2020, Pp. 13903-13912.
DOI: 10.1109/CVPR42600.2020.01392.
13. Mahalanobis Distance [Rasstoyanie Makhalanobisa], StatSoft Knowledge Portal [Portal znaniy StatSoft]. Available at: http://statistica.ru/theory/rasstoyanie-makhalonobisa (accessed 06 June 2022).
14. Kalman R. E. A New Approach to Linear Filtering and Prediction Problems, Journal of Basic Engineering, 1960, Vol. 82, Is. 1, Pp. 35-45. DOI: 10.1115/1.3662552 (accessed 06 June 2022).
HHmenneKmyaMbHue техноnогии Ha mpaHcnopme. 2022. № 2
47