Научная статья на тему 'Сравнение глубокого обучения с традиционными методами компьютерного зрения в задачах идентификации дефектов'

Сравнение глубокого обучения с традиционными методами компьютерного зрения в задачах идентификации дефектов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
404
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПЬЮТЕРНОЕ ЗРЕНИЕ / ИДЕНТИФИКАЦИЯ ДЕФЕКТОВ / ГЛУБОКОЕ ОБУЧЕНИЕ / НЕЙРОННЫЕ СЕТИ / COMPUTER VISION / DEFECT IDENTIFICATION / DEEP LEARNING / NEURAL NETWORKS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сеничев А. В., Новикова А. И., Васильев П. В.

Проведен сравнительный анализ методов глубокого обучения с традиционными алгоритмами компьютерного зрения в целях усовершенствования процессов идентификации дефектов и повышения их качества работы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARISON OF DEEP LEARNING WITH TRADITIONAL METHODS OF COMPUTER VISION IN THE PROBLEMS OF DEFECTS IDENTIFICATION

In order to improve the processes of defect identification and increase the quality of work, a comparative analysis of deep learning methods with traditional computer vision algorithms was carried out.

Текст научной работы на тему «Сравнение глубокого обучения с традиционными методами компьютерного зрения в задачах идентификации дефектов»

УДК 004.85

СРАВНЕНИЕ ГЛУБОКОГО ОБУЧЕНИЯ С ТРАДИЦИОННЫМИ МЕТОДАМИ КОМПЬЮТЕРНОГО ЗРЕНИЯ В ЗАДАЧАХ ИДЕНТИФИКАЦИИ ДЕФЕКТОВ

А. В. Сеничев, А. И. Новикова, П. В. Васильев

Донской государственный технический университет (г. Ростов-на-Дону, Российская Федерация)

Проведен сравнительный анализ методов глубокого обучения с традиционными алгоритмами компьютерного зрения в целях усовершенствования процессов идентификации дефектов и повышения их качества работы.

Ключевые слова: компьютерное зрение, идентификация дефектов, глубокое обучение, нейронные сети.

COMPARISON OF DEEP LEARNING WITH TRADITIONAL METHODS OF COMPUTER VISION IN THE PROBLEMS OF DEFECTS IDENTIFICATION

A. V. Senichev, A. I. Novikova, P. V. Vasilyev

Don State Technical University (Rostov-on-Don, Russian Federation)

In order to improve the processes of defect identification and increase the quality of work, a comparative analysis of deep learning methods with traditional computer vision algorithms was carried out. Keywords: computer vision, defect identification, deep learning, neural networks.

Введение. Стремительное развитие технологий машинного обучения связано с ростом объема цифровой информации и мощности компьютерного оборудования. Глубокое обучение используется при решении комплекса сложных задач: классификации, сегментации и идентификации дефектов. Его работа основана на использовании искусственных нейронных сетей, в основу которых были положены механизмы работы человеческого мозга. Модели с применением методов глубокого обучения, таких как сверточные нейронные сети (CNN), в основном используются в задачах семантической сегментации и классификации. Они также находят свое применение при необходимости увеличения производительности прогнозирования на основе большого объема данных и наличия вычислительных ресурсов. Проблемы, которые раньше считались неразрешимыми, теперь решаются с большей точностью.

Принцип работы традиционных методов компьютерного зрения заключается в извлечении векторов объектов из изображений для их дальнейшей классификации. Нейронные сети, используемые при глубоком обучении, обучаются, а не программируются. Следовательно, по сравнению с традиционными методами компьютерного зрения, они требуют меньшего экспертного анализа. Глубокое обучение обеспечивает гибкость, за счет которой модель и структура нейронных сетей может быть переобучена для любого возможного набора данных, что критически важно в задачах идентификации дефектов. Данная возможность является преимуществом, по сравнению с алгоритмами компьютерного зрения, которые адаптируются под конкретные задачи.

Обзор литературы. В [1] решается обратная задача механики с применением методов конечно-элементного моделирования, ультразвукового неразрушающего контроля и технологий искусственных нейронных сетей. Был разработан комплексный подход к определению локального напряженного состояния в окрестностях особых внутренних дефектов. В [2] проведено исследование проблемы определения асимптотического поведения напряжений в верхней части клиновидной области. В работе [3] под руководством Andy Lee проведен сравнительный анализ

Молодой исследователь Дона IfHfjJJ №4(25) 2020

глубокого обучения и традиционных методов компьютерного зрения на примере распознавания объектов. Авторы соорудили робота, который был оснащен технологиями OpenCV и Caffe. В результате было выявлено, что свёрточные нейронные сети показали лучшую производительность, по сравнению с традиционными методами компьютерного зрения. Результаты данной работы могут быть использованы при проектировании механического робота, который будет использоваться для идентификации дефектов на различных поверхностях. В совместной работе А. Н. Соловьева и соавторов [4] были предложены методы ультразвукового и магнитного контроля для выявления трещиноподобных дефектов в трубах с покрытием. Была разработана модель поперечного сечения трубы с внутренним покрытием и распространением ультразвуковой волны. Идентификация дефектов проводилась с применением методов ультразвукового контроля и искусственных нейронных сетей.

С ростом вычислительных мощностей графических процессоров стало возможным применять более глубокие архитектуры моделей машинного обучения [5]. С развитием сверточных нейронных сетей стала доступна возможность более эффективно изучать и обобщать особенности изображений. С их помощью решаются задачи классификации [6], идентификации образов [7], в том числе, транспортные задачи.

Цель данной работы состоит в том, чтобы на основе сравнительного анализа выявить недостатки и преимущества работы глубокого обучения перед традиционными методами компьютерного зрения и использовать результаты сравнения в будущих задачах, связанных с вопросами идентификации дефектов.

Теоретическая часть. Традиционный подход компьютерного зрения для обнаружения дефектов заключается в использовании таких методов как SIFT (Scale-Invariant Feature Transform), SURF (Speeded-Up Robust Features) и BRIEF (Binary Robust Independent Elementary Features). На этапе извлечения признаков в задачах классификации изображения могут быть задействованы следующие алгоритмы:

- детектор границ Канни — использует поэтапный алгоритм для обнаружения широкого диапазона краев в изображениях;

- детектор углов Харриса — применяется для извлечения углов и получения свойств изображения;

- пороговая сегментация — данный алгоритм может быть использован для получения бинарных изображений.

Сложность данного подхода заключается в том, что для каждого изображения необходимо выбрать, какие признаки стоит учитывать. По мере увеличения количества классов, извлечение признаков становится все более громоздким, от чего конфигурация классов объектов становится длительным процессом, что приводит к повышенному риску возникновения ошибок.

Благодаря развитию аппаратного обеспечения и увеличению предельной вычислительной мощности, разработка сверточных нейронных сетей оказала огромное влияние на решение задач распознавания дефектов. Название архитектура сети получила из-за наличия операции свертки, суть которой состоит в том, что каждый фрагмент изображения умножается на матрицу (ядро) свёртки поэлементно, а результат суммируется и записывается в аналогичную позицию выходного изображения. Наряду с этим, глубокое обучение представляет концепцию сквозного обучения, которая подразумевает передачу машине набора аннотированных изображений с информацией о том, какие классы объектов присутствуют на входном наборе данных. Таким образом, модель глубокого обучения обучается. Глубокие нейронные сети обнаруживают базовые шаблоны в классах изображений и автоматически вырабатывают наиболее наглядные и характерные

особенности в отношении каждого конкретного класса для каждого объекта. Отсюда получается более высокая производительность и точность, по сравнению с традиционными алгоритмами машинного зрения.

Недостатками сверточных нейронных сетей является потребность, в некоторых случаях, в большом наборе данных и высокая вариативность параметров сети, которые существенно влияют на результат работы. К таким параметрам относятся: количество слоев свертки, потребность в слоях субдискретизации, количество ядер и шаг сдвига при обработке слоя. Данные параметры выбираются эмпирически. Глубокое обучение используется для задач классификации, в которых широкий диапазон потенциальных сигналов должен быть отображен на ограниченное количество категорий, учитывая, что имеется достаточный набор данных, вследствие чего плохо работает с видеопотоком и 3D-моделированием.

Заключение. Глубокое обучение показывает хорошие результаты в задачах идентификации дефектов (трещин) на изображениях, но имеет ряд недостатков в области 3D-моделирования и обработки видеопотоков, где традиционные методы компьютерного зрения показывают лучшие результаты. Методы глубокого обучения также позволяют решить ряд проблем, связанных с вычислительной мощностью, временем исполнения, точностью. Для корректной работы и следования принципу наименьшего риска авторами данной работы рекомендуется использовать гибридный подход, в котором будут использоваться лучшие качества обеих технологий.

Благодарности. Работа выполнена при поддержке РФФИ в рамках проектов №19-0800074, №19-38-90248.

Библиографический список

1. Соболь, Б. В. Идентификация трещиноподобного дефекта и исследование концентрации напряжений в полосе с покрытием / Б. В. Соболь, А Н. Соловьев, Е. В. Рашидова // Вестник Пермского национально-исследовательского политехнического университета. Механика. — 2019. — № 4. С. 165-174. DOI : 10.15593/perm.mech/2019.4.16.

2. Soloviev, A. N, Sobol, B. V, Vasiliev, P. V. and Rashidova, E. V. Singularity of Stresses at the Top of an Elastic Wedge Supported by a Thin Flexible Coating on Its Sides // XV International Scientific-Technical Conference «Dynamic of Technical Systems» (DTS-2019). Rostov-on-Don : AIP Conference Proceedings 2188, 040014. - 2019. DOI : 10.1063/1.5138423

3. Andy Lee. Comparing Deep Neural Networks and Traditional Vision Algorithms in Mobile Robotics / Niall O' Mahony. — Conference : Computer Vision Conference (CVC) 2019At: Las Vegas. 2019. 9 р.

4. Soloviev, A. N., Sobol B. V., Vasiliev P. V. Ultrasonic and Magnetic Flow Inspection Methods of Identification of Cracks in the Pipe Coupled with Artificial Neural Networks // Parinov I., Chang S. H., Jani M. (eds) Advanced Materials. Springer Proceedings in Physics. 2017, Vol. 193. pp. 381 - 395. Springer, Cham.

5. Arel, I., Rose, D. C., Karnowski, T. P. Deep machine learning - a new frontier in artificial intelligence research. IEEE Computational Intelligence Magazine 5(4), 13-18 (2010).

6. Szegedy C. et al. "Going deeper with convolutions", 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Boston, MA, 2015, pp. 1-9. 21.

7. Girshick R., Donahue J., Darrell T. and J. Malik "Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation," 2014 IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, 2014, pp. 580-587.

L4QQ/J

Об авторах:

Сеничев Александр Вадимович, программист кафедры «Информационные технологии» Донского государственного технического университета (344003, РФ, г. Ростов-на-Дону, пл. Гагарина, 1), alexandr. senichev@gmail. com

Новикова Анна Ивановна, ассистент кафедры «Информационные технологии» Донского государственного технического университета (344003, РФ, г. Ростов-на-Дону, пл. Гагарина, 1), novikova. anna 16@yandex.ru

Васильев Павел Владимирович, старший преподаватель кафедры «Информационные технологии» Донского государственного технического университета (344003, РФ, г. Ростов-на-Дону, пл. Гагарина, 1) lyftzeigen@mail.ru

Authors:

Senichev, Aleksandr V., programmer, Department of Information Technologies, Don State Technical University (1, Gagarin sq., Rostov-on-Don, 344003, RF), alexandr.senichev@gmail.com

Novikova, Anna I., assistant, Department of Information Technologies, Don State Technical University (1, Gagarin sq., Rostov-on-Don, 344003, RF), novikova.anna16@yandex.ru

Vasilyev, Pavel V., senior lecturer, Department of Information Technologies, Don State Technical University (1, Gagarin sq., Rostov-on-Don, 344003, RF), lyftzeigen@mail .ru

i Надоели баннеры? Вы всегда можете отключить рекламу.