Научная статья на тему 'РАСПОЗНАВАНИЕ ЦЕЛЕЙ НА БАЗЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ БЕСПИЛОТНЫХ СИСТЕМ'

РАСПОЗНАВАНИЕ ЦЕЛЕЙ НА БАЗЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ БЕСПИЛОТНЫХ СИСТЕМ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
123
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПЬЮТЕРНОЕ ЗРЕНИЕ / НЕЙРОННАЯ СЕТЬ / ИЗОБРАЖЕНИЕ / АЛГОРИТМЫ / СВЕРТКА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Счетчиков Юрий Андреевич, Кайнова Татьяна Денисовна, Чупаков Максим Викторович, Демидова Кристина Анатольевна

Данная статья представляет обзор систем компьютерного зрения, описывая их ключевые задачи, такие как классификация, локализация, детектирование и сегментация объектов на изображениях. Также в тексте рассмотрены нейронные сети, свертку нейронных сетей и их применение в компьютерном зрении. Описаны основные этапы работы с изображениями, включая получение, обработку и анализ. Приведено описание двух библиотек для компьютерного зрения. Также в статье есть небольшой пункт про сверточные нейросети. Более подробно описывается процесс классификации объектов на изображении и методы машинного обучения, используемые для этого, такие как обучение с учителем, обучение без учителя.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Счетчиков Юрий Андреевич, Кайнова Татьяна Денисовна, Чупаков Максим Викторович, Демидова Кристина Анатольевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OVERVIEW OF THE TARGET RECOGNITION SYSTEM WITH COMPUTER VISION TECHNOLOGY

This article presents an overview of computer vision systems, describing their key tasks, such as classification, localization, detection and segmentation of objects in images. The text also discusses neural networks, convolution of neural networks and their application in computer vision. The main stages of working with images, including acquisition, processing and analysis, are described. The description of two libraries for computer vision is given. Also in the article there is a small paragraph about convolutional neural networks. The process of classifying objects in an image and the machine learning methods used for this, such as supervised learning and unsupervised learning, are described in more detail.

Текст научной работы на тему «РАСПОЗНАВАНИЕ ЦЕЛЕЙ НА БАЗЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ БЕСПИЛОТНЫХ СИСТЕМ»

DEVELOPMENT OF A METHOD FOR IMPROVING SCIENTIFIC AND TECHNICAL SUPPORT OF CONSTRUCTION

(NTSS) ON THE BASIS OF NEURAL MODELING

A.O. Khubaev, B.R. Dolov

This article provides an analysis and data collection for capital repairs of multi-apartment buildings in Russia. It explores methods and tools for data collection, analysis of the gathered information, and the management system for the repair process. The research is based on official data sources and resident surveys. The findings of this study will help optimize the capital repair process and enhance the efficiency of the housing sector in Russia.

Key words: major repairs, apartment buildings, process optimization, efficiency, official sources.

Khubaev Alan Olegovich, docent, alan_khubaev@mail.ru, Russia, Moscow, National Research Moscow State University of Civil Engineering,

Dolov Batyrbek Romanovich, student, bekadolov@mail.ru, Russia, Moscow, National Research Moscow State University of Civil Engineering

УДК 681.5

DOI: 10.24412/2071-6168-2023-7-628-629

РАСПОЗНАВАНИЕ ЦЕЛЕЙ НА БАЗЕ ТЕХНОЛОГИЙ КОМПЬЮТЕРНОГО ЗРЕНИЯ

ДЛЯ БЕСПИЛОТНЫХ СИСТЕМ

Ю.А. Счетчиков, Т.Д. Кайнова, М.В. Чупаков, К.А. Демидова

Данная статья представляет обзор систем компьютерного зрения, описывая их ключевые задачи, такие как классификация, локализация, детектирование и сегментация объектов на изображениях. Также в тексте рассмотрены нейронные сети, свертку нейронных сетей и их применение в компьютерном зрении. Описаны основные этапы работы с изображениями, включая получение, обработку и анализ. Приведено описание двух библиотек для компьютерного зрения. Также в статье есть небольшой пункт про сверточные нейросети. Более подробно описывается процесс классификации объектов на изображении и методы машинного обучения, используемые для этого, такие как обучение с учителем, обучение без учителя.

Ключевые слова: компьютерное зрение, нейронная сеть, изображение, алгоритмы, свертка.

Системы компьютерного зрения используют камеры и программное обеспечение для распознавания объектов на изображениях. Они могут быть использованы для распознавания лиц, автомобилей, животных и других объектов. Эти системы используются в интересах безопасности, в различных транспортных системах. С практической точки зрения компьютерное зрение стремится понять и автоматизировать задачи, которые выполняет зрительная система человека. Для того, чтобы компьютерное зрение (CV) понимало, что видит нужно пройти три этапа:

получить изображение;

обработать изображение;

проанализировать изображение.

Системы компьютерного зрения могут выполнять различные задачи, такие как:

Классификация. Путем обучения нейронных сетей на датасетах возможно достичь высокой точности в определении наличия на изображении объектов. Для этого могут использоваться различные методы, такие как пороговая обработка и графовые алгоритмы. Извлечение признаков позволяет определить характеристики объектов на изображении, такие как форма, цвет, текстура.

Локализация. Используется для определения местоположения объектов на изображении, ограничивая их прямоугольниками.

Детектирование. Алгоритм не только находит объект на изображении, но и проводит классификацию.

Сегментация. Одним из ключевых шагов при классификации объектов на изображении является сегментация, которая позволяет выделить объекты на изображении и отделить их от фона путем отнесения каждого пикселя изображения к определенной части объекта. В отличие от детектирования, сегментация подсвечивает только те пиксели, которые относятся к объекту.

Приложения компьютерного зрения. В области робототехники существуют различные приложения компьютерного зрения, которые обеспечивают автономную навигацию, распознавание и манипуляцию объектами. Приложения компьютерного зрения позволяют роботам воспринимать и анализировать окружающую среду для навигации без участия человека. Это включает в себя в общем виде распознавание окружающего пространства, в том числе географических и топографических объектов, дорог, разметки, покрытий и препятствий и т.п. Роботы могут использовать камеры и другие сенсоры для сбора информации об окружающей его среде для принятия решений о своих действиях на основе этой информации.

CV позволяет роботам распознавать и классифицировать объекты в окружающем его пространстве. Например, с помощью камер и других сенсоров роботы распознают и классифицируют различные подводные объекты, такие как коралловые рифы, рыбы, водоросли, судовые обломки, трубопроводы. Это позволяет роботам определять положение и ориентацию себя и объектов, что помогает им выполнять точные манипуляции и взаимодействовать с окружающими предметами там, где это недоступно человеку.

Автомобильная промышленность. В автомобильной промышленности компьютерное зрение играет важную роль в повышении безопасности и эффективности вождения. На сегодняшний момент компьютерное зрение внедряется в эту отрасль как в качестве ассистента для водителя, так и в качестве основной системы беспилотных автомобилей.

Данные системы обеспечивают основные и дополнительные функции безопасности и комфорта во время вождения. Они включают распознавание и отслеживание других автомобилей на дороге, определение расстояния до препятствий, предупреждение о столкновении, контроль движения по полосам шоссе, предупреждения о перестроениях во время движения и многие другие функции, которые помогают водителю или искусственному интеллекту (ИИ) принимать своевременные и правильные решения на дороге.

На дорогах общего пользования уже появились первые беспилотные автомобили, и они используют различные приложения компьютерного зрения для предоставления информации ИИ, управляющему движением автомобиля. ¿V использует камеры и другие сенсоры для считывания дорожных знаков, включая скоростные ограничения, предупреждения об опасности, указатели направления и другие знаки.

Рис. 1. Беспилотное такси Яндекса

Безопасность и видеонаблюдение. В области безопасности и видеонаблюдения приложения компьютерного зрения имеют большое значение они могут использоваться для распознавания лиц в видеопотоке или на статических изображениях. Это позволяет идентифицировать и аутентифицировать людей, контролировать доступ в ограниченные зоны, следить за подозрительными лицами и помогает в расследовании преступлений.

Технологии компьютерного зрения в безопасности и видеонаблюдении помогают автоматизировать процессы мониторинга, обеспечивают более эффективную и точную систему безопасности, а также помогают предотвращать преступления и реагировать на них. Эти приложения могут быть применены в различных сферах, включая общественные места, аэропорты, банки, транспортные системы и промышленные объекты, с целью обеспечения безопасности и защиты.

Основные принципы компьютерного зрения.

Классификация Локализация Детекпцшвание Сегментация

CAT CAT CAT, DOG, DUCK CAT, DOG, DUCK

Puc. 2. Примеры обработки изображения

Компьютерное зрение может распознавать изображение и без предварительного обучения, но такие алгоритмы распознавания обычно имеют ограниченную область применения. Например, чтобы распознать полосу на дороге нужно всего лишь написать такой алгоритм, чтобы он при помощи математических методов искал контраст с дорогой и рисовал линии на экране.

Рис. 3. Вид пользователя Рис. 4. Вид компьютера

Однако, такой алгоритм не всегда справляется со сложными задачами распознавания изображений, которые требуют обучения и применения более сложных методов, таких как нейронные сети.

Библиотеки по CV. Существует много библиотек для CV вот две наиболее популярные из них: OpenCV - самая известная библиотека, многоплатформенная и простая в использовании. Охватывает все основные алгоритмы для выполнения задач обработки изображений и видео, превосходно работает с Python и С++.

TensorFlow - символьная математическая библиотека, которая дополнительно используется для приложений машинного обучения, например, нейронных сетей.

Методы машинного обучения в компьютерном зрении. Нейронные сети - это математические модели, созданные для имитации работы человеческого мозга. Они состоят из нейронов, связанных между собой и способных обрабатывать информацию.

Существует множество различных типов нейронных сетей, которые отличаются по структуре и способу обработки данных. Одним из наиболее популярных типов нейронных сетей является сверточная нейронная сеть. Она используется для обработки изображений и видео. Сверточная нейронная сеть имеет специальный слой, который позволяет ей распознавать различные объекты и образы на изображении. Нейронные сети могут быть обучены на большом количестве данных, чтобы улучшить свою точность и качество работы. Обучение нейронной сети происходит путем подачи ей набора данных и корректировки ее параметров до тех пор, пока результаты не станут достаточно точными.

Рис. 5. Пример структуры сверточной нейронной сети

Операция свертки. Операция свертки изображения — операция между матрицей изображения и матрицей-ядром (фильтром), при которой каждый элемент (пиксель) в выходном изображении есть сумма произведений значения элемента ядра на значение соответствующего покрываемого элемента матрицы входящего изображения. Математически операция свертки записывается следующим образом:

в = (Х*К)у = Е^оЕ^о, 0 <= 1, ] < х - к+1, где X - матрица размера х на х, задающая входное изображение; К - матрица размера к на к, которая называется ядром свертки; В - результат свертки матрицы X с ядром К.

Точка приложении

Рис. 6. Операция свертки

Рекуррентные нейронные сети. Рекуррентная нейронная сеть, разработанная в 1980-х годах, представляет собой определенный тип нейронных сетей, в которых элементы связаны в направленную последовательность. Основная структура сети состоит из узлов, которые взаимодействуют между собой. У каждого узла имеется порог активации, который со временем изменяется и представляет собой вещественное число. Веса связей между элементами являются переменными вещественными значениями. Узлы классифицируются как входные, выходные и скрытые.

Обучение рекуррентной нейронной сети (К№Ы) аналогично обучению обычной нейронной сети, но с некоторыми небольшими изменениями. Для обучения RNN также используется алгоритм обратного распространения ошибки, но с некоторыми адаптациями.

Рис. 7. Развернутое представление RNN

Рекуррентные нейронные сети продемонстрировали большой успех во многих задачах связанных с КЬР. Также нужно упомянуть, что наиболее часто используемым типом RNN являются LSTM, которые намного лучше захватывают (хранят) долгосрочные зависимости, чем RNN.

Вот несколько сфер, где применяются рекуррентные нейронные сети:

языковое моделирование и генерация текстов;

машинный перевод;

распознавание речи;

генерация описания изображений.

Проблемы и вызовы в области компьютерного зрения. Одной из основных проблем в области компьютерного зрения является достижение высокой точности и надежности алгоритмов. Несмотря на значительные про-грессы, некоторые сложные задачи, такие как точное распознавание и классификация объектов, всё ещё представляют сложности для алгоритмов компьютерного зрения. Возникают проблемы с неправильной классификацией, что приводит к неправильному распознаванию лиц и может привести к неправильным выводам, ошибкам обнаружения или ложным срабатываниям. Работа над исправлениями данных проблем ведется каждый день и остается актуальной задачей.

Ещё одной значимой проблемой является обработка больших объемов данных в компьютерном зрении. Современные алгоритмы компьютерного зрения требуют больших вычислительных ресурсов и времени для анализа и обработки больших объемов изображений или видеопотоков. Работа с такими объемами данных может быть сложной и требует разработки эффективных алгоритмов и инфраструктуры для обработки и хранения данных. Также существует опасность недостаточной защиты данных, если системы компьютерного зрения используются неправомерно.

Тенденции и будущее компьютерного зрения. Глубокое обучение и нейронные сети имеют большой потенциал в области компьютерного зрения. Они позволяют моделям обучаться на больших объемах данных и достигать высокой точности в распознавании и классификации объектов. В будущем ожидается развитие более сложных и эффективных алгоритмов глубокого обучения. Компьютерное зрение имеет потенциал для автоматизации и оптимизации различных процессов в различных отраслях. Например, в производстве и сборке компонентов, робототехнике, медицине и автомобильной отрасли. Системы компьютерного зрения могут распознавать объекты, контролировать качество продукции, определять расположение и позицию объектов, и тем самым значительно повышать эффективность.

Тенденции и будущее компьютерного зрения направлены на разработку более точных, надежных и эффективных алгоритмов, а также на применение в различных сферах жизни. Развитие глубокого обучения, использование компьютерного зрения в расширенной реальности и автоматизация процессов будут продолжать преобразовывать нашу жизнь и приводить к новым возможностям в различных областях

Выводы. В заключение, компьютерное зрение является важной и быстро развивающейся областью, которая имеет широкий спектр применений. От робототехники и автомобильной промышленности до безопасности и видеонаблюдения, компьютерное зрение играет ключевую роль в решении сложных задач распознавания, классификации и анализа визуальной информации. Однако, существуют проблемы и вызовы, такие как точность алгоритмов, обработка больших объемов данных, недостаток размеченных данных и этические вопросы. Эти проблемы требуют дальнейших исследований, инноваций и строгого соблюдения этических стандартов.

Нейронные сети позволяют достигнуть высокой точности в классификации и определении местоположения объектов на изображении. Существуют различные библиотеки для CV, такие как OpenCV и TensorFlow. Методы машинного обучения в компьютерном зрении, включая сверточные нейронные сети и рекуррентные нейронные сети, имеют широкий спектр применения. Сверточные нейронные сети особенно эффективны в обработке изображений и видео, позволяя распознавать объекты и образы. Рекуррентные нейронные сети применяются в задачах NLP, таких как языковое моделирование, машинный перевод, распознавание речи и генерация описания изображений.

С учетом этих тенденций и развития, компьютерное зрение будет продолжать преобразовывать нашу жизнь и предоставлять новые возможности для улучшения различных сфер деятельности, от повышения безопасности до оптимизации производственных процессов.

Список литературы

1. Оптимальная идентификация объектов в задачах распознавания необитаемыми подводными аппаратами / А. П. Нырков, С. С. Соколов, О. М. Алимов [и др.] // Проблемы информационной безопасности. Компьютерные системы. 2020. № 2. С. 58-64. EDN OWQLTH.

2. Компьютерное зрение. [Электронный ресурс] URL: https://rdc.grfc.ru/2021/04/analytics-computer-vision (дата обращения: 10.05.2023).

3. CNN [Электронный ресурс] URL: http://arduino.zl3p.com/robots/NN CNN (дата обращения: 10.05.2023).

4. Обработка изображения. [Электронный ресурс] URL: https://hub.exponenta.ru/post/kratkiy-kurs-teorii-obrabotki-izobrazheniy734 (дата обращения: 10.05.2023).

5. Жиленков А.А. Применение технологий искусственного интеллекта в автоматизации контроля и управления в системах активных фазированных решеток для геоинформационного комплекса / А. А. Жиленков, С. Г. Черный // Оборонный комплекс - научно-техническому прогрессу России. 2020. № 2(146). С. 57-63. EDN VNGRYA.

6. Кутахов В.П. Управление групповым поведением беспилотных летательных аппаратов: постановка задачи применения технологий искусственного интеллекта / В.П. Кутахов, Р.В. Мещеряков // Проблемы управления. 2022. № 1. С. 67-74. DOI 10.25728/pu.2022.1.5. EDN JLXUXI.

7. Жиленков А.А. Защита информации в мультиагентных системах на базе динамического хаоса / А. А. Жиленков, А. В. Воронова, С. Г. Черный // Системы управления и обработки информации. 2021. № 3(54). С. 40-52. EDN UUWQNE.

8. Dang B. Finite precision modeling of radar digital chaotic systems with dynamical properties analysis / B. Dang, A. Zhilenkov // AIP Conference Proceedings, Tamil Nadu, 27-28 сентября 2018 года. Vol. 2034. Tamil Nadu: American Institute of Physics Inc., 2018. P. 020007. DOI 10.1063/1.5067350. EDN VHLXLU.

Счетчиков Юрий Андреевич, бакалавр, yura.schetchkov@mail.ru, Россия, Санкт-Петербург, Санкт-Петербургский Государственный Морской Технический Университет,

Кайнова Татьяна Денисовна, магистрант, kainova. td @mail. ru, Россия, Санкт-Петербург, Санкт-Петербургский Государственный Морской Технический Университет,

Чупаков Максим Викторов, канд. техн. наук, доцент, maxim.vor2012@yandex.ru, Россия, Севастополь, Черноморское высшее военно-морское училище имени П.С. Нахимова,

Демидова Кристина Анатольевна, магистрант, demidovakristina@gmail.com, Россия, Санкт-Петербург, Санкт-Петербургский Государственный Морской Технический Университет

OVERVIEW OF THE TARGET RECOGNITION SYSTEM WITH COMPUTER VISION TECHNOLOGY Yu.A. Schetchikov, T.D. Kainova, M.V. Chupakov, K.A. Demidova

This article presents an overview of computer vision systems, describing their key tasks, such as classification, localization, detection and segmentation of objects in images. The text also discusses neural networks, convolution of neural networks and their application in computer vision. The main stages of working with images, including acquisition, processing and analysis, are described. The description of two libraries for computer vision is given. Also in the article there is a small paragraph about convolutional neural networks. The process of classifying objects in an image and the machine learning methods used for this, such as supervised learning and unsupervised learning, are described in more detail.

Key words: computer vision, neural network, image, algorithms, convolution.

Counters Yuri Andreevich, bachelor, yura.schetchkov@mail.ru, Russia, Saint Petersburg, Saint Petersburg State Maritime Technical University,

Kainova Tatiana Denisovna, master's, kainova.td@mail.ru, Russia, Saint Petersburg, Saint Petersburg State Marine Technical University,

Shchupakov Maxim Viktorov, candidate of technical sciences, docent, maxim.vor2012@yandex.ru, Russia, Sevastopol, Black Sea Higher Naval School named after P.S. Nakhimov,

Demidova Kristina Anatolyevna, master's, demidovakristina@gmail.com , Russia, Saint Petersburg, Saint Petersburg State Maritime Technical University

УДК 629.052.6

DOI: 10.24412/2071-6168-2023-7-632-633

МЕТОДИКА РАСЧЕТА ЗАКОНА ИЗМЕНЕНИЯ НАВИГАЦИОННОГО ПАРАМЕТРА

П.В. Васильев, М.Т. Стадник

Наличие вынужденных случайных колебаний корпуса управляемого космического объекта при срабатывании двигателей управления может оказывать существенное влияние на точность измерений оптико-электронного координатора, жесткозакрепленного на корпусе. В результате система управления сближением космического объекта, управляемого в соответствии с методом пропорционального сближения, может не обеспечить прецизионного сближения и достижения требуемой вероятности попадания в область пространства заданного размера - требуемой вероятности сближения с объектом сближения. Для снижения «паразитного» влияния управления на точность измерений возможно применение в системе управления сближением метода пропорционального сближения с переменным навигационным параметром. Целью работы является разработка методики расчета закона изменения навигационного параметра для реализации метода пропорционального сближения с переменным навигационным параметром в условиях мешающего влияния управляющего воздействия на точность измерений бортового оптико-электронного координатора. Практическая значимость работы заключается разработке совокупности процедур точного и приближенного расчета закона изменения навигационного параметра с использованием итерационного метода Левенберга-Маркардта и метода дихотомии соответственно, обеспечивающих достижения требуемого значения вероятности сближения высокоскоростного управляемого космического объекта и объекта сближения.

Ключевые слова: метод пропорционального сближения, оптико-электронный координатор, система управления сближением, управляемый космический объект.

В управляемых космических объектах (УКО) с телевизионными или оптико-электронными координаторами (ОЭК) одной из особенностей функционирования систем управления сближения (СУС) на завершающем этапе, после устранения первоначального отклонения, в условиях установившегося режима функционирования при реализации классического метода пропорциональной навигации с постоянным параметром является наличие в СУС мешающего влияния управляющего воздействия [1]-[6] (далее для краткости «шум управления»). Это обусловленно, например, вынужденными случайными колебаниями корпуса управляемого объекта с установленным на нём ОЭК в диапазоне частот 100...2000 Гц [7] при срабатыванием двигательной установки, создающей поперечное управляющее ускорение.

i Надоели баннеры? Вы всегда можете отключить рекламу.