УДК 681.142
К ВОПРОСУ ПРИМЕНЕНИЯ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ В СИСТЕМАХ РАСПОЗНАВАНИЯ ОБЪЕКТОВ В БЕСПИЛОТНЫХ КОМПЛЕКСАХ
Н.С Акиншин, О.В.Есиков, Ю.В.Чебурков, А.В.Петешов, Н.А.Денисова
Показано, что одной из актуальных задач в области построения беспилотных систем является построение системы распознавания образов. Приводится общая формулировка задачи распознавания. Предложено в беспилотных комплексах систему распознавания строить по многоканальному принципу с использованием технологии искусственных нейронных сетей. В качестве дополнительного признака классификации объектов предложено использовать фрактальную размерность контуров изображений объектов. Для оценки фрактальной размерности контуров объектов предложено применение клеточного алгоритма на основе использования размерности Мин-ковского. В качестве решающего правила в многоканальной системе распознавания предложено использовать искусственную нейронную сеть типа автоэнкодер. Представлены результаты экспериментальной проверки работоспособности предлагаемых методов и алгоритмов.
Ключевые слова: система распознавания, искусственные нейронные сети, фрактальный анализ, фрактальная размерность, беспилотные комплексы
В настоящее время наблюдается взрывное развитие технологий в области беспилотных транспортных средств. Лидерами в данной области время являются фирмы Toyota, Google, Uber, DJI, Boeing, Northrop Grumman и др., в нашей стране определенный задел в данной области имеют Яндекс, ПАО «Камаз», группа «Кронштадт» и др.). Подобное положение определяет высокую динамику роста рынка беспилотных средств.
В авиационной области в стоимостном выражении беспилотные аппараты гражданского назначения составляют 47% от общего объема. При этом в количественном отношении 84% беспилотные летательные аппараты (БПЛА) составляют потребительские аппараты [1]. Прогноз объема НИОКР на БПЛА по странам мира до 2020 года представлен на рис.1[2].
Рис. 1. Прогноз объема на НИОКР в области БПЛА до 2020 г
330
В автомобильной отрасли, по прогнозам [2], рынок продаж самоуправляемых автомобилей вырастет с 330 тыс. автомобилей в 2017 году до 30.4 млн. автомобилей к 2035 году, а в стоимостном выражении с 13.65 млрд. долларов до 364.8 млрд.
К настоящему времени наиболее актуальными задачами, решаемыми беспилотными системами, являются следующие [1,2]:
1. Оценка и мониторинг экологической обстановки.
2. Мониторинг развития стихийных бедствий (наводнения, пожары, техногенные катастрофы и др.).
3. Оценка состояния объектов контроля (газотранспортные системы, системы передачи электроэнергии и др.).
4. Поиск потерпевших крушение объектов (спасательные операции).
5. Оценка дорожной ситуации и др.
Реализация указанных задач неразрывно связана с обеспечением автономного функционирования беспилотных систем [3], что в свою очередь приводит к необходимости решения задач распознавания в различных направлениях [4], от качества которого зависит общая их эффективность.
В общем случае процесс распознавания состоит в том [3-6], что система распознавания на основе сопоставления апостериорной информации об объекте поступившей на вход системы, с априорным описанием классов принимает решение о принадлежности этого объекта (явления) к одному из классов. Правило, которое каждому объекту ставит в соответствие определенное наименование класса, называют решающим правилом [3,4].
В общем смысле, распознавание изображений представляет собой задачу преобразования входной информации, в выходную, представляющую собой заключение о том, к какому классу относится распознаваемый объект [1].
Общая постановка задачи распознавания объектов с обучением формулируется следующим образом [1].
На множестве объектов X задано конечное число подмножеств (классов)Х1, ... X«.
Имеется общая информация J0 о принадлежности к классам множества объектов X0 с X.
Требуется указать алгоритм А , определенный на множестве X, который на основании информации J0 для произвольного объекта х е X \ X0 вычисляет результат, который можно интерпретировать в терминах принадлежности х к классам X], ... , X«. Для представления начальной информации J0 в задаче распознавания объектов чаще всего применяют преце-дентнуюмодель (перечисление объектов с указанием их принадлежности к классам) и логическая (через предикаты, описывающие объекты и классы).
Для повышения достоверности распознавания объектов могут использоваться априорная информация и дополнительные характеристики объектов, получаемые в ходе обработки данных, поступающих от различных источников (рис.2). В случае множественности источников и вида
331
входной информации система распознавания строится по принципу много-канальности. Для выше перечисленных беспилотных комплексов в качестве входной информации наиболее часто применяются изображения объектов, поступающие в оптическом, инфракрасном, радиолокационном диапазонах.
Каждый вид изображения поступает на предварительную обработку перед поступлением на вход системы распознавания (например, на вход соответствующей искусственной нейронной сети (ИНС)). В качестве дополнительного признака, характеризующего объект в системе распознавания перспективным, является использование результатов фрактального анализа его изображения, например, оценки фрактальной размерности. Результаты распознавания каждого вида изображений совместно с априорной информацией и результатом оценки фрактальной размерности объектов поступают на вход решающего правила. Такой вариант построения системы построения позволит обеспечить надежное распознавание объектов независимо от условий, в которых получены изображения.
Рис. 2. Схема функционирования многоканальной системы распознавания
Таким образом, для реализации многоканальной системы распознавания объектов необходимо решение следующих задач.
1. Обработка изображений.
2. Применение искусственной нейронной сети для решения задачи распознавания объектов изображений.
3. Разработка алгоритма определения фрактальной размерности изображений объектов.
4. Построение решающего правила.
Для оценки фрактальной размерности изображений наиболее часто используют алгоритмы на основе использования размерности Минковско-го[4,7], под которой понимают один из способов задания фрактальной размерности ограниченного множества в метрическом пространстве. В этом случае фрактальная размерность определяется следующим образом:
D = lim log N(e), (1)
e®0 - log e
где N(e) - минимальное число множеств диаметра е, которыми можно покрыть исходное множество.
В качестве решающего правила экспериментально проверено применение ИНС типа автоэнкодер [8], структура которого представлена на рис. 3. Число нейронов во входном и выходном слой автоэкодера одинаковое и соответствует числу выходов основной ИНС (количеству классифицируемых объектов). Количество нейронов в скрытом слое автоэнкодера меньше соответствующего числа нейронов во входном и выходном слое, что обеспечивает реализацию свойства обобщения. То есть
N1 = N3; N2 < N1.
Рис.3. Структура искусственной нейронной сети типа автоэнкодер
На вход основной ИНС поступает вектор X1, размерностью соответствующий разрешению изображения объекта. На выходе данной ИНС -вектор У(п), содержащий результат решения сетью задачи классификации, размерностью равной числу объектов, на которые обучена ИНС.
2
На вход автоэнкодера поступает вектор параметров X (п +1), где первые п элементов соответствуют выходам ИНС (вектор У(п)), а п+1 элемент - значению фрактальной размерности контура изображения объекта, поступающего на вход ИНС.
При экспериментальной проверке эффективности применения ИНС для решения рассматриваемых задач распознавания использовались обучающие выборки для объектов как наземного, так и воздушного транспорта. Пример фрагмента обучающей выборки для объекта воздушного транспорта представлен на рис. 4.
********
Рис.4. Фрагмент обучающей выборки для объекта воздушного транспорта
333
Для применения значений фрактальной размерности контуров изображений объектов в качестве дополнительного признака классификации выполнены расчеты значений фрактальной размерности контуров объектов, примеры которых представлены втаблице и на рис. 5 и 6 [4].
Результаты расчета фрактальной размерности объектов
авиационной техники
№ п/п Наименование Изображение Фрактальная размерность
1 Boing 777 1.151
2 Ил-96-300 1.050
3 МС-21 Ч4 0.964
4 Ми-17 1.187
Рис. 5. Примеры контуров изображений объекта колесной техники УАЗ-469, полученных на основе использования элементов обучающей
выборки ИНС
Контура изображений объектов получены с применением методов обработки изображений приведенных и оцененных в [9]. Полученная в результате расчетов диаграмма фрактальной размерности контуров объекта (рис.5) представлена на рис. 6.
Рис. 6. Диаграмма фрактальной размерности для объекта Уаз-469
334
При экспериментальной проверке в качестве основой ИНС использовалась сеть прямого распространения сигнала типа персептрон с сигмо-идной функцией активации нейронов [5,6]. Для обучающей выборки на 17 объектов наземного транспорта, каждый из которых представлен 22 экземплярами, данная ИНС имела следующую структуру: три слоя с количеством нейронов в слоях соответственно 25, 14, 17. Автоэнкодер,для данного варианта построения основной ИНС, представляет трехслойную сеть с количеством нейронов по слоям соответственно 17,10,17.
Для обучения основной ИНС и автоэнкодера применялся алгоритм обратного распространения ошибки [5]. Графики изменения значений функции ошибки при обучении нейронных сетей представлены на рис.7.
Из рис.7 видно, что при наличии обучающей выборки надлежащего качества [6], применение алгоритма обратного распространения ошибки позволяет за ограниченное число ее предъявлений (за ограниченное время) настроить применяемые искусственные нейронные сети до требуемого уровня функции ошибки.
а
б
Рис. 7. Зависимости значения функции ошибки E от числа предъявлений обучающей выборки K при обучении искусственной нейронной сети:а) основная ИНС, значение среднеквадратической ошибки для каждого экземпляра объекта не более 0.003, время обучения
29м. 2 с. *; б) автоэкодер, значение среднеквадратической ошибки для каждого экземпляра объекта не более 0.0003, время обучения 28 с. *
* Обучение сети выполнялось на вычислительном комплексе со следующимихарактеристиками: процессор IntelCorei5-7300HQ 2.50 ГГц, ОЗУ 8ГБ, операционная система MSWindows 10 HE
Результаты применения представленных ИНС для распознавания изображений, не входящих в обучающую выборку, показали, что применение в качестве решающего правила автоэнкодера обеспечивает в большинстве случаев (в 15 из 17, для полученных результатов), при использовании фрактальной размерности контуров изображений объектов в качестве дополнительного признака классификации, повышение качества распознавания на величину 2-15 %. Так для объекта «УАЗ-469» значения выходов
335
нейронов соответствующих объекту классификации для изображения с фрактальной размерностью контура 1.084 составили: для основной ИНС 0.88, для автоэнкодера 0.91. При этом значение выхода, нейрона ближайшего по результату к правильному не превышало для всех объектов 0.33.
Данные обстоятельства, с учетом невысокой вычислительной сложности алгоритмов обучения и функционирования представленных ИНС, свидетельствует о целесообразности их практического применения для решения практических задач в системах распознавания беспилотных систем.
Список литературы
1. Шут О.В. Метод решения задач распознавания на основе логической и прецедентной моделей // Информатика, 2012. №3. С. 35-50.
2. Официальный сайт ресурса json.tv [Электронный ресурс] URL: www.ison.tv (дата обращения: 10.03.2019).
3. Ларкин Е.В. Моделирование процесса дистанционного управления роботом // Известия Тульского государственного университета. Технические науки, 2016. Вып. 12. Ч. 4. С. 202-208
4. Есиков О.В., Нехаев И.В., Чернышков А.И. Оценка эффективности применения фрактальной размерности изображений контуров объектов для формирования дополнительной их характеристики в многоканальных системах распознавания образов // Труды Российского научно-технического общества радиотехники, электроники и связи им.А.С.Попова. Серия: научные сессии Тульской областной организации. Выпуск XXXVI, 2019. С. 185-191.
5. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы; пер. с пол. Рудинского И. Д. М.: Горячая линия-Телеком, 2004. 383 с.
6. Есиков О.В., Мамон Ю.И., Акиншин Р.Н., Затучный Д.А., Феоктистова О.Г. Применение искусственных нейронных сетей для распознавания объектов на графических изображениях // Вестник Санкт-Петербургского государственного университета гражданской авиации; под ред. М.Ю. Смурова. С. Петербург: СПбГУГА, 2017. №1(14). С. 131-141.
7. Потапов А. А. Фракталы в дистанционном зондировании // Зарубежная радиоэлектроника. Успехи современной радиоэлектроники. 2000. №6. С. 3-65.
8. Bourland Herve, Yves Kamp. Auto-association by multilayer perceptions and singular value decomposition/ Biological cybernetics, 1988. 59.4-5. P. 291-294.
9. Есиков О.В., Сухарев Е.М., Алтухов А.В., Тарасов Е.А. Оценка эффективности методов и алгоритмов обработки графической информаци-ии распознавания объектов мониторинга. Наукоемкие технологии, 2011. №4. С. 54-61.
Акиншин Николай Степанович, д-р техн. наук, профессор, начальник отдела, cdhaeacdhae.ru, Россия, Тула, АО ЦКБА,
Есиков Олег Витальевич, д-р техн. наук, профессор, главный специалист, cdhaeacdhae.ru, Россия, Тула, АО ЦКБА,
Чебурков Юрий Викторович, преподаватель, niriopaiia mail.ru, Россия, Пенза, Филиал Военной академии материально-технического обеспечения,
Петешов Андрей Викторович, канд. техн. наук, доцент, начальник кафедры, D-johnposta mail.ru, Россия, Череповец, Череповецкое высшее военное инженерное училище радиоэлектроники,
Денисова Наталья Александровна, студентка, den.natasha2014a yandex.ru, Россия, Тула, Тульский государственный университет
TO THE QUESTION OF APPLICATION OF ARTIFICIAL NEURAL NETWORKS IN SYSTEMS OF RECOGNITION OF OBJECTS IN UNMANNED COMPLEXES
N.S. Akinshin, O.V. Esikov, Yu.V. Chehurkov, A.V. Peteshov, N.A. Denisova
It is shown that one of the urgent tasks in the field of building unmanned systems is to huild a pattern recognition system. The general formulation of the recognition problem is given. It is proposed in unmanned systems to huild a recognition system according to the multichannel principle using the technology of artificial neural networks. It is proposed to use the fractal dimension of the contours of images of ohjects as an additional sign of the classification of ohjects. To assess the fractal dimension of the contours of ohjects, the use of a cellular algorithm hased on the use of the Minkowski dimension is proposed. It is proposed to use an artificial neural network such as an auto-encoder as a decisive rule in a multi-channel recognition system. The results of an experimental test of the operahility of the proposed methods and algorithms are presented.
Key words: recognition system, artificial neural networks, fractal analysis, fractal dimension, unmanned systems.
Akinshin Nikolay Stepanovich, doctor of technical sciences, professor, head of department, cdhaeacdhae. ru, Russia, Tula, JSC CDBAE,
Esikov Oleg Vitalyevich, doctor of technical sciences, professor, chief specialist, cdhaeacdhae. ru, Russia, Tula, JSC CDBAE,
Chehurkov Yury Viktorovich, teacher, niri-opaiia mail. ru, Russia, Penza, Penza artillery engineering Institute,
Peteshov Andrey Viktorovich, candidate of technical sciences, professor, head of the department, D-john postamail. ru,Russia, Cherepovets, Череповецкое высшее военное инженерное училище радиоэлектроники,
Denisova Natalya Aleksandrovna, student, den.natasha2014qyandex.ru, Russia, Tula, Tula State University