Научная статья на тему 'КЛАССИФИКАЦИЯ НАДВОДНЫХ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ ВИДИМОГО ОПТИЧЕСКОГО ДИАПАЗОНА'

КЛАССИФИКАЦИЯ НАДВОДНЫХ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ ВИДИМОГО ОПТИЧЕСКОГО ДИАПАЗОНА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
93
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАДВОДНЫЙ ОБЪЕКТ / НЕЙРОННАЯ СЕТЬ / ОПТИЧЕСКИЙ ДИАПАЗОН / БАЗА ДАННЫХ / SURFACE WATER OBJECT / NEURAL NETWORK / VISIBLE SPECTRUM / DATABASE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Артемьев А. А., Казачков Е. А., Матюгин С. Н., Шаронов В. В.

Рассмотрена задача классификации надводных объектов - судов и кораблей разных классов на изображениях видимого оптического диапазона с использованием сверточных нейронных сетей. Описана методика формирования базы данных изображений надводных объектов, создан специальный обучающий набор данных для классификации. Описана методика формирования и обучения сверточной нейронной сети. Исследована зависимость вероятностей правильного распознавания от числа и вариантов выбора конкретных классов надводных объектов. Приведены результаты распознавания для различных наборов классов.This paper considers the problem of classifying surface water objects, e.g. ships of different classes, in visible spectrum images using convolutional neural networks. A technique for forming a database of images of surface water objects and a special training dataset for creating a classification are presented. A method for forming and training of a convolutional neural network is described. The dependence of the probability of correct recognition on the number and variants of the selection of specific classes of surface water objects is analysed. The results of recognizing different sets of classes are presented.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Артемьев А. А., Казачков Е. А., Матюгин С. Н., Шаронов В. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «КЛАССИФИКАЦИЯ НАДВОДНЫХ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ ВИДИМОГО ОПТИЧЕСКОГО ДИАПАЗОНА»

https://doi.org/10.38013/2542-0542-2020-1-87-95 УДК 004.932

Классификация надводных объектов на изображениях видимого оптического диапазона

А. А. Артемьев, Е. А. Казачков, С. Н. Матюгин, В. В. Шаронов

Акционерное общество «Федеральный научно-производственный центр "Нижегородский научно-исследовательский институт радиотехники"», Нижний Новгород, Российская Федерация

Рассмотрена задача классификации надводных объектов - судов и кораблей разных классов на изображениях видимого оптического диапазона с использованием сверточных нейронных сетей. Описана методика формирования базы данных изображений надводных объектов, создан специальный обучающий набор данных для классификации. Описана методика формирования и обучения сверточной нейронной сети. Исследована зависимость вероятностей правильного распознавания от числа и вариантов выбора конкретных классов надводных объектов. Приведены результаты распознавания для различных наборов классов.

Ключевые слова: надводный объект, нейронная сеть, оптический диапазон, база данных

Для цитирования: Артемьев А. А., Казачков Е. А., Матюгин С. Н., Шаронов В. В. Классификация надводных объектов на изображениях видимого оптического диапазона // Вестник Концерна ВКО «Алмаз -Антей». 2020. № 1. С. 87-95. https://doi.org/10.38013/2542-0542-2020-1-87-95

For citation: Artemyev A. A., Kazachkov E. A., Matyugin S. N., Sharonov V. V. Classification of surface water objects in visible spectrum images // Vestnik Koncerna VKO "Almaz - Antey". 2020. No. 1. P. 87-95. https://doi.org/10.38013/2542-0542-2020-1-87-95

Поступила 10.12.2019 Одобрена 10.02.2020 Опубликована 21.05.2020

Введение

В работе исследуются алгоритмы классификации надводных объектов (НО) - судов и кораблей разных классов на изображениях видимого оптического диапазона с использованием сверточных нейронных сетей (СНС).

Традиционные подходы при разработке алгоритмов классификации сводятся к выбору формального описания объектов, построению базы данных (БД) с наиболее характерными описаниями (эталонными векторами признаков) для каждого класса и дальнейшим сопоставлением векторов признаков объектов с БД эталоном. В случае НО в качестве векторов признаков в различных работах использовались силуэты судов [1], наборы характерных точек объектов, а в качестве изображений рассматривались оптические [2], инфракрасные [3] и радиолокационные [4] изображения. Необходимо отме-

© Артемьев А. А., Казачков Е. А., Матюгин С. Н., Шаронов В. В., 2020

тить, что формирование БД эталонов (векторов признаков) является самой трудоемкой частью таких подходов и требует экспертных знаний от разработчиков системы распознавания.

Одним из наиболее активно развивающихся подходов в области распознавания в последнее время является применение нейронных сетей, в частности различных моделей СНС, например для распознавания наземных объектов на радиолокационных изображениях [5]. По сравнению с традиционными подходами для СНС не требуется экспертное построение формальных описаний объектов -используются непосредственно изображения объектов и для распознавания не нужна БД эталонных векторов признаков - знание о классах находится непосредственно в параметрах обученной СНС. Кроме этого, СНС достаточно устойчивы к зашумлению обрабатываемых я изображений. Для обучения СНС требуется значительный набор изображений объектов каждого класса.

В настоящее время есть некоторое количество работ по распознаванию НО на спутниковых радиолокационных изображениях с использованием СНС, например [4]. Для оптических изображений таких работ существенно меньше, что связано в первую очередь с отсутствием качественного доступного набора изображений НО. Можно отметить работу [6], в которой рассматривается распознавание объектов из набора данных VAIS [7]. В этих данных присутствует ограниченный набор классов с изображениями низкого качества в видимом и инфракрасном диапазоне. При этом не рассмотрены зависимости вероятностей правильного распознавания от выбора классов объектов. Поэтому исследование возможностей распознавания НО на оптических изображениях и оценки вероятностей правильного распознавания в зависимости от типов и количества выбранных классов являются актуальными.

1. Методика формирования обучающего набора данных

Как известно, одной из основных задач применения классификаторов, основанных на ней-росетевых методах, является создание обучающего набора данных достаточного объема, который может составлять десятки тысяч объектов, разбитых на классы.

В настоящее время альтернативой созданию обучающего набора данных является использование одного из общедоступных наборов изображений, таких как VAIS [7], MSTAR [8] и др. Однако подобные наборы существуют не для всех задач, либо такие данные не подходят по условиям съемки, или их оказывается недостаточно для решения конкретной задачи.

В рамках данной работы был создан обучающий набор данных для классификации НО. В качестве данных использовались изображения 5 классов судов и 5 классов кораблей, примеры которых приведены на рисунке 1.

о сч о сч

ш н

х

<

1

M

га

2 Ц

< о

ы m

га х о. ш

X

о

I-

о

Я)

m

сч

ю о

сч

ю сч

(О (О

Классы судов

Контейнеровозы

ш -"Г- х

Яхты

Классы кораблей

Корветы

Рис. 1. Примеры надводных объектов

В задаче классификации алгоритм предсказывает классы (их метки), к которым принадлежат НО. Соответственно, для обучения нейросетевого классификатора требуется набор размеченных данных. Качество алгоритма оценивается тем, насколько точно он может классифицировать новые (не участвовавшие в обучении) изображения НО.

Для обучения по имеющимся в открытом доступе оптическим изображениям НО был сформирован общий набор данных (ОНД) для 10 классов объектов, представленных на рисунке 1, с соответствующими метками. Набор содержит 7800 изображений гражданских судов и кораблей (780 изображений на каждый класс). Имеющиеся изображения были разбиты на тренировочный (680 изображений на класс) и проверочный (100 изображений на класс) наборы. Каждое изображение представлено в градациях серого, тип изображений JPEG. Изначально обработка проводилась на изображениях формата RGB, но в дальнейшем пришлось отказаться от данного типа изображений из-за больших вычислительных затрат по сравнению с обработкой изображений в градациях серого. Также для сокращения времени обучения нейронной сети все изображения в обучающем наборе данных были приведены к одному размеру 32*32 пикселя. Выбор единого размера был обусловлен имеющимися изображениями, часть которых имела размеры менее 64 пикселей по одному из измерений. Эксперименты с размерами изображений показали, что точность классификации при увеличении размеров до 64*64 и 128*128 пикселей возрастает незначительно при существенном увеличении вычислительных ресурсов для обучения СНС.

Как известно, для достижения высоких результатов глубокие нейронные сети должны обучаться на больших объемах данных. Если исходный обучающий набор содержал ограниченное количество изображений, как в нашем случае, то для увеличения набора данных выполнялась операция аугментации. Аугментация данных [9] - это методика создания дополнительных обучающих данных из имеющегося набора, в процессе которой изображения подвергаются различным преобразованиям: параллельному переносу по вертикали и горизонтали, масштабированию, повороту, отражению относительно горизонтальной и вертикальной осей, перестановке каналов изображения. Применялись различные комбинации преобразований, например поворот и случайное масштабирование, вариации величины насыщенности и значения всех пикселей.

Для построения нейросетевого классификатора и проведения экспериментов по обучению СНС на основе ОНД были сформированы отдельные наборы данных (базы данных) для обучения, содержащие разное количество классов объектов (табл. 1). Отметим, что при построении алгоритма распознавания классы кораблей «Эсминец» и «Фрегат» были объединены в один общий класс, так как данные НО имели структуры, трудно различимые между собой.

2. Алгоритм классификации

В качестве инструментов классификации НО были применены методы и алгоритмы СНС. Методика применения СНС для распознавания объектов на изображениях описана в предыдущих работах авторов [10, 11].

Впервые подобная структура искусственной нейронной сети была предложена

Таблица 1

Отдельные наборы данных для обучения

Наименование базы данных для обучения Классы объектов, входящих в состав базы данных

БД-1 Авианосец, Десантный корабль, Эсминец и фрегат, Катер, Корвет, Контейнеровоз, Рыболовное судно, Пассажирское судно, Танкер, Яхта

БД-2 Авианосец, Эсминец и фрегат, Корвет, Контейнеровоз, Рыболовное судно, Пассажирское судно, Танкер, Яхта

БД-3 Авианосец, Десантный корабль, Эсминец и фрегат, Катер, Корвет

БД-4 Контейнеровоз, Рыболовное судно, Пассажирское судно, Танкер, Яхта

БД-5 Авианосец, Эсминец и фрегат

те

m

s ф

о cv о cv

< i

со го

О ^

СО те г о. ф

£

о

V

со

сч ■ci-io

с?

сч ■ci-io сч

(П (П

французским ученым в области информатики Яном Лекуном в 1988 г. [12] и была специально нацелена на распознавание изображений.

Название архитектура сети получила из-за наличия сверточного слоя (операции свертки). Работу СНС можно интерпретировать как переход от конкретных особенностей изображения к более абстрактным деталям и далее к еще более абстрактным вплоть до выделения понятий высокого уровня. При обучении СНС самонастраивается и вырабатывает необходимую иерархию признаков, фильтруя маловажные детали и выделяя существенное.

Итоговая СНС представляет собой последовательность из 18 блоков. Каждый блок содержит сверточный слой и слой субдискретизации. Сверточный слой состоит из набора карт (карты признаков), у каждой карты есть сканирующее ядро или фильтр (ядро операции свертки). Количество карт определяется подбором в процессе обучения модели. Ядро представляет собой фильтр или окно с фиксированным размером, которое скользит по всей области предыдущей карты и находит определенные признаки объектов. Размер ядра обычно берут в пределах от 3*3 до 7*7 пикселей. Размер ядра в основном выбирается экспериментальным путем. Если размер слишком мал, то существует вероятность потери каких-либо важных признаков, а если слишком большой, то увеличивается количество связей между нейронами, что увеличит вычислительную сложность и время обработки. Также размер ядра выбирается таким образом, чтобы размер карт сверточного слоя был четным, это позволяет не терять информацию при уменьшении размерности в слое субдискретизации. Значения элементов ядра свертки подбираются автоматически в процессе обучения нейронной сети. Слой субдискретизации, как и сверточный, имеет карты. Целью слоя является уменьшение размерности карт признаков предыдущего слоя. Если на предыдущей операции свертки уже были выявлены некоторые признаки, то для дальнейшей обработки настолько подробное изображение уже не нужно, и оно уплотняется до менее подробного изображения. К тому же фильтрация уже ненужных деталей помогает

нейронной сети не переобучаться. Например, если карта слоя имеет ядро размером 2*2, то это позволит уменьшить предыдущие карты признаков сверточного слоя в 2 раза. Вся карта признаков в этом случае разделяется на ячейки размером 2*2, из которых выбираются максимальные по значению. Данная операция называется MaxPooling - выбор максимального.

Для повышения производительности и стабилизации работы нейронной сети в используемой модели применяется метод пакетной нормализации (англ. batch-normalization). Суть данного метода заключается в том, что некоторым слоям нейронной сети на вход подаются данные, предварительно обработанные и имеющие нулевое математическое ожидание и единичную дисперсию. Впервые данный метод был представлен в [13].

Известно, что глубокие сети извлекают низко-, средне- и высокоуровневые признаки сквозным многослойным способом, а увеличение количества слоев или блоков, состоящих из нескольких слоев, как в нашем случае, может обогатить уровни признаков. Однако с увеличением глубины сети обучение становится нестабильным, а достигаемая точность начинает уменьшаться (деградировать).

Чтобы преодолеть эту проблему, была использована архитектура связей между слоями, применяемая в сети ResNet [14]. Большинство нейронных сетей для обучения используют метод обратного распространения ошибки [15, 16], основанный на правиле коррекции по ошибке, который был разработан как метод обучения многослойного персептрона. Основная идея метода состоит в распространении сигналов ошибки после ее вычисления на выходе сети в направлении, обратном прямому распространению сигналов во время обычного вычислительного процесса, от выходов сети к ее входам. При обратном проходе веса настраиваются с целью минимизации ошибки.

При проходе обучающего примера и получении выхода с целью уменьшения функции ошибки начинается обратный проход сети методом градиентного спуска. При увеличении глубины нейронной сети

X

Рис. 2. Остаточный блок архитектуры ResNet

одна из самых частых проблем - это затухание градиента при обратном проходе и, как следствие, ухудшение работы нейронной сети. В частности, затухание градиента и потеря информации чаще всего случаются из-за использования слоя ReLu с функцией активации f = max(x,0). Во многих случаях при отсеивании ненужных признаков как раз и получается значение 0, что и способствует затуханию градиента.

В основе архитектуры ResNet [14] лежит так называемый остаточный блок (residual block), схема которого изображена на рисунке 2. Отсюда и название архитектуры Residual Network (остаточная нейронная сеть).

Работа данного блока заключается в следующем: пусть целевая функция будет в виде H(x) = F(x) + x. При достигнутом пределе качества на предыдущем слое, для того чтобы не происходило затухание градиента, хотелось бы, чтобы функция F(x) возвращала тождественное преобразование, однако этого не происходит, так как используется слой ReLU и часто она возвращает 0. В данной сети предлагают использовать так называемые быстрые соединения, то есть

явно добавляется тождественное отображение. В итоге при обратном проходе в методе обратного распространения ошибки получаем: dF(x)/dx+l. Таким образом, затухания градиента не произойдет, так как всегда будет выполнен обратный проход.

Использование архитектуры ResNet позволило обучать нейросеть с глубиной в 18 слоев (против трехслойной сети, использованной на начальных стадиях работы) с достижением приемлемых результатов распознавания одновременно для 10 классов при небольшом количестве изображений в обучающем наборе.

Для принятия окончательного решения о классе анализируемого изображения использовался слой SoftMax c количеством выходов, соответствующим числу рассматриваемых классов. За результирующий класс принимался тот, который соответствовал выходу СНС с максимальным откликом.

Одним из возможных способов учесть возможные неизвестные классы и пустые фоновые изображения является введение порога отклика на выходном слое СНС и трактовка случая «максимальный отклик < порог» как «не распознано». Корректное рассмотрение таких случаев требует дальнейшего расширения набора данных и выходит за рамки данной статьи.

3. Результаты

Для каждой из баз данных в таблице 1 проводилось отдельное обучение. В каждом случае использовалась одна и та же архитектура сети - ResNet с 18 слоями. Также в каждом случае использовалось 200 эпох обучения и ранняя остановка - прекращение обучения, если точность распознавания не улучшалась на протяжении нескольких эпох. Во всех случаях обучение завершалось с ранней остановкой, таким образом, количество эпох для обучения было достаточным. Количество обучающих образцов, обрабатываемых одновременно за одну итерацию алгоритма обучения (batch size), составляло 20. Далее приведены достигнутые вероятности правильного распознавания для всех рассмотренных случаев. Результаты приведены в таблицах 2-7.

те

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

те

s

V

3.1. Результаты обучения с использованием БД-1 - классификация по 10 классам НО (табл. 2).

Таблица 2

Результаты обучения с использованием БД-1 - классификация по 10 классам НО

Класс

10 классов Авианосец Десантный корабль Эсминец, фрегат Катер Корвет Контейнеровоз Рыболовное судно Пассажирское судно Танкер Яхта

Авианосцы 62 7 11 7 0 2 0 3 2 6

Десантные корабли 26 37 21 4 4 0 0 4 4 0

Эсминцы и фрегаты 7 5 61 13 9 0 0 0 4 1

3 Катера 3 17 10 51 4 2 0 6 0 7

ё е Корветы 0 0 0 0 100 0 0 0 0 0

^ ю Контейнеровозы 1 3 0 2 0 73 2 0 15 4

О Рыболовные суда 2 0 0 1 0 6 74 6 6 5

Пассажирские суда 5 4 11 3 1 5 0 57 5 9

Танкеры 1 1 0 2 0 4 2 4 82 4

Яхты 1 0 3 1 0 2 0 7 2 84

Правильно распознанных изображений 681 из 1000 (ВПР = 0,681)

3.2. Результаты обучения с использованием БД-2 - классификация по 8 классам НО (табл. 3).

Таблица 3

Результаты обучения с использованием БД-2 - классификация по 8 классам НО

Класс

8 классов Авианосец Эсминец, фрегат Корвет Контейнеровоз Рыболовное судно Пассажирское судно Танкер Яхта

Авианосцы 85 2 2 1 0 2 0 8

Эсминцы и фрегаты 4 82 4 0 0 1 0 9

3 Корветы 0 14 81 0 0 0 0 5

ё е Контейнеровозы 1 0 0 77 1 4 13 4

^ ю Рыболовные суда 1 4 0 6 54 3 18 14

О Пассажирские суда 7 10 0 3 1 56 1 22

Танкеры 1 2 0 12 1 3 73 8

Яхты 3 2 0 2 3 5 1 84

Правильно распознанных изображений 592 из 800 (ВПР = 0,740)

3.3. Результаты обучения с использованием БД-3 - классификация по 5 классам кораблей (табл. 4).

Таблица 4

Результаты обучения с использованием БД-3 - классификация по 5 классам кораблей

5 классов военных кораблей Класс

Авианосец Десантный корабль Эсминец, фрегат Катер Корвет

Объекты Авианосцы 58 5 22 9 6

Десантные корабли 10 33 39 4 14

Эсминцы и фрегаты 3 3 84 8 2

Катера 4 7 31 56 2

Корветы 0 0 2 0 98

Правильно распознанных изображений 329 из 500 (ВПР = 0,658)

3.4. Результаты обучения с использованием БД-4 - классификация по 5 классам надводных судов (табл. 5).

Таблица 5

Результаты обучения с использованием БД-4 - классификация по 5 классам надводных судов

5 классов гражданских судов Класс

Контейнеровоз Рыболовное судно Пассажирское судно Танкер Яхта

Объекты Контейнеровозы 66 5 5 19 5

Рыболовные суда 5 76 6 7 6

Пассажирские суда 4 1 88 1 6

Танкеры 5 2 9 80 4

Яхты 0 4 14 2 80

Правильно распознанных изображений 390 из 500 (ВПР = 0,780)

3.5. Результаты обучения с использованием БД-5 - классификация по 2 классам кораблей (табл. 6).

Таблица 6

Результаты обучения с использованием БД-5 - классификация по 2 классам кораблей

2 класса кораблей Класс

Авианосец Эсминец, фрегат

Объекты Авианосцы 97 3

Эсминцы и фрегаты 7 93

Правильно распознанных изображений 190 из 200 (ВПР = 0,950)

В таблице 7 приведены средние вероятности правильного распознавания в зависимости от числа классов НО.

Таблица 7

Средние вероятности правильного распознавания в зависимости от числа классов НО

БД-1 БД-2 БД-3 БД-4 БД-5

Число классов 10 8 5 5 2

Средняя вероятность правильного распознавания 0,68 0,74 0,66 0,78 0,95

При уменьшении числа классов ВПР, как и следовало ожидать, возрастала. Уменьшение вероятности правильного распознавания в случае БД-3 по сравнению с БД-4 (при одинаковом числе классов), по-видимому, объясняется наличием классов со схожими силуэтами.

Увеличение ВПР возможно при использовании дополнительных признаков и ансамблей СНС. Так, в [6] демонстрируется повышение ВПР в среднем на 13 % по сравнению с отдельной СНС для 6 классов гражданских судов. Использование этого подхода для всех классов, рассмотренных в статье, является перспективным направлением для дальнейших исследований.

Заключение

В работе исследованы методические аспекты распознавания надводных объектов (НО) по их оптическим изображениям при большом числе классов различных НО. Распознавание проводилось с использованием сверточных нейронных сетей. Используемая сверточная нейронная сеть позволила решать задачу классификации без промежуточного формирования признаков НО, непосредственно по оптическим изображениям.

Исследована зависимость вероятностей — правильного распознавания от числа классов | и набора распознаваемых НО в классе. Для это- § го была разработана методика формирова- ^ ния базы данных изображений объектов,

создан специальный обучающий набор данных (база оптических изображений объектов) для классификации НО в оптическом диапазоне. При формировании базы данных использовались изображения 10 классов НО и кораблей различных типов.

Получено, что средняя вероятность правильного распознавания составляла Р = 0,95 для 2-х классов («авианосцы» и «эсминцы, фрегаты») и убывала до Р = 0,68 для 10 классов НО.

Результаты, полученные в ходе исследования, показали возможность применения алгоритмов поэтапного распознавания НО. При этом вначале распознавание выполняется для объединенного класса, включающего схожие объекты, с целью отделения этого класса от остальных классов НО. Далее, при необходимости, проводится распознавание классов (типов) НО, входящих в объединенный класс.

Детальное рассмотрение методических аспектов повышения ВПР, в частности при применении ансамблей СНС, и введение класса «не распознано» будет проведено в последующих работах.

Список литературы

0 1. Gouaillier V., Gagnon L. Ship silhouette rec-T-" ognition using principal components analysis // ^ Applications of Digital Image Processing XX.

* 1997. Vol. 3164. P. 59-70.

Ц: 2. Feineigle P. A., Morris D. D., Snyder F. D. <f Ship recognition using optical imagery for harbor | surveillance // Proceedings of Association for Un-jj manned Vehicle Systems International (AUVSI).

* 2007. P. 1-17.

o5 3. Li H., Wang X. Automatic recognition of ship

1 types from infrared images using support vector machines // International Conference on Com-

J puter Science and Software Engineering. 2008. g Vol. 6. P. 483-486.

ь 4. Rainey K., Reeder J. D., Corelli A. G. Con-аз volution neural networks for ship type recognition // Proceedings of the SPIE Defense + Security. Vol. 9844: "Automatic Target Recognition 3 XXVI". 2016. 984409. DOI: 10.1117/12.2229366 8 5. Казачков Е. А., Матюгин С. Н., Попов И. В., w Шаронов В. В. Обнаружение и классификация и малоразмерных объектов на изображениях,

полученных радиолокационными станциями с синтезированной апертурой // Вестник концерна ВКО «Алмаз - Антей». 2018. № 1. С. 93-99.

6. Shi Q., Li W., Tao R., Sun X., Gao L. Ship Classification Based on Multifeature Ensemble with Convolutional Neural Network // Remote Sensing. 2019. No. 11. P. 419.

7. VAIS: A Dataset for Recognizing Maritime Imagery in the Visible and Infrared Spectrums. URL: http://vcipl-okstate.org/pbvs/bench/ Data/ 12/VAIS. zip

8. Moving and Stationary Target Acquisition and Recognition (MSTAR) Public Release Data. URL: https://www. sdms.afrl.af.mil/datasets/mstar/ (дата обращения: 24.03.2018).

9. Хайкин C. Нейронные сети: полный курс / Пер. с англ. д-ра техн. наук Н. Н. Кусеуль, канд. техн. наук А. Ю. Шелестова. 2-e изд. М.: Издательский дом «Вильямс», 2006. 1104 с.

10. Матюгин С. Н., Чернигин А. А. Исследование применимости нейронных сетей для классификации объектов на изображениях // Нейрокомпьютеры: разработка, применение. 2007. № 11. С. 38-42.

11. Казачков Е. А., Матюгин С. Н., Попов И. В., Шаронов В. В. Обработка глубокими сверточными нейронными сетями радиолокационных изображений из баз данных CARABAS-II и MSTAR // Радиолокация. Результаты теоретических и экспериментальных исследований: монография: в 2-х кн. Кн. 2 / Под ред. А. Б. Бляхмана. М.: Радиотехника, 2019. С. 72-86.

12. LeCun Y. LeNet-5, convolutional neural networks. 2013.

13. Ioffe S., Szegedy C. Batch normalization: Accelerating deep network training by reducing internal covariate shift. 2016.

14. He K., Zhang X., Ren S., Sun J. Deep residual learning for image recognition // IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2015. P. 770-778.

15. Гудфеллоу Я., Бенджио И., Курвилль А. Глубокое обучение / Пер. с англ. А. А. Слинки-на. 2-е изд., испр. М.: ДМК Пресс, 2018. 652 с.

16. Николенко C., Кадурин А., Архангельская Е. Глубокое обучение. Погружение в мир нейронных сетей. СПб.: Питер, 2018. 480 с.

Об авторах

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Артемьев Анатолий Александрович - инженер 1-й категории Акционерного общества «Федеральный научно-производственный центр "Нижегородский научно-исследовательский институт радиотехники"», Нижний Новгород, Российская Федерация.

Область научных интересов: исследование и разработка алгоритмов, цифровая обработка радиолокационных сигналов и оптических изображений, распознавание образов, нейросети.

Казачков Егор Андреевич - инженер Акционерного общества «Федеральный научно-производственный центр "Нижегородский научно-исследовательский институт радиотехники"», Нижний Новгород, Российская Федерация. Область научных интересов: исследование и разработка алгоритмов, цифровая обработка радиолокационных сигналов и оптических изображений, статистический анализ информации, распознавание образов, нейросети.

Матюгин Сергей Никандрович - канд. физ.-мат. наук, начальник сектора Акционерного общества «Федеральный научно-производственный центр "Нижегородский научно-исследовательский институт радиотехники"», Нижний Новгород, Российская Федерация.

Область научных интересов: распространение радиосигналов, цифровая обработка радиолокационных сигналов и оптических изображений, распознавание образов.

Шаронов Владимир Витальевич - заместитель начальника отдела, заместитель главного конструктора по направлению Акционерного общества «Федеральный научно-производственный центр "Нижегородский научно-исследовательский институт радиотехники"», Нижний Новгород, Российская Федерация.

Область научных интересов: радиолокация, цифровая обработка радиолокационных сигналов, распознавание образов.

Classification of surface water objects in visible spectrum images

Artemyev A. A., Kazachkov E. A., Matyugin S. N., Sharonov V. V.

Scientific Research Institute of Radio Engineering, JSC, Nizhny Novgorod, Russian Federation

This paper considers the problem of classifying surface water objects, e.g. ships of different classes, in visible spectrum images using convolutional neural networks. A technique for forming a database of images of surface water objects and a special training dataset for creating a classification are presented. A method for forming and training of a convolutional neural network is described. The dependence of the probability of correct recognition on the number and variants of the selection of specific classes of surface water objects is analysed. The results of recognizing different sets of classes are presented.

Keywords: surface water object, neural network, visible spectrum, database

Information about the authors

Artemyev Anatoly Aleksandrovich - Engineer of the 1st category, Scientific Research Institute of Radio Engineering, JSC, Nizhny Novgorod, Russian Federation.

Research interests: algorithm development, digital processing of radar signals and optical images, image recognition, neural networks.

Kazachkov Egor Andreevich - Engineer, Scientific Research Institute of Radio Engineering, JSC, Nizhny Novgorod, Russian Federation.

Research interests: algorithm development, digital processing of radar signals and optical images, statistical processing of information, image recognition, neural network.

Matyugin Sergey Nikandrovich - Cand. Sci. (Phys.-Math.), Sector Head, Scientific Research Institute of Radio Engineering, JSC, Nizhny Novgorod, Russian Federation. _

Research interests: distribution of radio signals, digital processing of radar signals and optical images, image recognition. S£

s (5

Sharonov Vladimir Vitalievich - Deputy Departmental Head, Deputy Chief Design Manager, Scientific Research Institute | of Radio Engineering, JSC, Nizhny Novgorod, Russian Federation. ¡5

Research interests: radar systems, digital processing of radar signals, image recognition. ^

i Надоели баннеры? Вы всегда можете отключить рекламу.