Научная статья на тему 'МОДЕЛЬ СИСТЕМЫ РАСПОЗНАВАНИЯ НАЗЕМНЫХ ОБЪЕКТОВ НА ОСНОВЕ НЕЙРОННОЙ СЕТИ'

МОДЕЛЬ СИСТЕМЫ РАСПОЗНАВАНИЯ НАЗЕМНЫХ ОБЪЕКТОВ НА ОСНОВЕ НЕЙРОННОЙ СЕТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
481
132
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННАЯ СЕТЬ / РАСПОЗНАВАНИЕ ОБЪЕКТОВ / ОБНАРУЖЕНИЕ / БЕСПИЛОТНЫЙ ЛЕТАТЕЛЬНЫЙ АППАРАТ / МОДЕЛЬ СИСТЕМЫ РАСПОЗНАВАНИЯ НАЗЕМНЫХ ОБЪЕКТОВ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Войцеховский Станислав Витальевич, Бугаева Яна Владиславовна, Касавцев Михаил Юрьевич, Кириенко Андрей Борисович

В настоящее время задача эффективного обнаружения и распознавания наземных объектов на местности системой искусственного интеллекта беспилотного летательного аппарата не решена. В статье предложена модель системы распознавания наземных объектов на основе сверточной нейронной сети с архитектурой YOLO-V3, которая может применяться в составе системы искусственного интеллекта беспилотного летательного аппарата.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Войцеховский Станислав Витальевич, Бугаева Яна Владиславовна, Касавцев Михаил Юрьевич, Кириенко Андрей Борисович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODEL OF A GROUND OBJECT RECOGNITION SYSTEM BASED ON A NEURAL NETWORK

At present, the problem of effective detection and recognition of ground objects on the ground by the artificial intelligence system of an unmanned aerial vehicle has not been solved. The article proposes a model of a ground object recognition system based on a convolutional neural network with the YOLO-V3 architecture, which can be used as part of an artificial intelligence system for an unmanned aerial vehicle.

Текст научной работы на тему «МОДЕЛЬ СИСТЕМЫ РАСПОЗНАВАНИЯ НАЗЕМНЫХ ОБЪЕКТОВ НА ОСНОВЕ НЕЙРОННОЙ СЕТИ»

УДК 004.89; 623.746.-519

DOI: 10.24412/2071-6168-2022-7-115-123

МОДЕЛЬ СИСТЕМЫ РАСПОЗНАВАНИЯ НАЗЕМНЫХ ОБЪЕКТОВ НА ОСНОВЕ НЕЙРОННОЙ СЕТИ

С.В. Войцеховский, Я.В. Бугаёва, М.Ю. Касавцев, А.Б. Кириенко

В настоящее время задача эффективного обнаружения и распознавания наземных объектов на местности системой искусственного интеллекта беспилотного летательного аппарата не решена. В статье предложена модель системы распознавания наземных объектов на основе сверточной нейронной сети с архитектурой YOLO-V3, которая может применяться в составе системы искусственного интеллекта беспилотного летательного аппарата.

Ключевые слова: нейронная сеть, распознавание объектов, обнаружение, беспилотный летательный аппарат, модель системы распознавания наземных объектов.

В министерствах и ведомствах нашей страны и других стран всё чаще применяются беспилотные летательные аппараты (БЛА). Они используются для промышленного и сельскохозяйственного мониторинга, при проведении поисковых и спасательных миссий, в охране особых природных территорий и государственных границ и для других целей. Во время полета они собирают огромные объемы информации, которую просматривают и анализируют операторы управления. Однако, из-за большого объёма поступающих входных данных и увеличения длительности полета БЛА, оператор способен пропустить важную информацию или допустить ошибку в расчетах (по данным [1] в 2000 году на долю человеческого фактора приходилось от 70% до 80% всех авиационных происшествий, а по данным [2], потери только БЛА MQ-9 Reaper (США) с 2011 по 2022 год от ошибок оператора составили 67%).

Несмотря на то, что применение БЛА имеет ряд преимуществ по сравнению с использованием традиционных летательных аппаратов, они обладают отдельными недостатками [3]:

- ограничением по применению в зависимости от времени суток и погодных условий для отдельных категорий БЛА;

- низкой интеллектуальностью действий в автономном режиме;

- низкой скрытностью каналов радиоуправления (КРУ) и передачи данных;

- подверженностью КРУ и канала спутниковой навигации БЛА воздействию радиоэлектронных помех и другими недостатками.

В настоящее время вопрос распознавания наземных объектов, которые обнаружены с помощью БЛА, решается исключительно оператором БЛА. Основой управления БЛА является радиоканал. Радиоканалы управления являются одним из слабых мест в контуре управления БЛА - они подвержены как влиянию окружающей среды, так и воздействию радиоэлектронных средств [4]. Например, неорганизованные помехи могут возникать вследствие отражений электромагнитной энергии от местных предметов, облаков, дождевых капель и других природных образований, а также от воздействия грозовых разрядов, электромагнитного излучения Солнца и космического пространства, радиоизлучения промышленных установок и т.д. [5].

Естественно, что при неустойчивом канале связи между БЛА и оператором, он не сможет идентифицировать обнаруженные БЛА объекты [6], а значит это приведёт, как минимум, к прекращению выполнения полетного задания БЛА. Поэтому разработка системы искусственного интеллекта (СИИ) БЛА для распознавания объектов с полученных фотоизображений в автономном режиме продолжает оставаться актуальной задачей. Наличие такой СИИ позволит оперативнее обнаруживать людей, например, в случае аварий, природных и техногенных катастроф, если по каким-либо причинам радиоканал будет не доступен. Ведь несвоевременность срока оказания первой медицинской помощи может привести к гибели пострадавших.

В Российской Федерации на данный момент отсутствует единая система для распознавания наземных объектов в автономном режиме без участия человека-оператора, которая могла бы с помощью СИИ, непосредственно на борту БЛА, за максимально короткое время обнаруживать, распознавать и классифицировать наземный объект, а также принимать управляющие решения исходя из частной обстановки [7].

За рубежом [8] в апреле 2021 года компания Exyn Technologies сообщила о достижении ею четвертого уровня автономности БЛА, что означает способность БЛА на 80% управляться в любой среде без вмешательства оператора. Для выполнения этой сложной задачи БЛА

115

оснащается несколькими наборами датчиков с поддержкой алгоритмов искусственного интеллекта (ИИ), позволяющих почти мгновенно ориентироваться в пространстве по трём осям (однако не раскрывается суть этих алгоритмов).

В нашей стране работы по созданию СИИ БЛА проводятся, как отдельными исследователями, так и научными коллективами. Так в [9] идёт речь о создании алгоритмических и программных решений для системы технического зрения летательных аппаратов, но не показывается математический аппарат, который лежит в их основе. В работах [10-11] в качестве системы распознавания объектов на фотоснимках, полученных с БЛА, использовалась нейронная сеть, но вычисления проводились уже после возвращения БЛА с задания.

Нейронные сети в составе СИИ БЛА для работы в автономном режиме ранее применялись в задачах навигации БЛА [12], в работе [6] использовались нейронные сети для обработки изображений с БЛА, но уже после его возвращения с летного задания. В работе [13] за счет алгоритмов нейросетевого обучения БЛА распознавались образцы техники, в том числе при короткой экспозиции, при этом суть самих алгоритмов не раскрывалась. В работе [14] говорилось о том, что СИИ БЛА может использоваться для обработки изображений с камер и облаков точек с лидаров с использованием нейронных сетей с методами классического компьютерного зрения, при этом сами алгоритмы не рассматривались. В работе [15] для создания системы автономного распознавания объектов на изображениях при дистанционном зондировании Земли предлагалось использовать базу данных из свёрточных нейронных сетей (СНС), заранее обученных на Земле.

Искусственные нейронные сети все более успешно применяют для распознавания класса обнаруженного объекта (самолет/человек/птица и т.д.) [16]. В работе [17] утверждается, что СНС являются наиболее эффективными в области классификации изображений. Они обеспечивают частичную устойчивость к изменениям масштаба, смещениям, поворотам, смене ракурса и прочим искажениям. Главным преимуществом выбора СНС для обнаружения таких объектов, в сравнении с признаковым описанием, является то, что алгоритм самостоятельно находит информативные признаки объектов [15].

В данной статье представлена модель СРНО на основе СНС с архитектурой YOLO-V3, которая может применяться в составе СИИ БЛА. Одной из основных задач при разработке указанной модели стал выбор топологии нейронной сети и настройка значительного числа ее параметров.

Математическая постановка задачи исследования. Дано:

1) входные данные: I, U, p, P, где I - переменная для входящего изображения; U - наименование класса; p - переменная (образ) для обнаружения объектов; P - множество описаний объекта. Существует неизвестная целевая зависимость - отображение e: P— U, значения которого станут известны только на объектах конечной обучающей выборки

P = {pe};

2) выходные данные: z - переменная для расчета степени достоверности идентификации обнаруженных объектов, рассчитываемая по формуле (1), T - показатель оперативности, расчет которого ведется по формуле (2);

3) математические аппараты сверточной нейронной сети:

- нормализация конкретного значения пикселя в диапазоне от 0 до 1 по формуле:

r - min

f (r, min, max) =-,

max- min

где f - функция нормализации; r - значение конкретного цвета пикселя от 0 до 255;

min - минимальное значение пикселя - 0; max - максимальное значение пикселя - 255;

-размер карты сверточного слоя:

(ж, И) = (mW - kW +1, mW - Ш +1), где (м>, И) - вычисляемый размер сверточной карты; mW - ширина предыдущей карты; тН -высота предыдущей карты; kW - ширина ядра; Ш - высота ядра;

- операция свертки:

(/*8) = У,,/[т -k,п -1]* g[k,I],

где /(т, п) - исходная матрица изображения; 8(^ I) - ядро свертки;

- величина функции ошибки для образа р:

Е = - У (Г - ^ . )2,

р 2 р. р. .

где - желаемый выход нейрона ] для образа р; уру - активированный выход нейрона у для образа р;

— неактивированное состояние каждого нейрона у для образа р:

5 .

PJ

= V w..y

где Spj - взвешенная сумма выходов связанных нейронов предыдущего слоя на вес связи; Wij -вес связи между i и у нейронами; уру — активированное состояние нейрона у предыдущего слоя для образа р;

— активированное состояние нейрона у для образа р:

Уру = /у- )'

где /у - функция активации; Spj — неактивированное состояние нейрона у для образа р;

— функция активации софтмакс (Бойтах):

% ( / ) = P(A = J\yk ) =

е(y" )W*J.

Е( у ) ш" ч

где Я — переменная, содержащая индекс класса;

—степень достоверности принадлежности обнаруженного наземного объекта на примере класса «Самолеты», рассчитывается в соответствии с формулой, предложенной в [18]:

г = X = а^тах] р] (ук), (1)

Требуется найти показатель оперативности Т, представляющий собой отношение среднего времени Т1 идентификации объектов при ручной обработке изображения к среднему времени Т2 обработки входящих изображений нейронной сетью от их ввода до вывода конечного результата, включая время, затраченное на предварительную обработку, передачу по сети и постобработку изображений:

Т

Т = Т (2)

T2

Среднее время Ti рассчитывается следующим образом:

V k =0(t2k ~ 4k )

T =L-i k=oV2 k lk' (3)

1 n

где n — количество изображений в тестовом наборе данных; t2k — время выдачи результата для k-го изображения, с; 1 — время начала обработки k-го изображения, с.

Среднее время обработки нейронной сетью входящих изображений на наличие объектов класса «Самолеты» рассчитывается по формуле (4):

да

T2(z; Ep ) = { (1 — P(z; Ep ; t))dt, (4)

0

где P(z, Ep, t) - вероятность успешной обработки нейронной сетью входящих изображений за время t.

Разработанная модель СРНО на основе СНС представлена на рис. 1.

Выбор архитектуры нейронной сети. Исследование в статье проводилось для нейронной сети с архитектурой YOLO-V3. Исходя из сопоставлений преимуществ и недостатков среди распространенных нейронных сетей, представленных в табл. 1, YOLO-V3 считается одной из самых быстрых и мало требовательных к ресурсам архитектур, что может облегчить ее использование во встраиваемых применениях.

Архитектура нейронной сети YOLO-V3 основана на одноэтапной сети YOLO [19]. Одноэтапный метод обнаружения имеет преимущество в расчетной скорости, так как происходит единичное прохождение кадра через нейронную сеть, где объекты детектируются сразу на всех её слоях, а затем уточняется их положение с помощью специального алгоритма Non Maximum Suppression.

Двухэтапные методы имеют более высокую производительность в поиске и распознавании объектов, например, DenseNet, AmoebaNet и Faster R-CNN, но они игнорируют различия при поворотах изображения, что приводит к недостаточному извлечению объектов с изображения и к ложным обнаружениям. Поэтому в данном исследовании выбран одноэтапный алгоритм обнаружения объектов на основе СНС из-за простоты структуры, высокой вычислительной эффективности и оперативности обнаружения.

На момент первой публикации (в 2016 году) по сравнению с другими архитектурами YOLO добилась передового значения средней точности обнаружения и идентификации объектов. Модель YOLO-V3 преобразовывает задачу распознавания объектов к единой задаче регрессии [20]. YOLO-V3 имеет 53 сверточных слоя, поэтому для увеличения оперативности модели существует необходимость создания функции, в которую передаются важные параметры, меняющиеся от слоя к слою.

Бортовые оптике электронные средства

Распознанные «самолёт» на с объекты класса отоизображении

Оператор RJ1A

Ударный БЛА или спасательный самолет

Рис. 1. Структура модели СРНО

Таблица 1

Характеристики моделей нейронной сети _

Архитектура Характеристика Преимущество Недостаток

1 2 3 4

DenseNet Компактно соединенный блок, который соединяет каждый слой с другим слоем. Признаки объектов не суммируются, а конкатенируются (объединяются) в единый тензор. Количество параметров сети намного меньше, чем у сетей с такой же точностью работы. Точность уменьшается на больших наборах данных.

AmoebaNet Использует эволюционные алгоритмы вместо алгоритмов обучения с подкреплением для автоматического поиска оптимальных архитектур нейросетей. Автоматический поиск оптимальных гиперпараметров нейросети Является очень затратной по вычислениям и использует сотни TPU (Tensor Processing Units) для вычислений.

Faster R-CNN Изображение используется в качестве входа в сверточную сеть, которая предоставляет сверточную карту признаков. Предсказанные области затем изменяются с использованием слоя пула, который используется для классификации изображения в пределах предлагаемой области и прогнозирования значений смещения для ограничивающих рамок. Высокая точность. Низкое использование информации об изображениях Нет ограничения для фильтрации образцов низкого качества. Относительно высокие затраты времени. Сложная структура и большой объем вычислений

YOLO-V3 Использование остаточной модели и использование архитектуры FPN (Feature Pyramid Networks for Object Detection) для достижения многомасштабного обнаружения. Высокая точность обнаружения мелких целей в реальном времени. Способность к динамическим корректировкам. Быстрая скорость обучения. Универсальность подлежит исследованию.

Требования к входным изображениям. Для дальнейших экспериментов были выбраны изображения самолетов, снятые с фотокамер БЛА, с различными размерами и поворотами. В качестве полезной нагрузки на БЛА чаще всего выступают системы оптических устройств, размещаемые либо непосредственно в корпусе БЛА, либо с помощью гиростабили-зированных платформ. Совместная установка телевизионной и инфракрасной камер позволяет существенно повысить информативность получаемого изображения. При разработке системы обнаружения БЛА нужно добиваться того, чтобы фотокамеры и блоки предварительной обработки передавали требуемые размеры и качество изображений на вход нейронной сети. Примеры образцов таких изображений представлены на рис. 2.

Рис. 2. Примеры фотоснимков для обучения нейронной сети

Решение. Для обучения и тестирования нейронной сети выбрано два набора данных, а именно DIOR [21], RSOD [22]. Изображения были получены при разных погодных условиях, сезонах и условиях съемки. Они имеют широкий диапазон разрешения, межклассовых и внутриклассовых вариаций.

Набор данных RSOD на 23 декабря 2021 года содержит 976 изображений четырех категорий, снятых Google Earth с некоторых аэропортов по всему миру. Из них авторами были выбраны 446 изображений, на которых присутствуют самолеты.

Набор данных DIOR - это большой общедоступный набор данных, предложенный Северо-Западным политехническим университетом в 2018 году, который содержит 23463 изображения и 20 категорий наземных объектов. Из всех изображений были использованы 300 изображений самолетов в качестве тестового набора данных. Основная информация о наборах изображений показана в табл. 2.

Информация о наборах изображений

№ п/п Набор Разрешающая способность Размер (в пикселях) Количество изображений Количество воздушных судов Задача

1. RSOD 0.5 - 2.0 1000x900 446 4993 обучение

2. DIOR 0.5 - 3.0 800 x 800 300 943 тестирование

Таблица 2

Эффективное обучение нейронной сети оказывает чрезвычайно важное влияние на её производительность, поэтому были посчитаны некоторые параметры обучения в соответствии с [23]. Скорость обучения, контролирующая прогресс в обучении, была установлена 0,005. Количество эпох и размер партии изображений, использованных при исследовании, составили 100 и 5 соответственно. Настройка параметров и результат обучения напрямую влияют на показатель оперативности и конечную точность, так как вероятность успешной обработки изображений зависит от степени уверенности в правильной идентификации объектов.

За счет использования автоматической обработки вместо ручной произойдет уменьшение времени ввода изображения, времени его обработки, времени распознавания полученных данных и получения выходной отчетности [24]. Виды затрат и посчитанное по формулам (3, 4) время на обработку 300 тестовых изображений из набора данных DIOR представлены в табл. 3.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Все эксперименты в исследовании проводились в системе Windows10, а Google Colab использовался в качестве среды для глубокого обучения нейронной сети (Google Colab - облачный сервис компании Google, предназначенный для распространения результатов исследований в области машинного обучения). Аппаратная конфигурация состояла из процессора Intel(R) Core(TM) i5-6300U, оперативной памяти (8 ГБ) и графического процессора (Nvidia

119

GeForce RTX 2080Ti 11 ГБ). Нейронная сеть модели СРНО обучалась на наборе тестовых данных RSOD, описанном ранее. На рис. 3 показана часть результатов распознавания по тестовым наборам данных. В надписи над ограничивающей рамкой объекта указан распознанный класс «Airplane» и соответствующая вероятность его распознавания.

Таблица 3

Временные затраты ручной и автоматической обработки_

Наименование вида работы Время на выполнение вида работы (в часах)

Ручная обработка Автоматическая обработка

Время ввода изображений 0,52 0,08

Время обработки изображений 2,1 0,13

Время анализа результатов 0,52 0,1

Вывод изображения 0,36 0,05

Формирование выходной отчетности 3,2 0,29

Итого 6,7 0,65

■ Results - □ X

Рис. 3. Результаты распознавания

Расчет затрат времени при ручной и автоматической обработке и показателя оперативности модели проводился по формулам (3, 4). По результатам успешной обработки изображений нейронной сетью среднее значение по посчитанным вероятностям (в процентах) распознавания объектов составляет 94,82% для набора данных DIOR, что обеспечивает большую точность по сравнению с современными сетями распознавания объектов в настоящее время [6]. При этом среднее время автоматической обработки набора входящих изображений, посчитанное по формуле (4) и представленное в табл. 3 для каждого вида процесса обработки, составляет 0,65 часа. Исходя из полученных данных, показатель оперативности по формуле (2) получился равным 6,7 / 0,65 = 10,3. Он увеличивается более чем в 10 раз при применении модели СРНО.

Хотя модель, предложенная в статье, обладает хорошей производительностью, она также не лишена определенных ограничений. По мере увеличения числа объектов на изображении затраты времени начинают возрастать. Основные причины данного явления следующие:

1) при извлечении нескольких объектов на изображении из-за уменьшения потери информации увеличивается сложность модели, что в свою очередь приводит к избыточным затратам времени;

2) в процессе обучения нейронной сети невозможно оптимизировать выбор параметров, таких как скорость обучения и размер партии изображений, которые являются одной из причин пропуска объектов и, как следствие, увеличения времени автоматической обработки входящих изображений.

Поэтому будущие работы могут быть посвящены дальнейшему упрощению и оптимизации структуры модели.

Заключение. В статье предложена модель СРНО на основе СНС YOLO-V3 для изображений с высоким разрешением получаемых с фотокамер БЛА. Результаты экспериментов показали, что модель может значительно увеличить показатель оперативности распознавания объектов (10,3). А повышение точности распознавания возможно за счет увеличения количества изображений в обучающей выборке нейронной сети.

Также модель позволяет СИИ БЛА самостоятельно (автономно) решать задачи распознавания наземных объектов непосредственно во время полёта, а не оператором по возвращении на аэродром, а также осуществлять поставленные перед БЛА задачи по предназначению, в том числе в условиях нарушения штатной работы канала связи с оператором.

Следует отметить, что в качестве примеров в статье рассматриваются вопросы обнаружения и распознавания воздушных судов (самолётов), однако предложенная модель теоретически применима и к другим видам объектов на изображениях. Например, разработанная модель СРНО СИИ БЛА позволит решать задачи поиска и спасения людей в случае аварий, природных и техногенных катастроф и выполнять другие задачи.

Список литературы

1. Shappell S.A., Wiegmann D.A. The Human Factors Analysis and Classification System -HFACS // Office of Aviation Medicine Federal Aviation Administration 14. Sponsoring Agency Code 800 Independence Ave., S.W. Washington, DC 20591, 2000. 19 p.

2. Сокирко В. Американский «Жнец» на Украине станет «урожаем» для российских ПВО // Сетевое издание ГАЗЕТА^и [Электронный ресурс]. URL: https://www.gazeta.ru/army/2022/04/17/14745794.shtml (дата обращения: 15.05.2022).

3. Макаренко С.И. Противодействие беспилотным летательным аппаратам. Монография. СПб.: Наукоёмкие технологии, 2020. 204 с.

4. Ходаренок М. Высока вероятность ошибки»: способны ли беспилотники самостоятельно вести боевые действия // Сетевое издание ГАЗЕТА^и [Электронный ресурс]. URL: https://www.gazeta.ru/army/2021/05/31/13615850.shtml (дата обращения: 15.05.2022).

5. Малинина Е.И. Анализ классификации радиотехнических помех // Инженерные кадры - будущее инновационной экономики России: материалы VI Всероссийской студенческой конф. (Йошкар-Ола, 20 ноября 2020 г.): в 8 ч. / Ч. 3: Новые технологии инфокоммуника-ций, радиотехники и электроники для прорывных отраслей промышленности. Йошкар-Ола: Поволжский ГТУ, 2020. С. 90-93.

6. Войцеховский С.В., Музыка В.Д., Файзулина Н.А., Шилов А.А. Модель интеллектуальной системы автоматической идентификации государственной принадлежности военнослужащих // Известия Тульского государственного университета, 2021. Вып. 10. С. 273283.

7. Алпатов Б.А., Бабаян П.В., Стротов В.В. Перспективные технологии обработки и анализа изображений для повышения ситуационной осведомленности при пилотировании летательных аппаратов / Сб. тезисов докл. VI междунар. науч.-практ. конф. «Авиатор». Воронеж: ВУНЦ ВВС «ВВА», 2019. С. 222-223.

8. Greg, Nichols Level 4 aerial autonomy: Drones can now fly themselves // Сетевое издание zdnet.com [Электронный ресурс] URL: https://www.zdnet.com/article/level-4-aerial-autonomy-drones-can-now-fly-themselves (дата обращения: 15.03.2022).

9. Алпатов Б.А., Бабаян П.В., Стротов В.В. Перспективные технологии обработки и анализа изображений для повышения ситуационной осведомленности при пилотировании летательных аппаратов / Сб. тезисов докл. VI междунар. науч.-практ. конф. «Авиатор». Воронеж: ВУНЦ ВВС «ВВА», 2019. С. 222-223.

10. Смирнова Н.В России с помощью новых технологий нашли потерявшегося в лесу человека // Сетевое издание РИА «Воронеж» [Электронный ресурс]. URL: https://riavrn.ru/news/v-rossii-s-pomoshchyu-novykh-tekhnologiy-nashli-poteryavshegosya-v-lesu-cheloveka- (дата обращения: 20.04.2021).

11. Учёные СФУ создают нейросеть для обнаружения вредителей хвойных лесов по БПЛА-снимкам на ранних стадиях // Сибирский Федеральный университет: официальный сайт. [Электронный ресурс] URL: http://news.sfu-kras.ru/node/23251 (дата обращения: 20.04.2021).

12. Кореванов С.В., Казин В.В. Искусственные нейронные сети в задачах навигации беспилотных летательных аппаратов // Научный вестник МГТУ ГА. 2014. № 201. С. 46-49.

13. Тимкив В. Российские БПЛА смогут автоматически распознавать технику НАТО // Сетевое издание РИА «Новости». [Электронный ресурс] URL: https://ria.ru/20220414/tekhnika-1783437321.html (дата обращения: 14.04.2022).

14. Малинина Н.В. Управления БПЛА при помощи искусственного интеллекта // Инновации. Наука. Образование. 2021. № 32. С. 1408-1418.

121

15. Хомоненко А.Д., Яковлев Е.Л. Обоснование архитектуры сверточной нейронной сети для автономного распознавания объектов на изображениях бортовой вычислительной системой // Наукоемкие технологии в космических исследованиях Земли. 2018. Т. 10. № 6. С. 8693.

16. Чивонго, Верданд Емил Сигфрид. Влияние масштабирования на распознавание объектов нейронной сетью ImageAI YOLOv3 // Молодой ученый. 2021. № 22 (364). С. 3437.

17. Хайкин С. Нейронные сети: полный курс. М.: Вильямс, 2006. 1104 с.

18. Шестопалов Р.П. О выборе предпочтительного алгоритма подстройки весов при обучении нейросетевых алгоритмов обработки информации // Информационно-экономические аспекты стандартизации и технического регулирования. 2021. № 2 (60). С. 90-101.

19. Redmon J., Farhadi A. Yolo-v3: An incremental improvement. // Cornell University: official website. [Электронный ресурс] URL: https://arxiv.org/pdf/1804.02767.pdf (дата обращения: 25.02.2022).

20. Zhao Z., Zheng P. Object detection with deep learning: A review // IEEE Transactions on Neural Networks and Learning Systems, 2019. P. 3212-3232.

21. Proposed DIOR Dataset // Ke Li, Gang Wan, Gong Cheng, Liqiu Meng [Электронный ресурс]. URL: http://www.escience.cn/people/gong-cheng/DIOR.html (дата обращения: 23.02.2022).

22. RSOD-Dataset // LIESMARS, China, Wuhan University, 2017. [Электронный ресурс]. URL: https://github.com/RSIA-LIESMARS-WHU/RSOD-Dataset (дата обращения: 27.02.2022).

23. Системы искусственного интеллекта: учебное пособие / А.Н. Адаменко, С.В. Вой-цеховский [и др.], под общ. ред. А.Д. Хомоненко. СПб.: ВКА имени А.Ф. Можайского, 2013. 291 с.

24. Ding P., Zhang Y., Deng W.-J., Jia P, Kuijper A. A light and faster regional convolution-al neural network for object detection in optical remote sensing images // ISPRS Journal of Photo-grammetry and Remote Sensing, 2018. P. 208-218.

Войцеховский Станислав Витальевич, канд. техн. наук, доцент, начальник кафедры, vka_kaf27_1 @mil.ru, Россия, Санкт-Петербург, Военно-космическая академия им. А. Ф. Можайского,

Бугаева Яна Владиславовна, курсант, [email protected], Россия, Санкт-Петербург, Военно-космическая академия им. А. Ф. Можайского,

Касавцев Михаил Юрьевич, канд. техн. наук, старший преподаватель, vka_kaf27_1 @mil.ru, Россия, Санкт-Петербург, Военно-космическая академия им. А. Ф. Можайского,

Кириенко Андрей Борисович, адъюнкт, vka_kaf2 7_1 @mil. ru, Россия, Санкт-Петербург, Военно-космическая академия им. А. Ф. Можайского

MODEL OF A GROUND OBJECT RECOGNITION SYSTEM BASED ON A NEURAL NETWORK

S.V. Voytsekhovsky, Y.V. Bugaeva, M.Y. Kasavtsev, A.B. Kirienko

At present, the problem of effective detection and recognition of ground objects on the ground by the artificial intelligence system of an unmanned aerial vehicle has not been solved. The article proposes a model of a ground object recognition system based on a convolutional neural network with the YOLO-V3 architecture, which can be used as part of an artificial intelligence system for an unmanned aerial vehicle.

Key words: neural network, object recognition, detection, unmanned aerial vehicle, ground object recognition system model.

Voytsekhovsky Stanislav Vitalievich, candidate of technical sciences, docent, head of chair, [email protected], Russia, Saint Petersburg, A.F. Mozhaysky's Military Space Academy,

122

Bugaeva Yana Vladislavovna, military student, [email protected], Russia, Saint Petersburg, A.F. Mozhaysky's Military Space Academy,

Kasavtsev Mikhail Yurievich, candidate of technical sciences, senior lecturer, [email protected], Russia, Saint Petersburg, A.F. Mozhaysky's Military Space Academy,

Kirienko Andrey Borisovich, adjunct, vka_kaf2 7_1 @mil. ru, Russia, Saint Petersburg, A.F. Mozhaysky's Military Space Academy

УДК 378:002

DOI: 10.24412/2071-6168-2022-7-123-132

ПРИМЕНЕНИЕ ТЕХНОЛОГИЙ ВИЗУАЛИЗАЦИИ ИГРОВОГО КОНТЕНТА ПРИ СОЗДАНИИ ОБУЧАЮЩЕЙ ИГРЫ

Л.Б. Филиппова, Р.А. Филиппов, А.А. Кузьменко

В данной статье рассматриваются вопросы компьютерной трехмерной графики, а также вопросы создания интерфейса при разработке образовательных игр, способствующие геймификация процесса обучения. Приведен анализ аналогов. Приведено описание и обоснование выбора используемого программного обеспечения (ПО). Также в работе рассмотрены вопросы выбора цвета, форм и пространства, и пользовательского интерфейса при создании графического интерфейса игры с точки зрения психологических приемов, юзабилити и визуального дизайна. Приведены результаты анкетированием группы учащихся, закончивших тестирование в конце игры. Кратко описаны итоги и приведена сравнительная таблица результатов, составленная по итогу внедрения игры и проведения тестирования обучающихся.

Ключевые слова: пользовательский интерфейс, 3Б-технологии, обучающая игра, тестирование, визуальный дизайн

Дизайн интерфейсов связан с широким спектром проектов, от компьютерных систем до автомобилей и самолётов. Все они связаны с одними и теми же основами человеческого взаимодействия, но требуют некоторых уникальных навыков и знаний. Есть различные дисциплины, связанные с разработкой графических пользовательских интерфейсов:

1. Дизайн их. Дизайн их сконцентрирован на последовательности действий, происходящих с пользователями во время работы с продуктом и гарантирует, что пользователь достигнет своих целей и будет доволен.

2. Дизайн взаимодействия (IxD). Дизайн взаимодействия (IxD) больше фокусируется на аспекте поведения пользователей. Слово «взаимодействие» относится к предмету дизайна: взаимодействие с цифровыми продуктами, системами или услугами [1].

3. Юзабилити. Юзабилити оценивает, насколько легко научиться и пользоваться продуктом.

4. Визуальный дизайн. Визуальный дизайн определяет «внешний вид» продукта. Визуальный дизайн работает с цветами, типографикой, значками, анимацией и общей эстетикой конечного продукта.

Все данные сферы популярны на данный момент и имеют огромное число специалистов в своей области.

Пользовательский интерфейс - это пространство, где происходит взаимодействие между человеком и машиной [2, 3]. Целью этого взаимодействия является обеспечение эффективного функционирования и управления машиной человеком, в то время как машина одновременно подает обратно информацию, которая помогает человеку принимать решения. В данной статье рассматривается взаимоотношение между обучающимся и образовательной игрой, в которой используются технологии компьютерной 3D-графики, а также создание пользовательского интерфейса игры, не только со стороны проектирования, но и юзабилити, их, IxD и визуального дизайна.

i Надоели баннеры? Вы всегда можете отключить рекламу.