Научная статья на тему 'МНОГОШАГОВЫЙ АЛГОРИТМ ТЕРМИНАЛЬНОГО НАВЕДЕНИЯ С ИНТЕЛЛЕКТУАЛЬНОЙ АДАПТАЦИЕЙ К ВЕТРОВЫМ ВОЗМУЩЕНИЯМ'

МНОГОШАГОВЫЙ АЛГОРИТМ ТЕРМИНАЛЬНОГО НАВЕДЕНИЯ С ИНТЕЛЛЕКТУАЛЬНОЙ АДАПТАЦИЕЙ К ВЕТРОВЫМ ВОЗМУЩЕНИЯМ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
142
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛЕТАТЕЛЬНЫЙ АППАРАТ / ТЕРМИНАЛЬНОЕ НАВЕДЕНИЕ / АДАПТИВНАЯ СИСТЕМА УПРАВЛЕНИЯ / ИДЕНТИФИКАЦИЯ ВОЗМУЩЕНИЙ / ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА НАВЕДЕНИЯ / ВЕТЕР

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Клишин Алексей Николаевич, Колесникова Дарья Сергеевна

Представлен качественно новый подход к реализации терминального наведения на конечном участке траектории летательного аппарата класса поверхность - поверхность. Предложена структура адаптивной системы управления летательного аппарата на основе многошагового терминального алгоритма наведения. Вычисление адаптивных поправок к коэффициентам управления осуществляется с помощью разработанной методики идентификации ветровых возмущений на основе моделей машинного обучения. Изложена методика формирования интеллектуального алгоритма распознавания интенсивности и направления ветровой нагрузки, действующей на летательный аппарат в процессе полета. Исследованы варианты моделей машинного обучения, используемых в интеллектуальном блоке системы наведения, представлены результаты их работы и проведен сравнительный анализ. Процедура работы адаптивной системы наведения продемонстрирована на примере типовой модели движущегося в атмосфере летательного аппарата при наведении на неподвижную цель. Приведены результаты численного моделирования и продемонстрирована возможность использования подобного алгоритма и реализации описанной системы.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Клишин Алексей Николаевич, Колесникова Дарья Сергеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MULTISTEP TERMINAL GUIDANCE ALGORITHM WITH INTELLIGENT ADAPTATION TO WIND DISTURBANCES

The paper presents a qualitatively new approach to terminal guidance at the final trajectory section for the surface-to-surface class aerial vehicles. The proposed structure of the adaptive control system for an aerial vehicle is based on the multi-step terminal guidance algorithm. Adaptive corrections to the control coefficients were calculated using the developed method for identifying the wind disturbances based on the machine learning models. The work describes technique to form an intelligent algorithm for identifying intensity and direction of the wind load acting on the aerial vehicle in flight. Options of the machine learning models used in the guidance system intelligent block were investigated; their operation results are presented; and the comparative analysis has been carried out. The adaptive guidance system operation procedure is demonstrated on a typical model of the aerial vehicle flying in the atmosphere and targeting a fixed object. Numerical simulation results are presented, and possibility of using such an algorithm and implementing the described system are demonstrated.

Текст научной работы на тему «МНОГОШАГОВЫЙ АЛГОРИТМ ТЕРМИНАЛЬНОГО НАВЕДЕНИЯ С ИНТЕЛЛЕКТУАЛЬНОЙ АДАПТАЦИЕЙ К ВЕТРОВЫМ ВОЗМУЩЕНИЯМ»

УДК 623.466.55

БОТ: 10.18698/2308-6033-2023-1-2247

Многошаговый алгоритм терминального наведения с интеллектуальной адаптацией к ветровым возмущениям

© А.Н. Клишин, Д.С. Колесникова МГТУ им. Н.Э. Баумана, Москва, 105005, Россия

Представлен качественно новый подход к реализации терминального наведения на конечном участке траектории летательного аппарата класса поверхность — поверхность. Предложена структура адаптивной системы управления летательного аппарата на основе многошагового терминального алгоритма наведения. Вычисление адаптивных поправок к коэффициентам управления осуществляется с помощью разработанной методики идентификации ветровых возмущений на основе моделей машинного обучения. Изложена методика формирования интеллектуального алгоритма распознавания интенсивности и направления ветровой нагрузки, действующей на летательный аппарат в процессе полета. Исследованы варианты моделей машинного обучения, используемых в интеллектуальном блоке системы наведения, представлены результаты их работы и проведен сравнительный анализ. Процедура работы адаптивной системы наведения продемонстрирована на примере типовой модели движущегося в атмосфере летательного аппарата при наведении на неподвижную цель. Приведены результаты численного моделирования и продемонстрирована возможность использования подобного алгоритма и реализации описанной системы.

Ключевые слова: летательный аппарат, терминальное наведение, адаптивная система управления, идентификация возмущений, интеллектуальная система наведения, ветер

Введение. Понятие высокоточного летательного аппарата (ЛА) сегодня достаточно часто встречается в профильной литературе, в различных описательных материалах, сводках с мест боевых действий. Основное определяющее свойство таких ЛА — способность поражать цель прямым накрытием. Однако нигде не раскрывается, как и каким образом достигается такое качество поражение целей, зачастую просто упоминается, что в системе наведения используются автономные системы управления, реализующие терминальные методы наведения. Следует признать, что на сегодня отсутствуют высокоточные ЛА, позволяющие на основе автономных систем управления без использования внешних источников информации осуществить поражение цели путем прямого попадания. Промахи таких систем достаточно существенны, они могут составлять сотни метров даже в «тепличных условиях» полигонов. Однако подобные промахи успешно парируются организацией спутниковой коррекции и/или осуществлением самонаведения на цель на конечном участке траектории.

Спутниковая коррекция позволяет достаточно просто, без применения дорогостоящей и энергоемкой аппаратуры, выполнять коррекцию траектории, обеспечивающую поражение цели с требуемым качеством. Но использовать такую технику можно лишь в странах третьего мира, не имеющих высокого оборонного потенциала. Применять такие ракетные комплексы в конфликтах с развитыми странами не получится из-за блокировки информационных каналов спутниковых систем.

Использование систем самонаведения влечет за собой целый комплекс проблем, связанных с их высокой стоимостью, высокой энергоемкостью и техническими сложностями осуществления наведения на нерадиоконтрастные объекты, причем такие системы остаются уязвимыми перед любой современной станцией радиоэлектронной борьбы. Применение систем наведения, основанных на оптическом принципе, существенно ограничивает область использования комплексов, так как их нельзя считать всепогодными.

Таким образом, для обеспечения страны современной, конкурентоспособной ударной ракетной техникой необходимо совершенствовать автономные системы управления. Следует многократно увеличивать мощность бортовых цифровых вычислительных машин, повышать качество измерительно-приборной базы и создавать абсолютно новый программно-алгоритмический аппарат, позволяющий использовать современные методы математического анализа. Внедрение новых технологий позволит уйти от заложенных еще в 1960-х годах принципов управления и добиться качества управления, близкого к прямому накрытию цели.

Предлагаемый подход основан на использовании адаптивных (к условиям внешней среды) систем наведения [1-6]: во-первых, на автономном получении информации об объекте управления, во-вторых, на проведении дополнительных процедур по определению основных возмущающих факторов. Первая задача связана с непосредственной реализацией модального управления в системах управления с наблюдателем состояния. Решение подобной задачи уже изучено в достаточной мере и продемонстрировано во многих научных работах [3, 4]. Однако первостепенную важность, которая выражается в значительной сложности реализации на практике, приобретает вторая задача — идентификация возмущающих характеристик, знание которых позволяет существенно повысить точность и качество синтезируемых управляющих устройств и алгоритмов [1, 2].

В общем случае возмущающие воздействия описываются чрезвычайно сложными нестационарными и нелинейными функциями. Число возмущающих факторов также может изменяться от траектории к траектории. Более того, сами эти факторы могут быть коррели-рованы между собой. Описанные ограничения приводят к тому, что

заранее смоделировать возмущенную траекторию, с высокой долей вероятности схожую с реальной, практически нельзя, так как отсутствует возможность явным образом определить, какими возмущающими факторами было вызвано то или иное отклонение траектории от опорной траектории [7, 8]. Понимание причин возникновения возмущений и использование адаптивных систем управления движением ЛА, параметры которых зависят от уровня и вида действующих возмущений, позволило бы существенным образом повысить качество наведения [7].

Цель настоящего исследования заключается в формировании интеллектуального блока системы наведения, позволяющего путем распознавания видов и интенсивности действующих возмущений реализовать наведение на цель с высокой степенью точности.

Анализ существующих методов решения поставленной задачи. Учет интенсивности возмущений в настоящее время частично реализован в адаптивных системах с многошаговыми терминальными методами наведения [8]. Адаптация в таких системах осуществляется путем уточнения выбранных универсальных параметров или функционалов, характеризующих совместное влияние возмущающих факторов, с «эталонными» для текущей плоскости в пространстве [7, 8]. Эти уточнения выполняются по бортовым измерениям на пройденной части траектории ЛА. В базу данных бортовой цифровой вычислительной машины (БЦВМ) заносятся средние значения контролируемых параметров вдоль опорной траектории движения с определенным шагом по высоте [8]. Таким образом, коррекция осуществляется путем интерполяции коэффициентов адаптации для текущего положения ЛА. Подобный подход к идентификации возмущений требует чрезвычайно полной информативной базы данных, по-прежнему характеризующейся значительным уровнем неопределенности, так как с увеличением количества возмущающих факторов и сложности описания модели оказывается чрезвычайно сложно оценить многомерную функцию коэффициентов адаптации. Кроме того, такой подход, как правило, является эвристическим, поскольку он основан на предварительном анализе перемещения воздушных масс и изменения погодных условий на предполагаемую дату старта.

В качестве альтернативного решения предлагается рассмотреть иной подход к решению этой задачи, основанный на применении систем машинного обучения для распознавания видов и интенсивности действующих возмущающих факторов по анализу отклонений реальной траектории от опорной, а также по анализу тенденции изменения этих отклонений.

Формирование концепции интеллектуального наведения. Интеллектуальная система наведения с использованием машинного обучения, которая позволяет решать поставленные задачи, относится

к автономным системам наведения, а применяемый при этом метод наведения — к терминальным методам. Такие методы наведения реализуются с помощью многошаговых алгоритмов, согласно которым время движения ЛА разделяется на фиксированные интервалы времени, и в их пределах ведутся расчет и коррекция траектории. В результате последовательно повторяющейся на каждом шаге коррекции ЛА приводится в точку или область с необходимыми координатами.

Рассматриваемая интеллектуальная система наведения отличается от классической системы автономного наведения тем, что необходимо проводить процедуру идентификации возмущающих факторов посредством анализа величин отклонений текущих параметров состояния ЛА XX от программных Хпр, заложенных в память БЦВМ. На основе отклонений АХ = Хпр - XX алгоритм идентификации возмущений формирует тензор возмущений С = [ю17 ю2,..., юп ] и тензор прогноза

возмущений СС = [сЬ 1,о>2,..., сЬп], где п — число возмущающих факто-

т т

ров, а компоненты = [сох,, ю^ ] , сог = [сох, со¡¥, соа ] представляют собой проекции интенсивности возмущающих векторов и тенденции изменения интенсивности соответственно на оси различных систем координат, удобных для описания того или иного компонента.

Решение полных дифференциальных уравнений движения ЛА осуществляется в БЦВМ с учетом возмущающих факторов, в результате чего определяются параметры текущей возмущенной траектории. На основе такой траектории вычисляются поправки к коэффициентам управления, обеспечивающие попадание в цель. Таким образом, особенность интеллектуальной системы наведения заключается в модификации процедуры коррекции. Функциональная схема системы на 1-й момент коррекции приведена на рис. 1.

Измерительная система состоит из комплекса датчиков, сигналы с них посредством нелинейных преобразований формируют некоторую оценку вектора состояния объекта XX1. Этот вектор сравнивается с вектором программного состояния объекта пр. На основе полученных

отклонений интеллектуальный алгоритм идентификации формирует тензор возмущений и тензор прогноза возмущений. Далее в блоке настройки параметров адаптивного регулятора осуществляется итеративное решение краевой задачи, которая включает в себя моделирование возмущенной траектории движения ЛА с настраиваемыми коэффициентами управления. Подобранное управление, реализующее попадание в цель, формирует параметры новой попадающей траектории, которые после процедуры коррекции поступают в базу данных

программного состояния объекта. Решение о выборе параметров наведения на предстоящем шаге принимается в конце текущего шага на основе располагаемой априорной информации и измерительной информации, полученной к началу текущего шага, а также прогноза движения на оставшейся части траектории.

Рис. 1. Адаптивная система наведения с интеллектуальной идентификацией

возмущений:

х{ — вектор состояния объекта |хг- е Я} ; иг- — вектор управлений |иг- е Я11; у{ —

вектор выхода |у ^ е Я™|; А (Г), В^ (Г) — матрицы состояния и управления соответственно; й — тензор возмущений, й — тензор прогноза возмущений

Математическая модель полета. В рамках решения поставленной задачи рассматривается анализ управляемого пространственного движения ЛА на конечном участке траектории. В качестве примера объекта управления рассматривается летательный аппарат, а именно отделяемая головная часть. Компоновочная схема объекта изображена на рис. 2.

Рис. 2. Компоновочная схема исследуемого летательного аппарата:

1 — щитки канала тангажа; 2 — сопла канала крена; 3 — щитки канала курса

Система наведения состоит из трех ортогональных каналов управления: каналов тангажа и курса, управляющих продольным движением, и автономным каналом крена, удерживающим угол крена равным нулю. Вследствие двухплоскостной симметрии компоновки рассматриваемых ЛА каналы тангажа и рыскания идентичны.

Математическая модель управляемого движения ЛА формируется исходя из следующих принятых подходов и допущений:

• модель атмосферы соответствует стандартной (ГОСТ 4401-81);

• поверхность Земли задана моделью вращающегося эллипсоида Красовского, гравитационное поле Земли соответствует модели Кра-совского [5];

• аэродинамические характеристики ЛА полностью определены и зависят от числа Маха, углов атаки и скольжения;

• задана номинальная точка положения ЛА в момент начала моделирования, находящаяся над поверхностью Земли на некоторой высоте (Н = 40 км);

• в номинальной точке считается известной скорость движения ЛА (V = 4800 м/с).

Формат описания математической модели трактуется необходимостью достижения оптимума между сложностью (полнотой описания) и оперативностью проведения вычислений. В данной работе сделан акцент на упрощение модели, так как общий объем проводимых вычислений выражается в гигабайтах.

Траектория рассматриваемого ЛА анализируется на конечном участке, который представляет наибольший интерес. На рис. 3 изображена утрированная геометрическая интерпретация траектории ЛА, поясняющая работу представленной системы наведения. Положение

горизонтальных плоскостей соответствует моментам времени коррекции. При этом в каждой плоскости фиксируется отклонение возмущенной траектории 2 от опорной траектории 1. Далее, согласно алгоритму управления, формируется новая попадающая траектория 2, которая при дальнейшем отсутствии возмущений приведет ЛА в точку прицеливания. Для новой возмущенной траектории процедура повторяется и вновь формируется попадающая траектория 3.

Для проведения цифрового моделирования управляемого движения ЛА разработано соответствующее программное обеспечение на языке программирования С++. Для проверки гипотез применения моделей машинного обучения, в том числе написания нейросетей, используется язык программирования Python 3.7. В частности, результаты моделей машинного обучения получены с помощью следующих Python-фреймворков:

• pandas [9] — библиотеки для работы с датафреймами;

• numpy [9] — библиотеки для вычислений и статистической обработки данных;

• sklearn [9] — фреймворка, в котором реализован набор алгоритмов машинного обучения, в частности, алгоритм случайного леса, градиентный бустинг, а также алгоритмы для предобработки данных;

• pyTorch [9]— фреймворка, реализующего алгоритмы нейронных сетей.

Подход к решению задач в рамках теории машинного обучения. Поставленная цель исследования достигается с помощью методик и алгоритмов машинного обучения. Данный раздел обусловлен необходимостью обосновать целесообразность использования моделей

Го

g

1

Рис. 3. Траектория движения ЛА при реализации коррекции

машинного обучения, их анализа и выявления того, насколько неизбежно применение в системе наведения полносвязной нейронной сети.

Процесс разработки и тестирования алгоритма является итерационным, в ходе реализации которого решается ряд задач, связанных с повышением качества полученного алгоритма, доработки, сбора дополнительных данных для обучения (рис. 4).

Рис. 4. Классическая схема решения задачи машинного обучения

Первоначальным и одновременно ключевым моментом в реализации подобных систем является корректная постановка задачи машинного обучения, которая напрямую зависит от имеющегося для этого набора данных. Отсутствие возможности сбора данных или ограниченность их количества существенно влияет на выбор соответствующей модели машинного обучения. Следующий этап заключается в выделении комплекса индивидуальных признаков, которые могут иметь категориальный или числовой вид. Далее имеющиеся данные разбиваются на обучающую выборку, по которой осуществляются подбор модели и непосредственно отработка выбранного алгоритма, и тестовую выборку, на которой оценивается качество обученной модели. На этапе обучения реализуются подбор модели, оптимизация и поиск гиперпараметров для композиции моделей. В процессе обучения проводится вычисление метрик качества, на основе которых выполняется проверка соответствия моделей требуемому качеству. Полученная в результате готовая модель оценивается на основе реальных полученных данных.

Анализ и формирование данных для обучения. В рамках данной работы в качестве возмущений рассматривается влияние наличия ветра как одного из основных источников появления отклонений параметров реальной траектории ЛА от опорной. Поскольку в системе имеются перекрестные связи, ветровые нагрузки, действующие, к примеру, в продольном канале движения ЛА, приводят к появлению отклонений параметров траектории как в продольном, так и в боковом канале. Иными словами, при наличии в системе нелинейных функций, описывающих ветровые возмущения, одни и те же отклонения траектории от опорной могут быть вызваны различными комбинациями скорости ветра по двум ортогональным каналам. Эта особенность позволяет в качестве примера рассматривать задачу идентификации возмущений применительно к решению задачи распознавания интенсивности и направления ветра при реализации терминального наведения.

Поскольку представленное исследование связано с программным моделированием движения объекта, обучающая выборка представляет собой синтетический набор данных, полученный в результате многократного интегрирования системы дифференциальных уравнений движения ЛА в пространстве под воздействием различных возмущающих факторов различной интенсивности (рис. 5).

у, м

Рис. 5. Данные для обучения (отклонения координат ДУ и ДУг в каждом слое коррекции)

Количество точек для обучения зависит от рассматриваемого диапазона изменения возмущающих факторов. Шаг, с которым при обучении моделируются параметры возмущенных траекторий, напрямую влияет на объем обучающей выборки и, тем самым, на точность результатов обученной модели. В данном случае синтетический набор обучающих данных был составлен при моделировании движения ЛА с высоты 40 км. При этом действие ветровых возмущений начинается с 10 км. Далее область пространства, в которой движется ЛА, разбивается горизонтальными плоскостями с шагом по 100 м на слои, в каждом из которых фиксируются отклонения возмущенной траектории от опорной. В данном случае сила ветра изменяется в диапазоне Жх Е [-30...30] м/с, Е [-30...30] м/с с шагом 5 м/с. Геометрическая интерпретация обучающей выборки изображена на рис. 5. Для использования данных в модели проводится предобработка, в результате которой они масштабируются с использованием минимаксного метода стандартизации. Тренировочная выборка после предобработки и нормировки продемонстрирована на рис. 6.

Рис. 6. Данные для обучения модели после препроцессинга

Формализация задачи и подбор модели машинного обучения.

В рамках теории машинного обучения [10, 11] решение подобной задачи представляет собой обучение с учителем, более узко — задачу регрессионного анализа [10, 11].

С точки зрения формализации описанной задачи существует функциональная зависимость типа

I: ^ ^ Т,

где I — функция (истинная зависимость) является искомой; X — множество объектов; Т — множество ответов.

Совокупность £ пар (объект, ответ) вида

Я = {(X,У, = I())е XхТ\, = 1,..., 1}

является обучающей выборкой. При этом требуется найти вид функции I путем построения такой аппроксимирующей функции а8 : X ^ Т, что

Ух е X, ая(х)~ У(х).

Подбор модели машинного обучения для решения задачи регрессионного анализа заключается в анализе применимости той или иной модели, в оценке суммарных временных затрат на обучение и оценке точности той или иной модели.

Решение поставленной задачи в рамках машинного обучения предлагается с использованием трех моделей:

• полносвязная нейронная сеть [10, 11];

• случайный лес [10];

• градиентный бустинг [10].

При этом для каждой указанной модели необходимо определить ее архитектуру, реализовать подбор гиперпараметров и получить наилучший вариант решения.

Полносвязаная нейронная сеть. В данном исследовании используется полносвязная нейронная сеть прямого распространения, обученная с помощью метода обратного распространения ошибки. Нейронная сеть представляет собой ориентированный граф, вершины которого являются нейронами, а ребра — связями между нейронами. Значения каждого из нейронов скрытых и выходных слоев равны:

( к \ *=I ъ

V ,=1

где к — число нейронов на предыдущем слое; ю, — вес связи между рассматриваемым нейроном и ,-м нейроном на предыдущем слое; х, — значение ,-го нейрона на предыдущем слое; I: М ^ М — функция активации.

Граф состоит из последовательности слоев, на каждом слое находится некоторое количество нейронов. Нейроны на к-м слое имеют связи со всеми нейронами на (к - 1)-м слое, каждый из которых имеет свой вес (рис. 7).

у, м

АУ, м/с АГ2, м/с 8А¥х/8у, 1/с дАК,/ду, 1/с

Рис. 7. Схематично изображенная нейронная сеть

Архитектура нейронной сети, используемой в исследовании, представлена ниже:

Входной слой из т = 3 нейрона Скрытый слой 1 — 16 нейронов Скрытый слой 2 — 32 нейрона Скрытый слой 3 — 64 нейрона Скрытый слой 4 — 32 нейрона Скрытый слой 5 — 16 нейронов Выходной слой из п = 2 нейрона

Входной слой нейронной сети включает отклонения параметров

траектории от опорной траектории {х,}, , т = I +1, где I — число

анализируемых параметров траектории, а также высоту слоя к, в котором осуществляется измерение этих отклонений. Выходной слой

нейронной сети содержит набор признаков { = /(х1 )}П=1, который

в рамках решаемой задачи состоит из текущего значения скорости ветра в проекциях на оси горизонтальной плоскости нормальной земной системы координат [7]. В качестве алгоритма обучения рассматривается метод обратного распространения ошибки [10, 11]. Для оптимизации сети рассматриваются метод Адама и ускоренный метод Нестерова. Скорость обучения (а) определяется итеративно в процессе обучения. В качестве метрики используются:

средняя квадратичная ошибка (МББ), рассчитываемая по формуле

1 п

МББ = - £ (/(х) - у,)

п 1=1

Многошаговый алгоритм терминального наведения с интеллектуальной адаптацией...

средняя абсолютная ошибка (MAE), вычисляемая как

MAE =1 ¿|/(х,) - y )|, П i=1 2

коэффициент детерминации R , определяемый выражением

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

i (f (х) - у )2 R2 = 1 - J=Ln-.

i (У - У)2

i=1

Путем анализа и многократного обучения нейронной сети для различных скоростей обучения, размеров батчей (текстовых файлов), функций активации и методов регуляризации были получены результаты, приведенные в табл. 1-3.

Таблица 1

Результаты обучения нейросети для разных функций активации и размеров батчей

Функция активации Размер батча MSE, м2/с2 MAE, м/с R2

sigm Г k Л V i=1 У 10 0,125327 1,17652 0,87524

20 0,106543 1,05332 0,94439

50 0,002658 0,23587 0,98271

tanh Г k Л S®ixi V i=1 У 10 0,186524 3,24453 0,81093

20 0,105658 2,46808 0,95480

50 0,004321 0,53279 0,97021

Г k Л ReLUReLU ^ю V t=1 10 0,039740 2,45055 0,96783

20 0,039875 2,24566 0,96537

50 0,025493 1,04882 0,97432

Таблица 2

Результаты обучения нейросети для разных скоростей обучения и количества эпох

Скорость обучения Количество эпох Время обучения, с MSE, м2/с2

0,01 50 375 0,02342

100 674 0,01172

150 859 0,01173

0,01 50 243 0,10028

100 510 0,00841

150 761 0,00199

0,10 50 129 0,09874

100 247 0,10012

150 369 0,09752

Таблица 3

Результаты обучения нейросети для разных методов оптимизации

Метод оптимизации М8Б, м2/с2

Метод Адама 0,01342

Метод Нестерова 0,03827

Стохастический градиентный спуск 0,09287

В результате анализа гиперпараметров нейросети наилучший результат наблюдается для скорости обучения при следующих параметрах модели: функция активации б1§ш(х), скорость обучения а = 0,01, размер батча — 50, количество эпох — 150, метод оптимизации — метод Адама, время обучения ~12 мин. При этом ошибка идентификации силы ветра по абсолютной величине составляет около 0,3 м/с для тестовой выборки, что является приемлемым разбросом для попадания в цель с заданной точностью.

Случайный лес. Решающие деревья предназначены для разбиения пространства признаков в соответствии с некими правилами разбиения, позволяющими реализовать последовательную дихотомическую сегментацию данных [10].

На основе условных суждений на каждой итерации множество объектов делится последовательно на две группы, образуя древовидную структуру, в которой конечными узлами являются «листья», соответствующие найденным решениям и объединяющие все разделенные на группы объекты обучающей выборки в кластеры, скомпонованные так, чтобы различия между точками в пределах каждой совокупности были минимальными.

Каждый выбранный признак должен разбить первоначальное множество объектов X таким образом, чтобы получаемые в итоге подмножества Хк, к = 1,..., р состояли из объектов, максимально приближенных к принадлежности одного из таких классов. Однако отдельно обученные решающие деревья являются очень чувствительными к различным случайным флуктуациям в данных. В связи с этим для решающих деревьев весьма характерна проблема переобучения. Лишен данной проблемы случайный лес — алгоритм машинного обучения, представляющий собой ансамбль независимых решающих деревьев.

Работа данного алгоритма заключается в построении заранее определенного количества независимых решающих деревьев и в дальнейшей комбинации полученных решений. Этот принцип основан на том, что усреднение нескольких наблюдений одного и того же явления снижает оценку дисперсии данных. Поэтому для снижения дисперсии прогноза осуществляются извлечение большого

количества порций данных из генеральной совокупности, построение предсказательной модели по каждой обучающей выборке и дальнейшее усреднение полученных предсказаний. В табл. 4 содержатся список параметров, среди которых осуществляется перебор, и значения параметров, которые были выбраны, а также метрика для соответствующих выбранных параметров. Варьируемые параметры [10, 11]: п_е8йта1ог8 — число деревьев; тах_ёерШ — глубина случайного леса (максимальное расстояние между «корнем» и «листьями»); тт_8атр1е8_8рШ — минимальное количество выборок, содержащихся в узле (по умолчанию 2); т1п_Батр1еБ_1еаГ — минимальное количество элементов «листа» (по умолчанию 1); тах_ГеаШге8 — количество функций, которые следует учитывать при поиске лучшего разделения (по умолчанию используются все).

Таблица 4

Значения гиперпараметров и метрика для случайного леса

Параметр Набор параметров Выбранное значение MSE, м2/с2 MAE, м/с R2

n_estimators [50; 100; 150; 200] 150 0,157 3,71 0,8437

max_depth [5; 10; 20; None] None 0,156 3,69 0,8442

min_samples_split [2; 0,05; 0,1; 0,2] 2 0,158 3,71 0,8429

min_samples_leaf [1; 0,01; 0,05] 1 0,152 3,70 0,8485

max_features ['sqrt'; 0,5; 0,75] 0,75 0,159 3,78 0,9415

Результаты решения задачи с помощью случайного леса при выборе наиболее оптимальных гиперпараметров, указанных в табл. 2, иллюстрируют высокую эффективность использования подобного алгоритма. Ошибка по определению интенсивности возмущающего фактора по абсолютной величине составляет около 3,7 м/с, что является приемлемым значением разброса, при котором возможна реализация попадания с заданной точностью.

Несмотря на достаточно хорошие результаты по точности, использование данного алгоритма по-прежнему характеризуется склонностью к переобучению и значительным временем обучения. Помимо того, данный алгоритм является менее «гибким» для ручной настройки проектировщиком модели, так как количество настраиваемых параметров ограничено. Более того, при увеличении количества данных в обучающей выборке для сохранений неизменного качества необходимо увеличивать размер и сложность подобной модели.

Градиентный бустинг. Одним из методов машинного обучения, позволяющим улучшить результаты моделирования решающего дерева или иной модели, является бустинг [10]. Идея его использования заключается в последовательном построении частных моделей,

каждая из которых обучается с использованием информации об ошибках предыдущей модели. При этом результирующая модель представляет собой линейную комбинацию ансамбля частных моделей. Градиентный бустинг осуществляет комбинацию моделей с учетом минимизации любой штрафной функции.

Рассмотрим подобный алгоритм для решения задачи регрессии с помощью решающих деревьев. На первом шаге по значениям исходных признаков строится дерево f 1( X) и находится вектор абсолютной ошибки (остатков) г1 . На следующем шаге строится новое регрессионное дерево f (X), однако в качестве данных для обучения используется не сама обучающая выборка, а вектор ошибки предыдущего дерева. Линейная комбинация прогноза по построенным деревь-

12 2

ям дает новые остатки г +А/ (X) ^ г , причем этот процесс повторяется итерационно по нескольку раз. Параметр сжатия X регулирует скорость процесса схождения деревьев, позволяя создавать комбинации деревьев более сложной формы для минимизации остатков.

Список параметров, среди которых осуществляется перебор, и значения параметров, которые были выбраны, а также метрика для соответствующих выбранных параметров приведены в табл. 5.

Таблица 5

Значения гиперпараметров и метрика для градиентного бустинга

Параметр Набор параметров Выбранное значение М8Б, м2/с2 МАЕ, м/с R2

Скорость обучения [0; 0,01; 0,1; 0,5] 0,4 0,016 2,29 0,9385

^еБИшайге [100; 150; 200] 200 0,0154 0,97 0,9842

тт_5атр1ез_5рШ: [2; 0,05; 0,1; 0,2] 2 0,0154 1,97 0,9841

тт_5атр1ез_1еаГ [1; 0,01; 0,05] 1 0,0154 1,97 0,9841

тах_1еа1иге8 [ЪдП'; 0,5; 0,75] 0,5 0,0154 1,97 0,9841

На основе проведенного анализа можно сделать вывод, что использование градиентного бустинга весьма эффективно, так как ошибка при определении интенсивности возмущающих факторов по абсолютной величине составляет порядка 1 м/с, что характеризует сопоставимое качество модели по сравнению со случайным лесом и полносвязной нейронной сетью. Преимущество использования данного алгоритма по сравнению со случайным лесом заключается в том, что случайный лес выдает лучший результат лишь по истечении прохождения по множеству независимых деревьев, в то время как градиентный бустинг объединяет и улучшает результаты последовательно во время обучения. Это позволяет повысить производительность модели. Однако наличие шума в системе, равно как и для модели случайного леса, может привести к переобучению.

Сравнительный анализ результатов моделирования. Графически результаты идентификации на тестовой выборке при использовании трех исследуемых моделей машинного обучения приведены на рис. 8. Видно, что модель нейронной сети позволяет практически точно распознавать значение скорости ветра для различных комбинаций тестовых данных. Следующий по качеству результат принадлежит градиентному бустингу, затем — модели случайного леса.

А У„ м/с

А У„ м/с

Рис. 8. Результаты обучения моделей машинного обучения:

а — нейронная сеть, б — случайный лес, в — градиентный бустинг

Тем не менее каждая из представленных моделей демонстрирует сравнительное качество. В общем случае с математической точки зрения каждый из этих методов применим для получения результата,

приемлемого для решения поставленной задачи. Однако необходимо учитывать ряд факторов, связанных с интерпретацией, дальнейшей реализацией и внедрением моделей.

Дело в том, что наиболее простыми и производительными алгоритмами являются модели, основанные на концепции решающих деревьев (случайный лес, градиентный бустинг), однако они являются чрезвычайно сложно интерпретируемыми. Еще один из недостатков указанных моделей заключается в том, что они могут приводить к построению громоздких композиций, состоящих из сотен алгоритмов. Такие композиции требуют больших объемов памяти для хранения базовых алгоритмов и существенных затрат времени на вычисление классификаций.

Этих недостатков лишен алгоритм полносвязной нейронной сети. Нейронные сети — очень эффективный и мощный инструмент для восстановления сложнейших зависимостей. Чрезвычайно широкий функционал подобных алгоритмов, а также мощный скачок в развитии за последние годы позволяют сделать модель более гибкой, настраиваемой. Большое внимание в настоящее время уделяется совершенствованию алгоритмов обучения, значительный рост производительности и точности демонстрируют рекуррентные нейронные сети и сети-трансформеры. Применение подобных моделей позволит сделать большой шаг в развитии систем управления ЛА.

Таким образом, для использования в интеллектуальном блоке идентификации возмущений авторы данной статьи выбрали модель машинного обучения на основе полносвязной нейронной сети и глубокого обучения.

Заключение. В результате проведенного исследования продемонстрирована возможность применения алгоритмов машинного обучения в системах наведения летательных аппаратов. Введены основные принципы и понятия, на основе которых формируется так называемый «интеллектуальный блок». Применение подобных технологий в ракетно-космической технике позволит существенно расширить функционал используемых систем наведения. В сущности, подобные системы позволят реализовать интеллектуальную адаптацию ЛА к внешним условиям в автономном полете.

ЛИТЕРАТУРА

[1] Клишин А.Н. Управление коэффициентами усиления системы стабилизации летательных аппаратов для компенсации ее нестационарности. Тезисы докладовXXVIIГагаринских чтений. Москва, 2002, с. 106.

[2] Klishin A.N., Kolesnikova D.S. High-precision aircraft guidance system with axial acceleration self-tuning. Herald of the Bauman Moscow State Technical University, Series Mechanical Engineering, 2022, no. 4 (143), pp. 60-76. https://doi.org/10.18698/0236-3941-2022-4-60-76

[3] Кузин С.А. Адаптивная система управления продольным движением многорежимного самолета. Ученые записки ЦАГИ, 2005, № 1-2, с. 79.

[4] Зайцев А.В., Канушкин С.В., Волков А.В., Тов Вэй Тун. Алгоритм оптимального управления летательного аппарата с учетом влияния внешних возмущений. Транспортное дело России, 2015, № 5, с. 158.

[5] Галаев С.А. Научно-методический подход к оцениванию состояния сложных объектов в условиях разнородности измерительной информации. Образовательные ресурсы и технологии, 2018, № 1 (22), с. 44-48.

[6] Буков В.Н. Адаптивные прогнозирующие системы управления полетом. Москва, Наука, 1987, 232 с.

[7] Лысенко Л.Н. Наведение баллистических ракет. Москва, Изд-во МГТУ им. Н.Э. Баумана, 2016, 445 с.

[8] Сихарулидзе Ю.Г. Баллистика и наведение летательных аппаратов. Москва, Наука, 2013, 407 с.

[9] Жерон О. Прикладное машинное обучение с помощью Scikit-Learn и Tensor-Flow: концепции, инструменты и техники для создания интеллектуальных систем. Санкт-Петербург, ООО «Альфа-книга», 2018, 688 с.

[10] Миронов А.М. Машинное обучение. Часть 1. Москва, МАКС Пресс, 2018, 90 с.

[11] Шитиков В.К., Мастицкий С.Э. Классификация, регрессия, алгоритмы Data Mining с использованием R. URL: https://github.com/ranalytics/data-mining (дата обращения 12.12.2021).

Статья поступила в редакцию 27.03.2022

Ссылку на эту статью просим оформлять следующим образом:

Клишин А.Н., Колесникова Д.С. Многошаговый алгоритм терминального наведения с интеллектуальной адаптацией к ветровым возмущениям. Инженерный журнал: наука и инновации, 2023, вып. 1.

http://dx.doi.org/10.18698/2308-6033-2023-1-2247

Клишин Алексей Николаевич — канд. техн. наук, доцент кафедры «Динамика и управление полетом ракет и космических аппаратов» МГТУ им. Н.Э. Баумана; автор более 150 научных и научно-популярных работ в области баллистики, динамики полета, управления движением летательных аппаратов и истории оружия. e-mail: alkl@mail.ru

Колесникова Дарья Сергеевна — студентка кафедры «Динамика и управление полетом ракет и космических аппаратов» МГТУ им. Н.Э. Баумана. e-mail: kolesnikovads@student.bmstu.ru

Multistep terminal guidance algorithm with intelligent adaptation to wind disturbances

© A.N. Klishin, D.S. Kolesnikova Bauman Moscow State Technical University, Moscow, 105005, Russia

The paper presents a qualitatively new approach to terminal guidance at the final trajectory section for the surface-to-surface class aerial vehicles. The proposed structure of the adaptive control system for an aerial vehicle is based on the multi-step terminal guidance algorithm. Adaptive corrections to the control coefficients were calculated using the developed method for identifying the wind disturbances based on the machine learning models. The work describes technique to form an intelligent algorithm for identifying intensity and direction of the wind load acting on the aerial vehicle in flight. Options of the machine learning models used in the guidance system intelligent block were investigated; their operation results are presented; and the comparative analysis has been carried out. The adaptive guidance system operation procedure is demonstrated on a typical model of the aerial vehicle flying in the atmosphere and targeting a fixed object. Numerical simulation results are presented, and possibility of using such an algorithm and implementing the described system are demonstrated.

Keywords: aerial vehicle, terminal guidance, adaptive control system, disturbance identification, intelligent guidance system, wind

REFERENCES

[1] Klishin A.N. Upravlenie koeffitsientami usileniya stabilizatsii letatelnykh appa-ratov dlya kompensatsii eye nestatsionarnosti [Control of the gain coefficients of the aircraft stabilization system to compensate for its unsteadiness]. In: Tezisy dokladov XXVII Gagarinskikh chteniy [Abstracts from the XXVII Gagarin Readings]. Moscow, 2002, p. 106.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[2] Klishin A.N., Kolesnikova D.S. High-precision aircraft guidance system with axial acceleration self-tuning. Herald of the Bauman Moscow State Technical University, Series Mechanical Engineering, 2022, no. 4 (143), pp. 60-76. https://doi.org/10.18698/0236-3941-2022-4-60-76

[3] Kuzin S.A. Adaptivnaya sistema upravleniya prodolnym dvizheniem mnog-orezhimnogo samoleta [Adaptive longitudinal motion control system of a multimode aircraft]. Uchenye zapiski TsAGI — TsAGI Science Journal, 2005, no. 1-2, p. 79.

[4] Zaitsev A.V., Kanushkin S.V., Volkov A.V., Toe Wai Tun. Algoritm optimal-nogo upravleniya letatelnogo apparata s uchetom vliyaniya vneshnikh vozmus-cheniy [The algorithm of optimal control of the aircraft taking into account the influence of external disturbances]. Transportnoe delo Rossii — Transport Business of Russia, 2015, no. 5, p. 158.

[5] Galaev S.A. Nauchno-metodicheskiy podkhod k otsenivaniyu sostoyaniya slozhnykh obyektov v usloviyakh raznorodnosti izmeritelnoy informatsii [Scientific and methodical approach to state estimation of complex objects under the conditions of heterogeneity of measurement information]. Obrazovatelnye resursy i tekhnologii — Educational Resources and Technologies, 2018, no. 1 (22), pp. 44-48.

[6] Bukov V.N. Adaptivnye prognoziruyuschie sistemy upravleniya poletom [Adaptive predictive flight control systems]. Moscow, Nauka Publ., 1987, 232 p.

[7] Lysenko L.N. Navedenie ballisticheskikh raket [Guidance of ballistic missiles]. Moscow, BMSTU Publ., 2016, 445 p.

[8] Sikharulidze Yu.G. Ballistika i navedenie letatelnykh apparatov [Ballistics and guidance of aircraft]. Moscow, Nauka Publ., 2013, 407 p.

[9] Geron A. Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques for Building Intelligent Systems. O'Reilly Media, Inc., 2019 [In Russ.: Zheron O. Prikladnoe mashinnoe obuchenie s pomoschyu Scikit-Learn i TensorFlow: kontseptsii, instrumenty i tekhniki dlya sozdaniya in-tellektualnykh sistem. St. Petersburg, Alfa-Kniga Publ., 2018, 688 p.].

[10] Mironov A.M. Mashinnoe obuchenie, chast 1 [Machine learning, part 1]. Moscow, MAKS Press Publ., 2018, 90 p.

[11] Shitikov V.K., Mastitsky S.E. Klassifikatsiya, regressiya, algoritmy Data Mining s ispolzovaniem R [Classification, regression, Data Mining algorithms using R]. Available at: https://github.com/ranalytics/data-mining (accessed December 12, 2021).

Klishin A.N., Cand. Sc. (Eng.), Associate Professor, Department of Dynamics and Control of the Rocket and Spacecraft Flight, Bauman Moscow State Technical University; author of more than 150 scientific and popular works in ballistics, flight dynamics, aerial vehicle control and weapons history. e-mail: alkl@mail.ru

Kolesnikova D.S., Student, Department of Dynamics and Control of the Rocket and Spacecraft Flight, Bauman Moscow State Technical University. e-mail: kolesnikovads@student.bmstu.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.