ISSN 2079-3316 ПРОГРАММНЫЕ СИСТЕМЫ: ТЕОРИЯ И ПРИЛОЖЕНИЯ № 5(23), 2014, с. 67-77 удк 629.7.015
М. В. Хачумов
Задача автоматического управления летательным аппаратом в процессе преследования цели
Аннотация. Решается задача управления беспилотным летательным аппаратом (далее по тексту, ЛА) в процессе преследования цели, движущейся по криволинейной траектории в плоскости тангажа. Предложена схема работы системы управления, основанная на реализации простых правил в соответствии с текущими и прогнозными состояниями ЛА и цели. Решаются задачи прогнозирования траектории движения цели с применением аппарата искусственных нейронных сетей (ИНС) и определения точки встречи с ЛА. В экспериментальной части работы моделируется преследование цели в возмущенной среде.
Ключевые слова и фразы: автоматическое управление, преследование цели, прогнозирование траектории, искусственные нейронные сети, параметрический сплайн, правила.
Введение
Актуальность темы исследования обусловлена необходимостью решения задачи преследования-убегания, рассмотренной в серии работ [1-5], в которых сформулированы основные принципы оптимального управления летательным аппаратом. Однако практическое решение этой задачи непосредственно на борту ЛА наталкивается на большие вычислительные трудности, которые не могут быть преодолены ограниченными аппаратными ресурсами и требуют пересмотра самого принципа управления. Одним из эффективных подходов является привлечение средств искусственного интеллекта, в частности, алгоритмов имитации действий человека-оператора, управляющего ЛА, на основе применения стратегии сближения, реализуемой простыми правилами. Задача управления летательным аппаратом в условиях
Работа выполнена в рамках проекта Программы фундаментальных исследований ОНИТ 1 РАН «Развитие методов интеллектуального анализа данных и управления робототехническими системами с применением бесконтактных человеко-машинных интерфейсов» и в рамках проекта РФФИ № 13-07-00025 А.
© М. В. Хачумов, 2014
© Институт системного анализа РАН, 2014 © Программные системы: теория и приложения, 2014
ветровой нагрузки в процессе преследования цели, совершающей на заданном временном интервале кусочно-линейное движение, рассматривалась автором в работе [6]. В ней была показана принципиальная возможность использования простейшего имитатора пилота. В настоящей статье цель движется по заранее неизвестному криволинейному маршруту, что существенно усложняет задачу преследования.
1. Постановка задачи
Предполагается, что цель движется по криволинейной траектории, а ЛА преследует ее, руководствуясь возможностью управления углом тангажа. Примем скорость цели — vc, а скорость ЛА vp > vc. Индексом р помечаются переменные преследователя, а индексом с — цели. Во время преследования догоняющий «видит» цель, т.е. знает координаты свои и цели в каждый текущий момент времени. В результате ветровых возмущений возможно отклонение летательного аппарата от траектории преследования, причем существенное, что инициирует преследование с повышенной скоростью.
Пусть (xp(t),yp(t)) и (xc(t),yc(t)) — координаты ЛА и цели, а d(t) — расстояние между ними в момент времени t. Задача на этапе преследования заключается в построении такого управления углом тангажа 0p(t) на временном отрезке ро, Тр] при наличии возмущений, что d(Tp) < е и Тр ^ min.
Рассмотрим в общем виде способ ее решения. Преследователь наблюдает за целью, накапливая данные, и в некоторый момент времени То начинает преследовать цель на основе знания ее текущего состояния и прогноза движения. Прогнозирование траектории цели осуществляется с помощью ИНС, обученной на накопленных данных. Восстанавливаемая траектория движения цели описывается параметрическим кубическим сплайном и используется для решения задачи определения предполагаемой точки встречи в стратегии сближения. Задача преследования в возмущенной воздушной среде решается на основе простых правил имитирующих поведение летчика (человека-оператора), что позволяет достичь приемлемых результатов менее трудоемкими средствами, что существенно для реализации режима реального времени. Далее рассмотрим более детально компоненты предлагаемого решения задачи.
2. Прогнозирование движения цели
Известно, что для случая равномерного прямолинейного движения преследователь догонит цель на окружности Аполлония [5].
Рис. 1. Архитектура ИНС для прогнозирования движения и результаты экспериментов
В случае сложного (криволинейного движения) прогнозирование значений временного ряда будем осуществлять с помощью ИНС прямого распространения с сигмоидальной функцией активации а(х) =
1 + е-х '
Пусть известны значения координат цели (хс(1^,ус(1^) в моменты времени ^ = ¿о,... ,tj, tj = То. Ставится задача прогнозирования п последующих значений координат цели (жс(^), ус(^)), где и = tj+l,... ,tj+n. Для этого выполняется обучение сети на имеющихся данных. Для сканирования временного ряда скользящим окном будем использовать т значений. Число входов первого слоя равно 2т и соответствует двум векторам координат цели на плоскости, охватываемых окном. Число слоев второго слоя подбирается экспериментально. Третий слой содержит два нейрона, выход одного из них служит для прогнозирования координаты х следующей точки, а выход второго — координаты у (рис. 1).
Для обучения ИНС (настройки) используется метод обратного распространения ошибки. При подаче на вход нейронной сети т значений, добиваемся получения на выходе прогнозного значения (т +1). Для получения значения (т + 2) может быть использован прогноз, полученный на предыдущем этапе. На рис. 2 представлены результаты проведенных экспериментов по прогнозированию траектории движения цели средствами МаШЬ. Траектория цели задана
произведением сигналов сгенерированных на выходе блоков Chirp Signal (формирование синусоидальных колебаний, частота которых линейно изменяется) и Ramp (формирование линейного сигнала). Прогноз совершался на один шаг вперед при известных текущих координатах цели. Как показывают эксперименты, нейронная сеть достаточно уверенно прогнозирует элементы временного ряда также и на несколько шагов вперед.
На рис. 2 светлой линией обозначена реальная траектория цели, темной — прогнозная. При преследовании цели в реальном времени, необходимо сравнивать полученные сетью прогнозные значения и реальные координаты цели и при необходимости проводить переобучение сети.
3. Задача опережающего определения точки встречи ЛА и цели
После получения прогноза п последующих значений координат цели, необходимо дать математическое описание траектории движения цели для решения задачи определения точки встречи. Ограничимся случаем п =1, т.к. долгосрочный прогноз теряет свою актуальность. Воспользуемся способом приближения кривой сплайнами.
Выражения для локального параметрического эрмитового кубического сплайна имеет следующий вид [7]:
5(х, т) =хг{1 - 3т2 + 2т3) + жт(3т2 - 2т3) + х!^(т - 2т2 + т3)-2 - т3),
Б(у, т) =^(1 - 3т2 + 2т3) + у.,+1(3т2 - 2т3) + у&(т - 2т2 + г3)-
-у[+Мт2 - т3).
Здесь (х^, у^) — координаты г-ой узловой точки, г = 0,... ,к-1; к — количество узлов; ¿г = \/(х^+1 - х) + (у1+1 - Уг)2; х'г, у[ — приближенные значения производных в г-ой узловой точке по длине дуги интерполируемой кривой; параметр т изменяется в пределах [0,1]. Способ вычисления производных достаточно рассмотреть для одной компоненты.
Для первой точки:
¿0 \ Х1 - х0 ¿о Х2 - Х1
(1 + Лт)
\ а0 + а\)
d0 + d\ J d0 do + d\ d\
Рис. 2. Результаты экспериментов прогнозирования движения цели
для промежуточной точки:
/ ¿г— 1 Х-1— 1 XI Хг X1
х- ^--+--;
Дг-1 + Дг ¿г ¿г-1 + ¿г ¿г-1
для конечной точки:
2 _ -^-1 , Хк - Хк-1 / _ ¿к-1 \ Хк-1 - Хк-2
(2- ¿к-1 А Хк - хк-1 Л
\ ¿к-1 +Дк) ¿к-1 \
¿к-1 + ¿к) ¿к-1 V ¿к-1 + ¿к) ¿к-2
Пусть текущие координаты цели (хг(г), ус(^г)), а прогнозные — (хг(i+l), ус(Ъ¿+1)). Необходимо построить траекторию движения цели на временном отрезке \рг, Ь 1+1]. Тогда выражение для сплайна принимает следующий вид:
Б(хс, т) =хс(1 i)(1 - 3т2 + 2т3) + хс(1 + )(3т2 - 2т3) +
+х'с(Ь1 )Ъ(т - 2т2 + т3) - х'с(и+1)Ь(т2 - т3),
я (у С г) =ус(г ¿)(1 - 3т2 + 2т3) + ус(г +1)(3т2 - 2т 3)+
+у'с(и)Ъ(т - 2т2 + т3) - у'с(и+1)Ъ(т2 - т3).
Для нахождения точки встречи ЛА с целью необходимо решить следующую задачу:
{Б(хс, т) = Хр(Ьг) + УрТ СОв(в)
я(Ус т) = Ур (и )+УрТ вт(е) ,
где т € [0,1] — параметр, нормализующий время.
Решение системы (1) позволяет вычислить угол в преследования цели. Здесь целесообразно применить метод Ньютона [8], который легко реализуется и подходит для вычислений на борту ЛА в реальном времени. Отсутствие решения означает, что ЛА не успевает догнать цель на спрогнозированном интервале. В таком случае ЛА для определенности может лететь в последнюю спрогнозированную точку (хс^{+1), ус(Ъ¿+1)). Соответствующий угол в находим следующим образом:
(2) Ус(!г+1],- Ур=ч в.
4. Система управления ЛА
В процессе преследования цели на исследуемом интервале времени задача (1)—(2) многократно возобновляется, ввиду действующих
Рис. 3. Схема моделирования работы системы управления
возмущений, которые вызывают рассогласование положений ЛА и цели.
Схема моделирования работы системы управления представлена на рис. 3.
Реализация механизма управления основана на выполнении следующих функций:
(1) чтение текущих параметров ЛА и цели из базы данных (состояние системы «ЛА-цель»);
(2) отработка стратегии сближения: поиск применимых правил (применимые правила — правила, условия которых выполнимы);
(3) расчет угла тангажа ЛА для встречи с целью;
(4) передача выбранного правила на выполнение в систему для его применения к текущему состоянию модели ЛА;
(5) синхронизация внутренних тактов системы с реальным временем;
(6) измерение параметров нового состояния системы «ЛА-цель» (замыкание) и их запись в базу данных.
Стратегия действует до момента достижения цели (расстояние между ЛА и целью не превышает наперед заданного порога).
Существенную роль здесь играет выбор правил управления на основе текущих данных о состояниях ЛА и цели. Правила задают условия, при которых вырабатываются конкретные управления. Одним из основных является следующее правило выбора угла тангажа в для преследования цели: если существует решение системы (1), то .задать угол тангажа в, решив (1); иначе .задать угол тангажа на основе равенства (2).
о1-'-1-'-тЬ-тЬ-
О 6 10 16 20 2Ь 3D
X
Рис. 4. Сравнение траекторий движения ЛА и цели
Модель ЛА, как объекта системы автоматического управления, содержит стабилизирующий контур, который получает задание на установление угла тангажа и отрабатывает их в условиях возмущающих ветровых воздействий [6].
5. Моделирования сближения ЛА с целью
Моделирование сближения ЛА с целью в неспокойной атмосфере осуществляется в базовой системе координат с помощью программного обеспечения MATLAB и системы Simulink.
Рассматривается случай, при котором на летательный аппарат воздействует встречный ветер. Примем скорость цели vc = 30 м/с, скорость ЛА vp = 50 м/с. Ветровая нагрузка состоит в общем случае из двух составляющих. Первая учитывает распределение скорости ветра по высоте, и ее закон устанавливается в зависимости от местности. Вторая составляющая носит случайный характер и непосредственно влияет на изменение угла тангажа. Среднеквадратичные значения продольной составляющей ветра ат = 4 м/с. На рис. 4 представлены траектории движения цели (светлая кривая) и ЛА (темная кривая). Пройденное расстояние измеряется в километрах.
На рис. 4 и рис. 5 траектория цели задана произведением сигналов сгенерированных на выходе блоков Chirp Signal (формирование синусоидальных колебаний, частота которых линейно изменяется) и
Рис. 5. Задача следования за целью
Ramp (формирование линейного сигнала). Видно, что ЛА осуществляет вполне логичные действия по преследованию цели, завершая полет, догнав цель.
6. Моделирования следования ЛА за целью
В работе [6] была рассмотрена проводка ЛА по заданному маршруту как задача преследования цели. Предлагается полученными средствами решить задачу следования за целью на заданном временном отрезке. При этом используется две скорости ЛА: vpi = vc и vpi > vc. Результаты эксперимента показаны на рис. 5.
Из рис. 5 видно, что ЛА (темная кривая) под действием имитатора сначала выполняет сближение с целью (светлая кривая), отклоняясь в дальнейшем в допустимых пределах от ее траектории. Общее время моделирования составило 400 секунд.
Заключение
Предложенный способ решения задачи предоставляет достаточно широкие возможности для автоматического управления ЛА в процессе преследования цели на основе простых правил. Использование ИНС и аппроксимации кубическими сплайнами позволяет получать приемлемое по точности решение выбора угла тангажа в условиях дефицита времени и необходимости оперативных действий. Моделирование процессов сближения ЛА с целью и следования за нею
при наличии ветровой нагрузки, показало, что предложенная система управления, достаточно уверенно отрабатывает рассогласование между ЛА и целью.
Список литературы
[1] Анисимов В.Н., Кабанов С. А., «Управление траекторией движения летательного аппарата при облете препятствий с применением методов аналитической механики», Автоматика и телемеханика, 2005, №3, с. 3-10 t 67.
[2] Красовский Н. Н., Котельникова А. Н., «Стохастическое управление в детерминированной дифференциальной игре сближения-уклонения», Автоматика и телемеханика, 2011, №2, с. 93-110 ^ 67.
[3] Понтрягин Л. С., «Оптимизация и дифференциальные игры», Вестник АН СССР, 1978, №7, с. 10-17 t 67.
[4] Петросян Л. А., «Дифференциальные игры преследования», Соросов-ский Образовательный Журнал, 1995, №1 ^ 67.
[5] Петросян Л. А., Рихсиев Б. Б., Преследование на плоскости, Наука, М., 1991, 96 с. t 67, 68.
[6] Абрамов Н. С., Хачумов М. В., «Моделирование проводки по маршруту беспилотного летательного аппарата как задачи преследования цели», Авиакосмическое приборостроение, 2013, №9, с. 9-22 ^ 68, 74, 75.
[7] Завьялов Ю. С., Квасов Б. И., Мирошниченко В. Л., Методы сплайн-функций, Наука, М., 1980, 352 с. ^ 70.
[8] Бахвалов Н. С., Жидков Н.П., Кобельков Г. М., Численные методы, БИНОМ. Лаборатория знаний, М., 2008, 640 с. t 72.
Рекомендовал к публикации д.т.н. В. И. Гурман
Об авторе:
«Г
Михаил Вячеславович Хачумов
Кандидат физико-математических наук, научный сотрудник Института системного анализа Российской академии наук. Область научных интересов: интеллектуальное управление, управление динамическими системами, кластерный анализ слабоструктурированных данных, обработка изображений и распознавание образов.
e-mail: [email protected]
Образец ссылки на эту публикацию:
М. В. Хачумов. Задача автоматического управления летательным аппаратом в процессе преследования цели // Программные системы: теория и приложения: электрон. научн. журн. 2014. T. 5, № 5(23), с. 67-77.
URL http://psta.psiras.ru/read/psta2014_5_67-77.pdf
Mikhail Khachumov. The task of control of an unmanned aerial vehicle in the process of pursuit of the target.
Abstract. The task of control of an unmanned aerial vehicle (hereinafter, UAV) in the process of pursuit of the target moving along a curvilinear in the pitch plane is solved. A scheme of the control system based on the implementation of simple rules in accordance with the current and expected condition of the UAV and the target is given. The tasks of predicting the trajectory of target movement using the apparatus of artificial neural networks (ANN) and the calculation of the point of meeting with UAV are solved. In the experimental part of the article the pursuit of the target in a perturbed environment is modeled. (In Russian)
Key Words and Phrases: automatic control, target pursuit, trajectory prediction, artificial neural networks, parametric spline, rules.