УДК 658.286:621.868.2
г
\
БО! 10.21685/2307-4205-2017-4-8
ИНФОРМАЦИОННОЕ МОДЕЛИРОВАНИЕ В ЗАДАЧАХ ПОИСКА УПРАВЛЕНИЯ ПОДВИЖНЫМ ОБЪЕКТОМ
А. В. Полтавский, В. П. Буц, Н. К. Юрков
А
Введение
В ходе решения множества навигационных задач организации траектории движения и управления применением беспилотных летательных аппаратов (БЛА) часто возникает вопрос о достаточности ресурсов по управлению достижения тех или иных областей координатного пространства из текущего (заданного) состояния и, если такие границы достижимы, то какой тогда вид имеет и сама траектория движения объекта? Положение в определенной мере может еще осложняться отказами датчиков информации, органов управления или двигателей БЛА. Для оператора, управляющего поврежденным БЛА с мобильного наземного пункта управления (НПУ), необходимо и важно знать оставшиеся возможности БЛА для выполнения маневров, связанных с поиском различных объектов-целей и т.п. В связи с этим представляется решение весьма актуальной задачи разработки информационных моделей и рациональных алгоритмов, позволяющих в реальном масштабе времени осуществлять решение задачи для траекторного анализа. Принципиально, такое решение задачи возможно с использованием известных методов оптимального управления (ОУ) [1-3]. Подробный анализ каждого из достаточно хорошо известных подходов является достаточно трудоемкой научной проблемой и не входит в проблематику исследования настоящей работы. В данной работе рассматриваются только те особенности, которые послужили источником применения прямой (непосредственной) оптимизации и автоматизированных процедур неградиентного случайного поиска (НСП) в моделях управления движением подвижных объектов (ПО), в частности роботов - БЛА [1, 2, 4, 5].
Для большинства традиционных методов, реализующих основные положения теории классического вариационного исчисления [6-9], задача траекторного анализа в условиях множества нелинейных дифференциальных связей и ограничений типа неравенств представляется практически неразрешимой и особенно в реальном масштабе времени. Принцип максимума Л. С. Понтря-гина, как известно, позволяет, в частности, решать задачи ОУ с нелинейными ограничениями в форме неравенств. Множество областей использования и полученные в них результаты свидетельствуют о достаточно высокой эффективности данного метода, и в то же время решение многих прикладных задач свидетельствует о том, что численная реализация принципа максимума в задачах ОУ сталкивается с многими проблемами. Необходимость одновременного решения основной и сопряженной систем дифференциальных уравнений, которые в большинстве своем являются нелинейными, приводит к значительному возрастанию затрат машинного времени и потребных резервов оперативной памяти компьютера. Например, только при увеличении вдвое размерности матрицы, определяемой основной и сопряженной системами, затраты времени вычислений возрастают приблизительно в 8 раз, т.е. пропорционально кубу увеличения размерности. Альтернативой предлагаемого подхода является прямая оптимизация, взгляд на проблему решения задач траекторного анализа и оптимального управления, в частности траекторных и пилотажных задач полета БЛА. В данном случае полагается, что оптимизационное решение может быть получено в результате вариации производной допустимой опорной функции координат вектора состояния (классическое вариационное исчисление использует в этих целях вариацию непосредственно функции координат вектора состояния, а принцип максимума Л. С. Понтрягина - вариацию управления). Данный принцип позволяет в процессе решения вычислительной задачи избавиться от необходимости многократного интегрирования прямой и сопряженной систем нелинейных дифференциальных уравнений. Получение реализуемого управления ПО осуществляется за один цикл интегрирования динамической системы. В основу прямой оптимизации положен принцип вариации функций производных вектора состояния для опорного решения [2, 3].
Задача оптимизации управления подвижным объектом
Рассмотрим, как введение данного принципа сказывается на характере получаемых в результате его применения оптимальных траекторий. Можно предположить, что при неизменности заданного пространства решений изменение типа функций, по которым осуществляется дифференцирование целевой функции, не должно приводить к изменению вида оптимальных траекторий. Для доказательства этого высказывания воспользуемся следующим рассуждением. Традиционно считается [1-4], что основой для классического вариационного исчисления является уравнение Эйлера. Вывод этого уравнения нестрогим конечно-разностным методом опирается на принятое в математическом анализе допущение о том, что экстремальное значение функционала для произвольной кривой линии может быть получено на основе ее аппроксимации, прямолинейными звеньями с заданными абсциссами их концов. При этом частные производные функционала по ординатам вершин звеньев должны быть равными нулю. Изменим данное допущение предположением, что экстремум заданного функционала достигается на аналогичной кривой, на которой равны нулю его частные производные по производным функции от координаты состояния. Затем применим это допущение в процессе вывода необходимого условия экстремальности функционала. Необходимое условие экстремальности произвольной целевой функции будем проводить нестрогим конечно-разностным методом. Для этого рассмотрим критерий, заданный в виде общепринятого в вычислительной практике функционала [1-4]
Ч
J[х(/)] = |F(1, х, х) ■ Ж, (1)
£
где х(1н) = а, х(4) = Ь, 1 - независимая переменная.
Искать оптимальное значение функционала (1) следует на ломаных, составленных из конечного числа п звеньев с заданными абсциссами вершин
1н + А/, 1н + 2А/, ..., 1н + (п - 1)А?, (2)
где А/1 = (4 - 1н)п-1.
В этом случае функционал J превращается в функцию п-1 переменных - ординат х1, х2, ..., хп-1 и задача определения его экстремума сводится к задаче отыскания такого набора этих переменных, на котором в соответствии с принятым допущением достигаются
= 0, дJ/дx2 = 0,..., дJ/ЭхпЧ = 0. (3)
Решая систему (3), найдем те значения х, (/ = 1, ..., п - 1), при которых функционал J может достигнуть экстремального значения. Для получения необходимого решения проведем следующие необходимые операции. Представим значение заданного функционала (1) в виде приближенной интегральной суммы
4 х(0] = х, (/)], (4)
1=0
J, [х, (/)] = { F ^ 1,, х,, ^^^ Л = F (1,, х,, ^)А/. (5)
Выражение (4) может быть преобразовано к виду
J [ х(1)] = ^и, х,, -А/. (6)
г=0 V )
Следующим шагом рассмотрим частные производные функционала ./[х(,/)] по независимым переменным х{. Далее следует то, что от 7-й производной в (6) зависят
J1 = F (, х,, ^^ ) А/; Jl_1 = F ( ^1, х,_1, ^^ ) А/. (7)
Условным выражением для частной производной исходного функционала по переменной х (' = 1, 2, ..., п _ 1) является
а// 1. (дху ), I дJ/
а// ~а//
/ах,. = '
/а±1
х., х.,Хм х' ' дх
/ах
/ах1
■ДХ +
/а±1
ах,
ахХ'-1/
а^| х,., x, х'
/ах,
ар I ''-1, х-1, х~мГ
=к | х., х, ). дХ+ЛХ, х,
/ах
м
(ахч/ах' )ДХ =
, ах, ■(ах, /ах,.)-дх+
(8)
ДХ
ДХ
■ (-1) .ДХ + ^ (х--1, х-1,
х - х.
ДХ
■ (-1) .ДХ.
Сокращая слагаемые конечного выражения (8) на -АХ и приравнивая найденную производную к нулю, получим очередное выражение
^ (, х, Дх/ДХ) - ^,х, ^ДХ)-^( -1,х -1,Дх' -1'ДХ) = 0
ДХ
или
*;(Х,, х, Дх/ДХ )-Д^х /ДХ = 0,
('= 1, 2, ...,п - 1).
При выводе выражения (8) были произведены подстановки в виде
ах,./ах = -Дх , ахч/ ах = -1.
(9)
(10) (11)
Рациональность формулы (10) может быть проиллюстрирована на примере, на котором приращение координаты опорной траектории и ее производной различаются по знаку, а их отношение пропорционально шагу интегрирования, а замена (11) имеет геометрический смысл. Так как в каждый момент времени Х, варьируется только положение '-й точки траектории, а точки, соответствующие времени Х,_1 и Х+\, фиксированы, произвольное приращение производной ах-1 вызывает равное по модулю и противоположное по знаку приращение производной ах . Решение системы (9) относительно компонент х, (' = 1, 2, ..., п_ 1) позволяет определить множество значений X = (хь х2, ..., х_\}, при которых функционал (1) принимает экстремальное значение. Устремляя число разбиений п ^ да, получим последовательность изX = (хь х2, ...}, которой может быть поставлена в соответствие бесконечная последовательность {/■}. Если предел этой последовательности существует, он может быть искомым экстремумом функционала (1). Предположим, что рассматриваемые вышеперечисленные функции ^ их обладают необходимыми свойствами непрерывности и дифференцируемости по соответствующим аргументам. В выражении для (9) возможен предельный переход при п^^, в итоге
Ех (Х, х, х) - й [ Ек (Х, х, х)]/ dХ = 0.
(12)
Таким образом, равенство (12) согласовывается с предположением об адекватности подходов теории вариационного вычисления и прямой оптимизации.
Решение задачи оптимального управления подвижным объектом
На рис. 1 отображены оптимальные траектории движения БЛА в горизонтальной плоскости наведения, полученные в результате решения задачи на «быстрый разворот» принципом максимума Л. С. Понтрягина (за оптимизируемое управление здесь принималась скорость угла крена
dy/dt БЛА) и прямым методом оптимизации. Уравнения для подвижного объекта представляли зависимости вида [4, 5]
" X' Vcos0cos(
н = Vsin0
Z Vcos0sin(
(13)
~V' g(nx - sin0)
0 = g (nxcosy- cos0)V
_ ( _ -gnysiny[Vcos0] 1
(14)
X. км I 4 ,/77
jy A
/ / -1 1 2 3 4> 4 \ 5 6 Z, км
-2 \
-3
приишш максимума имитационное моделирование
Рис. 1. Схематизация решения задачи на быстрый разворот БЛА
На функции управления по крену и продольной перегрузки накладывались условные ограничения типа неравенств. В практике они обусловлены не только эксплуатационными значениями, но и влиянием механических повреждений или отказов в системе управления подвижного объекта [3, 4].
Далее рассмотрим решение задачи управления БЛА методом прямой оптимизации.
Классическое решение задачи на быстродействие представляет следующий алгоритм. Имеется управляемая динамическая система, в которой управление реализует u eU = {u : (u (< l},
Vt e [0, tk ], а краевые условия имеют следующий вид [1-4]:
х(0) = -4, х(4) = 0, y(0) = 4, y(tk) = 0. (15)
Функционал в данной задаче задается как минимум величины времени окончания движения объекта как материальной точки в виде
J(x(), tk) = tk ^ inf. (16)
Из теории принципа максимума [1-3] следует, что решение поставленной задачи существует и оно единственно. Задача в данном случае не требует доопределения по фазовым координатам и их первой производной, поскольку множество краевых условий является полным, за исключением значений управляющих функций в моменты времени tB и tk. В общем случае эти значения
включаются в число варьируемых параметров и находятся из условия экстремума функционала 3. Смысл исходной задачи и предположение о наличии переключения управления по траектории движения позволяют сразу выбрать управление в виде и(0) = -1, н(Д) = 1. В соответствии с общим подходом [4] в прямой оптимизации вид функции приращения управлений для рассматриваемой задачи определяется динамической системой
* = У, У = и,
(17)
схема вычисления приращений управлений может быть записана как система разностных уравнений вида
Ду, = - (у + у),
& - )
(
Ди, = 0,5
_Ду_ )
(18)
- и, + и.
«Сжимая» последовательно временной интервал, получаем, что 4 = 8. Решая данные системы при 4 = 8, и(0) = -1, и(4) = 1 и И(Х,) = 0,5 (4 — X,), получим управление и траекторию, практически совпадающие с приведенными ранее аналитическими зависимостями. Вычисленные невязки по-прежнему практически равны нулю, а значения функционалов в данной задаче совпадают по определению. Так как условие равенства численного и аналитического функционалов при допустимом значении невязки выполнено, можно говорить об адекватности двух представленных подходов к решению исходной задачи. Как и в траекторном контуре, проведем декомпозицию системы уравнений, описывающих движение в пилотажном контуре модели системы управления (СУ) БЛА, а также построим систему управления, базирующуюся на основных принципах в прямой оптимизации [1, 2].
Информационную модель движения представим как [2]
а = ш -
£ Р(
ш 008 а-та 81п а)---—
У ' V 008 Р
[(
п„ 81п а + п„ 008 а) -
У
- (81п Ф 81п а + 008 Ф 008 у 008 а);
р = (тщ.81п а + тау008 а)- V{[((008а-пу81п а)81п Р-пг008 р] -- [(81п Ф 008 а- 008 Ф 008 у 81п а-81п Р + 008 Ф 81п у 008 Р] };
у = ш* Ф(тту 008 у - шг 81п у);
I (I +I -I )
ху \ .х* уу гг !
(19)
• I I I (I -1 — I х Д х Д у Д
ш ш --
у 2
Д
ш = ^М +—М +
у Д у Д х
^хх ( (хх ^гг -
Д
ш хш 2 +
I (I + I - I )
ху у д^ уу гг /
ш =— М -
г I„ г I
^ уу ~^хх . ^ ху ( 2 „2
—-ш ш н—-1ш -ш
х у т \ х у
ш уш г;
Представим уравнения, входящие в (19), в виде двухуровневой иерархии из системы уравнений. Первый уровень иерархии представляет модель вида
¡¡ = ^(¡1, | —
(20)
где ц = [а, Р,у, V]Т - вектор состояния рассматриваемой системы; - = |шг,шу,шх,пх^ - вектор псевдоуправлений. После разложения в ряд Тейлора система (20) примет вид
Ц к = т( к -к -1) +
эт
ЭцТ
ЭТ
АЦк-1 +Э-Т , Э-Т
Д-к-1.
(21)
Приращением для вектора псевдоуправления на каждом шаге является
эт
А-к - = Э-Т
1
к -1
Цк-Т(к -1, -к -1 )-
эт
ЭцТ
л
АЦ -1
к -1
(22)
• ц, -ц(к-1) б„ „ „
где цк =---1 - потребный средний вектор скорости, определяемый на каждом шаге из
К
условия достижения системой состояния цк .
Здесь решается краевая задача, как и в случае с траекторным контуром, описанным ранее, но в отличие от траекторного контура цк не является свободной координатой и задается исходя из необходимости решения задач, поставленных перед ней траекторным контуром. Интенсивность же управления Кц задается исходя из получения приемлемого качества переходного процесса в ходе решения задачи. Рассматривая короткопериодическое движение и считая, что цк является свободной координатой, решаем краевую задачу в пилотажном контуре. Последующая модель в уровне иерархии представлена контуром моделирования угловых скоростей, который описывается уравнением
ш = й(ш, м),
(23)
где ш = |шх, шу, шг, пх ^ - вектор состояния динамической системы; М = |Мх, Му, М2, Я, фг ^ вектор управлений. После разложения динамической системы в ряд Тейлора, она принимает вид
• ^ V ЭЙ
ш = Й(ш Мк -1
Аш
ЭЙ
к -1
ЭМТ
АМк -1.
(24)
Приращение для вектора управления объекта на каждом шаге определяется:
АМ, 1 = -
Эй
ЭМТ
1
к -1
та,
-Й(Шк -1, Мк -1)-
Эй
ЭшТ
Ашк
к -1
к -1 /
(25)
где Шк =
А^хк Аюук А^гк Апх
- потребный средний вектор скорости, определяемый на
каждом шаге из получения решения для уравнения (25) ; Иш - интенсивность управления, определяется из дополнительного условия. Интенсивность управления определяет характер переходного процесса в динамической системе. Изменяя Кш, мы в состоянии получить практически весь диапазон переходных процессов для информационной модели объекта. На практике интенсивность управления выбирается либо из условия получения приемлемого переходного процесса, либо из условия решения оптимизационной задачи. Отметим, что интенсивность управления в информационной модели БЛА для каждой координаты вектора шк может подбираться индивидуально в зависимости от режима движения робота - полета БЛА. Полученные приращения для моментов в уравнении пересчитываются в отклонения рулевых органов СУ БЛА. На рис. 1 показано одно из частных решений оптимизационной задачи траекторного управления БЛА в горизонтальной плоскости его движения.
Библиографический список
1. Казаков, И. Е. Статистическая теория систем управления в пространстве состояний / И. Е. Казаков. -М. : Наука, 1975.
2. Казаков, И. Е. Статистическая динамика систем с переменной структурой / И. Е. Казаков. - М. : Наука, 1977.
3. Красовский, А. А. Системы автоматического управления летательных аппаратов / А. А. Красовский, Ю. А. Вавилов. - М. : Изд. ВВИА им. проф. Н. Е. Жуковского, 1986.
4. Казаков, И. Е. Методы оптимизации стохастических систем / И. Е. Казаков, Д. И. Гладков. - М. : Наука, 1987.
5. Казаков, И. Е. Анализ стохастических систем в пространстве состояний / И. Е. Казаков, С. В. Мальчиков. - М. : Наука, 1983.
6. Полтавский, А. В. Управление безопасностью движения беспилотного ЛА / А. В. Полтавский // Датчики и системы. - 2008. - № 9. - С. 4-8.
7. Полтавский, А. В. Модель измерительной системы в управлении БЛА / А. В. Полтавский // Информационно-измерительные и управляющие системы. - 2009. - № 10. - С. 73-77.
8. Казаков, И. Е. Авиационные управляемые ракеты / И. Е. Казаков, А. Ф. Мишаков. - М. : Изд. ВВИА им. проф. Н. Е.Жуковского, 1985. - Ч. 2.
9. Пат. РФ № 2302030. Адаптивная СУ БЛА по крену и тангажу / Полтавский А. В. - 2007.
Полтавский Александр Васильевич
доктор технических наук, профессор,
кафедра информатизации образования,
Институт математики, информатики
и естественных наук,
Московский государственный
педагогический университет;
ведущий научный сотрудник,
Институт проблем управления
им. В. А. Трапезникова РАН
(117997, Россия, г. Москва, ул. Профсоюзная, 65)
E-mail: avp57avp@yandex.ru
Буц Виктор Петрович
доктор технических наук, профессор, кафедра конструирования и производства радиоаппаратуры, Пензенский государственный университет (440026, Россия, г. Пенза, ул. Красная, 40) E-mail: kipra@pnzgu.ru
Юрков Николай Кондратьевич
доктор технических наук, профессор, заведующий кафедрой конструирования и производства радиоаппаратуры, Пензенский государственный университет (440026, Россия, г. Пенза, ул. Красная, 40) E-mail: yurkov_NK@mail.ru
Аннотация. Актуальность и цели. Показано, что в ходе решения задач организации траектории движения беспилотных летательных аппаратов (БЛА) часто возникает вопрос о достаточности ресурсов по управлению с целью достижения тех или иных областей координатного пространства. Следует определить вид траектории движения объекта для выхода БЛА из текущего (заданного) состояния в заданную точку при условии нахождения управле-
Poltavskiy Aleksandr Vasil'evich doctor of technical sciences,
Professor of «Informatization of Education» Institute of Mathematics, Informatics and Natural Sciences, Moscow State Pedagogical University; leading researcher,
ICS RAS named after V. A. Trapeznikov (117997, Россия 65 Profsoyuznaya street, Moscow, Russia)
Buts Viktor Petrovich
doctor of technical sciences, professor,
sub-department of radio equipment design
and production,
Penza State University
(440026, 40 Krasnaya street, Penza, Russia)
Yurkov Nikolay Kondrat'evich
doctor of technical sciences, professor,
head of sub-department of radio equipment design
and production,
Penza State University
(440026, 40 Krasnaya street, Penza, Russia)
Abstract. Background. It is shown that in the course of solving the problems of organizing the trajectory of unmanned aerial vehicles (UAVs), the question often arises of the adequacy of control resources in order to achieve certain areas of the coordinate space. It is necessary to determine the type of the object's trajectory for the output of the UAV from the current (specified) state to a given point, provided that controls are located within the specified boundaries. The problem of developing
ний в заданных границах. Ставится и решается задача разработки информационных моделей и рациональных алгоритмов, позволяющих в реальном масштабе времени осуществлять решение задачи для траекторного анализа. Материалы и методы. В ходе решения поставленной задачи рассматриваются только те особенности, которые послужили источником применения прямой (непосредственной) оптимизации и автоматизированных процедур неградиентного случайного поиска в моделях управления движением подвижных объектов. Результаты. Решена задача оптимизации управления подвижным объектом на «быстрый разворот» согласно принципу максимума Л. С. Понтрягина. Показано, что интенсивность управления определяет характер переходного процесса в динамической системе, причем интенсивность управления в информационной модели БЛА для каждой координаты вектора должна подбираться индивидуально в зависимости от режима полета БЛА. Выводы. Дан один из подходов поиска оптимального управления при имитационном моделировании и поиска характеристик подвижных объектов.
Ключевые слова: комплекс с БЛА, состав, структура, система.
information models and rational algorithms that allow realizing the solution of the problem for trajectory analysis is put and is being solved. Materials and methods. In the course of solving the task posed, only those features that have served as a source of application of direct (immediate) optimization and automated procedures of non-gradient random search in motion control models of mobile objects are considered. Results. The problem of optimizing the control of a moving object for a "fast turn" is solved in accordance with the maximum principle of L S. Pontryagin. It is shown that the control intensity determines the nature of the transient process in the dynamic system, and the control intensity in the UAV information model for each vector coordinate must be selected individually depending on the UAV flight mode. Conclusions. One of the approaches to finding the optimal control in simulation simulation and searching for characteristics of moving objects is given.
Key words: UAV complex, composition, weaponry.
УДК 658.286:621.868.2
Полтавский, А. В.
Информационное моделирование в задачах поиска управления подвижным объектом /
А. В. Полтавский, В. П. Буц, Н. К. Юрков // Надежность и качество сложных систем. - 2017. - № 4 (20). -С. 56-63. БО! 10.21685/2307-4205-2017-4-8.