УЧЕНЫЕ ЗАПИСКИ Ц А Г И Т о м IV ~ 19 7 3
М 2
УДК 629.735.33.015.017.2
О СИНТЕЗЕ ОПТИМАЛЬНОЙ СИСТЕМЫ СТАБИЛИЗАЦИИ ТРАЕКТОРИИ ДВИЖЕНИЯ ЦЕНТРА МАСС САМОЛЕТА
В. А. Бобцов
Рассматривается задача синтеза оптимальной системы управления движением центра масс самолета в окрестности номинальной траектории для случая трех управляющих параметров — угла атаки, угла крена и степени дросселирования тяги. Задача решается методами теории аналитического конструирования регуляторов с приближенным учетом ограничений, налагаемых на отклонение управляющих органов. Предполагается, что на борту известны текущие значения веса самолета, скорости, высоты, угла наклона траектории и угла курса. Решение задачи в предположении наличия всей необходимой информации позволяет установить предельные возможности управляющих параметров.
1. Постановка задачи. Уравнения, описывающие движение центра масс самолета в скоростной системе координат без учета сферичности Земли в предположении, что полет происходит без скольжения, имеют вид [1]
йт
м
= f(V, Н, а, /?);
<1у_
=* Н, а, Д) — 81П0];
^ — Н, а, /?) соэ ч — соэ 0];
V сое
;«„(!/, Н, а, /?) эт у;
йН
<и
Кеш 6.
(1.1)
Здесь т — масса самолета, V-—скорость, 0—угол наклона траектории к горизонту; ф — угол курса; //—высота; пх, пу — продольная
и поперечная перегрузки; а — угол атаки; -{ — угол крена; Я — степень дросселирования тяги.
При синтезе системы управления летательным аппаратом может рассматриваться следующая задача. В окрестности заданной номинальной траектории системы (1.1) требуется найти такой закон управления по а, у и Я, который обеспечивает минимум функционала
Л 4- 2/,*(*,
г,
и удовлетворяет ограничениям
з
2
У =1
н
(1.2)
(1.3)
где Иу и хгн, и;н — возмущенные и номинальные значения фазовых координат и управляющих параметров.
Весовые функции а; (1;) и Ру(£), а также матрица (1Ш) определяют переходные процессы в замкнутой системе летательный аппарат 4-система управления. При достаточно большом интервале времени Т влияние матрицы (1Ш) на параметры системы управления, по-видимому, будет незначительным, так как вклад второго слагаемого в функционал при устойчивой замкнутой системе будет тем меньше, чем больше интервал времени Т.
Будем предполагать, что возмущенное движение системы обусловлено начальным отклонением фазовых координат от номинальных значений, причем начальные отклонения принадлежат эллипсоиду:
2 ^ Х‘ (в) - Х1 Н (0)
<1.
(1.4)
В качестве весовых функций а;(^) функционала (1.2) целесообразно выбрать а,-— длины полуосей эллипсоида (1.4), так как именно их величина характеризует, насколько нежелательным является отклонение соответствующей фазовой координаты от номинального значения.
Известно (см. [2] и [3]), что синтез систем управления с помощью принципа максимума или с использованием методов динамического программирования при наличии ограничений на управление связан с преодолением принципиальных и вычислительных трудностей. Поэтому для приближенного решения задачи синтеза с ограниченным управлением будем использовать подход, аналогичный методу штрафных функций [2, 3]. Для этого вместо функционала (1.2) рассмотрим следующий:
Л
+•
*)(*>
2 1ц,(хг-Х1Н)(хк-хка)\т,(1.5)
1, к=\
где (£) — некоторая положительная функция.
Таким образом, исходные ограничения вида (1.3) учитываются с помощью интегрального квадратичного критерия. При этом, как будет показано ниже, функцию т](£) можно подобрать так, чтобы исходные ограничения (1.3) выполнялись.
Задачи с функционалами вида (1.5) представляют интерес и сами по себе (вне связи с ограничениями на управление), и их решению посвящено достаточно большое число работ [2, 3]. Будем
5—Ученые записки ЦАГИ № 2
65
решать задачу приближенно, для чего в окрестности заданной номинальной траектории линеаризуем систему (1.1) и перейдем к безразмерным переменным по формулам:
(/=1, 2, 3).
(1.6)
Линеаризованную систему (1.1) в новых переменных запишем в матричном виде:
^-Ау + т, (1.7)
где А — матрица размером 5X5, В— матрица размером 5X3, у— матрица-столбец размером 5X1, £—матрица-столбец размером 3X1.
После введения безразмерных переменных функционал (1.5) может быть записан следующим образом:
Т
J=][y'y + ■±■\^^dt+?LтУ\т. (1.8)
о * *
Штрих означает транспонирование матрицы.
Теперь задача может быть сформулирована так. Для линейной системы (1.7) найти такой закон управления £ = $(_у, £), который доставляет минимум функционалу (1.8), и одновременно подобрать функцию т)(£) таким образом, чтобы для любых начальных отклонений у0, принадлежащих единичной сфере |.у0|-<1, выполнялось неравенство
т<1- (1-9)
! = /?>?
где норма вектора \у\ определяется выражением |_у|
г'=1
2. Метод расчета. Как известно, сформулированная таким образом задача при заданной функции т)(0 была решена в работе [2]. Оптимальный закон управления является линейной функцией фазовых координат и в матричной форме может быть записан в виде
г = — цВ'Ьу. (2.1)
Здесь £ — симметричная матрица размером 5X5, являющаяся решением матричного уравнения Риккати:
^ = — ЬА - А' I + т)1ВВ' Ь - Е, Ь(Т) = и,
(2.2)
где Е— единичная матрица.
Исследование поведения решения уравнения (2.2) подтверждает вывод о практической независимости параметров регулятора (2.1) от матрицы Ьт при больших интервалах времени Т. Оказывается, решение уравнения (2.2) при постоянных Л и Я асимптотически стремится к некоторому постоянному значению. Для медленно меняющихся матриц А и В, характерных для траекторий неманевренных самолетов, ситуация аналогична. На фиг. 1 сплошной кривой показана зависимость от времени одного из коэффициентов
матрицы когда в качестве 1Т выбрана матрица, удовлетворяющая условию =0. Штрих-пунктирной кривой нанесена зави-
симость того же коэффициента от времени при /,7- = 0. На фиг. 1 пунктирной кривой изображен также переходный процесс в замкнутой системе. Значение действительно несущественно, так как переходные процессы уравнения Риккати и системы (1.7) протекают
Фиг. і
на разных концах интервала. Выбор в качестве Ьт матрицы, удови М. г,
летворяющеи условию = 0 имеет то преимущество, что исклю-
чаются переходные процессы уравнения (2.2) и коэффициенты регулятора (2.1) оказываются медленно меняющимися функциями времени. Поэтому всюду в дальнейшем матрица /.г находилась как решение алгебраического матричного уравнения
А'^Ьт + ЬтА^-^тВЩВ' (Т)и + Е = 0,
(2.3)
представляющего собой правую часть матричного уравнения Риккати в точке Ь — Т.
Перейдем к рассмотрению метода, позволяющего приближенно учесть ограничения (1.9) на базе решения (2.1) — (2.2).
Если взять т] достаточно малым, то реакция системы управления (2.1) может быть сделана сколь угодно малой при любых значениях у, принадлежащих конечной области фазового пространства. Это вытекает непосредственно из физической сути задачи и может быть строго доказано на основании анализа (2.1) с учетом (2.2). Из этого следует, что существует бесчисленное множество функций г\(Ь), таких, что система управления не выходит на ограничение (1.9), если начальное возмущение динамической системы находится в допустимой области. Чтобы сделать выбор т] (£) однозначным, найдем такую функцию т,(£), которая обеспечит наиболее полное использование ресурсов управления. Для этого замкнем систему (1.7) каким-нибудь регулятором и для замкнутой системы определим функцию
/?(*) = шах | .у (£Ц, (2.4)
I Уо I < 1
которая зависит как от параметров системы (1.7), так и от параметров системы управления.
Очевидно, ресурсы управления будут использованы наиболее полно, если нам удастся найти такую функцию т^), что для регулятора (2.1) после замыкания им системы (1.7) в каждый момент времени выполняется условие
шах | \ {у (t)) | = max {t)V(t) = 1. (2.5)
I у0 1<1 1Уо]«1
Функция SS' является квадратичной формой у и, следовательно, ||| линейно зависит от |_у|. Поэтому условие (2.5) с учетом (2.1)
и (2.4) можно переписать в виде:
max 11 (у (t)) | = max || (j>(£)) | = 1. (2-6)
1Л1<1 \y(t)] = R(t)
Таким образом, задача определения функции f\{t) свелась к задаче на условный экстремум функции
| \ I = v rfy'LBB’Ly , (2.7)
которую будем решать методом неопределенных множителей Лагранжа. Введем в рассмотрение функцию
Ф == т]2 у' LBB' Ly — Ъуу'. (2.8)
Необходимое условие экстремума может быть записано в виде
gradO==2y'(7)3LB5'Z. — Х£) = 0. (2.9)
Условие нетривиальнскЗти решений однородной линейной системы (2.9)
det(rfLBB'L— кЕ) = 0 (2.10)
выполняется, если к — собственные числа матрицы rfLBB'L. Пусть К шах — максимальное собственное число, a ys — соответствующий ему собственный вектор, такой, что |_у4| = R(t). Тогда, умножая (2.9) справа на ys, получаем
y's rf LBB' Lys = \s щах У*У* — К шах R2 (t) (2.1 1)
и в соответствии с (2.6) и (2.7)
max \k {y(t)) i = V (2,12)
1Уо| ^ 1
Следовательно, функция r\(t) должна быть такова, чтобы в каждый момент времени выполнялось условие
K**m.x(f)fl(0= 1- (2-13)
Соотношение (2.13) может быть следующим образом использовано для построения итерационного процесса поиска ?)(£). Для разомкнутой системы (1.7) определим функцию R0{t) по формуле (2.4). Затем для некоторого г)n-i(T) находим Lj как решение уравнения (2.3)
и вычисляем [\s max(f)]«-!• Если условие (2.13) не выполняется, вычисляем следующее значение по формуле
т\п-АТ)
до тех пор, пока не выполнится условие (2.13). На фиг. 2 показаны два итерационных процесса определения у,\(Т) для различных начальных значений щ(Т). Видно, что процесс быстро сходится.
Найденное значение у](Т) и соответствующее значение Ьт принимаются в качестве граничных для интегрирования уравнения (2.2). Интегрирование ведется методом Рунге—Кутта, на каждом шаге производится корректирование ^ по формуле (2.14), где значения
7
10
0,8
0,6
ОЛ
0,2
О
функций берутся в точке tn-1. При этом, как показали расчеты, соотношение (2.13) выполняется с высокой точностью.
Найденным регулятором замыкается система (1.7) и определяется функция Rx(t) по формуле (2.4). Для функции повто-
ряется описанный выше цикл вычислений. Этот итерационный процесс имеет ясный физический смысл. Регулятор, параметры которого рассчитаны для функции /?о(0» не полностью использует ресурсы управления, так как он выбран с запасом на заведомо не реализующиеся отклонения фазовых координат. Следующее приближение вычисляется с учетом максимально возможных отклонений при замыкании системы регулятором с неполным использованием ресурсов управления. Ясно, что если этот процесс сходится, то предельный регулятор является оптимальным в смысле функционала (1.8) и, кроме того, полностью использует ресурсы управления, в том смысле, что максимальное ^ отклонение управляющих пара- д$ метров возникает при максимально ' возможном отклонении системы от номинала.
На фиг. 3 представлена зависимость t\(t) для различных шагов дз итерационного процесса опреде- ' ления параметров оптимального регулятора. Заметим, что при t— 0 функции flk(t) несущественно отличаются друг от друга. Это объясняется упоминавшимся уже В,2д 5ц
(см. фиг. 1) асимптотическим характером поведения решения урав- Фиг. з
I
*
( [> <j [> ;
с р >
^ I . с )— Г-< >—$ ь-._< !>—і > : t— -і Ы
/ 10 15 20 п
Фиг. 2
нения (2.2) и может быть следующим образом использовано для уменьшения числа итераций при поиске R(t) и параметров оптимального регулятора. Для некоторого нулевого приближения функции R(t) вычисляются функции ri (t) и L(t). Значения rj(0) и L (0) принимаются в качестве граничных для интегрирования уравнения (2.2) от / «=0 к i = r. На каждом п—1 шаге интегрирования вычисляются параметры регулятора (2.1) и значение R(tn-1). Корректирование rj для интегрирования на следующем шаге производится по формуле
Чя-1
^ ' VlKm.Jn-1 ‘
Полученная функция т), показанная пунктиром на фиг. 3, несущественно отличается от предельной функции ц, полученной итерационным методом.
3. Примеры расчета. На фиг. 4 представлены два вызванных одинаковыми начальными возмущениями переходных процесса, протекающих в системе (1.1) при замыкании ее регулятором, соответствующим нулевому приближению т](£) (фиг. 4, а), и оптимальным регулятором, соответствующим предельной функции (фиг. 4, б). Как и следовало ожидать, при полном использовании ресурсов управления система лучше компенсирует возмущения.
Полученным оптимальным регулятором замыкались исходная нелинейная система (1.1) и соответствующая линейная система (1.7),
Фиг. 4
и проводилось сравнение переходных процессов, вызванных одина ковыми возмущениями. На фиг. 5 приведена зависимость отноше
I у I
— от времени для различ-
НИЯ I Улин
ных возмущений. Довольно значительное отклонение кривых от единицы в конце рассматривае-
50 100 t[ce/r]
Фиг. 5
\У\
75
5,0
2,5
| /
/
— управление ос, )Г; Я /
п и, К /
- » 1,я 4
ос, у /
— неулрабляеше А /
дЗижение
/
V
и
/
/
/
/
--
50 Фиг- 6
100 Ь[сек]
мого промежутка времени не является существенным из-за малости для этих моментов времени самих величин |.у| и |_улин| (см. фиг. 4,6).
Таким образом, решение задачи в линейном приближении дает достаточно хорошие результаты и для нелинейной системы.
В соответствии с описанной выше методикой были рассчитаны параметры оптимальной системы управления для случаев, когда управляющими параметрами являются:
угол атаки а и степень дросселирования тяги /?;
угол атаки а и угол крена у;
угол крена у и степень дросселирования тяги /?; _
угол атаки а, угол крена ч и степень дросселирования /? тяги.
Реализующиеся переходные процессы при одинаковых возмущениях сравниваются на фиг. 6. Следует отметить существенное улучшение качества переходных процессов при использовании всех трех управляющих параметров. Особенно эффективным является управление тягой.
ЛИТЕРАТУРА
1. Остославский И. В., Стражева И. В. Динамика полета, траектории летательных аппаратов. М., Оборонгиз, 1963.
2. Л е т о в А. М. Динамика полета и управление. М., „Наука", 1969.
3. Моисеев Н. Н. Численные методы в теории оптимальных систем. М., „Наука', 1971.
Рукопись поступила 29\ХП 1971 г. Переработанный вариант поступил 31)Х 1972 г.