УЧЕНЫЕ ЗАПИСКИ ЦАГИ
Том XXI 1990 № 4
УДК 629.78.015 : 531.55
ИСПОЛЬЗОВАНИЕ МЕТОДА «СОСЕДНИХ ЭКСТРЕМАЛЕЙ» ДЛЯ УПРАВЛЕНИЯ ТРАЕКТОРНЫМ ДВИЖЕНИЕМ КОСМИЧЕСКОГО ЛЕТАТЕЛЬНОГО АППАРАТА ПРИ ВЫВЕДЕНИИ НА КРУГОВУЮ ОРБИТУ
А. И. Федоров
Предложен алгоритм субоптимального управления траекторным движением на участке безатмосферного выведения космического летательного аппарата на круговую орбиту, основанный на теории «соседних экстремалей» и учитывающий наряду с требованиями точности управления требование минимизации расхода топлива. Субоптимальный алгоритм обеспечивает высокую точность управления при большом диапазоне начальных возмущений фазовых координат. При этом отличие субоптимального управления от оптимального незначительно.
Метод управления по соседним оптимальным траекториям («соседним экстремалям») является одним из способов управления, применяемых при малых отклонениях траекторных параметров от номинальных. Этот метод позволяет наряду с удовлетворением граничных условий получать траектории, близкие к оптимальным.
Выпишем основные соотношения, получаемые с помощью теории «экстремального управления» [1] для системы, описываемой дифференциальным уравнением
-§£-=/(*, и, 0, *(*о) = *о. (!)
где х, и—векторы фазовых и управляющих переменных.
Пусть нормальная оптимальная программа ыном (/) минимизирует заданный критерий качества
/ = / (х (/*), /*), (2)
где —нефиксированное время окончания полета, удовлетворяющее условию
ё (х (**))= 0.
В случае отклонения начальных условий от номинальных
х ((о) = Хо -|- 8хо (3)
программа управления и (/), реализующая траекторию, близкую к оптимальной, формируется в виде
и (/) = «*» (0 + М0 • (* (0 -*ноМ (0). (4)
где хном (*)—вектор фазовых координат номинальной траектории к (()—матрица передаточных коэффициентов.
Указанные функции ыном ((), хИ0и (/) определяются при решении задачи оптимизации для номинальных начальных условий, а передаточные коэффициенты— при решении вспомогательной задачи минимизации критерия качества с помощью вариации управления. Для этого решается справа налево система дифференциальных уравнений с соответствующими граничными условиями:
5=-5Л-Лт5 + 5В5-С; 5(/Г)=(-0-) , (5)
Я = _С4Т_5В)/?;' * (/«») = Л|£Л , (б)
<5 = /?тЯ/?; (?(*Г) = 0, (7)
п, = -(Ат-5А)п,; я,(Ч“) = (-^-)Т , (8)
п2 = ГВпГ, п2(ГГ) = (%) , (9)
а = п\Впх- а (С“) = (-§■) , (10)
\ / ^_/НОМ
где
Л(/) = /,-/иН-‘Ни„
в(0 = /.н-‘г..
С(0 = Н„-НхцН-1Них,
Н — гамильтониан системы, взятый вдоль номинальной траектории,
1 к°м — номинальное время окончания движения.
Выражения, входящие в граничные условия, имеют следующий вид:
Ф = / (*,/)+Vх* (х), а=^,
где V7 — транспонированный вектор коэффициентов, определяемый условиями трансверсальности на правом конце.
Уравнение (5) является матричным уравнением Риккати, уравнения (6) и (7) — линейными матричными уравнениями, а (8), (9) и (10)—просто квадратурами. В результате решения системы (5) — (10) определяются матрицы
а а а
с помощью которых формируется матрица передаточных коэффициентов
к=-Н-'[Них + П {§-&}-'&) ]. (11)
По сути дела, выписанный закон управления представляет собой приближенное решение уравнения Беллмана, определяющее оптимальный закон
управления в форме синтеза, справедливое в окрестности номинальной траектории.
Вычисленные с помощью соотношений (5) — (11) передаточные коэффициенты запоминаются в виде функций времени. В случае, если задано более чем одно конечное условие, некоторые передаточные коэффициенты неограниченно возрастают в номинальный конечный момент времени. Пусть в начальный момент времени отклонение системы от номинального состояния таково, что оптимальная траектория из начального состояния достигает конечного множества позже момента времени /4ном. Если бы в качестве независимой переменной для функции передаточных коэффициентов использовать текущее время I, то передаточные коэффициенты неограниченно возрастают еще до достижения конечного состояния. Для преодоления указанного затруднения в работе [2] предлагается использовать в качестве независимой переменной для функции передаточных коэффициентов и характеристик номинальной траектории «индекс времени», определяемый из условия равенства оставшегося времени движения по соседней и по номинальной траектории, т. е.
(12)
где — оценка конечного времени на соседней траектории,
/—текущее время,
— индекс времени.
Оценка определяется на основании формулы [1]:
».= Ч“-(4—<13>
Рассмотрим в качестве примера оптимальную траекторию выведения космического летательного аппарата (КЛА) на круговую орбиту с высотой ^орб на участке безатмосферного полета. При заданной программе расхода топлива задача о максимизации конечной массы эквивалентна задаче о минимизации времени выведения.
Уравнения плоского движения КЛА относительно сферической невра-щающейся Земли записываются в виде:
<1и __ Р СОБ О___________ии
аг ~ т0—се(<—*„) /?о+л ’
Ли
(Н
_ Рзт #________________/ *0 \2 . и2
то — *о) °\Л0 + Л/ #0 + ^
IШ <И
V,
(14)
где и, V — местные горизонтальная и вертикальная составляющие вектора скорости; А — высота; #—угол тангажа, отсчитываемой от местного горизонта, который является управлющей переменной; Р, се—сила тяги аппарата и секундный расход топлива, принятые в работе за постоянные.
В качестве номинальных начальных значений фазовых координат были взяты условия в начале безатмосферного участка выведения
Мл»р«)
0,36, v0 =
Уо
МО
0,07, А0
0,57,
орб
где
^кр (^орб) ^орб —
8о + Л
'орб
V
Чоев
0,05
О
100 г,С 200 0,25
-0,05
О
100
200 £,с
Рис. 1
Для указанных граничных условий первоначально была решена вариационная задача на минимум времени, результаты решения которой представлены на рис. 1.
Передаточные коэффициенты к„, /г„, к>, опередялись по формуле (II) при интегрировании системы (5) — (10) справа налево при граничных условиях на правом конце:
Частные производные, необходимые при решении уравнений (5) —(10), имеют вид
« — “оР«=0, и = 0, А — Аор6=0.
Н|Ш = 2*1,/(*0+Л),
Ло + А ’
I» _1_______________
Р Хи сое О + вШ в ’
И-ЖТ5Г’0’ ■)•
f __ / UV na *°__________U2 (Д
\{Ro+h)2' (R0+h)3 (R0 + h)2’ )’
c __/_______P sin ft P cos ft T
\ то-сЛ‘-‘о) ’ m0-ce(t-t0) ’ ) ’
где ku, kv, kn — сопряженные переменные. Гамильтониан системы имеет вид
и . / Р cos 0___________uv \ | . / Р sin -д________
_ и\то-се({-*о) Ra + h) °\ m0-ce(t-t0)
+ я"+л) +^u-
Зависимости £„ (t), (*), kh {t) представлены на рис. 2. Отметим, что
lim kv(t)= lim kh(t) = oo.
/—(jOB
где <*OM—время окончания полета по номинальной траектории.
При моделировании субоптимального управления КЛА характеристики номинальной траектории и зависимости передаточных коэффициентов выбирались путем линейной интерполяции из таблицы, куда они были занесены с шагом At — 5 с.
Поскольку некоторые передаточные коэффициенты неограниченно возрастают при t-t-t™", в качестве независимой переменной для построенной таблицы использовался «индекс времени» tu определяемый соотношениями (12) и (13).
На рис. 3 и 4 представлены результаты расчетов для различных вариаций начальных условий. На этих рисунках приведены зависимости ,
*орб
*орб
&1Г, с/кп
Кп,Цкп
ки,с/км
ОМ
0,05
Рис. 2
, {► (/) соответственно для номинальной и соседней траектории, причем
^орб
начальное время для соседней траектории сдвинуто таким образом, чтобы
<*=/Гм.
Данные рисунки, а также серия других расчетов показывают, что для соседних траекторий ошибки по фазовым координатам в конце полета, определяемым условием
И — “орб=0.
не превосходят величин
для достаточно больших вариаций начальных условий
6Л„
Л„рб
<0,16, |б0о|<5°,
где и= (u2 + v2)1/2.
Начальные вариации скорости оказывают наибольшее влияние на точность управления и изменение времени полета.
На рис. 5 показано сравнение результатов расчетов для возмущенных начальных условий с оптимальным законом управления (для данных начальных условий) и с субоптимальным законом (4). Приращение времени полета с субоптимальным законом по сравнению с оптимальным не превосходит 0,05 с, что соответствует штрафу по топливу 2 • 10~2% от оптимального расхода топлива, причем параметры оптимальных и соседних траекторий очень близки.
Некоторое колебание субоптимальной программы ft(t) в окрестности объясняется неограниченным возрастанием передаточных коэффициентов в конце полета.
Одним из достоинств метода «соседнего» управления является возможность оценивания приращения времени полета по формуле (13) в течении всего полета: результаты такого оценивания для различных вариантов вариации начальных условий приведены на рис. 6.
Для дальнейшей проверки работоспособности алгоритма, построенного в предположении безатмосферного полета, было проведено численное моделирование выведения КЛА на круговую орбиту при наличии атмосферы, а также вариаций тяги и секундного расхода топлива КЛА в виде:
Р = Рном • (1 + к); се = сСН0М (1+Л), к = ±0,1,±0,2,
гДе РНом. Сеном — номинальные программы по тяге и расходу топлива. Для рассматриваемого диапазона начальных условий нормальные перегрузки, вызванные действием аэродинамических сил не превосходят 0,04.
Результаты расчетов показывают, что точность выведения при этом существенно не изменилась. Некоторое ухудшение точности наблюдается при уменьше-
Ьио — 0,13иорб;
6и0 = 0,05ц
6А„ = - 0,09Лорб;
Рис. 6
6и0 = 0,13и б; 6и0 = - 0,05иь б; 6Ло = 0,09Аорб
к Лу Номинальная
П0Р5 траектория
1.0 "
0,8 ~ /><
0.6 // Соседняя
Р' траектория
I ^ I .]
420
120
t.C
&и<> = — 0,13и 6и0 ;
6Л„ =
орб»
0.07«орв, 0,09АорРб;
^ а 20° I 1
120 0 120 "—\с
-200
л
Паре
0,15
0,50 -
—■—т 1 . . I
-120
Рис. 7
120
Р — 0,8РНОМ,
се == О.о^е ном
t,c
нии тяги по сравнению с номинальной. Наличие атмосферы сказывается на увеличении времени выведения, которое составляет до 0,3% от номинального времени выведения в зависимости от начальных отклонений КЛА. Вариации параметров КЛА существенно влияют на продолжительность выведения. Так, для начальных отклонений
ьип
ММ
0,13,
орб
60о = - 10°
0,16,
и уменьшения тяги и секундного расхода на 20% происходит увеличение времени вывода примерно на 50% (рис. 7). Конечные рассогласования по высоте и углу наклона траектории составляют в этом случае
6кь
орб
= 1,2 - 10-
60О = — 0.03°.
Таким образом, с помощью решения описанной выше задачи можно реализовать выведение КЛА на орбиту с круговой скоростью для большого диапазона начальных состояний КЛА в начале выведения, причем размеры области допустимых вариаций начальных условий позволяют использовать для управления информацию лишь по одной номинальной траектории. Для дальнейшего сокращения объема памяти БЦВМ, требуемого для организации алгоритма выведения, полезно аппроксимировать номинальную траекторию и передаточные коэффициенты в виде полиномов по степеням
При желании закон управления (4) можно преобразовать к некоторой эквивалентной в линейном приближении форме, используя в качестве аргумента программы не время, а горизонтальную скорость и, которая в случае непрерывно работающих двигателей монотонно возрастает вдоль траектории
(и)+кн (А — А„ом {и))+кв (и — уном (ы)) +
+*, (/ —/ном (и)),
где передаточные коэффициенты (и) выражаются через коэффициенты /г, (*) посредстом следующих соотношений:
£Л = ЛА, кв=к„, ь —( дкио“ ь дУт“ ь ь \ 1
—V ди + ди ■
ди
В этом случае не придется прибегать к специальным приемам выбора независимой переменной для функций передаточных коэффициентов [см. формулы (12) и (13)].
Отметим, что подобный же прием используется иногда при синтезе алгоритмов управления спуском КЛА (см. [3], стр. 258, 261).
ЛИТЕРАТУРА
1. Брайсон А., X о Ю.-Ш и. Прикладная теория оптимального управления.— М.: Мир, 1972.
2. Спейер, Брайсон. Методы управления по соседним оптимальным траекториям и его применение для формирования траекторий спуска в атмосфере,—РТК, 1968, т. VI, № 5.
3. Ярошевский В. А. Вход в атмосферу космических летательных аппаратов. — М.: Наука, 1988.
Рукопись поступила 30/У 1989 г.