УЧЕНЫЕ ЗАПИСКИ ЦА Г И
Том /
1970
№ 4
УДК 629.7.015.076.8
НЕРЕГУЛЯРНЫЕ ОПТИМАЛЬНЫЕ ТРАЕКТОРИИ АППАРАТА ПРИ ПОЛЕТЕ В АТМОСФЕРЕ
В. В. Дикусар, А. А. Шилов
Даны анализ необходимых условий оптимальности и численное решение задачи об определении маневренных возможностей аппарата в нерегулярном случае. Исследуются методические особенности численного решения краевых задач при получении нерегулярных оптимальных траекторий.
ПОСТАНОВКА И АНАЛИЗ ЗАДАЧИ
При определении маневренных возможностей аппарата [1] возникает ситуация, когда локальное влияние подъемной силы на перегрузку оказывается исчерпанным. Такой случай в работе [2] назван нерегулярным. В этой же работе доказан принцип максимума для ограничений класса £ (х, и) ^ 0 в случае, когда оптимальная траектория содержит конечное или счетное число нерегулярных точек, причем принцип максимума [2] в регулярном случае эквивалентен классическому принципу максимума Понтрятина.
Рассмотрим задачу о выборе управления углом атаки тормозящегося в атмосфере аппарата при полете на минимальную дальность с учетом ограничения на 'величину полной перегрузки в случае локальной неэффективности управления.
Выражение для дальности полета имеет вид
[ V сов 0 ^ ,1ч
\-RTi,-**' (1)
ь =
где Л, V — высота и скорость полета;
0— угол наклона траектории к горизонту;
Я — радиус Земли; t0, — время движения (фиг. 1).
Требуется найти программу управления подъемной силой ру = су(()дЭ, дающую минимум функционалу £(^) при условиях:
1. — N =Ус2х + с], 0;
(2)
2. Су т!п су ^ су тах; сх с* о ■"}“
3. V— C,q~-g(h)s■m9; « № = '•
3-( ттк-•£)со$0;
• V2
Н—Увтв; ^ = рр — р0е~$н ;
4. Л (* 0) = А№); I/ (д = 1/<°»; 0 (* 0) = е<0); А (Л) = АО).
НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА В НЕРЕГУЛЯРНОМ СЛУЧАЕ
—
Точки множества, определяемого уравнениями :=0иЯз: = /V, следуя [2], назовем нерегулярными точками. В поставленной задаче
0 при Су = 0 и множество нерегулярных точек состоит из
дпх
^=и „„„
конечного числа изолированных точек, так как баллистическая траектория при сх = сх 0 = const не может быть изоперегрузочной. Для решения задачи воспользуемся принципом максимума, сформулированным в работе [2]. Обозначая сопряженные переменные вариационной задачи Ри Р2, Р3> Pi, выпишем гамильтониан расширенной системы:
я-Л
+ Р2 V sin 0 —
,,, /CxpV*S . . а\ , PiRV COSb
-РА о- ■- + gsinOH----------п-г-й---• (3)
2 т у /? + А
Согласно [2], система сопряженных уравнений при наличии нерегулярных точек имеет вид
■ дН /а<?Яе
р-=“г^ + ч')гг; + >‘8('”* >317’
где >-(0 — множитель Лагранжа, не равный нулю при п^ = М; Х(£) полагается равным нулю при пъФ N и
ёо(^г — *рзСу V
X{t)~ Vcy[\+2*cx\ ^с* + с*' ^
{а — постоянная; 8(f) — дельта-функция, и известно, что
t-f
Таким образом, систему сопряженных уравнений можно выписать полностью:
А = р1 (тгт-й — -7 ) й1п 9 - Р2 V соэ 0 + Р3 £сой 0 +Рь ;
Р + А
Р, = Р
^СурУБ Усов© 2 § сое 0 2/т
(Р+Л)2' У(Р + Л)
П /Р^Р^*5 І 2£5іп0\ РКСО8 0 , М 2т ^ И-\-к )1~ 4 (Р + А)2 1
где
+ 40 ^- + 4* (*-**)
, сое 0 ^соэ 0
~2т "г Р + /г ї/2~
дпц
Ж ;
— Р2 вІП 0 + Р;
п Рсоэ0 . дпъ
~Р‘7ГПГ + <ЧЭй + ^■(<~ ‘ > д¥ Р. = о,
дп,у________рр!/25 уз
дії ~ 2 т g0
сі + 4.
т
(4)
дпг
Ш
у,
тёо
с\ + 4-
Из условия Р'р = — 1 и (4) следует РА = — 1 на всей траектории. Поскольку на правом конце траектории t, V, 0 свободны и система (2) автономна, то Я = 0 и
РІ^РГ
0.
(5>
Условия (5) являются граничными для системы (4).
Решение двухточечной краевой задачи (так же как и в регулярном случае [1]) удобно свести к решению задачи Коши. Нужно задать Р[0> и Рз0) и из условия Н((0) = 0 определить значение Р20> в соответствии с требованиями Р^ = Рз) = 0, выполняя одновре~ менно условие Н(1)->тах для задачи /.(1) -* тт.
су
Однако в нерегулярной точке требуется выполнить дополнительные условия на фазовые координаты и сопряженные переменные.
Из (4) следует, что в нерегулярной точке при су{1*) — 0,
дп.у дп
и импульсы Р2 и Р3 будут испытывать скачок на величину ц
дп*
соответственно ((а — положительная постоянная). В этом
и Ш
состоит существенное отличие нерегулярного случая от регулярного, где все импульсы являются непрерывными функциями на всей траектории для ограничения класса ^(л:, м)<!0. В работе [2]
показано, что на оптимальной траектории должны быть выполнены следующие требования:
Л
I о, (6)
- 'о
Л
-Р4 + [ l(t)dt = C>0, (7)
К
где С — постоянная величина для данного семейства оптимальных траекторий.
Требование (6) приводит к тому, что в нерегулярной точке
на оптимальной траектории, где су — О и «я = ./V, должно быть
Рг = 0. Выпишем условие интегрируемости (6):
go[^- — *Psc V
Vcy [1 -j-2xcx] ^ dt
rP^y.cl + 4dt<00m (8)
[1+2 %cx]
dcy
Пользуясь тем, что, как правило (см. ниже),
Ф О,
рассмотрим некоторый малый интервал времени t, содержащий точку су = 0. Интеграл, вычисленный на этом интервале от второго
*r Р а Ус2 _L- с2
слагаемого, ограничен при | Р31< + ос. Интеграл I —|?ггт п y-?dt
J су V [ I ~Г *
^0
йсу
будет ограничен, если при cyj—p0 и ->• const функция Pi(f)
убывает по крайней мере как P1(t)~c" где я>0. Следовательно, в нерегулярном случае на оптимальной траектории нуль функции Рх должен совпадать с точкой нерегулярности.
Условие (7) является условием нормировки импульсов [Х(£)>0,
— Р4>0], существенным лишь в предельном случае приР4->0.
Рассмотрим теперь условия, которым должны удовлетворять фазовые координаты в нерегулярной точке.
Пусть на некотором интервале лх = Л/, тогда там же ~ tiz = Q, n^ = q(c2x + c'ly)-{-cycf[\-\-2t.cx]q—0.
В точке t*, где су = 0, если |с^,Коо, то величина ^ = 0.
Итак, на оптимальной траектории, удовлетворяющей всем ограничениям, в точке t* <C,tb cy(t*) = 0 должны быть выполнены условия ‘
q = q(N,cx0); ?(П = 0; Р,(П = 0. (9)
Отсюда следует, что для получения оптимальной траектории в нерегулярном случае необходимо одновременно удовлетворить краевым условиям (4) и условиям (9) в нерегулярной точке. Но на отрезке [4, £*] сформулирована двухточечная краевая задача второго порядка, поэтому условиями (9) оптимальная траектория на t0<^t<^t* определяется однозначно. В результате в нерегулярном случае поиск оптимальной траектории в целом сводится к последовательному поиску отрезков оптимальной траектории (двух отрезков при наличии одной нерегулярной точки и п-\~ 1, если количество точек равно п).
Рассмотрим теперь отрезок траектории, лежащий справа от нерегулярной точки. В уравнениях (4) значение Р4 (^* + 0) определяется однозначно, если с помощью ^ определены Р2 (^* + 0), Р3 (^* + 0):
Р,(** + 0) = Р,(**-0) +рзГ + 0) = Р3Г-0)+^ ;
В выражениях Р2 (^* + 0) и Р3 (^*-|-0) следует полагать б (/* -|-+ 0) = 0, а значение X (^* + 0) задать. Это не противоречит условиям интегрируемости, так как разрыв X (7) при ^ = /* допустим. Более того, лишь благодаря новой свободной постоянной можно при t'>t* получить семейство траекторий с параметрами ц и А,(^* + 0) и найти экстремаль, удовлетворяющую условиям (5) или (9), если нерегулярная точка не единственна.
Исходя из сопоставления регулярного и нерегулярного случаев можно назвать условия (9) условиями продолжимости экстремали, так как при невыполнении их происходит нарушение ограничения Пц = N и Р2,3 -»оо.
При численном решении важно, что задание ц эквивалентно заданию Р3 V* + 0), а задание А,(^*+0) —заданию Р3 (£* + 0) (Р2 и Р3 связаны); величина Р2 (^* + 0) определяется с использованием соотношения Р1 (^*-(-0) = 0 из эквивалентных при /=£* условий Я = 0или
р2 а* о) - р2 (/* - о)=^ [р3 а*+о) - р3 у* - о)] У .
Поскольку точка является устранимой особой точкой для системы (4), то при интегрировании последней нужно точку выбирать за начальную, что упростит решение краевой задачи.
1. Зададим значения /г*, из условий (9) найдем V*, 6* при известном /V; зададим Р3(1*—0) и, используя Рх(6* — -0) = 0 и НЦ* — 0) = 0, определим Р2(£*— 0) и Р1^* — 0). Однако для интегрирования необходимо определить Х(£* — 0). Покажем, что /г* и Р3Ц* — 0) определяют величину Х(£* — 0), связанную с пределом
.. РХ{Ь) .. РДО ,, • п
Ьт = 11Ш —- . Из выражения /г2 = N следует = 0, т. е.
^*-0 СуЩ {^*-0 Су (1)
V с% + с2уд= N и А/2 -^ + сусу(1 + 2хсл) = 0, тдед = д(У, /г, 6, сх). Отсюда при су —0 можно получить
М2 + су (1 +2 у.сх) + су су \ Су=о (1 + 2*сх) = 0, где д = д(су, су, V, к, б, су, сх).
п
Считая, что при £<?* — 0 значение | су | •< оо, получим выражение для су(Ь* — 0) в виде функции V*, к*, б* и определим Х(£*— 0). Соотношение «я = 0 показывает, что функция су(() может быть разрывной. Таким образом, из семейства траекторий, определяемого параметрами к*, Р3(£* — 0), можно выбрать траекторию, удовлетворяющую условиям V(/г(0)) = У(0) и 0 (№°>) = 6(0>.
Практически, ввиду неустойчивости решения системы (2), удобно поступить несколько иначе.
Л Л
2. Зададим значение к (или £), удовлетворяющее условию
Л Л
Л(0) </г < к*. Тогда отрезок траектории в полосе \к, к*\ можно получить интегрированием влево от нерегулярной точки, а отрезок
Л Л
[/г(П), к\ — интегрированием вправо. В точке £ все переменные должны быть непрерывными функциями:
Л Л Л Л Л^Л л, л
0+ = 0- ; V* = V/- ; Рх+ = РГ; р£ = Рз (Ю)
л л , л _
{из условия //(0 — 0 следует Рг =Рг].
Заметим, что расширенная система автономна и время № не
Л Л
задано, а координата Ь циклическая, поэтому условия /,+ =/.-
Л Л
и £+ = Ь~ могут быть удовлетворены отдельно от (10).
При соответствующем выборе Р(10), Рз0), Р3 {«* — 0), к* можно
выполнить условие (10) путем численного решения четырехпара-
метрической краевой задачи.
НЕКОТОРЫЕ ЧАСТНЫЕ СЛУЧАИ ПРИНЦИПА МАКСИМУМА (МИНИМУМА)
Рассмотрим систему сопряженных уравнений (4).
1. Если оптимальная траектория регулярна, то цб (^ — /*) =0.
Если на такой траектории положить Р4 =0, то в силу граничных условий (5), равенства Н— 0 и уравнений (4) получим Л = = Рг = Рз = Рк ЕЕ 0 на всей траектории (т. е. при такой нормировке принцип максимума (минимума) удовлетворяется тривиально). Следовательно, в регулярном случае на оптимальной траектории для задач /,(!)._ т}п и £(')_*. тах функция Р4=^= 0 [1].
2. Пусть .рассматриваемая оптимальная траектория в задаче £(') ппп нерегулярна и Я4 ЕЕ 0. Слева от нерегулярной точки может быть определен сопряженный вектор (Ри Рг, Рз, 0), на который наложен ряд ограничений, следующих из граничных условий.
При / > есть две возможности:
1. движение без выхода в новую нерегулярную точку;
2. движение с выходом в нерегулярную точку.
В случае 1 должно быть — Рз1’ = 0, Н= 0, т. е. Р^ = 0 и,
таким образом, Р = 0 при В результате выбор управления
при с использованием принципа максимума (т. е. первой
вариации функционала) невозможен. Далее, так какР^^ + 0^ = Р3 (£* 0) = 0 в силу сказанного, для задачи ^ шш получим:
0)=-^; ргУ*-0) = -г%£ (где !Х>0).
Отсюда и из (4) следует Рх{1* — 0)<0, а следовательно, рдг* — г)>0 при г>0. Поэтому при решении задачи на
вы ■
— тШ су (/* — г) > 0. Условия -----<7 = 0 в нерегулярной
С х 0 ^
точке однозначно определяют V((* — 0), 6 (£* — 0) и отношение р., и*_0)
при заданных к* и N. Выбирая соответствующим обра-
/з(г и)
зом к* и N для левого отрезка траектории, можно удовлетворить условиям V (/г(0)) = V(0) и 0 (/г<°>) = б<0), где /г'0) — начальная высота аппарата. [Аналогичное рассмотрение получается для задачи на
Ьт шах [1] с учетом условия Р3(£* — 0) = Iх и РА** ~~ 0) =
Обозначим величину N, полученную в результате решения краевой задачи для левого отрезка траектории, через N0. При этом очевидно, что при N = N0 отрезок траектории, лежащий слева от нерегулярной точки, будет одинаковым для задач на минимум и на максимум дальности и представляет собой решение задачи о минимуме максимальной перегрузки при заданных 1/(0), 0(О) [2]. Стационарность траектории в данном случае определяется не функционалом Ь, а ограничением Задачу на минимум макси-
мальной перегрузки можно решать и другим способом. Будем в процессе решения задачи на /.(1) -> пип (или £(1) -»шах [1]) монотонно менять N в сторону убывания при заданных У'(0), 6(0). При
этом начальные значения Р[0), Рр будут расти по абсолютной
<1
величине. В силу (7) величина Р4 будет убывать с ростом [ Х(£)^.
Ясно, что существует нижняя грань N, зависящая от У(0), 0(О), схсу и определяемая тем, что рассматриваемые задачи имеют решение, т. е. infN=N0 [2].
Вторая возможность (случай 2) состоит в том, что имеется несколько нерегулярных точек. Условия в нерегулярной точке, ближайшей к концу траектории, описаны выше; заметим, что в этом случае при заданных 1/(0>, 0<°) значение Л^0 определяется последней нерегулярной точкой. Действительно, если в предпоследней нерегулярной точке импульсы Р2 и Р3 скачком обращаются в нуль (т. е. Я0 определяется предпоследней точкой N0 = то для
выбора продолжения оптимальной траектории остается только один параметр Ц£я_1+0), в то время как для выполнения условий (9) в Сп с учетом ограничения А^о”_1> требуется два параметра. Отсюда следует, что лишь выбирая специальным образом У<0) или 0(О) можно в принципе обеспечить условия (9) в двух нерегулярных точках подряд (и не более чем в трех, выбирая и У{0), и б(0)). Число выходов в нерегулярные точки, размещенные левее последней точки, в которой задается значение Л/ = УУ0, практически определяется с использованием условий 1/(Л<0)) =/г (к*„, Л/)= У(0), 6 (/г(0)) =/2 {к*п, Л/') = б<0).
Очевидно, существуют начальные значения V<°>, 0(О) такие, что при N = к*—к(1). В этом случае на всей траектории определен
ненулевой сопряженный вектор, поскольку нерегулярная точка совпадает с концом траектории.
МЕТОДИКА И РЕЗУЛЬТАТЫ ЧИСЛЕННОГО ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНЫХ ТРАЕКТОРИЙ В НЕРЕГУЛЯРНОМ СЛУЧАЕ
При получении левого отрезка траектории в задаче на /.<’) -> шіп решалась четырехпараметрическая краевая задача о выборе значений Р^\ Рз\ к*, Р3(/* —0) для удовлетворения условий (10) в точ-
л
ке к. В качестве функции невязки рассматривалась величина
і
<Р (А)
л л
А А / и+_ I/-\г л, Л л, д
(6+ _ е-)2 + ( ^ утУ- ■) + (Р,+ - Р7Г + (Рз - ЯГ)2
2
Л
Из условия непрерывности указанных переменных в точке к
Л
следует, что ср (к) = 0. Практически при решении задачи нуль
Л "
функции <р (к) контролировался с точностью до Ю-5. Поскольку ^9(к)
производная ^ содержит явно управление, то поверхность
ср [к, Р\?ъ> к*, Р3(Ь*—0)] имеет сложную структуру. Анализ структуры этой поверхности проводился методом градиента. При этом
Л
оказалось, что ср [А] имеет несколько локальных минимумов. После выбора наименьшего минимума с использованием метода Ньютона [3]
л ...
удовлетворялось условие ср(А)<10~5. Поиск решения Р
А*(Л^4), Р3(£* — 0, УУ4) при известных решениях з(Л^), А*(Л/г); Р3 (£* — 0, ТУ,.) (г = 1, 2, 3) выполнялся с использованием градиентного метода [1] и квадратичной экстраполяции. Далее это решение уточнялось по методу Ньютона [3]. На правом отрезке траектории решалась двухпараметрическая краевая задача о поиске начальных условий Р3 (£* 4-0) и X(£* + 0) для выполнения условий (5). На фиг. 2 приведены результаты расчета траектории 1(1) -» т1п для N =-- 10, 6<0) = — 3°,8, 1/<0) = 7900 м/сек. Видно, что существует интервал времени t, где Су(£)>0. Ограничение на перегрузку приводит к перераспределению ресурсов управления. При уменьшении N интервал времени, где с^(£)>0, возрастает. При этом дальность полета увеличивается.
Перегрузка Л^0, соответствующая тт тахп%, получается путем
°у от(
решения четырехпараметрической краевой задачи о выборе значений Р|°>3, А1(к*), к*. В результате решения этой задачи получено Л/о = 3,334 при 1/(°> = 7900 м/сек и 6<°) = — 3°,8 (фиг. 3).
Как уже указывалось, при IV—N0 оптимальное управление определено только на части траектории слева от нерегулярной точки, а справа сопряженный вектор тождественно равен нулю. На правом отрезке траектории функционал может быть любым. На фиг. 3 решение задачи о поиске Л’0 = 3,334 сопряжено с решением задачи 1(1)-^т1п при Л<А*=0,0399Р; принималось, что Р4= —1
7Г
для Г>£*. Заметим, что при 6<—^ функционал начинает убывать, при этом подъемная сила действует против силы веса аппарата. 80
Ученые записки
15
10
0,15
0,1
■0,05
оо
00
to
Фиг. З
Заключительная - часть траектории представляет собой планирование с постоянным углом в = — аг^к.
На фиг. 4 приведены результаты расчета маневренных возможностей аппарата при = 7900 м/сек и 6(°>= —3°,8 по данным расчета регулярных и нерегулярных оптимальных траекторий [1].
1.
0,3
0,29
‘ 3,0
/ / 1"'~тах
3,5
40 N
0,2
0,1
)
( 1 4- йп)-~тах
\
1 1 1— 1т -тт
п суссдллрныс'*- оптимальные траектории —• Регулярные оптимальные траектории 1 ,
20
30 /V
Фиг. 4
Авторы благодарят А. А. Милютина за многочисленные беседы и ряд ценных указаний по данной работе.
ЛИТЕРАТУРА
1. Д и к у с а р В. В., Шилов А. А. Оптимизация дальности полета аппарата в атмосфере с учетом ограничений на полную перегрузку. «Ученые записки ЦАГИ», т. 1, № 2, 1970.
2. Дубовидкий А. Я., Милютин А. А. Необходимые условия слабого экстремума в задачах оптимального управления со специальными ограничениями типа неравенства. ЖВМ и МФ № 4, 1968.
3. Исаев В. К., Сонин В. В. Об одной модификации метода Ньютона численного решения краевых задач. ЖВМ и МФ, т. 3, № 6, стр. 1114—1116, 1961.
Рукопись поступила 28/IV 1969 г.