УЧЕНЫЕ ЗАПИСКИ Ц А Г И Том XXI 1990
м /
УДК 629.7.015
ИССЛЕДОВАНИЕ ЗАКОНОМЕРНОСТЕЙ ПОЛЯ ЭКСТРЕМАЛЕЙ ДВУМЕРНЫХ ЛИНЕЙНЫХ ЗАДАЧ МЕХАНИКИ ПОЛЕТА
Л. П. Федоров
Исследованы особенности поля экстремалей простейшего класса вариационных задач механики полета, содержащих две дифференциальные связи с одной линейно входящей в них управляющей переменной. Исследование базируется на идеях работ [1—3].
Сопоставлены известные методы решения рассматриваемых задач: метод Миеле, метод Остославского—Лебедева и принцип максимума Понт-рягина. Основное внимание уделено участкам особого управления экстремалей. Исследованы также закономерности движения фазовой точки с заданными значениями управляющей функции и движение с периодическим переключением ее между максимальным и минимальным значениями.
Среди задач оптимизации режимов полета на различных участках траектории ЛА на основе упрощенной системы уравнений движения большое место занимают двумерные линейные задачи, в которых система уравнений движения состоит из двух дифференциальных уравнений с одной линейно входящей в них управляющей функцией. Для решения таких задач применяются достаточно простые и наглядные методы оптимизации: метод Остославского — Лебедева [4], метод Миеле [5—7] и различные графические методы. Все эти методы, как показано в [8, 9], связаны между собой.
Среди многих работ по исследованию упрощенных вариационных задач отметим работы [1—3], в которых проведен глубокий анализ семейства оптимальных траекторий в задаче о полете самолета с минимальным расходом топлива на заданную дальность. В этих работах выявлены практически важные свойства поля экстремалей в открытой области значений управляющих функций, в том числе проанализированы условия существования и возможные типы особых точек поля экстремалей.
В настоящей статье результаты этих работ распространены на весь рассматриваемый класс двумерных линейных задач и получены дополнительные результаты, развивающие теорию линейных задач [7]. Полученные общие результаты могут быть использованы при решении соответствующих конкретных задач.
Рассматриваемый класс вариационных задач. При исследовании режимов и траекторий полета ЛА широкое применение нашли простей-
шие вариационные задачи, которые заключаются в определении экстремума функционала
Ф
у
= /(*1, *2) Л (1)
при выполнении следующих двух дифференциальных уравнений движения связи
7ЙГ =/1 (-«1. *«) « + /2 (*|, ха), ]
Лс, (2)
ЛГ = /з (-«1, •*2) и + Л (ЛГ1. х2). )
В (1) и (2) £— время, Г — продолжительность полета. Характерной особенностью системы (2) является линейная зависимость правых частей уравнений от управляющей функции и. Фазовые координаты хи х2 и управляющая функция и являются ограниченными.
К уравнениям (2) может быть добавлена изопериметрическая связь
т
Х3 = |/5(^1, Х2)М=СОП${, о
которую можно записать также в виде дифференциального уравнения
*») (3)
при условии, что в конце траектории должно быть обеспечено заданное значение х3. В этом случае вместо (1) находится экстремум вспомогательного функционала
т _
Ф= | /(*„ хг, X) Л, (4)
О
где
/(*„ х2, X) =/(*„ х2) - X /5 (*„ х2).
Функционал (4) отличается от (1) лишь наличием постоянной X. Значение постоянной К находится из условия обеспечения конечного значения *3.
Экстремали рассматриваемых задач в общем случае могут состоять из участков особого управления и участков с граничными (максимальным и минимальным) значениями управляющей функции. Наиболее трудоемким является определение участка особого управления. Для синтеза экстремалей используются метод Миеле, графо-аналити-ческий метод Остославского — Лебедева (энергетический метод) и другие достаточно простые и наглядные методы расчета.
При использовании метода Миеле искомый функционал (1) или (4) с помощью уравнений связи (2) приводится к криволинейному интегралу
йхх, (5)
где
/Л /.
^1— 77 т~Г > ?2— т~
/1/4—/2/3 /з
*гН, ^К, г = 1, 2 — соответственно заданные начальные и конечные значения фазовых координат. Знаменатель в функции <р1 представляет собой определитель системы (2)
/г Л-/2/3. (6>
/г /2 /з А
Экстремаль в методе Миеле формируется с помощью функции
“0*1, х2) = ^ — р±. (7>
<МГ| ОХ2
На особых участках она равна нулю, т. е. эти участки определяются уравнением
■ ®(*1, *2) = о*.
Участки с предельными значениями управляющей функции (ытах, «тш) добавляются в экстремаль согласно правилу Миеле в зависимости от знака функции (7) и граничных условий задачи [5—7]. В некоторых случаях особого участка может не быть.
Для использования метода Остославского — Лебедева и других гра-фо-аналитических методов вместо х1 или х2 вводится новая переменная [8] у=у{х 1, х2), являющаяся общим интегралом уравнения
/3 йхх — /1 йх2 = 0.
Принимая XI—х1 (у, х2), функционал (4) и уравнения связи (2)
с учетом (6) приводим к виду
г
ф = 17(У, х2, Ц Ш, (8>
о
^ = _Я(у, х2), (9>
§-2 = /з (У» Ха) и +/4 (у, х2). (10)
Система (9), (10) отличается по структуре от (2) тем, что управляющая функция и входит только в одно уравнение (10).
Обычно за независимую переменную принимают у вместо / и функционал (8) приводят к виду
Ф = | Р{у, Х2, \)(1у, (11)
у«
где
-----= -т>+ХЪ ■ <12>
Интеграл (11) можно рассматривать также как криволинейный интеграл вида (5), в котором ф1 (у, х2, К) = Р(у, х2, к), а ф2=0, и для определения его экстремума применить метод Миеле. При этом
Уравнение (о = 0, определяющее участки особого управления, можно свести к виду
Ш, (у, Х)=-£ - £^-к = 0. (14)
Это уравнение описывает поле экстремалей в открытом множестве значений управляющей функции и, т. е. поле участков особого управления (сокращенно УОУ). Каждому значению к соответствует определенный УОУ. Наоборот, для любой точки (у, х2), через которую проходит УОУ, можно найти значение постоянной
х^^=-к-тЛ- <15>
Связь значений постоянной к и функции при О (у, х2)=0.
/5
Участки экстремали, удовлетворяющие уравнению (14), можно разделить на два типа: УОУ, пересекающие линию £>(</, х2)—0, и УОУ* не пересекающие ее.
Для первого типа УОУ значения постоянной к, как следует иа
(15), равны значению функции ~=Рх(у, х2) на линии Б(у, х2)=0
• 5
Х=Ш0„„- <16>
Заметим, что функция у- = Р1(у, х2) представляет собой подынтегральную функцию искомого функционала при независимой переменной д:3
*з к ,
Ф_1 т;Лх‘-
хзн
что следует из (1) и (3).
Таким образом, построение функции (-£-] в зависимости от
\/5 /0=0
у позволяет знать весь возможный диапазон значений X, при которых УОУ пересекают линию Р(у, х2) = 0. Для построения УОУ,
пересекающего линию О (у, дг2) = 0 в заданной точке, достаточна
значение постоянной X принять равным функции (■г-') в этой точке
у»/0=0
и воспользоваться уравнением (14) (рис. 1). Максимальные и минимальные значения функции совпадают с максимальными и ми-
уь /0=0
нимальными значениями постоянной X, при которых УОУ пересекаются с линией И (у, х2) = 0.
Заметим, что линия D(y, х2)=0 является линией установившихся
dv
режимов полета, так как в каждой ее точке =0 и, следовательно,
у = const и д:2=const.
Определение вида участков особого управления экстремалей в плоскости (ух2). Исходя из уравнения (14), найдем
i1-dx4
^cot дш1 ’
ду
где
da>i дх2'
D jL
/5 дх.
здесь
да>1 — Г — ± И dj b а
D д { а \
7ъду\Ь)'
(17)
(18) (19)
В точке пересечения УОУ с линией И (у, х2) = 0, как следует из (17) и (18), имеем ^=0 и д£г = 0, т. е. эта точка является стационарной точкой функции у=у(х2) для УОУ (см. рис. 1). Характер изменения этой функции существенно зависит от знака второй производной в стационарной точке. В данном случае при £) = 0 и
ду „ д2 у
— = 0 производная —\ приводится к виду ах* дхт,
дг (
а2У
dxi
дш1
ду
(20)
где
(т). (21)
д<й[
дУ
= С
d.
(22)
Рис. 1
Знак производной (21) на линии 0 = 0 соответствует знаку функции
МУ, (23)
которая, как будет показано ниже, связана с условиями максимума и минимума искомого функционала (11).
Значение производной (22) на линии £> (у, х2)=0 равно производ-
ной функции
Л/0=0
— А (Ц
дУ *У /о=о'
(24)
Действительно,
— (£\ = А (£\ . А- (1\
аУ '/->/о=о ду [/-,) ^ дх2\/5) (1у
0-0
где производная равна
определяется из уравнения у = О и
0 = 0
А (£. ду (/б _а_/о дъ I/6
Ь •
В результате
=>С-?гй. Лу \/ъ /о=о 6
(25)
Из сравнения (22) и (25) приходим к равенству (24). Следовательно, производную (20) можно записать в виде
\ <Ру _ Фо
\ ах\ ~ А{1\ ’ (26)
\ Лу \/б/п_о
где гро — значение функции (23) на линии Б = 0.
Как видно, знак второй производной (26) зависит только от знаков функции \Ь и первой производной функции от у. В зави-
\Л /о=о
симости от этих знаков можно установить вид УОУ. Для иллюстрации на рис. 2 и 3 показаны возможные виды УОУ в зависимости от характера изменения функции при положительных и отрицатель-
на /0=0
ных значениях функции ф. Каждый УОУ соответствует определенному значению X. Для УОУ, пересекающихся с линией /)(г/, х2) =0, значения постоянной X, как было показано выше, равны функции [4-\
\-'5/О=0
в соответствующих точках пересечения.
Особые точки поля участков особого управления. Согласно [1-3] поле УОУ может иметь особые точки на линии О {у, х%) =0, координаты которых в плоскости (у, х2) совпадают с координатами стационарных
точек функции (^А
\/5/о=0
Действительно, координаты, рассматриваемых в {1—3], особых точек поля УОУ, определяемого уравнением (14), должны удовлетворять трем равенствам [10]:
•.(У,*.)-О, ^=0, *5 = 0.
Рис. 2
Функция (01 (у, хг) имеет вид (14), а производные ее по х2 и у— (18) и (19). Приравняв их к нулю, получим
Щу, х,) = 0, (27)
с_«й==0. (28)
Первое уравнение показывает, что особые точки лежат на линии Щу, х2)=0.
К этим же уравнениям сводятся условия стационарности функции (15). Поэтому координаты особых точек поля УОУ и стационарных точек функции К (у, Хя) совпадают и находятся на линии установившихся режимов полета. В силу равенства (16) на этой линии координаты
стационарных точек функций Х(у, х2) и (£\ совпадают и, следо-
\л о
вательно, особые точки соответствуют стационарным точкам функции
[~\ от у (см. рис. 2, 3).
у 5/.0=0
Тип особых точек зависит от знака определителя в этих точках [10]:
д2 о>1 д3 <ог
Д в
дх\ дх2 ду
Ы] д3
дудх2 ду%
д2 д2 и») / д2 \2
1^2 ду I ‘
дх\
(29>
При А>0 особая точка представляет собой изолированную точку («центр»), а при Д<0 — узловую точку («седло»), при Д = 0 — точку возврата или точку самоприкосновения.
Производные, входящие в (29), при условиях (27) и (28) имеют следующий вид:
д3<1> _ , д / а\
~д£~~
ду2
2
дс
ду
а дй Ь ду
д^_=_йд1а\ дхду дх2\Ь )
д2 и>д _ ^д_ /с^\ дс
дудх? дх2 \ Ь I ‘ дх2
а дй Ь дх2
Так как
д1 а>1
д2 <
дх ку = Ъудх2' т0 И3 П0следних двух выражении следует
дс а дЛ . д / а \
дхц Ь дх2 ду[Ь I
0.
С учетом этого и, используя выражение (25) для определения второй производной
д2»! й2 д
ду2 Ъ дх2
(£)•
определитель (29) можно привести к виду
А=~'*°д?(л)о=0'
(30>
Знак определителя (30) зависит от знака функции ^>(у, х2) и вто-
рой производной функции
\/й/в=о
от у в стационарных точках. Тип
особых точек полностью согласуется с видом УОУ, устанавливаемого' с помощью (26) (см. рис. 2 и 3).
Направление движения вдоль участков особого управления. Условия максимума и минимума искомого функционала. Направление дви-
жения фазовой точки вдоль экстремалей устанавливается с помощью уравнения (9). Для этого достаточно определить знак функции Б (у, х2).
При £)<0 движение происходит в сторону увеличения переменной у, так как ^!>0, а при /)>0 — в сторону ее уменьшения. Линия
0 = 0 разделяет плоскость (у, х2) на две части, в одной из которых В>0, а в другой /)<0 (см. рис. 1). На этой линии функция у(х2) имеет
стационарные точки ^ = 0 ^ .
Тип экстремума (максимум или минимум) функционала (11) определяется знаком второй производной его подынтегральной функции по
хг на УОУ = 0^ при каждом значении у. Это следует из того, что
подынтегральная функция (12) равна функции Гамильтона, в которой х2 играет роль управления. Согласно принципу максимума Понтрягина переменная х2 должна обеспечивать соответственно максимум или минимум этой функции при каждом значении у. УОУ представляют собой
множество стационарных точек = о|, в которых реализуется максимум или минимум функции (12) в зависимости от знака второй про-д8 У7
изводной —в этих точках. Максимум функционала (11) при дви-дхт,
д3 У7
жении по УОУ в сторону увеличения получается при уу < 0, а мини-
с 2
мум — при —о->0. Ьсли движение происходит в сторону уменьше-дх£
,
ния у, то знаки производной —г- меняются на обратные.
С учетом изменения направления переменной у эти условия можно записать в виде
д2Р йу
дХ2 5г<°* 01)
«ели реализуется максимум функционала, и
щ%>°- <32>
если реализуется минимум.
др
Используя (12), (13), (14) и, учитывая, что на УОУ ^ = О» <01 (г/, х2) =0, получим
д2 Р_ ф
дх\
и
С учетом этого выражения и уравнения (9) неравенства (31) и (32) можно записать в виде
/5ф<0 (33)
в случае максимума функционала и
/6Ф>0 (34)
в случае минимума.
Обычно в рассматриваемых вариационных задачах механики полета ЛА функция /5>0 и поэтому при максимуме 1|з<0, а при минимуме "ф >0.
д2 Р
Знак производной —^ и> следовательно, знак г|) можно уста-
дх:
новить по характеру изменения функции (12), построив ее в зависимости от х2 при каком-либо постоянном значении у.
Если известны знаки функции <» по обе стороны УОУ (ш = 0),
то сразу же устанавливается знак производной и, следова-тельно, знак — — -р-. Например, если в плоскости {у, х2) снизу от
УОУ, как показано на рис. 1, ©<0, а сверху — <о>0, то > 0.
Иногда тип экстремума функционала известен заранее. Тогда знак функции гр принимается согласно (33) и (34) и используется в (26) и (30) для определения вида УОУ.
Применение полученных результатов к построению поля участков особого управления. На основании полученных результатов можно рекомендовать следующий порядок исследования и построения экстремалей конкретных вариационных задач, относящихся к рассмотренному классу.
1. В плоскости (у, х2) построить линию О (у, х2)=0 и по обе стороны ее установить знаки функции И (у, х2) (см. рис. 1).
2. Построить функцию (£-') в зависимости от у. При наличии
V 5 /х)= о
стационарных точек этой функции сразу же определяются особые точки поля УОУ, которые находятся на линии И (у, х2) =0 при том же значении у.
3. Установить знак функции г|)(г/, х2), имеющей вид (23). Знак этой функции согласно (33) и (34) определяет тип экстремума искомого функционала (максимум или минимум).
4. Используя характер изменения кривой 7-1 и знак функ-
V 5 /0=0
ции г|> на основании (26) установить вид УОУ, найти месторасположение особых точек и определить их тип в зависимости от знака определителя (30).
5. На основании уравнения (15) строятся УОУ для различных значений X. При выборе значений X удобно использовать построенный
график функции 1£\
\-'5/£>=0
6. В зависимости от знака функции Б (у, х2) устанавливается направление движения фазовой точки вдоль УОУ.
Движение фазовой точки с предельными значениями управляющей функции. Выше исследовалось поле участков особого управления экстремалей. Кроме этого, существуют поля участков движения с максимально и минимально допустимыми значениями управляющей функции («шах ИЛИ МтгПп). Рассмотрим свойства этих полей.
Траектория движения фазовой точки в плоскости (у, х2) при любом заданном значении и определяется уравнениями (9) и (10), из которых получим
йу____ £>
Лхг /Зм +Л ’
где и принимает граничные значения ытах или ыт1п.
(35)
Будем изучать типичный случай в рассматриваемых вариационных задачах механики полета, когда правые части уравнений (2) при umax и umln имеют различные знаки, и, следовательно, если при одном значении и переменная х2 растет |^ > oj, то при другом — уменьшается
таком случае, как следует из (35), производная ^ при Umax или ит1п может изменить знак только в момент пересечения линии D (у, х2) = 0. На этой линии ^ = 0 и
иХ2
rf2 У _______1 дР
dx 2 fa и + fi дх1
Следовательно, как и на участках особого управления в плоскости {у, х2), функция у(х2) при заданных значениях мтах и «т1п может иметь стационарные точки только на линии D(y, х2) =0. Знак второй производной (36), указывающий на максимум или минимум функции у(х2),
зависит от знаков производных и ^ = /3и+/4. Знак производной
г, „ * 1
на линии D = 0 можно определить в зависимости от знаков функ-
ОХ%
dx
ции D(y, х2) по обе стороны от этой линии. Знак ~ в соответствии
со сделанным предположением является различным ДЛЯ Ытах И итш. Поэтому из (36) следует, что соответствующие фазовые кривые для «шах и Mmm имеют разные экстремумы. При пересечении линии D = 0 в одной точке эти кривые касаются друг друга (рис. 4).
Направление движения фазовой точки вдоль рассматриваемых кривых можно определить по знаку правых частей уравнений (9) и
(10). В области D<0 точка движется в сторону увеличения у, а в об-
ласти £>>0 — в сторону уменьшения у независимо от значения управляющей функции. Направление движения координаты х2 фазовой точки зависит от значения управляющей функции и при изменении одного граничного значения ее на другое меняется на обратное (см. рис. 4).
В случае прерывистого управления, т. е. поочередного переключения управляющей функции со значения ытах на значение итт и обратно, движение сопровождается колебаниями переменной х2 и ростом или убыванием переменной у в зависимости от знака функции D (у, х2). На рис. 5 схематично изображено движение точки с прерывистым управлением в области D>0 и D<0. В пределе при стремлении интервала переключения управления к нулю получаем скользящий режим, который исследовался В. Ф. Кротовым [11].
С помощью прерывистого (скользящего) режима можно двигаться в окрестности практически любой линии в плоскости (у, х2), в том числе в окрестности участка особого управления, пересекая его то с одной, то с другой стороны (рис. 6). Такое движение исследовалось В. И. Ильиным в 1959 году в связи с рассмотрением оптимальных режимов горизонтального полета многоступенчатых JIA с ЖРД [12]. В частности, им было показано, что потери в искомом функционале (целевой функции) по сравнению с его оптимальным значением уменьшаются с увеличением частоты переключения управляющей функции, когда происходит уменьшение отклонения от участка особого управления экстремали <в = 0.
s
Q<
Таким образом, любая экстремаль, имеющая участок особого управления, может быть реализована при соответствующем непрерывном изменении управляющей функции и на УОУ или с любой заданной точностью с помощью прерывистого режима управления при соответствующем выборе частоты переключения управляющей функции. В обоих случаях значения функционала для рассматриваемого класса задач являются практически одинаковыми.
При непрерывном изменении управляющей функции ее значения могут быть определены после построения экстремали х2{у) из системы (9), (10):
и (У, х2) = -±(0^ +/4),
где соответствует участку особого управления.
Полученные выше результаты могут быть использованы при построении экстремалей и анализе решений двумерных линейных вырожденных задач механики полета ЛА.
Автор выражает признательность В. И. Ильину за обсуждение полученных результатов и полезные замечания.
ЛИТЕРАТУРА
1. Илларионов В. Ф., Пашинцев В. Т. О свойствах поля экстремалей в одной задаче оптимального управления. — ДАН СССР, 1971, т. 200, № 6.
2. Илларионов В. Ф., Пашинцев В. Т. Качественное исследование семейства экстремалей в одной задаче оптимального управления движением самолета. — Ученые записки ЦАГИ, 1973, т. 4, № 6.
3. Илларионов В. Ф., Пашинцев В. Т. Качественный анализ семейства оптимальных траекторий в задаче полета самолета на максимальную дальность. — Труды ЦАГИ, 1974, вып. 1591.
4. Остославский И. В., Лебедев А. А. О расчете подъема скоростного самолета. — ТВФ, 1946, № 8, 9.
5. Исследование оптимальных режимов движения ракет. Сб. переводов иностранных статей/Под ред. И. Н. Садовского. — М.: Оборонгиз, 1959.
6. И л ь и н В. А. Оптимальные режимы движения летательных аппаратов.— Обзор БНИ ЦАГИ, 1961, № 40.
7. Методы оптимизации с приложениями к механике космического полета/Под ред. Д. Лейтмана. — М.: Наука, 1965.
8. Ф е д о р о в Л. П. К графо аналитическому методу И. В. Осто-славского и А. А. Лебедева. — Изв. вузов СССР. Авиационная техника, 1968, № 4.
9. Ф е д о р о в Л. П. Приближенные методы оптимизации характеристик участка набора высоты самолета. — Труды ЦАГИ, 1987, вып. 2366.
10. Бронштейн И. Н., Семендяев К. А. Справочник по математике. — Гос. изд. технико-теоретической литературы, 1945.
11. Кротов В. Ф., Букреев В. 3., Гурман В. И. Новые методы вариационного исчисления в динамике полета. — М.: Машиностроение, 1969.
12. И л ь и н В. А. Оптимальные режимы горизонтального полета крылатых ступенчатых ракет с ЖРД. — Труды ЦАГИ, 1959.
Рукопись поступила 27/УП 1983 г. Переработанный вариант поступил 24/у111 1989 г.