Научная статья на тему 'Об оптимальном управлении летательным аппаратом в условиях неопределенности'

Об оптимальном управлении летательным аппаратом в условиях неопределенности Текст научной статьи по специальности «Математика»

CC BY
194
58
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Ученые записки ЦАГИ
ВАК
Область наук

Аннотация научной статьи по математике, автор научной работы — Желнин Ю. Н.

Рассматривается задача оптимального управления движением летательного аппарата при наличии неизвестных возмущений и неполной информации о текущих фазовых координатах, получаемой с помощью бортовых измерительных устройств летательного аппарата. Для решения задачи используются методы теории дифференциальных игр. Рассмотрена задача оптимального управления траекторией гиперзвукового аппарата при входе в атмосферу. На основе качественного анализа необходимых условий оптимальности игровой вариационной задачи определена структура оптимального управления и наиболее неблагоприятных возмущений для одного класса траекторий входа в атмосферу.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Об оптимальном управлении летательным аппаратом в условиях неопределенности»

УЧЕНЫЕ ЗАПИСКИ Ц А Г И Т о м II 19 7 1

М2

УДК 629.78.015.076.8

ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ ЛЕТАТЕЛЬНЫМ АППАРАТОМ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Ю. Н. Желнин

Рассматривается задача оптимального управления движением летательного аппарата при наличии неизвестных возмущений и неполной информации о текущих фазовых координатах, получаемой с помощью бортовых измерительных устройств летательного аппарата. Для решения задачи используются методы теории дифференциальных игр. Рассмотрена задача оптимального управления траекторией гиперзвукового аппарата при входе в атмосферу. На основе качественного анализа необходимых условий оптимальности игровой вариационной задачи определена структура оптимального управления и наиболее неблагоприятных возмущений для одного класса траекторий входа в атмосферу.

Наличие неизвестных возмущений, действующих на летательный аппарат, а также неполнота информации о текущих фазовых координатах приводят к необходимости определения оптимального управления траекторий аппарата в условиях неопределенности. Предположение о „наиболее неблагоприятном“ характере неизвестных факторов приводит к игровой постановке задачи, из решения которой можно найти некоторое „гарантированное“ решение.

Рассмотрим вначале задачу оптимального управления при наличии неизвестных возмущений для случая, когда имеется полная информация о текущих фазовых координатах.

Пусть движение летательного аппарата описывается следующими уравнениями:

здесь л:(хи . . . , хп) — вектор фазовых координат; и(ии . . . , н,)бивектор управления; . . . , V—вектор неизвестных возму-

щений.

Качество управления оценивается функционалом /; (¿0, Т) — заданный интервал. Векторы л:06Л'0, неизвестны, однако гра-

ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ

* = /(*, и, V); л(д = л°;

т

(1)

ницы области их возможных значений считаются известными. Требуется определить оптимальное управление и*(t), минимизирующее функционал / при условии, что неизвестное начальное положение и неизвестное возмущение являются наиболее „неблагоприятными" и доставляют максимум этому функционалу:

г

7=min max Г/° (х, и, v)dt -f F\x(T)\. (2)

и € U Xü 6 Х°» V в V f

*0

Сформулированная задача представляет собой игровую вариационную задачу. Известные в настоящее время результаты теории дифференциальных игр [1—4] позволяют получить необходимые условия оптимальности, которые сводят игровую задачу к краевой двухточечной. Приведем необходимые условия для случая, когда решение имеет седловую точку в чистых стратегиях;

шах min Н(и, ,y) = min max Н (и, г»);

и € U V В V V 6 V й G U

Н (и, г») = <|» •/(*, и, v)~f°(x, и, V); ^

dH dF I

дх ’ дх ’ I

здесь ф (ф15 . . . , — вектор сопряженных переменных; ф • f(x, и, V) ~

скалярное произведение. Если седловая точка в задаче отсутствует, то условия (3) позволяют определить некоторое минимаксное решение задачи [3]. Решение задачи в смешанных стратегиях может быть получено и на основании результатов работы [4].

Решив задачу при некотором фиксированном значении вектора x(t0) — x°, получим оптимальное управление и*(х°, t). Считая затем л:0 текущим вектором фазовых координат, получим синтез оптимального управления u*(x(t), t). Отсюда следует, что для создания системы оптимального управления необходимо иметь полную информацию о текущих фазовых координатах аппарата, т. е. в каждый момент t знать все компоненты вектора x(t). Это условие трудно выполнить, поскольку бортовые измерительные устройства летательного аппарата позволяют измерить только часть координат или некоторую функцию от координат. Например, наиболее распространенным измерительным устройством для ги-перзвуковых аппаратов, тормозящихся в атмосфере, является акселерометр, измеряющий перегрузку, действующую на аппарат, которая представляет собой нелинейную функцию фазовых координат, параметров атмосферы и параметров аппарата. Как правило, измерения приводятся с некоторыми ошибками, которые заранее неизвестны. Поэтому в общем случае представим информацию о текущих фазовых координатах, поступающую от измерительных устройств, следующим образом:

уУ) — <?(х, и, V, и») = 0; (4)

здесь у (уи . . . , ур) — вектор измерений; w (wu . . ., wm) £W — вектор погрешностей измерений.

Как и в предыдущем случае предполагается, что векторы л;0, V, w неизвестны, хотя границы области их возможных значений заданы. Считается также, что система нелинейных уравнений (4), описывающая результаты измерений, не может быть разрешена однозначно относительно неизвестных х, V, wt и (т. е. р < п + r+q -f яг).

Другими словами, на основании измерений нельзя однозначно определить вектор текущего фазового состояния и, следовательно, вектор y(t) представляет собой „неполную“ информацию о текущем фазовом положении летательного аппарата. Задача состоит в том, чтобы определить оптимальное управление как функцию от вектора измерений y(t). Управление u(y(t), t) в этом случае назовем синтезом управления при „неполной“ информации.

Прежде чем приступить к решению поставленной задачи управления, рассмотрим вспомогательную задачу об оптимальном „наблюдении“. Пусть в интервале (t0, Т) имеются результаты измерений, т. е. в указанном интервале известен вектор y(t). Требуется по известному вектору y(t) определить функционал / системы, описываемой соотношениями (1) и (4), при условии, что управление u(t) известно, а векторы х°, v, w неизвестны. Поскольку вектор y(t) представляет собой неполную информацию о текущем фазовом положении, то существует некоторое множество векто-Л Л Л л

ров л:0, v{t), w(t) и, следовательно, множество значений 1(х°, и,

Л Л

'v, w) = /, которые удовлетворяют дифференциальному уравне-

л л л

нию (1), описывающему движение аппарата x—f(x, и, v), и соот-

ношению (4), определяющему информацию о фазовом положении. Очевидно, что искомой величиной / является один из элементов

- Л

множества, образованного значениями /. Поскольку нельзя устаЛ

новить, какой из элементов множества значений / совпадает с действительным значением /, то в качестве оптимальной оценки иско-

Л л

мой величины будем брать то значение / = /*, которое обеспечиЛ

вает минимум максимальной возможной ошибки. Векторы x(t),

Л Л Л

v(t), w{t), соответствующие оптимальной оценке /*, назовем оптимальными оценками фазового положения, возмущений и погрешностей измерений соответственно.

Л ■

Пусть р (/ —/)—некоторая положительная функция, характе-

Л

ризующая величину отклонения оценки / от действительного знаЛ ■

чения /. В частности, это может быть квадратичная функция л л

р = (/ — If или модуль разности р = | / — /1. Тогда оптимальная оцен-Л ' л л л

ка /* определится из условия, что х°, v, w доставляют минимум, а действительные значения л:0, v, w доставляют максимум функ-

Л

ционалу р(/—I). При этом уравнение измерительного устройства (4) играет роль ограничений на фазовые координаты и „управления“. В этом случае имеем задачу:

. А А

х =f{x, и, v); x=f(x, и, v);

А ДА

y{t) — <t(x, и, v, w) = 0; у(0 — ?(х, U, v, w) = 0;

А

р* — min max р (/—/).

л A л -V", V, W

Л v, w ...

Эта задача яйляётсй игровой задачей с Ограничениями на фал л

зовые координаты и „управления“ V, V, да, ни типа равенств. На основании результатов работ [2, 4| можно получить необходимые условия оптимальности для решения этой задачи как в чистых, так и в смешанных стратегиях. Приведем необходимые условия оптимальности для случая решения в чистых стратегиях в области „регулярности“ функционала (для простоты принято /° = О, ? — скаляр):

Л АЛЛ

Н(г», v) — max min'¡»■/(х, и, v) + ty-f(x, и, v);

А v е V

V е V - ....

Л Л Л

y(t) — <p(x, и, v, w) = 0; y(t) — <?(x,-u, v, w) = 0;

dH

дх

+ 40

dcp дх ’

ПТ) — £

Л

<Р;

дх дх

д

'НП =

д?

л

дх

(6)

Необходимо отметить, что условия (6) далеко не всегда позволяют определить оптимальное решение задачи, так как оно может не находиться в области „регулярности“, а принадлежать так называемым „сингулярным“ поверхностям [6], где условия (6) недостаточны для определения решения. Одним из путей, позволяющих избежать трудностей, связанных с отысканием „сингулярных“ поверхностей при решении игровой задачи (5), является сведение ее к двум вариационным задачам:

/+ = max /; x—f(x, и, v); y(t) — ?(х, и, v, w) — 0;

х°, vt w

l~ — min /; x = f(x, u, w); у (t) — cp (x, u, v, w) = 0.

X°t V, W .

После введения дополнительного вектора xw, удовлетворяющего уравнению xw — w с произвольными граничными условиями, приведенные задачи представляют собой обычные вариационные задачи с ограничениями на фазовые координаты и „управления“, методы решения которых хорошо известны. Нетрудно убедиться,

Л

что оптимальная оценка 1* в этом случае определяется равенст-л

вом /* = 0,5 (/+ + /~), а ошибка оценки удовлетворяет условию

р(/+—/*) = р (/- — /*).

Решение задачи (5) позволяет по известному вектору y(t) восстановить величину функционала / с некоторой гарантированной

Л

точностью, характеризуемой функцией р (/ — /). Напомним, что управление u(t) считалось заданным и известным. Теперь будем считать управление u(t) не заданным и определим его таким образом, чтобы оценка функционала / была минимальна, а точность

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

оценки удовлетворяла заданным условиям, т. е. р — р = 0, где р — задано. Сформулированная таким образом задача оптимального управления записывается следующим образом: .

. Л Л Л

х=/{х, и, V); x=f{x, и, V);

А Л Л

f(x, и, V, 11)) — <?(*, и, V, 10) = 0;

I* = ш!п шах / + р (/ г~ I).

Л Л Л Л-0, V, 1У И, Х°, V, ТУ

(7)

Начальные условия определяются заданием начального вектора у (¿0) = у0. Множитель Х° определится из выполнения условия р — р = 0. Как видно, задача управления (7), как задача о наблюдении (5), является игровой задачей с ограничениями на фазовые координаты и „управления“ и ее решение принципиально не отличается от решения задачи (5). Из решения краевой двухточечной задачи, к которой сводится задача (7), при некотором заданном значении вектора _у(/0)=_у° определим оптимальное управление и* (у0, 0- Затем, считая вектор у° текущим, получим синтез оптимального управления и* (_у(£), /).

Следует отметить, что введение ограничения на текущую информацию о фазовом положении приводит, в отличие от задачи с полной информацией (1), к игровой задаче с ограничениями на фазовые координаты и управления в некотором расширенном пространстве фазовых координат и их оценок. Причем роль ограничения играет уравнение измерительного устройства.

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ И НАИХУДШИЕ ВОЗМУЩЕНИЯ ПРИ ВХОДЕ В АТМОСФЕРУ

Используя результаты изложенного выше игрового подхода к задаче управления, определим оптимальное управление и наихудшие возмущения при входе в атмосферу для случая полной информации о текущих фазовых координатах летательного аппарата. Для анализа воспользуемся приближёнными уравнениями движения, при выводе которых предполагается, что угол наклона траектории к горизонту мал, а величина проекции сил тяжести на направление полета незначительна по сравнению с величиной осевой перегрузки. Тогда имеем

рЪх 1 й и

6 ' = -К + -------А'- — ; (•)' = #-;

ер гр 4 йх

— Су СХЬ

х = -1пУ; К = — со8Т; е =

(8)

здесь Л — высота; 0 — угол наклона траектории к горизонту;

7 — угол крена аппарата; V — скорость, отнесенная к круговой; К — эффективное аэродинамическое качество; т—масса; £—характерная площадь аппарата; р —плотность атмосферы.

Рассмотрим задачу минимума максимального отклонения точки посадки от заданной. Возмущениями будем считать отклонение эффективного аэродинамического качества 8К°, плотности атмосферы 8р и начальных условий 860, 8/г0 от их расчетных значений.

Считается такжё, что управление траекторией осуществляется с помощью изменения угла крена при постоянном балансировочном угле атаки. В этом случае эффективное аэродинамическое качество и плотность атмосферы в системе уравнений (8) можно представить в виде

К = /<4-8К« + 3/Г; 8р = р + 8р,

где К, р — расчетные (номинальные) значения; З/С1', 8р — возмущения; ЬКа — управление возмущенным движением.

Возмущения ЬКЬ, 8р—неизвестные функции, однако границы области их возможных значений известны: |8К®|-<8/Стах; |8р|<8ртах. Управление возмущенным движением также ограничено: |8/<“|<

< 8/Стах- ^

Рассмотрим задачу управления траекторий входа в атмосферу со второй космической скоростью с большой дальностью полета и двукратным погружением в атмосферу. Известно, что для траекторий этого типа основное отклонение дальности от расчетной величины происходит на участке внеатмосферного полета, после первого погружения в атмосферу. В связи с этим возникает задача об определении оптимального управления и наихудших возмущений на участке первого погружения. Оптимизируемым функционалом в этом случае является отклонение дальности внеатмосферного полета от расчетного значения, которое представим следующим образом:

8'=!ю-+!“"+!И-;

индексом „в“ обозначены отклонения координат в момент вылета из атмосферы; / — дальность полета на внеатмосферном участке.

Предполагая, что возмущенное движение достаточно точно описывается линеаризованными уравнениями, условия задачи запишем в виде

80' = е2л;~1 ьи + е2Х- ] 8р + 8/С“ + 8/Г ;

гр2 дк ер2

1 6 др § л

8А' = _.8в-- ЬИ-^Ьр-, (9)

ер £р2 ер

/ — пНп шах 86в + -^г8^

ЪКи ЬК.ъ 5р 6в0 «А, \ 00 ОП

Здесь предполагается, что момент вылета определяется некоторым значением скорости V — Ув, тогда 81/в = 0, 0 — угол наклона траектории в расчетном движении.

В соответствии с необходимыми условиями оптимальности (3) получим

8/С“ = 8/Стах Sign фе ! щ* = _ 8/Сах фв ;

8р = — 8ртах ,{р ёфе + (е2 * — 1 )фе} •

Отсюда следует, что оптимальное управление ЪКи и наихудшие возмущения ЬКп и 8р принимают свои граничные значения, а моменты переключения зависят от сопряженной переменной <рв и ее производной Сопряженная переменная фв удовлетворяет дифференциальному уравнению второго порядка:

др / е dh

3i-l\ ‘

(П)

Известно, что для траекторий рассматриваемого типа скорость на участке первого погружения превышает круговую, тогда

е2Х— 1<0. Считая далее, что <0 (плотность убывает с высотой h), можно показать, что решение уравнения (11) имеет не более одного нуля [5]. Кроме того, для рассматриваемых траекторий

большой дальности полета (9000—11000 км) '“^‘>0, > 0. Тогда

из граничных условий (11) получим sign фе (-*„) = — sign >}^(л:в). Из анализа дифференциального уравнения (11) следует, что это условие может выполняться непосредственно перед точкой пересечения оси л;. Учитывая, что возможно лишь одно пересечение, заключаем, что решение уравнения (11) знакопостоянно и противоположно знаку отклонения дальности 8/. Следовательно, оптимальное управление ЬКа и наихудшее возмущение знакопостоянны. Так, например, для случая перелета (8/ > 0) Ща = — 8/i£ax, 8/С" = 8/Стах-

Теперь определим структуру наиболее неблагоприятного отклонения плотности. Моменты смены знака этого возмущения определяются знаком функции рбфа + (¿2 г — 1)фе . Число нулей этой функции сильно зависит от характера расчетной траектории. Однако видно, что на участках траектории, где б>0, оба слагаемых функции переключения имеют одинаковый знак (е2 х — 1 <0, р>0. sign фе = —sign>ie). Следовательно, на этих участках возмущение 8р знакопостоянно и совпадает со знаком отклонения дальности. На участке, где 6<0, слагаемые имеют разные знаки и функция переключения может быть равна нулю. Возмущение 8р на этом участке может изменить знак. В частности, можно показать, пользуясь знакопостоянством кривизны функции рбфе, что на траекториях с постоянным или медленно изменяющимся расчетным значением аэродинамического качества К функция переключения может обратиться в нуль не более одного раза. Поскольку рассматриваемые траектории на участке первого погружения имеют одну точку смены знака угла наклона траектории, то максимальное число смен знака отклонения плотности не более одного. Наихудшие значения начальных отклонений координат 8б0, 8/г0 определяются начальными значениями сопряженных переменных ф0 (-*о) — фе

и фе(л0) = — — Как было установлено выше, фе (х) и фв(л:)— знакопостоянные функции. Из (11) получим sign —_____________sign 8/,

slgn<pft—• — signB/. Тогда наихудшие начальные отклонения определятся следующим образом:

890 = 860max Signs/; 8A0maxsignS/;

здесь 80ошах и 8/z0max — предельные значения возможных отклонений.

ЛИТЕРАТУРА

1. Гаврилов В. М. Оптимальные процессы в конфликтных ситуациях. М., »Советское радио“, 1969.

2. Лейтман Г., Мон Г. Об одном классе дифференциальных игр. „Кибернетика' (АН УССР), 1968, № 1.

3. Пропой А. И. Принцип минимакса в дифференциальных играх. В сб. „Исследование операций", ВЦ АН СССР, 1970.

4. Смоль я ко в Э. Р. Дифференциальные игры в смешанных стратегиях. ДАН СССР, т. 191, № 1, 1970.

5. Же л нин Ю. Н., Шилов А. А. Траектории минимальной дальности при входе в атмосферу со сверхкруговыми скоростями. „Ученые записки ЦАГИ“, т. 1, № 1, 1970.

6. Айзекс Р. Дифференциальные игры. М., „Мир“, 1967.

Рукопись поступила 17\VII 1970 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.