Научная статья на тему 'Градиентный метод коррекции управления для решения краевой задачи'

Градиентный метод коррекции управления для решения краевой задачи Текст научной статьи по специальности «Математика»

CC BY
132
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Ученые записки ЦАГИ
ВАК
Область наук

Аннотация научной статьи по математике, автор научной работы — Мельц И. О., Усков Г. В.

Рассматривается градиентный метод построения коррекции управляющих функций и параметров, который в линейном приближении обеспечивает заданное изменение вектора краевых условий на правом конце траектории. Проводится сопоставление результатов ряда работ по прямым методам оптимизации, в которых рассматривается такая задача. Рассмотрено построение коррекции управляющих функций в классе кусочно-постоянных функций. В качестве иллюстрации приводятся результаты расчетов для задачи об управлении углом атаки, обеспечивающем планирование летательного аппарата в заданную точку.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Градиентный метод коррекции управления для решения краевой задачи»

УЧЕНЫЕ ЗАПИСКИ Ц А Г И Том III 1972

№ 2

УДК 629.7.15:531.55

ГРАДИЕНТНЫЙ МЕТОД КОРРЕКЦИИ УПРАВЛЕНИЯ ДЛЯ РЕШЕНИЯ КРАЕВОЙ ЗАДАЧИ

И. О. Мельц, Г. В. Усков

Рассматривается градиентный метод построения коррекции управляющих функций и параметров, который в линейном приближении обеспечивает заданное изменение вектора краевых условий на правом конце траектории. Проводится сопоставление результатов ряда работ по прямым методам оптимизации, в которых рассматривается такая задача. Рассмотрено построение коррекции управляющих функций в классе кусочно-постоянных функций. В качестве иллюстрации проводятся результаты расчетов для задачи об управлении углом атаки, обеспечивающем планирование летательного аппарата в заданную точку.

Задача определения управляющих функций и параметров динамических систем для удовлетворения заданных условий на правом конце траектории, являясь частью задачи оптимизации, имеет для приложений самостоятельное значение. Алгоритмически наиболее простым способом решения такой задачи является минимизация функции штрафа [1], представляющей собой положительноопределенную форму невязок краевых условий. При таком подходе к решению краевой задачи не учитываются свойства каждого из условий связи на правом конце траектории, а нелинейный характер функции штрафа, как правило, приводит к увеличению объема вычислений.

В работе [2], где задача оптимизации ставится как краевая, улучшающие вариации строятся в виде линейной относительно весовых функций формы с постоянными коэффициентами. Аналогичный подход, но в более общей форме, рассмотрен в работе [3]. В работах [4]—[8] улучшающая вариация управления содержит компенсационную составляющую, которая явным образом влияет на решение краевой задачи.

Для решения задачи о выборе параметров, удовлетворяющих краевым условиям, число которых равно числу параметров, в ра-

боте [9] была предложена эффективная модификация метода Ньютона.

В данной статье приводится вывод формул для коррекции управления из условия минимума обобщенной нормы этой коррекции при заданном малом изменении вектора краевых условий с одновременной компенсацией нарушения ограничений на управление. Эти формулы являются распространением результатов, полученных в работах [4], [5], на случай одновременной коррекции управляющих функций и параметров. Компенсация нарушения ограничений на управление приводит к такой модификации способа срезки, которая не приводит в линейном приближении к нарушению краевых условий. .

Постановка задачи. Рассмотрим динамическую систему, описываемую системой дифференциальных уравнений

где х и /-матрицы-столбцы размером я XI, а v = v^t) и с — матрицы-столбцы размером гХ 1 и ту^\, представляющие собой вектор управляющих функций и вектор параметров. На правом конце траектории должны выполняться условия

где у — матрица размером р X 1» а момент времени Т либо задан, либо подлежит определению.

На управляющие функции v — v(t) и вектор параметров с наложим ограничения

При некоторых ю-=ю(і) и с система (1) переводится изначального состояния х{Ь0) = х0 в соответствующее конечное состояние х (Т) в момент времени Т. Для исходных, т. е. подлежащих коррекции, V и с условия (2) и (3) могут не удовлетворяться.

Обозначим [8] через и аргумент v-й управляющей функции, т. е. будем считать, что г/, = *>,(£,) (V = 1,..., г). Через й обозначим множество точек промежутка [£„, Т], где управляющая функция г», не удовлетворяет условиям (3). После совершения шага 8®, в точках множества Ь* управляющая функция V„ должна принять предельное максимальное или минимальное значение V-,*. Сумму множеств £*^=1.......г) обозначим через £*, через £** — дополни-

тельное к і* на промежутке [^0> Т\ множество точек. На множестве і* коррекция управления осуществляется путем срезки, т. е. полагаем 8г' = ї>* — V, где V* — вектор, имеющий своими компонентами функции V-,*.

Аналогичным образом через С* обозначим множество компонентов вектора с, для которых условия (3) нарушены. При определении на С* вектора 8с путем срезки (для с 6 С*) имеем 8с — с^ — с. Компоненты вектора с, для которых условия (3) не нарушены, обозначим через С**.

Задачу построения коррекции управляющих функций и параметров сформулируем следующим образом: требуется определить такие корректирующие поправки Ъv = Ъro(t) и 8с, которые

x=f(x, V, с, і),

(1)

<Р(х(Г)) = О,

(2)

(3)

— обеспечивают в линейном приближении выполнение условий

где Дер — вектор с малыми компонентами, характеризующими желаемое изменение вектора <р;

— устраняют имевшие место при исходном управлении

и параметрах с на множествах і* и С* нарушения ограничений вида (3) путем срезки;

— имеют минимальную обобщенную норму следующего вида:

где КУ = К„($) и Кс — некоторые положительно определенные симметричные матрицы.

Геометрический смысл третьего условия состоит в минимизации „длины11 вектора коррекции, соединяющего ТОЧКИ V, с и у-\-Ьх), с + 8с функционального пространства. Привлечение этого условия, которое, вообще говоря, является произвольным и дает лишь одно из возможных решений, обеспечивает единственность решения задачи и приводит к достаточно простому результату.

Второе условие при одновременном выполнении первого условия приводит к такой модификации способа срезки [1], которая устраняет вычислительные трудности, связанные с решением краевой задачи.

Вычисление корректирующих поправок 5г> и 8с. Будем считать известными матрицы функций влияния и №£, которые связывают вариации управления V и параметров с с вариацией вектора 9:

где одним из компонентов с может быть время Т.

Матрицы №1 и ИТ’у могут быть определены с использованием решений сопряженной системы

^0

В соответствии со вторым условием за счет срезки осуществляется изменение вектора f на величину

равны нулю все элементы столбцов, соответствующих с 6 С**.

Первое условие на основании (5) с учетом (7) можно записать в следующем виде:

<р [V + 8г/, с + 8с] — <р [V, с] = Д<р,

С£С**

(4)

т

(5)

(6)

с краевыми условиями >. (Т) = (д^/дх)' |*=г . При этом

г

где второе слагаемое определяется при условии, что в матрице \Уеч

(8)

где второе слагаемое слева определяется при условии, что в матрице УС^ равны нулю все элементы столбцов, соответствующих с 6 С*.

Решение задачи о вычислении корректирующих поправок 8г; на и 8с на С** может быть получено из условия равенства нулю первой вариации функционала

J = Г Ь&К„ЪъсН+Ъс'КЛс + р'( Г ЩЪо<и+ЧР1Ъс\

*е>* сеС** се($* }

где [а — вектор множителей Лагранжа.

Учитывая, что д(8г>'К„Щ1дЪу = 2Ъю'АТ*, и д{Ьс'КсЬс)!дЬс — 2Ьс'Кс, первую вариацию У запишем в виде

8У= | {?МК„ + р'Щ)Ъгъ+№с,Кг + ?.'Ус,)Ъ'с\евс».

В соответствии с основной леммой вариационного исчисления сомножители при вторых вариациях Ь'iv и 82с должны быть равны нулю. Из этого условия получаем, что при tQ.t** и с 6 С**

8®- —8с = ~~К7'№с;а. (9)

Подставляя (9) в (8), определяем вектор ц = — 2Ф^ (Л<р — Д<р*),

где

Ф_. = Г Щ Ку 1 сН + К71 иК (1°)

ф* *ес**

и матрица предполагается неособенной.

Подставляя р. в (9), можно записать следующие формулы для расчета корректирующих поправок:

8^ = ^^ — V при

ог; = Кг1 К (Д? - Д?*) при /6 (** ;

Ьс — с*— с при с в С*\

8с = К7Х Ф',1 (Д<р - А?,) при ее С**.

Для организации итерационного процесса на основе формул (11) желательно алгоритмизировать формирование вектора А<р. Вектор Д-р может быть сформирован, например, следующим образом:

А? =»-/?, (12)

где/ —скалярный множитель, удовлетворяющий условию 0<;/<!1. При подстановке (12) в (11) 8г>, 8с зависят теперь от одного скалярного параметра I, который регулирует длину шага. При переходе в точку v-\-Ьv, с + 8с вектор <р принимает значение ср(/) = <рг, зависящее

от I. Для выбора I, так же как и в работе [9], сформулируем конт-

рольный функционал типа штрафной функции ф = <|> (/) = <р' К9 <рг, где К9 — некоторая положительно определенная матрица весовых коэффициентов. В исходной точке, т. е. при / = 0, контрольный функционал (13) определяет исходную невязку краевых условий [<р = ср(0) = <р0]. Величина I может быть определена, например,

путем подбора. Вначале положим 1=1. Если ф (1) <1 ф (0), то принимается шаг ог/, 8с, соответствующий 1—1. Если же (1) >- <|) (0),

V*

то необходимо принять какую-либо схему дробления величины I [9]. Величину I можно определить также из условия тШФ(/).

{г}

Кроме такого подхода, для выбора А? можно использовать нелинейные зависимости А?* =/(?*) вида, показанного на фиг. 1. Величина Д<рА тах выбирается настолько малой, чтобы шаг 8г>, 8с не вывел систему (1) из линейной окрестности ТОЧКИ V, с. При малых ср можно положить, например, Д<р = —<р. Заметим, что если исходная невязка велика, то при достаточно больших I может быть осуществлен крупный шаг, не соответствующий исходной линейной постановке задачи.

Использование же контрольного функционала (13) позволяет судить о допустимости такого шага.

Отметим, что после построения 8г> и 8с в соответствии с формулами (И)-на исходных множествах Ь* и С* происходит полная компенсация нарушения ограничений (3), при этом могут возникнуть нарушения ограничений на исходных множествах £** и С**. В этом Фиг. 1

случае требуется несколько последовательных приближений на одном шаге без повторного вычисления функций влияния для определения множеств £* и С*.

В ряде случаев, например, при использовании описанного выше метода для коррекции управления летательным аппаратом, можно ограничиться введением в программу управления постоянных или кусочно-постоянных поправок, что несколько упрощает алгоритм управления.

П

Будем считать, что 8г> = ^<Згаг, где — t^-x) — —

г=1

есть разность единичных ступенчатых функций и а.1 — векторы с постоянными компонентами, которые подлежат определению. Моменты времени ^ будем считать фиксированными.

т

Определим векторы а<г> из условия | W1Ьvdt = Д<р при допол-

п

нительном условии ^а(!)/ ^а’а^^тіп, где № — матрицы весовых

/=1

коэффициентов. Используя ту же процедуру, которая была использована при выводе формул (11), можно получить следующий результат:

|-; = 1

— і

Дер,

(13)

где

7-і

Эта формула получена без учета ограничений на управление, однако и в этом случае нетрудно получить результаты, аналогичные полученным выше.

6—Ученые записки № 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

81

Сопоставление некоторых способов решения краевой задачи.

Проведем теперь сопоставление подходов к решению краевой

задачи, основанное на результатах работ [2]—[7] и формулах (11).

Подход, развиваемый в работах [2] и [3], основан на построении вектора Зг; в следующей форме:

= (14)

где матрица-столбец к имеет размеры рх 1 и подлежит выбору. Поскольку матрица к содержит р постоянных, имеется в принципе возможность удовлетворения р условий:

т

= (15)

А>

Подставляя сюда вместо выражение (14), получим

Ф!р9* = Д'Р, (16)

откуда к = Ф"1 Дер и

(17)

Wv' Ф-1 Ди,

ср ср <р Т1

Нетрудно видеть, что формулы (17) и (11) для bv при Дф* = 0, отсутствии ограничений на г/, неварьируемом векторе с и kv = 1 для t £t** совпадают.

В работе [7] формула (17) получена с использованием методов нелинейного программирования в конечномерном пространстве [4]. Если управление представить в виде ступенчатых воздействий, описываемых вектором параметров с, то решение задачи W^bc — Д?, 8с'8е = rain, где <р = у (с), — dcp/dc, приводит [4]

к следующему результату:

5С = ^'(^1Ге;)-1Д?. (18)

Вектор 8с, определяемый выражением (18), имеет минимальную по евклидовой метрике длину. Если устремить число ступенчатых воздействий к бесконечности, т. е. осуществить предельный переход к функциональному пространству, то выражение (18) переходит в (17). При этом сохраняется геометрическая интерпретация [4], представленная в линейном приближении на фиг. 2 для конечномерного пространства в случае, когда вектор ср имеет два компонента.

ffrad ср, (и)

if7 (v'Sir)=(p,!v)+atp,

Фиг. 2

Фиг. 3

Аналогичная геометрическая интерпретация может быть дана и методу построения bv по формуле (14). В этом случае (фиг. 3) вектор bv ищется в виде суммы градиентов

bv = grad <Р1 + &2 grad <р2

и при любых кх и &2, образующих матрицу к, остается в плоскости, перпендикулярной линии пересечения поверхностей (в линейном приближении плоскостей) <pt (tt-f-Si/) = <fj (v) + Д?!, <f2 (v 4- bv) = <j>2 (v) + &<?2- В связи с этим желаемое изменение вектора <р достигается на шаге минимальной длины.

Рассмотрим теперь геометрическую интерпретацию способа построения вектора 8г>, используемого в [5], [6]. Здесь ищется вектор 8», который удовлетворяет условию (15), обеспечивает максимальное приращение

т

ЬР = |і57£8г><й = тах (19)

*0

функционала Р = /•'(лг(Т’)), заданного на правом конце траектории, и имеет при этом заданную „длину"

■)' к,, 8 и сіі — (І52.

(20)

Геометрическая интерпретация такого подхода представлена на фиг. 4. Условия (15), (20) не являются достаточными для однозначного определения вектора 8у и определяют конус, образующие которого Ьиа соединяют точку V с точками а окружности, лежащей в плоскости П, где (р (г/ + 8у) = <р («) + Д<р. Эта окружность представляет собой пересечение сферы 5 радиусом определяемой условием (20), и плоскости П. Условие Б/^тах приводит к однозначному определению точки о. В выражении для 8и, полученном в [5], можно выделить слагаемое, совпадающее при = 1 с выражением (17).

Рассмотренный подход к построению коррекции управления сводится к продвижению из точки V, с по перпендикуляру к пересечению условий связи, которое представляет собой гиперплоскость в функциональном пространстве. В связи с этим такой метод коррекции может быть назван градиентным.

Задача о выборе программы управления углом атаки при планировании. Описанный способ построения управления, обеспечивающий решение краевой задачи, был использован для решения задачи о выборе программы управления углом атаки, обеспечивающей прилет в заданную точку, для летательного аппарата при неработающем двигателе.

Уравнения плоского движения с использованием общепринятых обозначений имеют в этом случае следующую форму:

Фиг. 4

с

ргг

+ БІП 6

ё_

V

pv2

■ соэ 0

//=г>з1п0; Ь = ю соэО,

где сх = сх{а, ъ1а(Н)) и су = су(а, г>/а(#)). Были приняты следующие начальные условия: Нй — 5 км, г»0 = 600 м/сек, 0о = О. В качестве краевых были приняты условия вида

с?, = Н(Т) - Нк = 0, = 0, (21)

где Нк = 0 и = 5 км.

Ограничение на угол атаки было принято в следующей форме:

®балі

|а(01<шіп| 2пу пред в/Б с* рг>2

= а

’пр»

где авал:=150, Пу пред = 5, 6/5 = 5000 н/м2.

Несмотря на то что ограничение, связанное с пуиред, представляет собой ограничение, зависящее от фазовых координат, была использована модифицированная срезка в соответствии с формулами (11). Это оказалось возможным в связи с тем, что при больших скоростных напорах и малом изменении а вариация апр является малой величиной более высокого порядка, а при малых скоростных напорах ограничением является абал = const.

В качестве контрольного функционала была принята величина Л2 = ср2 -|— 9>|. Исходный режим соответствовал a(t) = 0.

Задача с использованием формул (11) решалась для различных значений Т при / (s) = 1 /s, s> 1. Было также проведено решение краевой задачи с использованием формулы (17) и обычной срезки. В таблице показано поитерационное изменение величины h для модифицированной и обычной срезки.

№ итера- ции Модифицированная срезка h [км] Обычная срезка^. h [км]

0 5,08 5,08

2 1,20 1,48

4 0,05 0,26

6 0,01 0,14

8 0,00 0,08

10 0,00 0,07

12 0,00 0,04

14 0,00 0,02

Фиг. 5

Из таблицы следует, что использование модифицированной срезки существенно уменьшает количество итераций, необходимых для решений краевой задачи, и обеспечивает практически точное выполнение условий (21).

тт1в=№ек\

> пр

* 8 12 /6 ifcen]

-

&-пр

Фиг. 6

Примененный для решения краевой задачи алгоритм был использован также для определения траектории, соответствующих Tmin и Ттах. Эти траектории и соответствующее им управление могут быть получены путем уменьшения или увеличения Т до тех пор, пока с некоторой точностью не будет выполняться условие |Ф9?|=0. На фиг. 5 показаны траектории, соответствующие Тш1а и ТтЛ1., полученные таким способом. Управление, соответствующее этим траекториям, показано на фиг. 6.

ЛИТЕРАТУРА

1. Ш а т р о в с к и й Л. И. Об одном численном методе решения

задач оптимального управления. .Журн. вычисл. матем. и матем.

физ.“, 1962, т. 2, № 3.

2. Stancil R. Т. A new approach to steepest—ascent trajectory optimization, AIAA Journal, v. 2, No 8, 1964.

3. Э н e e в Т. М. О применении градиентного метода в задачах теории оптимального управления. .Космические исследования",

1966, № 5.

4. Rosen J. В. The gradient projection method for nonlinear programming. J. Soc. Indust. Appl. Math., v. 9, No 4, 1961.

5. Bryson A. E., Dehnham W. F. A steepest—ascent method

for solving optimum programming problems. Journal of Appl. Mech.,

No 2, 1962.

6. Denham W. F., Bryson A. E. Optimal programming problems with inequality constraints, AIAA Journal, v, 2, No 1, 1964.

7. Мельц И. О. Применение методов нелинейного программирования для оптимизации динамических систем в функциональном пространстве. .Автоматика и телемеханика', 1968, № 1.

8. Мельц И. О. Учет ограничений в задаче оптимизации динамических систем в функциональном пространстве на основе методов нелинейного программирования. .Автоматика и телемеханика",

1968, № 3.

9. И с а е в В. К., С о н и н В. В. Об одной модификации метода Ньютона численного решения краевых задач. „Журн. вычисл, матем. и матем. физ.“, 1963, т. 3, № 6.

Рукопись поступила 29/IX 1969 г. Переработанный, вариант поступил 13/IX 1971 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.