УДК 517.977
© Д. О. Трунин
АЛЬТЕРНАТИВНЫЕ ПРОЦЕДУРЫ НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ В НЕЛИНЕЙНЫХ ПО СОСТОЯНИЮ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ТЕРМИНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ1
В данной статье предлагаются процедуры нелокального улучшения допустимых управлений для нелинейных по состоянию задач оптимального управления с терминальными ограничениями.
Ключевые слова: нелинейная задача оптимального управления, нелокальное улучшение, терминальные ограничения.
©Х>. О. Trunin
ALTERNATIVE PROCEDURES OF NONLOCAL IMPROVEMENT IN NONLINEAR ON A STATE OPTIMAL CONTROL PROBLEMS WITH TERMINAL CONSTRAINTS
In the article a nonlocal improvement procedures of admissible control for nonlinear optimal control problems with terminal constraints is proposed.
Keywords: nonlinear optimal control problem, nonlocal improving, terminal constraints.
Введение
При разработке численных методов решения задач оптимального управления наиболее трудоемкой представляется реализация процедуры варьирования управлений. В ряде задач от процедуры варьирования можно освободиться, если для данного класса задач возможно построение точных (без остаточных членов) формул приращения функционала.
Такие формулы были получены в [1] для линейных по состоянию задач оптимального управления, в работе [2] проведено обобщение на класс квадратичных и полиномиальных по состоянию задач оптимального управления, в работе [3] процедуры нелокального улучшения обобщаются на класс нелинейных по состоянию задач оптимального управления со свободным правым концом. В работе [4] предложен подход к построению процедур нелокального улучшения в класс нелинейных по состоянию задач оптимального управления с терминальными ограничениями.
Точные формулы приращения получаются на основе специального представления сопряженных переменных с помощью соответствующей модификации сопряженной системы. Данный подход позволяет свести задачу улучшения допустимых управлений к решению специальных
1 Работа выполнена при финансовой поддержке РФФИ (проект 15-01-03680-а)
65
краевых задач, которые существенно проще, чем краевая задача принципа максимума. Возможность улучшения управлений, удовлетворяющих принципу максимума, обусловливает повышенную эффективность построенных методов. В данной статье предлагаются две процедуры нелокального улучшения допустимых управлений для нелинейных по состоянию задач оптимального управления с терминальными ограничениями.
1. Постановка задачи
Рассматривается задача оптимального управления с частично закрепленным правым концом
x = f(x,u,t), teT^,^], (1)
x(t0) = x°, u(t) e U, (2)
Ф(и) = <p(x(Yj)) + f F(x,u,t)dt^> min, (3)
J T
xi (Yj ) = x/, i = \,m, m <n, (4)
в которой x = (xl(t),x2(t),...,xn(t)) - вектор состояния,
и = {ul(t),u2(t),...,ur(t)} - вектор управления, интервал Т фиксирован,
х° e R" - заданный вектор, х. , i = 1. m - заданные числа, функция (р(х) не зависит от первых m компонент вектора х. Функции f(x,u,t), <р(х). F(x,u,t) непрерывно дифференцируемы по своим аргументам в областях определения.
В качестве доступных управлений рассматривается множество кусочно-непрерывных функций со значениями в компактном множестве
V = {uePCr(T):u(t)eU, tel).
Для каждого доступного управления ueV обозначим x(t,u), teT -решение задачи Коши (1), (2) при и = u(t).
Определим множество допустимых управлений
W = eV : хД tx,u) = х/,7 = 1,/wj .
В задаче (1)-(4) составим нормальный функционал Лагранжа
m
z(M) = Ф(«)+£ A-)-*/)•
1=1
Функция Понтрягина с сопряженной переменной ре R" имеет вид H(p,x,u,t) = (р, /(х,м,0) - F(x,u,t) .
Приращение функционала Лагранжа на паре доступных управлений (ï/'.v'j в соответствии с [3] имеет вид
L(v,A)-L(u°,A) =
JT
,0
где p{t,u ,v,A) - решение модифицированной дифференциально-алгебраической сопряженной системы
P = -Hx(p,x(t,u0),u0(t),t)-r(t), (6)
(Hx(p,x(t,u°),u°(t),t), X(t,v) - x(t,u0)) + (r(t),x(t,v) - X(t,u0)) = = H(p,x(t,v),u°(t), t) -H(p,x(t,u°),u°(t), t),
Pl(tl) = -Ai, i = Ljn, (8)
= j = m+i,n, (9)
n
X [<PX +
J=m+l J (10) n
j=m+1
Альтернативная формула приращения получается из формулы (5) путем симметричной замены a°f>v и имеет вид L(v,A)-L(u°,A) =
= -\T{H{p{t,vyMx{ty)At)J)-H{p{t,vy,A)Mty)ym))dt}ll)
где p(t,u°,v,A) - решение следующей модифицированной дифференциально-алгебраической сопряженной системы
p = -Hx(p,x(t,v),u\t),t)-r(t),
(Hx(p,x(t,v)X0,t), x(t,u0)-x(t,v)) + (r(t),x(t,u°)-x(t,v)) = = H(p,x(t,u°),v(t),t)-H(P,x(t,v),v(t),t),
= i = \,m,
Pj(h) = -(PX](x(h,v))~43, j = m + \n,
n
j=m+1 n
+ Z = (p(x(tl,u°))-(p(x(tl,v)).
j=m+1
Введем отображение
u*(p,x,t) = argmaxH(p,x,v,t), pe Rn, xe Rn, teT.
veU
2. Процедуры нелокального улучшения
Поставим задачу улучшения управления и0 е W : найти управление veW со свойством O(v') < Ф{и").
На основе формулы приращения (5) построим первую процедуру нелокального улучшения.
1. Найдем решение (x(t),p(t)), I е Т дифференциально-
алгебраической краевой задачи
х = f(x,u(p,x,t),t), teT, р = -Нх(р,x(t,u°),u°(t),t) - r(t), (Hx(p,x(t,u°),u°(t),t), x-x(t,u°)) + (r(t),x-x(t,u°)) = = H(p,x,u0(t),t)-H(p,x(t,u0),u°(t),t),
x(t0) = x°, xi(tx ) = Xj , i = l,m,
Pj Ci ) = -<PX] ,u°))-qj, j = m + \,n,
n
X [<PXj (x(t,У )) (x,. ft ) " */ 0i, ))J +
j=m+1 n
+ Z \_<1](х№)-х№>и0))\ = (р(Щ))-(р(ЩУ))-
j=m+1
2. Сформируем управление v(t) = и (p(t),x(t),t), teT. Предположим, что решение (x(t),p(t)), teT краевой задачи (12) (возможно, не единственное) существует на Т. Тогда x{t) = x(t,v) и veW . Покажем свойство улучшения для выходных управлений. Действительно, решение pit), / е / является решением системы (6), (7) и удовлетворяет условиям (9), (10). Обозначим
Ûi = -Pi(A), i = \m. Тогда условия (8) выполняются и p(t) = р(1л" .v. A). teT . Следовательно, в соответствии с формулой приращения (5) выходное управление v обеспечивает невозрастание функционала Лагранжа
Z(v,I)<Z(M°,I) .
Отсюда, в силу допустимости управлений и0, v получаем
Ф(у)<Ф(м°).
На основе формулы приращения (11) построим вторую процедуру нелокального улучшения.
1. Сформируем отображение
v(p,t) = u(p,x(t,u°),t).
2. Найдем решение (x(t),p(t)), I е Т дифференциально-алгебраической краевой задачи
Х = f(x,v(p,t),t), teT, p = -Hx(p,x,u\t),t)-r(t),
(Hx(p,x,v\p,i),t), x(t,u°) - x^ + (r(t),x(t,u°) - =
= H(p,x(t,u°),v (p, t), t) - H(p, x, v(p, 0, t), x(t0) = x°, x,(t{) = x], i = l,m, Pj(h) = -<PX] j = m +1,n,
n
Z ))(хАУ)~xj(0)] +
j=m+1 n
j=m+1
3. Сформируем управление v(t) = v*(p(t),t), t <eT.
Свойство улучшения для выходных управлений обосновывается в полной аналогии с первой процедурой.
Алгебраические соотношения краевых задач (12), (13) можно разрешить в аналогии с [3] относительно величин r{t), qj и свести дифференциально-алгебраическую краевую задачу к обычной дифференциальной задаче. Определяя различные однозначные способы разрешения алгебраических уравнений, можно получать модификации метода улучшения с различными дифференциальными краевыми задачами.
Заключение
Предложенные процедуры обеспечивают нелокальное улучшение допустимых управлений без процедуры варьирования с выполнением всех терминальных ограничений на каждой итерации. Данное свойство является существенным фактором повышения эффективности методов численного решения нелинейных по состоянию задач оптимального управления с дополнительными ограничениями на фазовую траекторию.
Литература
1. Срочко В.А. Итерационные методы решения задач оптимального управления. - М.: Физматлит, 2000. - 160 с.
2. Булдаев A.C. Методы возмущений в задачах улучшения и оптимизации управляемых систем. - Улан-Удэ: Изд-во Бурят, гос. ун-та, 2008. -260 с.
3. Булдаев A.C., Моржин О.В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. - Сер. Математика. - 2009. - Т. 2, № 1. - С. 94-106.
69
4. Трунин Д.О., Булдаев А.С. Об одном подходе к оптимизации нелинейных управляемых систем с терминальными ограничениями // Вестник Бурятского государственного университета. Математика, информатика. -2013,- № 1.-С. 15-20.
References
1. Srochko V.A. Iteracionnye metody reshenija zadach optimal'nogo uprav-lenija. - M.: Fizmatlit, 2000. - 160 p.
2. Buldaev A.S. Metody vozmushhenij v zadachah uluchshenija i optimi-zacii upravljaemyh sistem. - Ulan-Ude: Izd-vo Burjat. gos. un-ta, 2008. - 260 P-
3. Buldaev A.S., Morzhin O.V. Uluchshenie upravlenij v nelinejnyh siste-mah na osnove kraevyh zadach // Izvestija Irkutskogo gosudarstvennogo uni-versiteta. - Ser. Matematika. - 2009. - T. 2, № 1. - P. 94-106.
4. Trunin D.O., Buldaev A.S. Ob odnom podhode k optimizacii neli-nejnyh upravljaemyh sistem s terminal'nymi ogranichenijami // Vestnik Burjatskogo gosudarstvennogo universiteta. Matematika, informatika. - 2013. - № 1. - P. 15-20.
Трунин Дмитрий Олегович, кандидат физико-математических наук, старший преподаватель кафедры прикладной математики Бурятского государственного университета, e-mail: [email protected]
Trunin Dmitry Olegovich, candidate of physical and mathematical sciences, senior lecturer, applied mathematics department, Buryat State University, email: [email protected]