Альтернативные процедуры нелокального улучшения в нелинейных по состоянию задачах оптимального управления с терминальными ограничениями

Трунин Дмитрий Олегович

УДК 517.977

АЛЬТЕРНАТИВНЫЕ ПРОЦЕДУРЫ НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ В НЕЛИНЕЙНЫХ ПО СОСТОЯНИЮ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ТЕРМИНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ1

В данной статье предлагаются процедуры нелокального улучшения допустимых управлений для нелинейных по состоянию задач оптимального управления с терминальными ограничениями.

Ключевые слова: нелинейная задача оптимального управления, нелокальное улучшение, терминальные ограничения.

©Х>. О. Trunin

ALTERNATIVE PROCEDURES OF NONLOCAL IMPROVEMENT IN NONLINEAR ON A STATE OPTIMAL CONTROL PROBLEMS WITH TERMINAL CONSTRAINTS

In the article a nonlocal improvement procedures of admissible control for nonlinear optimal control problems with terminal constraints is proposed.

Keywords: nonlinear optimal control problem, nonlocal improving, terminal constraints.

Введение

При разработке численных методов решения задач оптимального управления наиболее трудоемкой представляется реализация процедуры варьирования управлений. В ряде задач от процедуры варьирования можно освободиться, если для данного класса задач возможно построение точных (без остаточных членов) формул приращения функционала.

Такие формулы были получены в [1] для линейных по состоянию задач оптимального управления, в работе [2] проведено обобщение на класс квадратичных и полиномиальных по состоянию задач оптимального управления, в работе [3] процедуры нелокального улучшения обобщаются на класс нелинейных по состоянию задач оптимального управления со свободным правым концом. В работе [4] предложен подход к построению процедур нелокального улучшения в класс нелинейных по состоянию задач оптимального управления с терминальными ограничениями.

Точные формулы приращения получаются на основе специального представления сопряженных переменных с помощью соответствующей модификации сопряженной системы. Данный подход позволяет свести задачу улучшения допустимых управлений к решению специальных

1 Работа выполнена при финансовой поддержке РФФИ (проект 15-01-03680-а)

65

краевых задач, которые существенно проще, чем краевая задача принципа максимума. Возможность улучшения управлений, удовлетворяющих принципу максимума, обусловливает повышенную эффективность построенных методов. В данной статье предлагаются две процедуры нелокального улучшения допустимых управлений для нелинейных по состоянию задач оптимального управления с терминальными ограничениями.

1. Постановка задачи

Рассматривается задача оптимального управления с частично закрепленным правым концом

x = f(x,u,t), teT^,^], (1)

x(t0) = x°, u(t) e U, (2)

Ф(и) = <p(x(Yj)) + f F(x,u,t)dt^> min, (3)

J T

xi (Yj ) = x/, i = \,m, m <n, (4)

в которой x = (xl(t),x2(t),...,xn(t)) - вектор состояния,

и = {ul(t),u2(t),...,ur(t)} - вектор управления, интервал Т фиксирован,

х° e R" - заданный вектор, х. , i = 1. m - заданные числа, функция (р(х) не зависит от первых m компонент вектора х. Функции f(x,u,t), <р(х). F(x,u,t) непрерывно дифференцируемы по своим аргументам в областях определения.

В качестве доступных управлений рассматривается множество кусочно-непрерывных функций со значениями в компактном множестве

V = {uePCr(T):u(t)eU, tel).

Для каждого доступного управления ueV обозначим x(t,u), teT -решение задачи Коши (1), (2) при и = u(t).

Определим множество допустимых управлений

W = eV : хД tx,u) = х/,7 = 1,/wj .

В задаче (1)-(4) составим нормальный функционал Лагранжа

m

z(M) = Ф(«)+£ A-)-*/)•

1=1

Функция Понтрягина с сопряженной переменной ре R" имеет вид H(p,x,u,t) = (р, /(х,м,0) - F(x,u,t) .

Приращение функционала Лагранжа на паре доступных управлений (ï/'.v'j в соответствии с [3] имеет вид

L(v,A)-L(u°,A) =

JT

,0

где p{t,u ,v,A) - решение модифицированной дифференциально-алгебраической сопряженной системы

P = -Hx(p,x(t,u0),u0(t),t)-r(t), (6)

(Hx(p,x(t,u°),u°(t),t), X(t,v) - x(t,u0)) + (r(t),x(t,v) - X(t,u0)) = = H(p,x(t,v),u°(t), t) -H(p,x(t,u°),u°(t), t),

Pl(tl) = -Ai, i = Ljn, (8)

= j = m+i,n, (9)

n

X [<PX +

J=m+l J (10) n

j=m+1

Альтернативная формула приращения получается из формулы (5) путем симметричной замены a°f>v и имеет вид L(v,A)-L(u°,A) =

= -\T{H{p{t,vyMx{ty)At)J)-H{p{t,vy,A)Mty)ym))dt}ll)

где p(t,u°,v,A) - решение следующей модифицированной дифференциально-алгебраической сопряженной системы

p = -Hx(p,x(t,v),u\t),t)-r(t),

(Hx(p,x(t,v)X0,t), x(t,u0)-x(t,v)) + (r(t),x(t,u°)-x(t,v)) = = H(p,x(t,u°),v(t),t)-H(P,x(t,v),v(t),t),

= i = \,m,

Pj(h) = -(PX](x(h,v))~43, j = m + \n,

n

j=m+1 n

+ Z = (p(x(tl,u°))-(p(x(tl,v)).

j=m+1

Введем отображение

u*(p,x,t) = argmaxH(p,x,v,t), pe Rn, xe Rn, teT.

veU

2. Процедуры нелокального улучшения

Поставим задачу улучшения управления и0 е W : найти управление veW со свойством O(v') < Ф{и").

На основе формулы приращения (5) построим первую процедуру нелокального улучшения.

1. Найдем решение (x(t),p(t)), I е Т дифференциально-

алгебраической краевой задачи

х = f(x,u(p,x,t),t), teT, р = -Нх(р,x(t,u°),u°(t),t) - r(t), (Hx(p,x(t,u°),u°(t),t), x-x(t,u°)) + (r(t),x-x(t,u°)) = = H(p,x,u0(t),t)-H(p,x(t,u0),u°(t),t),

x(t0) = x°, xi(tx ) = Xj , i = l,m,

Pj Ci ) = -<PX] ,u°))-qj, j = m + \,n,

n

X [<PXj (x(t,У )) (x,. ft ) " */ 0i, ))J +

j=m+1 n

+ Z \_<1](х№)-х№>и0))\ = (р(Щ))-(р(ЩУ))-

j=m+1

2. Сформируем управление v(t) = и (p(t),x(t),t), teT. Предположим, что решение (x(t),p(t)), teT краевой задачи (12) (возможно, не единственное) существует на Т. Тогда x{t) = x(t,v) и veW . Покажем свойство улучшения для выходных управлений. Действительно, решение pit), / е / является решением системы (6), (7) и удовлетворяет условиям (9), (10). Обозначим

Ûi = -Pi(A), i = \m. Тогда условия (8) выполняются и p(t) = р(1л" .v. A). teT . Следовательно, в соответствии с формулой приращения (5) выходное управление v обеспечивает невозрастание функционала Лагранжа

Z(v,I)<Z(M°,I) .

Отсюда, в силу допустимости управлений и0, v получаем

Ф(у)<Ф(м°).

На основе формулы приращения (11) построим вторую процедуру нелокального улучшения.

1. Сформируем отображение

v(p,t) = u(p,x(t,u°),t).

2. Найдем решение (x(t),p(t)), I е Т дифференциально-алгебраической краевой задачи

Х = f(x,v(p,t),t), teT, p = -Hx(p,x,u\t),t)-r(t),

(Hx(p,x,v\p,i),t), x(t,u°) - x^ + (r(t),x(t,u°) - =

= H(p,x(t,u°),v (p, t), t) - H(p, x, v(p, 0, t), x(t0) = x°, x,(t{) = x], i = l,m, Pj(h) = -<PX] j = m +1,n,

n

Z ))(хАУ)~xj(0)] +

j=m+1 n

j=m+1

3. Сформируем управление v(t) = v*(p(t),t), t <eT.

Свойство улучшения для выходных управлений обосновывается в полной аналогии с первой процедурой.

Алгебраические соотношения краевых задач (12), (13) можно разрешить в аналогии с [3] относительно величин r{t), qj и свести дифференциально-алгебраическую краевую задачу к обычной дифференциальной задаче. Определяя различные однозначные способы разрешения алгебраических уравнений, можно получать модификации метода улучшения с различными дифференциальными краевыми задачами.

Заключение

Предложенные процедуры обеспечивают нелокальное улучшение допустимых управлений без процедуры варьирования с выполнением всех терминальных ограничений на каждой итерации. Данное свойство является существенным фактором повышения эффективности методов численного решения нелинейных по состоянию задач оптимального управления с дополнительными ограничениями на фазовую траекторию.

Литература

1. Срочко В.А. Итерационные методы решения задач оптимального управления. - М.: Физматлит, 2000. - 160 с.

2. Булдаев A.C. Методы возмущений в задачах улучшения и оптимизации управляемых систем. - Улан-Удэ: Изд-во Бурят, гос. ун-та, 2008. -260 с.

3. Булдаев A.C., Моржин О.В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. - Сер. Математика. - 2009. - Т. 2, № 1. - С. 94-106.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

69

4. Трунин Д.О., Булдаев А.С. Об одном подходе к оптимизации нелинейных управляемых систем с терминальными ограничениями // Вестник Бурятского государственного университета. Математика, информатика. -2013,- № 1.-С. 15-20.

References

1. Srochko V.A. Iteracionnye metody reshenija zadach optimal'nogo uprav-lenija. - M.: Fizmatlit, 2000. - 160 p.

2. Buldaev A.S. Metody vozmushhenij v zadachah uluchshenija i optimi-zacii upravljaemyh sistem. - Ulan-Ude: Izd-vo Burjat. gos. un-ta, 2008. - 260 P-

3. Buldaev A.S., Morzhin O.V. Uluchshenie upravlenij v nelinejnyh siste-mah na osnove kraevyh zadach // Izvestija Irkutskogo gosudarstvennogo uni-versiteta. - Ser. Matematika. - 2009. - T. 2, № 1. - P. 94-106.

4. Trunin D.O., Buldaev A.S. Ob odnom podhode k optimizacii neli-nejnyh upravljaemyh sistem s terminal'nymi ogranichenijami // Vestnik Burjatskogo gosudarstvennogo universiteta. Matematika, informatika. - 2013. - № 1. - P. 15-20.

Трунин Дмитрий Олегович, кандидат физико-математических наук, старший преподаватель кафедры прикладной математики Бурятского государственного университета, e-mail: [email protected]

Trunin Dmitry Olegovich, candidate of physical and mathematical sciences, senior lecturer, applied mathematics department, Buryat State University, email: [email protected]

Аннотация научной статьи по математике, автор научной работы — Трунин Дмитрий Олегович

Похожие темы научных работ по математике , автор научной работы — Трунин Дмитрий Олегович

Alternative procedures of nonlocal improvement in nonlinear on a state optimal control problems with terminal constraints