Метод нелокального улучшения управляемых систем с функциональными ограничениями

Трунин Дмитрий Олегович; Ганхуяг Данзан

Мижидон Клара Арсалановна, преподаватель кафедры Восточно-Сибирского государственного университета технологий и управления, тел.: (951-6) 398322, e-mail: [email protected]

Лобанов Алексей Валерьевич, студент Бурятского государственного университета, тел.: (950-3) 944685, email: [email protected]

Mizhidon Arsalan Dugarovich, doctor of technical sciences, professor, head of applied mathematics department, East-Siberian State University of Technology and Management.

Mizhidon Klara Arsalanovna, teacher, applied mathematics department, East-Siberian State University of Technology and Management.

Lobanov Alexey Valeryevich, student, Buryat State University.

УДК 517.977

МЕТОД НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ УПРАВЛЯЕМЫХ СИСТЕМ С ФУНКЦИОНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ

Работа выполнена при финансовой поддержке РФФИ (проекты 12-01-00914-а, 12-01-98011-р_сибирь_а, 13-01-92200-Монг_а)

В статье предлагается процедура нелокального улучшения допустимых управлений в нелинейных управляемых системах с функциональными ограничениями.

Ключевые слова: задача оптимального управления, нелокальное улучшение, функциональные ограничения.

D.O. Trunin, D. Gankhuyag

METHOD OF NONLOCAL IMPOVMENT OF CONTROLLED SYSTEMS WITH FUNCTIONAL CONSTRAINTS

In the article a nonlocal improvement procedure of admissible control in nonlinear controlled systems with functional constraints is proposed.

Keywords: optimal control problem, nonlocal improving, functional constraints.

Введение

В [1] для полиномиальных по состоянию задач оптимального управления со свободным правым концом построены методы нелокального улучшения управлений, основанные на нестандартных формулах приращения функционала без остаточных членов разложений. Отсутствие операции варьирования управлений и возможность улучшения управлений, удовлетворяющих принципу максимума, обусловливают повышенную эффективность построенных методов. В работе [2] эти методы обобщены на класс нелинейных задач оптимального управления со свободным правым концом. В данной статье предлагается процедура нелокального улучшения допустимых управлений для нелинейных задач оптимального управления с дополнительными функциональными ограничениями.

1. Постановка задачи

Рассматривается задача оптимального управления [3, 4] с функциональными ограничениями типа равенства

x = f (x,u,t), t e T = [t0,t ], (1)

x(t0) = x0, u(t) e U, (2)

O0(u) ^ min, (3)

ф. (u) = 0, i = 1s. (4)

Функционалы (3), (4) имеют вид

ф, (u) = p. (x(t1)) + f F (x,u, t)dt, i = 0, s.

JT

Задачу (1)-(4) сведем к задаче оптимального управления с частично закрепленным правым концом [5]. Для этого преобразуем функциональные ограничения (4)

ф. (u) = р (Xo) + £,[(Pix(x), f (x,u,i)} + F(x,u, t)]dt, i = 1,5.

Вводя в рассмотрение дополнительные фазовые переменные

i

y г (i) = ЖРх (x(z)), f (x(T),u(T),T)) + F (x(T),u(T),T)]dz, i = 15,

io

дополним систему (1) уравнениями вида

y = (x(x), f(x,u,i)) + F (x,u,i), i = 1,s, (5)

начальные условия (2) - условиями

y (io) = 0, i = ITs. (6)

Тогда ограничения (4) перепишутся в виде

y, (ii) = -р (x0), i = ITs. (7)

Нетрудно видеть, что задача (1)-(3), (5)-(7) является задачей оптимального управления с частично закрепленным правым концом.

Таким образом, далее будем рассматривать задачу оптимального управления с частично закрепленным правым концом

x = f (x,u,i), i eT = [i0,i], (8)

x(i0) = x0, u(i) e U, (9)

ф^) = p(x(i1)) +f F(x,u,i)di ^ min, (10)

J T

xi (i1) = x¡, i = 1, m, m < n, (11)

в которой x = (x1(i),x2(i),...,xn(i)) - вектор состояния, u = (u1(i),u2(i),...,ur(i)) - вектор управления,

интервал T фиксирован, x0 e Rn - заданный вектор, x,1, i = 1, m - заданные числа, функция р(x) не зависит от первых m компонент вектора x. Функции f (x, u, i), р( x), F (x, u, i) непрерывно дифференцируемы по своим аргументам в областях определения.

В качестве доступных управлений рассматривается множество кусочно-непрерывных функций со значениями в компактном множестве U с Rr

V = {u e PCr (T): u(i) e U, i e T} . Для каждого доступного управления u e V обозначим x(i,u), i e T - решение задачи Коши (8), (9) при u = u(i).

Определим множество допустимых управлений

W = |u e V : x¡(i1,u) = x.1,i = 1,m} . В задаче (8)-(11) составим нормальный функционал Лагранжа

m

L(u, Л) = Ф(u) + (x,. (О - x,1).

i=1

Функция Понтрягина с сопряженной переменной p e Rn имеет вид

H(p, x,u,i) = (p, f (x,u,i)} - F(x,u,i) . Приращение функционала Лагранжа на паре доступных управлений (u0,v) в соответствии с [2] имеет вид

L(v,A) - L(u °,Л) =

(12)

= -[ (H (p(i, u0, v,A), x(i, v), v(i), i) - H (p(i, u0, v,A), x(i, v), u 0(i), i ))di,

где p(i, u0, v,A) - решение модифицированной дифференциально-алгебраической сопряженной системы

p = -Hx (p, x(i, u0), u 0(i), i) - r (i), (13)

{Их(Р,x(t,u0),u0(t),t), x(t,v) - x(t,u0)^ + (rr(t),x(t,v) - x(t,u=

(14)

pt (ti) = -!,, i = 1, m, (15)

= H (p, x(t, v), u0 (t), t) - H (p, x(t, u0), u 0(t), t),

Pj(ti) = -^xj(x(t1,u ))-qj, j = m +1,n, (16)

n

X p (x(t1,u0)) (xj (t1, v) - xj (t1,u0))J +

j=m+1 n

+ X [qj (xj(t1,v) - xj(t1,u0))J = p(x(t1,v)) -p(xft,u0)).

(17)

j=m+1

Введем отображение

u (p, x, t) = arg max H (p, x, v, t), p e , x e , t e T.

veU

2. Метод нелокального улучшения

Поставим задачу улучшения управления u0 еЖ: найти управление v e Ж со свойством O(v) <0(u0).

1. Найдем решение (x(t),p(t)), t eT дифференциально-алгебраической краевой задачи

x = f (x,u*(p,x,t),t), t eT, p = -Hx (p, x(t, u0), u 0(t), t) - r (t), (p, x(t, u0), u 0(t), t), x - x(t, u0)^ + ^ r (t), x - x(t, u=

= H (p, x, u 0(t), t) - H (p, x(t, u0), u 0(t), t), x(t0) = x0, xi (t1) = x], i = 1, m,

(18)

pj (O = -pXj(x(t1, u )) - qj, j = m +1, n,

n

X (x(t,u0)) (xj (t1) - xj (t1,u0))J +

j=m+1 n

+ X Lqj (x} (t1) - xj (t1,u0)) J = p(x(t1)) - p(x(t1,u0)).

У=т+1

2. Сформируем управление м(;) = и*(р(;), х(;),;), ; еТ.

Предположим, что решение (х(;),р(;)), ; еТ краевой задачи (18) (возможно, не единственное) существует на Т. Тогда х(;) = х(;, V) и V е W .

Покажем свойство улучшения для выходных управлений.

Действительно, решение р(;), ; е Т является решением системы (13), (14) и удовлетворяет условиям (16), (17).

Обозначим

= - pi (;1), i = 1, т.

Тогда условия (15) выполняются и р(;) = р(;,и0,v,Л), ; еТ .

Следовательно, в соответствии с формулой приращения (12) выходное управление V обеспечивает невозрастание функционала Лагранжа

L(vД) < L(u0Д) .

Отсюда, в силу допустимости управлений и0, V получаем

Ф(м) <Ф(м0).

Алгебраические соотношения краевой задачи (18) всегда можно разрешить по аналогии с [2] относительно величин г (;), qj, и тем самым свести дифференциально-алгебраическую краевую задачу

(18) к обычной дифференциальной задаче. Определяя различные однозначные способы разрешения алгебраических уравнений, можно получать модификации метода улучшения с различными дифференциальными краевыми задачами.

3. Примеры

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пример 1.

Рассмотрим задачу оптимального управления

x1 = u, x2 = 1 x12, t eT = [0, 4],

Xj(0) = 1, x2(0) = 0, \u(t)| < 1, Ф(м) = x2 (4) ^ min, x1 (4) = 1.

В данном случае

1 2

H = P1u + 2 P2 X1 .

Поставим задачу улучшения допустимого управления u0(t) = 0, которому соответствуют фазовые траектории Xj(t,u0) = 1, x2(t,u0) = t, t e T и значение целевого функционала Ф^0) = 2. В данной задаче

u*( p, x, t) = sign p1.

Таким образом, краевая задача улучшения принимает вид

1 2

x1 = sign p1, x2 = — x1 , x1 (0) = 1, x2 (0) = 0, x1 (4) = 1, p1 = "P2 " r1(t), p2 = -r2(t), P2(4) = -1,

( x2 - 2 ) = у (x12 -1)-P2( x1 -1).

r(t)(x1 -1) + r2(t)\x2 - 2 j = p- ( x12 -1)-,

Полагая r2 (t) = 0 (тогда p2 (t) = -1), получим краевую задачу

x1 = sign p1, x1 (0) = 1, x1 (4) = 1,

11

p1 = — x1 + —. 1 2 1 2

Эта краевая задача имеет решение

Г-t +1, t e [0,2],

^(0 Ч , r„J p1(t) =

[t -3, t e [2,4].

t2

-—+1 -1, t e [0,2],

12

4 -1 +1 t e[2,4].

Г-1, t e [0,2), Соответствующее выходное управление v(t) = \

[1, t e [2,4].

2

Нетрудно видеть, что управление v(t) является улучшающим: O(v) = — < Ф(и ) = 2 .

Пример 2.

Рассмотрим задачу оптимального управления

X = u, X2 =-xj2, t eT = [0, 2], Xj(0) = 0, x2(0) = 0, |u(t)| < 1, Ф(и) = x2 (2) ^ min, Xj (2) = 0 .

В данном случае

H = pu - p2xj2.

Поставим задачу улучшения допустимого управления u0(t) = 0, которому соответствуют фазовые траектории xj (t,u0) = 0, x2(t,u0) = 0, t e T и значение целевого функционала Ф(и0) = 0 . В данной задаче

u*( p, X, t) = sign pj.

Таким образом, краевая задача улучшения принимает вид

X = signpj, X2 = -xj2, Xj(0) = 0, x2(0) = 0, Xj(2) = 0 ,

Pi = -rj (tX P2 = -r2 (t), P2(2) = -U Tj (t) xj + r2 (t) x2 = -p2 xj2. Полагая r2 (t) = 0 (тогда p2 (t) = -1), получим краевую задачу

Xj = sign pj, xj (0) = 0, xj (2) = 0,

pj =- xj.

Нетрудно видеть, что пара xj(t) = 0 , pj(t) = 0, t e T является решением краевой задачи, т.е. управление и0 удовлетворяет регулярному принципу максимума с \ = 0 (особое управление). Кроме того, краевая задача имеет решение

k t е [0,1],

r'(t) ^-t, 1 ,е [1,2]. "■<t) =

t2 1

-у+2, t е[0,1],

t2 3

- - 2t + -, t е [1,2].

Соответствующее выходное управление

Í1, t е [0,1), v<t) = \

И t е [1,2].

2

Нетрудно видеть, что управление v(t) является улучшающим: 0<v) = —— < Ф(и ) = 0 .

Заключение

Предлагаемая процедура обеспечивает нелокальное улучшение допустимых управлений без процедуры варьирования в окрестности улучшаемого управления с выполнением всех функциональных ограничений. Это свойство является существенным фактором повышения эффективности решения нелинейных задач оптимального управления с ограничениями на фазовую траекторию.

Литература

1. Булдаев А.С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. 260 с.

2. Булдаев А.С., Моржин О.В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. 2009. Сер. Математика. Т. 2, № 1. С. 94-106.

3. Васильев О.В. Лекции по методам оптимизации. Иркутск: Изд-во Иркут. гос. ун-та, 1994. 340 с.

4. Срочко В.А. Итерационные методы решения задач оптимального управления. М.: Физматлит, 2000. 160 с.

5. Трунин Д.О., Булдаев А.С. Об одном подходе к оптимизации нелинейных управляемых систем с терминальными ограничениями // Вестник Бурятского государственного университета. Математика, информатика. 2013. № 1. С. 15-20.

Трунин Дмитрий Олегович, кандидат физико-математических наук, старший преподаватель кафедры прикладной математики Бурятского государственного университета, тел.: (301-2) 217733, e-mail: [email protected]

Ганхуяг Данзан, e-mail: [email protected]

Trunin Dmitry Olegovich, candidate of physical and mathematical sciences, senior lecturer, applied mathematics department, Buryat State University, tel. (301-2) 217733, e-mail: [email protected]

Gankhuyag Danzan, e-mail: [email protected]

Метод нелокального улучшения управляемых систем с функциональными ограничениями Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Трунин Дмитрий Олегович, Ганхуяг Данзан

Похожие темы научных работ по математике , автор научной работы — Трунин Дмитрий Олегович, Ганхуяг Данзан

Method of nonlocal improvement of controlled systems with functional constraints

Текст научной работы на тему «Метод нелокального улучшения управляемых систем с функциональными ограничениями»