Мижидон Клара Арсалановна, преподаватель кафедры Восточно-Сибирского государственного университета технологий и управления, тел.: (951-6) 398322, e-mail: mizhidon@gmail.com
Лобанов Алексей Валерьевич, студент Бурятского государственного университета, тел.: (950-3) 944685, email: albeux@gmail.com
Mizhidon Arsalan Dugarovich, doctor of technical sciences, professor, head of applied mathematics department, East-Siberian State University of Technology and Management.
Mizhidon Klara Arsalanovna, teacher, applied mathematics department, East-Siberian State University of Technology and Management.
Lobanov Alexey Valeryevich, student, Buryat State University.
УДК 517.977
© Д. О. Трунин, Д. Ганхуяг
МЕТОД НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ УПРАВЛЯЕМЫХ СИСТЕМ С ФУНКЦИОНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ
Работа выполнена при финансовой поддержке РФФИ (проекты 12-01-00914-а, 12-01-98011-р_сибирь_а, 13-01-92200-Монг_а)
В статье предлагается процедура нелокального улучшения допустимых управлений в нелинейных управляемых системах с функциональными ограничениями.
Ключевые слова: задача оптимального управления, нелокальное улучшение, функциональные ограничения.
D.O. Trunin, D. Gankhuyag
METHOD OF NONLOCAL IMPOVMENT OF CONTROLLED SYSTEMS WITH FUNCTIONAL CONSTRAINTS
In the article a nonlocal improvement procedure of admissible control in nonlinear controlled systems with functional constraints is proposed.
Keywords: optimal control problem, nonlocal improving, functional constraints.
Введение
В [1] для полиномиальных по состоянию задач оптимального управления со свободным правым концом построены методы нелокального улучшения управлений, основанные на нестандартных формулах приращения функционала без остаточных членов разложений. Отсутствие операции варьирования управлений и возможность улучшения управлений, удовлетворяющих принципу максимума, обусловливают повышенную эффективность построенных методов. В работе [2] эти методы обобщены на класс нелинейных задач оптимального управления со свободным правым концом. В данной статье предлагается процедура нелокального улучшения допустимых управлений для нелинейных задач оптимального управления с дополнительными функциональными ограничениями.
1. Постановка задачи
Рассматривается задача оптимального управления [3, 4] с функциональными ограничениями типа равенства
x = f (x,u,t), t e T = [t0,t ], (1)
x(t0) = x0, u(t) e U, (2)
O0(u) ^ min, (3)
ф. (u) = 0, i = 1s. (4)
Функционалы (3), (4) имеют вид
ф, (u) = p. (x(t1)) + f F (x,u, t)dt, i = 0, s.
JT
Задачу (1)-(4) сведем к задаче оптимального управления с частично закрепленным правым концом [5]. Для этого преобразуем функциональные ограничения (4)
ф. (u) = р (Xo) + £,[(Pix(x), f (x,u,i)} + F(x,u, t)]dt, i = 1,5.
Вводя в рассмотрение дополнительные фазовые переменные
i
y г (i) = ЖРх (x(z)), f (x(T),u(T),T)) + F (x(T),u(T),T)]dz, i = 15,
io
дополним систему (1) уравнениями вида
y = (x(x), f(x,u,i)) + F (x,u,i), i = 1,s, (5)
начальные условия (2) - условиями
y (io) = 0, i = ITs. (6)
Тогда ограничения (4) перепишутся в виде
y, (ii) = -р (x0), i = ITs. (7)
Нетрудно видеть, что задача (1)-(3), (5)-(7) является задачей оптимального управления с частично закрепленным правым концом.
Таким образом, далее будем рассматривать задачу оптимального управления с частично закрепленным правым концом
x = f (x,u,i), i eT = [i0,i], (8)
x(i0) = x0, u(i) e U, (9)
ф^) = p(x(i1)) +f F(x,u,i)di ^ min, (10)
J T
xi (i1) = x¡, i = 1, m, m < n, (11)
в которой x = (x1(i),x2(i),...,xn(i)) - вектор состояния, u = (u1(i),u2(i),...,ur(i)) - вектор управления,
интервал T фиксирован, x0 e Rn - заданный вектор, x,1, i = 1, m - заданные числа, функция р(x) не зависит от первых m компонент вектора x. Функции f (x, u, i), р( x), F (x, u, i) непрерывно дифференцируемы по своим аргументам в областях определения.
В качестве доступных управлений рассматривается множество кусочно-непрерывных функций со значениями в компактном множестве U с Rr
V = {u e PCr (T): u(i) e U, i e T} . Для каждого доступного управления u e V обозначим x(i,u), i e T - решение задачи Коши (8), (9) при u = u(i).
Определим множество допустимых управлений
W = |u e V : x¡(i1,u) = x.1,i = 1,m} . В задаче (8)-(11) составим нормальный функционал Лагранжа
m
L(u, Л) = Ф(u) + (x,. (О - x,1).
i=1
Функция Понтрягина с сопряженной переменной p e Rn имеет вид
H(p, x,u,i) = (p, f (x,u,i)} - F(x,u,i) . Приращение функционала Лагранжа на паре доступных управлений (u0,v) в соответствии с [2] имеет вид
L(v,A) - L(u °,Л) =
(12)
= -[ (H (p(i, u0, v,A), x(i, v), v(i), i) - H (p(i, u0, v,A), x(i, v), u 0(i), i ))di,
где p(i, u0, v,A) - решение модифицированной дифференциально-алгебраической сопряженной системы
p = -Hx (p, x(i, u0), u 0(i), i) - r (i), (13)
{Их(Р,x(t,u0),u0(t),t), x(t,v) - x(t,u0)^ + (rr(t),x(t,v) - x(t,u=
(14)
pt (ti) = -!,, i = 1, m, (15)
= H (p, x(t, v), u0 (t), t) - H (p, x(t, u0), u 0(t), t),
Pj(ti) = -^xj(x(t1,u ))-qj, j = m +1,n, (16)
n
X p (x(t1,u0)) (xj (t1, v) - xj (t1,u0))J +
j=m+1 n
+ X [qj (xj(t1,v) - xj(t1,u0))J = p(x(t1,v)) -p(xft,u0)).
(17)
j=m+1
Введем отображение
u (p, x, t) = arg max H (p, x, v, t), p e , x e , t e T.
veU
2. Метод нелокального улучшения
Поставим задачу улучшения управления u0 еЖ: найти управление v e Ж со свойством O(v) <0(u0).
1. Найдем решение (x(t),p(t)), t eT дифференциально-алгебраической краевой задачи
x = f (x,u*(p,x,t),t), t eT, p = -Hx (p, x(t, u0), u 0(t), t) - r (t), (p, x(t, u0), u 0(t), t), x - x(t, u0)^ + ^ r (t), x - x(t, u=
= H (p, x, u 0(t), t) - H (p, x(t, u0), u 0(t), t), x(t0) = x0, xi (t1) = x], i = 1, m,
(18)
pj (O = -pXj(x(t1, u )) - qj, j = m +1, n,
n
X (x(t,u0)) (xj (t1) - xj (t1,u0))J +
j=m+1 n
+ X Lqj (x} (t1) - xj (t1,u0)) J = p(x(t1)) - p(x(t1,u0)).
У=т+1
2. Сформируем управление м(;) = и*(р(;), х(;),;), ; еТ.
Предположим, что решение (х(;),р(;)), ; еТ краевой задачи (18) (возможно, не единственное) существует на Т. Тогда х(;) = х(;, V) и V е W .
Покажем свойство улучшения для выходных управлений.
Действительно, решение р(;), ; е Т является решением системы (13), (14) и удовлетворяет условиям (16), (17).
Обозначим
= - pi (;1), i = 1, т.
Тогда условия (15) выполняются и р(;) = р(;,и0,v,Л), ; еТ .
Следовательно, в соответствии с формулой приращения (12) выходное управление V обеспечивает невозрастание функционала Лагранжа
L(vД) < L(u0Д) .
Отсюда, в силу допустимости управлений и0, V получаем
Ф(м) <Ф(м0).
Алгебраические соотношения краевой задачи (18) всегда можно разрешить по аналогии с [2] относительно величин г (;), qj, и тем самым свести дифференциально-алгебраическую краевую задачу
(18) к обычной дифференциальной задаче. Определяя различные однозначные способы разрешения алгебраических уравнений, можно получать модификации метода улучшения с различными дифференциальными краевыми задачами.
3. Примеры
Пример 1.
Рассмотрим задачу оптимального управления
x1 = u, x2 = 1 x12, t eT = [0, 4],
Xj(0) = 1, x2(0) = 0, \u(t)| < 1, Ф(м) = x2 (4) ^ min, x1 (4) = 1.
В данном случае
1 2
H = P1u + 2 P2 X1 .
Поставим задачу улучшения допустимого управления u0(t) = 0, которому соответствуют фазовые траектории Xj(t,u0) = 1, x2(t,u0) = t, t e T и значение целевого функционала Ф^0) = 2. В данной задаче
u*( p, x, t) = sign p1.
Таким образом, краевая задача улучшения принимает вид
1 2
x1 = sign p1, x2 = — x1 , x1 (0) = 1, x2 (0) = 0, x1 (4) = 1, p1 = "P2 " r1(t), p2 = -r2(t), P2(4) = -1,
( x2 - 2 ) = у (x12 -1)-P2( x1 -1).
r(t)(x1 -1) + r2(t)\x2 - 2 j = p- ( x12 -1)-,
Полагая r2 (t) = 0 (тогда p2 (t) = -1), получим краевую задачу
x1 = sign p1, x1 (0) = 1, x1 (4) = 1,
11
p1 = — x1 + —. 1 2 1 2
Эта краевая задача имеет решение
Г-t +1, t e [0,2],
^(0 Ч , r„J p1(t) =
[t -3, t e [2,4].
t2
-—+1 -1, t e [0,2],
12
4 -1 +1 t e[2,4].
Г-1, t e [0,2), Соответствующее выходное управление v(t) = \
[1, t e [2,4].
2
Нетрудно видеть, что управление v(t) является улучшающим: O(v) = — < Ф(и ) = 2 .
Пример 2.
Рассмотрим задачу оптимального управления
X = u, X2 =-xj2, t eT = [0, 2], Xj(0) = 0, x2(0) = 0, |u(t)| < 1, Ф(и) = x2 (2) ^ min, Xj (2) = 0 .
В данном случае
H = pu - p2xj2.
Поставим задачу улучшения допустимого управления u0(t) = 0, которому соответствуют фазовые траектории xj (t,u0) = 0, x2(t,u0) = 0, t e T и значение целевого функционала Ф(и0) = 0 . В данной задаче
u*( p, X, t) = sign pj.
Таким образом, краевая задача улучшения принимает вид
X = signpj, X2 = -xj2, Xj(0) = 0, x2(0) = 0, Xj(2) = 0 ,
Pi = -rj (tX P2 = -r2 (t), P2(2) = -U Tj (t) xj + r2 (t) x2 = -p2 xj2. Полагая r2 (t) = 0 (тогда p2 (t) = -1), получим краевую задачу
Xj = sign pj, xj (0) = 0, xj (2) = 0,
pj =- xj.
Нетрудно видеть, что пара xj(t) = 0 , pj(t) = 0, t e T является решением краевой задачи, т.е. управление и0 удовлетворяет регулярному принципу максимума с \ = 0 (особое управление). Кроме того, краевая задача имеет решение
k t е [0,1],
r'(t) ^-t, 1 ,е [1,2]. "■<t) =
t2 1
-у+2, t е[0,1],
t2 3
- - 2t + -, t е [1,2].
Соответствующее выходное управление
Í1, t е [0,1), v<t) = \
И t е [1,2].
2
Нетрудно видеть, что управление v(t) является улучшающим: 0<v) = —— < Ф(и ) = 0 .
Заключение
Предлагаемая процедура обеспечивает нелокальное улучшение допустимых управлений без процедуры варьирования в окрестности улучшаемого управления с выполнением всех функциональных ограничений. Это свойство является существенным фактором повышения эффективности решения нелинейных задач оптимального управления с ограничениями на фазовую траекторию.
Литература
1. Булдаев А.С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. 260 с.
2. Булдаев А.С., Моржин О.В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. 2009. Сер. Математика. Т. 2, № 1. С. 94-106.
3. Васильев О.В. Лекции по методам оптимизации. Иркутск: Изд-во Иркут. гос. ун-та, 1994. 340 с.
4. Срочко В.А. Итерационные методы решения задач оптимального управления. М.: Физматлит, 2000. 160 с.
5. Трунин Д.О., Булдаев А.С. Об одном подходе к оптимизации нелинейных управляемых систем с терминальными ограничениями // Вестник Бурятского государственного университета. Математика, информатика. 2013. № 1. С. 15-20.
Трунин Дмитрий Олегович, кандидат физико-математических наук, старший преподаватель кафедры прикладной математики Бурятского государственного университета, тел.: (301-2) 217733, e-mail: hint@rambler.ru
Ганхуяг Данзан, e-mail: gankhuyagd@gmail.com
Trunin Dmitry Olegovich, candidate of physical and mathematical sciences, senior lecturer, applied mathematics department, Buryat State University, tel. (301-2) 217733, e-mail: hint@rambler.ru
Gankhuyag Danzan, e-mail: gankhuyagd@gmail.com