Математика
УДК 517.977
Необходимые условия экстремума для 2-нормальных процессов
Н. Г. Павлова
Кафедра нелинейного анализа и оптимизации Российский университет дружбы народов ул. Миклухо-Маклая, 6, Москва, 117198, Россия
В статье исследуется управляемая система с импульсными управлениями в окрестности анормальной точки. Вводится понятие 2-нормальности, которое играет большую роль при выводе необходимых условий первого и второго порядка для задачи оптимального управления. В статье приводятся достаточные условия 2-нормальности. Исследована близость между необходимыми и достаточными условиями экстремума для 2-нормальных траекторий.
Ключевые слова: оптимальное управление, импульсное управление, условие 2-нормальности.
При выводе необходимых условий первого и второго порядка для задачи оптимального управления, заключающейся в минимизации некоторого функционала на множестве допустимых процессов управляемой системы, большую роль играют понятия регулярности и 2-нормальности в рассматриваемой точке. Поясним суть этих определений для абстрактного отображения F, действующего из заданного банахова пространства Z в Rfc.
Пусть z — заданная точка из Z, и отображение F дважды непрерывно дифференцируемо в окрестности z.
Определение 1. Отображение F называется регулярным (нормальным) в точке z, если
im F'(z)= Rk, (1)
где im — образ линейного оператора.
Известно, что если отображение F регулярно в точке z, то для него справедлива теорема об обратной функции. Кроме того, для задачи минимизации
fo(z) ^ min, F(z) = 0, (2)
где f0 — заданная гладкая функция, справедлив принцип Лагранжа (при Ао = 1), а также необходимые условия второго порядка. Если же точка z является анормальной, т.е. imF'(z) = Rk, то утверждение классической теоремы о неявной функции, как известно, может не выполняться.
Аналогично, в задаче минимизации (2) принцип Лагранжа является неинформативным, то есть выполняется при Ао = 0 (независимо от минимизируемой функции /о), а классические необходимые условия второго порядка могут не выполняться.
Таким образом возникает проблема нахождения условия, более тонкого, чем условие (1), но которое бы гарантировало локальную разрешимость уравнения F(z) = у для всех z, близких к точке у = F(z), а также наличие содержательных необходимых условий первого и второго порядка в задаче (2). Это условие известно и называется условием 2-нормальности (см. [1]). Приведём это условие.
Статья поступила в редакцию 5 ноября 2008 г.
Обозначим через F2(i;) конус, состоящий из таких Л £ К, Л = 0, что Р '(2)*Х = 0 ив 2 существует линейное подпространство П = П(А):
П С КегР' (2), соётП < к;
2
^ (Л, Ф(*)) [г, г] > 0 Vг £ П.
Сразу же отметим, что конус F2(-г) может оказаться пустым. Он, например, заведомо пуст, если отображение Ф нормально в точке так как из (1) вытекает, что Р'(¿)*А = 0 VЛ = 0. Кроме того, после присоединения к этому конусу нуля он становится замкнутым, но вовсе не обязан стать выпуклым.
Определение 2. [1] Отображение Р называется 2-нормальным в точке если конус convF2(z) является острым, т.е. не содержит ненулевых подпространств (случай F2(-г) = 0 не исключается, так как пустой конус острый по определению).
Как известно [2], 2-нормальность отображения Р 2-регулярно в точке гарантирует разрешимость уравнения Р(х) = у для всех у, достаточно близких к у = Р(¿). Кроме того, в задаче (2) справедливы некоторые необходимые условия первого и второго порядка, содержательные и в анормальном случае (т.е. когда \шР '(¿) = К).
В настоящей работе условие 2-нормальности расшифровывается применительно к управляемым системам.
Рассмотрим задачу оптимального импульсного управления
¿2
J = J(x1,u,v) = (жх,ж2)^у ¡0(х(г),и(г),г)<и + ^ д0(г)Ф(г) ^ шш, (3)
ёж(£) = /(х(г), и(?),£)М + С(£)ф(£), г £ (4)
£(¿1) = Х\,Х(Ь2) = Х2, (5)
№(Ж1,Ж2) = 0, р £ К. (6)
Здесь Ь £ [¿1,^2]
— время, tl < ¿2 заданы, х — фазовая переменная, принимающая значения в п-мерном арифметическом пространстве К", и = (и1,и2,..., ит) £ — управление, / — п-мерная, д0 — ^-мерная, С — п х к-мерная, а Ш — и>-мерная вектор-функции (к, п,т,т — натуральные числа), и /0 — скалярные функции. Функции Wо и Ш предполагаются дважды непрерывно дифференцируемыми, функции /0 и / — дважды дифференцируемыми по х и и для п.в. Ь £ [¿1,^2], а функции д0 и О — непрерывными.
Положим
К = |р £ С* ([¿ь^]; К*) : V непрер. <р : <р(Ь) £ К* V г,
! > 0 V борел. В с [¿1,^]|,
где К С К — заданный острый выпуклый замкнутый конус, К * — его сопряжённый. Другими словами, ^ — ^-мерная мера Бореля, такая, что В) с К для любого борелевского множества В.
В качестве класса допустимых управлений рассматривается множество пар (и, у) : ц £ К, и £ ¿^[¿1,^2].
Тройка (х(Ь),и(Ь)ф(Ь)), £ £ [¿1 ,¿2], называется допустимым процессом, если (и(-),^(-)) — допустимое управление, а х(-) — соответствующее ему решение уравнения (4), удовлетворяющее концевым ограничениям (5), (6):
х(г) = х(г1)^/(х(т),и(т),т)Лт +у с(т)й/л(т) V г е [г1,г2]. <1 [<!,<]
Определим на множествах К" х х К1 х К" х К1 и К2" х гамильтониан
1 ш>1 „ ш>2п
и малый лагранжиан по формулам
н(Х,и,г,ф,х0) = ц(х,и,г),ф) -х70(х,и,г),
1(Х1,Х2,\) = X0Wo (Х1,Х2) + (Х1^ (Х1,Х2)) , X = (X0 ,Х1).
Здесь А0 е К1, А1 е К™, а ф — п-мерный вектор-столбец. Пусть (х,й,р) — заданный допустимый процесс.
Определение 3. Процесс (х,й,р) удовлетворяет уравнению Эйлера-Лагранжа, если существует такой вектор А = 0, что А0 > 0 и для вектор-функции ф, являющейся решением задачи Коши
ф= -дН (х(г),и(г),г,'ф(г))/дх, ф(Ь) = д1(х1,х2,Х)/дх1, (7)
имеет место
дн(х(г),й(г),г,ф(г),х0)/ди = о для п.в.г е [ь,ь],
= -д1(х1,х2,х)/дх2, (8)
{^(г),С(ф) - X0 (д0^),у) < о Vv е к, V е [ь2],
{ф(г),с(ф(г)) - х0 (д0(г),д(г)) = о для р, - п.в. г е [ь,г2].
Здесь = (^ — производная Радона-Никодима, х1 = ж(^), х2 = х(Ь2).
Обозначим через Л(х, и, р) множество векторов А, которые отвечают заданной экстремали (х, и, р) в силу уравнений Эйлера-Лагранжа.
Если конус Л не содержит элемент вида (0, А1) (т.е. элемент с А0 = 0), то задача называется нормальной. В противном случае задачу называют анормальной и для неё необходимые условия первого порядка выполняются тривиально. При этом классические необходимые условия второго порядка (см. теорему 1), вообще говоря, неверны.
Для формулировки условий второго порядка для процесса (х,й,р) введём в рассмотрение систему уравнений в вариациях
д^ д/■ = ^-(х(г), й(г),г)5х& + т^-(х(г),й(г),г)5иШг + вШ(б»Ш. (9) ох ои
Здесь 5и е Ь™ ^1,12], 5ц, е Тк(р), а решение уравнения в вариациях должно удовлетворять условию
дШ дШ
—- (х1 ,х2)5х(11) = 0, (х1,х2)5х(12) = 0. (10)
Пусть А е Л(х, и, р). На пространстве V = Кп х Ь™ ^1,12] пар ((, 5и) определим квадратичную форму Пд формулой
д21
Па((,5и) = д(х^ х)2 (х\,х2,Л) [(5х(Ь\),5х((5х(Ь^^х^))] —
Г д 2 Я
— тт,-(х,и,Ь,ф)[(5 х(Ь),5и(Ь)), (ё хи),ёии))]М.
] д(х,и)2 ¿1
Здесь и далее 6х — соответствующее (5и, 5ц) решение системы уравнений в вариациях (9) с начальным условием 5х(11) =
Через X обозначим линейное подпространство X = Кп х 1,12] х С*, состоящее из всех тех (£, 5и, 6 ц), что решение системы (9) 5х удовлетворяет граничным условиям (10). Для произвольного целого неотрицательного числа г через ^Л^ — ^Л^ (х, и,ц) обозначим множество тех Л € Л(х,и,ц), для которых индекс сужения формы Па на подпространство X не превышает г.
Пусть Ф — фундаментальная матрица системы уравнений в вариациях (9), т.е. Ф является решением однородной системы
^Ф = дхт,и®,ф, Ф(г 1) = I,
Обозначим через й размерность ядра блочной матрицы (Е*Е*), где
^ = (хих2) + Ф(*2) (хьх2),
¿2
^2 = ^(хих2)*Ф$2)*! Ф-1 (г)*ди(х®,и(г), г)*д^Ш,и(г), г)Ф-1(г)м х 2 ¿1
дW
х Ф(г2) ~дх^2 (х1 ,х2).
Приведём необходимые условия слабого локального минимума, полученные в [2].
Теорема 1. Пусть допустимый процесс (х,и,ц) является слабым локальным минимумом в .задаче (3)-(6). Тогда Л^ = 0 и для ((,5и,5ц) € X, таких, что
¿2
5х(г), (х(£),и(£), ^ + ^5и(г), Ц-(х(£),и(£), г) ¿1
+ I (д0(г),5ц) + ^д) (х1,х2), (5х(и),5х(12))Т^ < 0,
имеет место
тах Па(С,5и) > 0. (11)
АеЛа,|А| = 1
Если экстремаль (х,и,ц) нормальна, то конус Л(х,и,ц) содержит единственный единичный вектор Л и теорема 1 гарантирует неотрицательность формы Па на X, а это и есть классические необходимые условия второго порядка. Если же экстремаль анормальна, то может не существовать такого Л € Л(х, и, ц), что форма Па неотрицательна на X.
Пример 1. Рассмотрим задачу оптимального управления
х-]_(1) ^ шш,
х i = щ, i = 1,4
X5 = X1U1 + х2и2 — х3и3 — х4и4, t е [0,1],
Xi(0) = 0, i = 1,5, Жб(1) = 0.
Здесь t е [0,1] — время, х = (х1,х2,х3,х4,х5) — фазовая переменная, и = (и1, и2,и3, и4) — управление.
В качестве класса допустимых управлений рассматривается множество измеримых существенно ограниченных функций и е L™ [¿х, t2].
Определим гамильтониан и малый лагранжиан по формулам
Н(х, и, t, ф) = + Ф2U2 + ФзЩ + ФаЩ + Фь(Х1 Щ + X2U2 — X3U3 — Х4щ),
l(Xl,X2 ,Х) = Х°х1 (1) + А}жх(0) + \12Х2(0) + А1>жз(0) + \\Xi(0) + A^W + \\хъ(1),
А = {\01\1 )■
Здесь А0 е R1, А1 е R6, а ф — 5-мерный вектор-столбец.
Исследуем на экстремум анормальные процессы (х(-),и(-)) = (0, 0). Классические необходимые условия выполняются на нем с фi = 0, % =1,4, Ф5 = const. Система в вариациях имеет вид
^5xi = Sui, г = 1,4, 5x5 = 0. at at
Выпишем вторую вариацию
1
Qx(Su) = ф5 J(Sx1Su1 + 6х26и2 — 5х35и3 — Sx4Su4)dt =
0
1
= Y J ((6x2) + (6x2) — 2) — 2))dt =
0
= Y №(1) + 6x2(1) — 6xl(1) — ¿4(1)).
Отсюда следует, что классические необходимые условия второго порядка для этой задачи не выполняются.
Пример 2. Обозначим через Q : R™ х R™ ^ Rk билинейное симметричное отображение, удовлетворяющее двум условиям:
a) существует у е Rk: Q(x) = уУх е R™, где Q(x) = Q[x,x];
b) не существует такого ненулевого вектора А е Rk, что {X, Q(x)) > 0 Ух е R™. (Примером отображения, удовлетворяющего условиям a), b), является отображение Q : R3 х R3 ^ R3, Q[x, у] = (х1у2,х2уз,хз, У1).)
Выберем любое а е Q(Rn). Рассмотрим задачу
z(0) ^ min, х = zu, у = z(2Q[x,u] + a), z = 0, t е [0,1],
ж(0) = 0, у(0) = —а, у(1) = 0.
Здесь х,и е R™, у е Rk, z е R1. Тогда
1
/а
—zQ[x, x]dt + za = a(z — 1) + zQ[x(1),x(1)} = 0.
Но так как а ф Q(Rn), то из последнего соотношения следует, что z = 1. Значит, процесс (x(t), y(t), z(t),u(t)) = (0,ta, 1, 0) является решением задачи.
Определим гамильтониан Н = ф1zu + ф2z(2Q[x,u] + а). Из условия стационарности (8) имеем ф1 = 0, а в силу (7) ф2 = const. Система в вариациях имеет вид
—5x = Su, — 5y = 5za, — 5z = 0. at at at
Выпишем вторую вариацию
± ± Пх(Su) = 2 j ip2Q[5x,5u]dt = 2ф2 j Q
Sx, 5x a
at = ^2Q[Sx(1),5x(1)].
Из условия Ь) следует, что квадратичная форма Па не будет неотрицательно определена ни для какого ф2 = 0. Это значит, что классические необходимые условия второго порядка для этой задачи не выполняются.
Пусть экстремаль (х,й,р) анормальна (т.е. д>> 0). Тогда если сопь Л^ — выпуклая оболочка конуса Л^ — содержит ненулевое подпространство, то условие (11) выполняется автоматически, так как максимум зависящей от переменной Л линейной функции по множеству, содержащему одновременно два вектора Л и (-Л), неотрицателен. Таким образом, если конус сопVЛ^ не является острым, то условие (11) содержательной информации не несёт. Выделим класс экстремалей, для которых условие (11) содержательно.
Для управляемой системы (2)—(4) определим гамильтониан и малый лагранжиан по формулам
Н(х, й, I, ф) = (ф, /(х, й, , 1(х1,х2, Л1) = (Л1, W(х1,х2)).
Для допустимого процесса (х, й, р) обозначим через Т(х, й,р) = Т множество тех Л1 С К™, Л1 = 0, для которых существует абсолютно непрерывная вектор-функция ф = ф\\ (■), являющаяся решением задачи Коши
ф = -дН(х(г),й(г),г,ф(г))/дх, ф(Ь) = д1(х1 ,х2,Л1)/да, (12)
такая, что
ф(Ь) = -д1(х1,х2,Л1)/дх2, дН(х^),и^)^,ф^),Л°)/дй = 0 для п.в. tС ^ 1, г2],
(ф(г),в(г)V) < 0 УуСК, ШС ^ 1,t2],
(ф(t),G(t)v(t)) =0 для р - п.в. te [ii,t2].
Здесь v(t) = 44-(t) — производная Радона-Никодима, vi = x(ti), xv2 = x(t2).
Предположим, что Т = 0. Для Л1 С Т определим на X квадратичную форму формулой
~ д2[
ПЛ1 (С,5й,5р) = щх-(х1,х2,Л) [(5х^ 1 ),6х^2)), (5х^ 1),&^2))] -
/2 д2 Н
2(х, й, I, ф\1) [(<5х^), 5й(£)), (5х^), 5й^))] ё.
д( х, й) <1
Для натурального числа г через Т2,г(х,й,р) = Т2,г обозначим множество тех Л1 С Т, для которых индекс сужения формы Пд1 на подпространство X не превышает .
Определение 4. Допустимый процесс (Х,й,р,) называется 2-нормальным, если конус convТ2,г(Х,й,'ц) является острым.
Из лемм 1 и 2 из [1] естественно вытекает, что 2-нормальность в смысле определения 4 означает ни что иное как 2-нормальность введённого ранее отображения F в точке z = (х\, й(-),р(-)). Приведём достаточные условия 2-нормальности, полученные в [3].
Предположим, что рассматриваемое управление й(1) является кусочно-гладким, т.е. имеет на отрезке [t 1, t2] конечное число р точек разрыва т\,..., тр, и на каждом из отрезков [ti, т+\] оно бесконечно дифференцируемо.
Определим векторные поля f(x, t) и fUi (х, t) на Rn+1 формулами:
f = col(f(x,u(t), t), 1), fUi = C0l(df (x,u(t), €)/дщ, 0).
Положим Ъ\(1) = (ас13(/))(х(Ь)), г = 1,т, где
ад°и)и, = и,, аЛаи)и, = - ^.
Обозначим через №3(Ь) (п х т)-матрицу со столбцами, полученными из Ъ\ удалением (п + 1)-й координаты. Для целого 8 ^ 0 рассмотрим систему уравнений
5х) = (х(Ь), й(Ь), Ь)5хЛЬ + (-1)"%а(г)6и(г)<И + С(ЬЩ5ц)($. (13)
Через Х8 обозначим линейное подпространство X, состоящее из всех тех (£,6и,3р), что решение системы (11) 5х удовлетворяет граничным условиям (8). Для целого 8 ^ 0 на пространстве Х8 определим квадратичную форму
—21
й^((,5и,5ц) = —х——у2[(<5х(Ь 1 ),5х(Ь2)), (5х(Ь 1),5х(Ь2))] -
- I (^ (&, й, ^) [§х, $х] + (-1У+1 ■ 2 ^ ——-^-—^Ш, т^фх!)*5х, 6и^ Ы.
Положим
*.) = ¿((¿§)* в,-,)^ + (¿d-f <*•)•»<-'<«) ■ (14)
Здесь A MT = M(t + 0) — M(t — 0) — скачок матрицы M в точке т, а через indQ обозначен индекс квадратичной формы, определяемой симметричной матрицей Q. Отметим, что все матрицы, входящие в (12), симметричны.
Теорема 2 (Достаточные условия 2-нормальности). Пусть для некоторого г конус convF2,r не является острым. Тогда существует такое A1 G T2r, что для любого целого s > 0 выполняются условия:
1) для решения сопряжённого уравнения (10) гр, соответствующего вектору X1, имеет место
д ds дЙ
2) существует такое подпространство Ys С Xs, что
codim Ys < (k — 7(s) + 1)(r — 7(s)) < r(k + 1)
П С ,ó u, S ц) = 0 С J u,5fi) e Ys;
3) 7(s) < r.
и
Выше было отмечено, что если конус conv Ad в теореме 1 не является острым, то необходимое условие (9) выполняется тривиальным образом и не несёт содержательной информации. Приводимая ниже теорема показывает, что в 2-нормальном случае это не так. Оказывается, что в этом случае «зазор» между необходимыми условиями из теоремы 1 и достаточными условиями локального минимума в некотором смысле неулучшаем.
Определение 5. Допустимый процесс (x,U,¡j¡) называется конечномерным минимумом, если для любого содержащего точку и конечномерного подпространства Ri С L™[ti, t2] и любого содержащего точку ¡ конечномерного подпространства R2 С С * процесс (х, и, ¡1) является локальным минимумом в задаче (3)-(6) с дополнительным ограничением и(-) G Ri, ¡(-) G R2.
Поясним введённое определение. Задача (3)-(6) с дополнительным ограничением и(-) G Ri, ¡(-) G R2 является задачей условной минимизации на конечномерном векторном подпространстве. Как известно, в произвольном конечномерном векторном пространстве существует единственная отделимая векторная топология, т.е. топология, превращающая его в отделимое векторное топологическое пространство. Рассматривая конечномерные векторные подпространства, мы считаем их наделёнными этой (единственной отделимой векторной) топологией. Именно относительно указанной топологии и подразумевается локальность минимума в участвующей в определении конечномерной задаче. Отметим, что введённый конечномерный минимум слабее других рассматривающихся в теории оптимального управления типов минимума.
Предположим, что концевые ограничения регулярны, т.е.
rаnкЩ^к) (xi,x2) = w.
Теорема 3. Предположим, что допустимый процесс (х, и, ¡) является 2-нормальным для задачи (3)-(6) и для него выполняются необходимые условия второго порядка из теоремы 1.
Предположим также, что матрица df (x(t),u(t), t)/du имеет ранг т при почти всех t и существует непрерывная n-мерная функция £ такая, что £(t)G(t) = 0 и £(t)ff (x(t),u(t), t) = 0 для п.в. t G [t i, t2]. Тогда существуют такие вектор v G R™ и вектор-функция 0(t) G L^ti, t2], что для любого e > 0 тройка (х,и,1) доставляет строгий конечномерный минимум в следующей возмущённой задаче:
Wo (Xi,X2) + el(xi,x2) — (xi,X2)l2 +
Í2
+ J (f 0(x(t),u(t), t) + elx(t) -x(t)l2) dt+J g0(t)d¡(t) ^ min, (15) ti [Í1,Í2]
dx(t) = f(x(t),u(t), t)dt + ef3(t)lx(t) — x(t)|2dt + G(t)d¡(t), tG [h, t2], (16) W(xi,x2) + evl(xi,x2) — (xi,x2)|2 = 0, ¡ G K. (17)
Доказательство. В силу 2-нормальности процесса (x,u,¡j¡) конус
convAd(x,u,1) является острым, поэтому его поляра (Ad(x,u, ¡))0 имеет непустую внутренность.
Возьмём произвольное v G int (Ad(x,u, ¡))0. Рассмотрим конус Е = (Xo, е) : е = di(xl,x2,X)/dxl. Покажем, что конус convE острый. Предположим противное. Тогда по теореме Каратеодори 3X¿ = (0, уг) G Л d(x,U,¡) :
Ег f {&t2'Xi) = 0, откуда = 0, где X = причём Xo = 0, X = 0
в силу остроты конуса conуЛл. Поэтому в силу (7) и (8) di(xi,x2, X)/dx2 = 0, откуда в силу регулярности концевых ограничений X = 0. Полученное противоречие доказывает остроту конуса n Е.
Возьмём (Xo, е) G i nt (Е0). Пусть (¡3°,0) — решение задачи Коши
00 = (dd£(t),p), 0 = dxт 0o(0) = XO, 0(0) = — ^
Легко видеть, что ((f30(t), /(t)), (А0, —ф(t))) = С = const для любого решения задачи (7). Уменьшая по модулю (А0, е), добьёмся того, чтобы |/°(t)| < 1. Тогда А0 — {ip(t),p(t)} > 0 Vt для любого решения задачи (7). Кроме того, из полноты ранга матриц df (X(t)^(t), ty/дй и из существования функции £ такой, что £(t)G(t) = 0 и £(t)^(X(t),u(t), t) = 0 для п.в. t G [t 1, t2] вытекает, что для решений системы (9) если 5х = 0, то 5й = 0. Поэтому в силу (11) для возмущённой задачи (13)—(15) выполнены достаточные условия строгого конечномерного минимума [1, теорема 7.2]. Теорема доказана. □
Литература
1. Арутюнов А. В. Условия экстремума. Анормальные и вырожденные задачи. — М.: Факториал, 1997.
2. Arutyunov A, Jacimovic V., Pereira F. Second Order Necessary Conditions for Optimal Impulsive Control Problems // J. on Dynamical and Control Systems. — 2003. — Vol. 9, No 1. — Pp. 131-153.
3. Pavlova N. 2-regularity and 2-normality Conditions for Systems with Impulsive Controls // Yugoslav Journal of Operations Research. — 2007. — Vol. 17, No 2. — Pp. 149-164.
UDC 517.977
Necessary Conditions of Optimality for 2-normality Systems
N. G. Pavlova
Nonlinear Analysis and Optimization Department Peoples Friendship University of Russia 6, Miklukho-Maklaya str., Moscow, 117198, Russia
In this paper controlled system with impulsive controls in the neighborhood of abnormal point is investigated. The concept of 2-normality which plays a greater role in the course of derivation of the first and second order necessary conditions for optimal control problem is introduced in this article. Sufficient conditions of 2-normality are obtained in this article. Besides that proximity of necessary and sufficient conditions of optimality for 2-normality systems is investigated.