УДК 517.977.52
DOI: 10.20310/1810-0198-2016-21-1-28-39
НЕПРЕРЫВНОСТЬ МЕРЫ-МНОЖИТЕЛЯ ЛАГРАНЖА ИЗ ПРИНЦИПА
МАКСИМУМА ДЛЯ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ ТИПА РАВЕНСТВ И НЕРАВЕНСТВ В УСЛОВИЯХ СЛАБОЙ РЕГУЛЯРНОСТИ ЭКСТРЕМАЛЬНОГО ПРОЦЕССА
© А. В. Горбачева
В условиях слабой регулярности исследуется свойство непрерывности меры-множителя Лагранжа из принципа максимума Понтрягина для задач управления с фазовыми ограничениями типа равенств и неравенств. Доказаны соответствующие утверждения. Ключевые слова: оптимальное управление; принцип максимума; фазовые ограничения.
1. Постановка задачи и основные определения
Настоящая работа является дальнейшим развитием результатов, полученных в [1]. Приведем необходимые формулировки и определения из [1]. Рассмотрим следующую задачу оптимального управления:
Ф(р, u(-)) := e0(p) + фо(х, u, t)dt — min, x = p(x,u,t), t £ [ti,t2], ti <t2, gi(x,t) = 0, g2(x,t) < 0, r(x, u, t) < 0, ei(p) = 0, e2(p) < 0, p = (xi,x2,ti,t2).
Будем считать, что вектор-функции r, ei, gi принимают значения в евклидовых пространствах размерности d(r) , d(ei) , d(gi) соответственно, функции eo, ф0, ф являются скалярными, x = dx , t £ [ti,t2] - время (концы времени ti и t2 не предполагаются фиксированными), x есть фазовая переменная из n-мерного евклидового пространства Rn , и u £ Rm - переменная управления. Вектор p £ Rn х Rn х Ri x Ri называется концевым. Управляющая функция, или просто управление, есть измеримая существенно ограниченная функция u(-) , т. е. элемент пространства L^([ti,t2]) .
Предположим, что функции e0 , ei, ф0 , ф непрерывно дифференцируемы, функции gi дважды непрерывно дифференцируемы, а функции ф,ф0,r дважды непрерывно дифференцируемы по u для всех x, t .
Определение1. Пусть u(t) , t £ [ti,t2] - управление, а x(t) , t £ [ti,t2] - соответствующая этому управлению траектория, то есть x = ф(x(t),u(t),t) , и p - соответствующий концевой вектор. Допустимым процессом будем называть тройку (p, x, u) , если она удовлетворяет
. концевым ограничениям: ei('p) = 0 , e2(p) < 0 ,
. смешанным ограничениям: r(x(t),u(t),t) < 0 для п.в. t £ [ti,t2] , и
. фазовым ограничениям gi(x(t),t) = 0 , g2(x(t),t) < 0 Vt £ [ti,t2] .
Определение 2. Будем говорить, что допустимый процесс оптимален, если значение функционала Ф является наименьшим на множестве всех допустимых процессов.
Определение 3. Концевые ограничения называются регулярными в точке р = (х1,х2,г1,г2) : е1(р)=0 , е2(р) < 0 , если
rank (p) = d(ei), 3 d € Ker (p) : (^(p),d\ > 0 V j : ei(p) dp dp \ dp /
(Верхние индексы означают координаты вектора или вектор-функции). Определение 4. Смешанные ограничения называются регулярными, если для любых (х, и, ¿) : г(х, и,г) < 0 существует вектор д = д(х, и, ¿) такой, что
/ drj \
(— (x,u,t),qj > 0 Vj : rj(x,u,t) = 0. (2)
Определение5. Фазовые ограничения называются регулярными, если для любых (x,t) : g\(x,t) = 0 , g2(x,t) < 0 , имеет место
rank dx (x,t) = d(g{), 3 z = z(x,t) € Ker dx (x,t) :
(dx(x,t),z) > 0 Vj : g2(x,t)=0.
Определение 6. Фазовые ограничения называются согласованными с концевыми ограничениями в точке p* , если существует число е > 0 такое, что
{p € М2га+2 : \p* - p\< е, ei(p) = 0, e2(p) < 0} С
{p : gi(x1,t1) = 0, g2(x\,ti) < 0, gi(x2,t2) = 0, g2(x2,t2) < 0.}
Определение 7. Будем говорить, что в концевых точках выполнены условия управляемости относительно фазовых ограничений, если для s = 1, 2 ,
3 ф3 € conv p(x*, U(x*,t*),t*):
(-1У
dxK dt
'dx (x * ,t* ),<Ps^j+d4 (x *, t *)
> 0, V j € J (x * ,t *).
Пусть (р*,х*,и*) допустимый процесс в задаче (1). Здесь р* = (х*,х2,г*,Ь2) . Введем необходимые обозначения:
3(х, ¿) = ^ : д2(х, ¿) = 0}, I(х, и, ¿) = {г : тг(х, и, ¿) = 0},
Гг(х, и, ¿) = дх(х, ¿)ф(х, и, ¿) + (х, ¿), г = 1, 2, и(х, ¿) = {и е Мт : г(х, и, ¿) < 0, Г1(х, и, ¿) = 0},
Т = [¿1 ,¿2], Г = (Г1,Г2), д = (д1,д2).
Пусть : М ^ Мт заданная измеримая ограниченная функция.
Определение 8. Замыканием справа по мере функции в точке т называется множество (т) таких векторов и е Мт что
¿({г е [т,т + е]: ((¿) е Б£(и} > 0 Vе > 0.
Здесь, Б£(и) = {V € Мт: V — и\< е} , и I - мера Лебега на М . Соответственно, замыкание слева - это множество (т) таких векторов и € Мт что
0.
{t £ [т - е, т] : £(t) £ B£(u} > 0 Vе > 0.
Многозначное отображение ,(1):=," (Ь) и ,+ (Ь) , где Ь € М , называется замыканием ((Ь) по мере Лебега.
Некоторые свойства замыкания по мере приведены в [1]. Ниже будем обозначать через и(Ь) замыкание по мере функции и*(Ь) . Будем также считать, что и"(Ь*) = и+(Ь*) , и+(Ц) =
= и ~(11).
Следующее определение является ослаблением условий регулярности из [1] (см. там Определение 9).
Определение 9. Допустимый процесс (р*,х*,и*) называется слабо регулярным,
дГ д ъ
если для любых Ь € Т , и и €и (Ь) , векторы -дцт (х* (Ь),и,Ь) , 3 = 1, ...,й(д\) , ди (х* (Ь),и,Ь) ,
г € I(х*(Ь),и,Ь) линейно независимы, и существует вектор й = й(и,Ь) € Мт такой, что й € Кег д£(х*(г),и,г) У г € I(х*(г),и,г), й € Кег дт(х*(г),и,г),
ди (х*(£),и,г),й^ > о Уз € з(х*(г),г): т{(х*(г),и,г) = о. (3)
В общем случае, когда множество и(Ь) трудно вычислимо, достаточно проверить условие (3) для всех и € и(х*(Ь),Ь) . Кроме того, имеет место следующее простое утверждение.
З а м е ч а н и е 1. Любой допустимый процесс задачи (1) является слабо регу-
дГ-
лярным, если для любых х,Ь и любого и € и(х,Ь) , векторы -дц1 (х,и,Ь) , 3 = 1,..,й(д\) , ди(х,и,Ь) , г € 1(х,и,Ь) линейно независимы, и существует вектор й = й(х,и,Ь) € Мт такой, что й € Кег ди (х,и,Ь) У г € I(х,и,Ь) , й € Кег дт (х,и,Ь) , и
(ff (x'u,t),d)
dj> 0 V j £ J(x, t) : T32(x, u, t) = 0.
Наряду с определением регулярного процесса ниже нам также понадобится понятие регулярной точки множества U(x, t) . В отличие от регулярности процесса это понятие никак не связано с фазовыми ограничениями типа неравенств.
Определение 10. Назовем точку u £ U (x, t) регулярной, если rank ^ (x, u, t) = d(g\) , и существует вектор q £ Ker dl(x,u,t) такой, что
/ дгг \
(х>и,Ь),д) > 0 У г € I(х,и,Ь).
Подмножество всех регулярных точек множества и (х,Ь) обозначим через ии(х,Ь) .Положим 0,(х,Ь) := сШи(х,Ь) (с\ обозначает замыкание). Отметим, что если процесс регулярен, то и(Ь) С ия(х*(Ь),Ь) У Ь € Т, и значит все близкие точки из некоторой его окрестности регулярны. В частности смешанные ограничения будут регулярными в некоторой окрестности регулярного процесса. Отсюда, поскольку и(Ь) = 0 У Ь € Т , также следует, что 0,(х*(Ь),Ь) = 0 У Ь € Т. Будем неявно (т.е. не ссылаясь на них каждый раз) использовать эти факты ниже.
Рассмотрим расширенную функцию Гамильтона-Понтрягина
Й(х, и, ф, ц, \°,Ь) = (ф, ф(х, и, Ь)) — , Г(х, и,Ь)) — \°фо(х, и, Ь),
где ц = (ц1,ц2) , и малый Лагранжиан
l(p, A) = A°e°(p) + (\\ei(p)) + (A2, e2(p)), \ = (A°, A1, \2).
Определение 11. Будем говорить, что допустимый процесс (p *,x *,u *) в задаче (1) удовлетворяет принципу максимума Понтрягина, если существует вектор A = (A°, A1, A2): A° € € R, A1 € Rd(ei), A2 € Rd(e2) , A° > 0 , A2 > 0 , (A2 ,e2(p* )) = 0, абсолютно непрерывная функция ф: T ^Rra , функция ц = (ц1,ц2): T ^ Rd(g) и измеримая ограниченная функция v : T ^ Rd(r) такие, что
да *
либо A° + \ц2(^1)\ > 0, либо ф(г)€ im -д!(t) vt € T, (4)
dH dr
ф = - Ж (t)+ v(t) fa (t) п.в. ^ (5)
Ф(К ) = (-l)s+1 (p*,A)+ Ц2(К) (t*), s = 1, 2, (6)
max H(u,t) = H(t) п.в. t, (7)
uen(t)
dH dr
h = — (t) - v(t) — (t) п.в. t, (8)
h(t*) = (-l)sIS(p*,A) - Ц2(t*) 9-§-(t*), s = 1, 2, (9)
H) = vV "и(t) - t, (10)
{v(t),r(t)) =0, v(t) > 0 п.в. t, (11)
где h(t) := maxueQ(t) H(u, t) .
Более того, функция h(t) абсолютно непрерывна на T, а вектор-функция ц = (ц1,ц2) удовлетворяет следующим свойствам:
а) каждая из функций Ц постоянна на каждом отрезке времени [a, b] , на котором траектория x* (t) целиком лежит во внутренности фазового множества, задаваемого j -ым фазовым ограничением-неравенством, т. е. когда g2(t) < 0 V t€ [a, b] ;
б) вектор-функция ц2 непрерывна слева на интервале (t1,t2) ,и ц2(Ь2) = 0;
в) каждая из функций ц22 (нестрого) монотонно убывает;
г) вектор-функция ц1 измерима и ограничена на T .
Процесс (р*,х*,и*) , удовлетворяющий принципу максимума, называется экстремалью, а набор (Х,ф,^,и) - множителями Лагранжа, отвечающими процессу (р*,х*,и*) в силу принципа максимума.
В работе приняты следующие соглашения относительно обозначений. Во-первых, если у отображений Н,д,г,ф, О , и т. п. или их производных какие-нибудь из аргументов опущены, то вместо них подставлены значения х*(Ь),и*(Ь) или множители Лагранжа ф(Ь),^(Ь),Х . Во-вторых, все множители Лагранжа или элементы сопряженных пространств рассматриваются как вектор-строки, в то время как вектор-функции или векторы, такие как ф, х, и рассматриваются как вектор-столбцы. Градиенты функций считаются элементами сопряженных пространств. Элементы матрицы Якоби Е(х): Rra ^ Rfc имеют вид ^Хт (х) , и ее строками являются градиенты координатных функций Ег.
2. Гельдеровость ^(Ь) .
В этом разделе ослабим условия регулярности, приведенные в [1], таким образом, чтобы по-прежнему выполнялось условие гельдеровости ц,2 . Ослабление условий регулярности (и тем самым усиление Теоремы 2 из [1]) предполагает, что фазовое ограничение д2 скалярно.
В случае векторной функции д2 ниже потребуются дополнительные предположения.
Предположение (А) Существует целое число 0 и точки Ьг € (Ь*,Ь2) , г = 1,...,М такие, что <Ь2 <...<ЬN , отображение 3 (Ь) постоянно для каждого интервала (Ь*,Ь\) , (Ьг,Ьг+1) , г = 1,...,Ы — 1 и (Ьм ,Ь*) .Точка Ьг или Ь*,Ь* называется точкой стыка (или точкой контакта), если отображение 3(Ь) не является постоянным в любой из ее окрестностей.
Пусть
д+(Ь) := {и € и(Ь) : Ц(и, Ь) > 0У з € 3(Ь)}, д"(Ь): = {и € и(Ь): Г32(и, Ь) < 0У з € 3(Ь)}.
Далее будем считать, что априори справедливы следующие условия:
и+(г) пд-(ь) = 0, и~(г) пд+(ь) = 0 уь € т. (12)
Следующее утверждение предлагает два важных класса задач.
П р е д л о ж е н и е 1. Пусть выполняется хотя бы одно из следующих двух условий.
a) \3(Ь)\< 1 У Ь ;
b) управление и*(Ь) кусочно-непрерывно, и выполняется Предположение (А).
Тогда справедливо (12).
Доказательство очевидно. Оно следует из допустимости траектории х* (Ь) . □
Предложение 2. Предположим, что выполнены условия (12), и процесс (р*,х*,и*) слабо регулярен.
Тогда х*(Ь) управляема в концах.
Доказательство очевидно и следует непосредственно из определений.
Если выполнены условия слабой регулярности для экстремального процесса, то имеет место следующий результат.
Т е о р е м а 1. Предположим, что допустимый процесс (р* ,х* ,и*) экстремален. Пусть концевые ограничения регулярны в точке р* , фазовые ограничения согласованы с концевыми ограничениями в точке р* , процесс (р*,х*,и*) слабо регулярен, выполнено условие (12), и имеет место хотя бы одно из следующих условий:
1) выполняется Предположение (А);
2) \3(Ь)\< 1 У Ь .
Тогда, для любых множителей Лагранжа А,ф,ц,^ , отвечающих (р*,х*,и*) в силу принципа максимума, выполняется:
1) условие нетривиальности
либо А0 > 0, либо ф(Ь) — (ъ(г)дх(Ь) € ™ д1 (Ь) У Ь € Т; (13)
д х д х
п) в каждой точке Ь* € (Ь*,Ь2) функция ¡л2(Ь) непрерывна и более того имеет корневой рост справа и слева; если оптимальная траектория выходит негладко на границу з -ого фазового ограничения в точке Ь* , 3 € 3(Ь*) , тогда рост линеен справа; в случае негладкого схода с границы 3 -ого фазового ограничения, рост линеен слева;
iii) существует вектор Am — (Л , Am, Am) и функция фт (t) такие что, набор mj ßlj Ц-2} v , где
' ß2(t) -ß2(t*2-), te (t*vt*2), P2(t)— { ß2(t\+) - ß2(tt), t — t\, 0, t —1*2.
удовлетворяет принципу максимума и условию (12); и
iv) при дополнительном предположении, что d(g2) — 1, функция ß2(t) является гельдеро-вой с показателем а — ^ , то есть
\р2(t) - ß2(s)\< const л/\t - s\ V t,seT. (14)
Теорема 1 является развитием результатов из [5] на случай, когда также присутствуют фазовые ограничения типа равенств. Заметим, что благодаря Теореме 1 и Замечанию 1 можно априори (т. е. не вычисляя оптимальный процесс) гарантировать непрерывность ß2(t) . Приведем несколько примеров.
П р и м е р 1. Пусть n — m, r1,r2 - заданные положительные числа, ф : М2га — М1 , в : Мга — Мга - заданные гладкие функции. Рассмотрим задачу:
f Î1
/ ф(x,u)dt — min,
Jo
X — в(х) + u, \u\2 < r1, \x\2 < r2,
Предположим, что
^x(0) — XA, x(1) — xB.
\(e(x),x)\ < л/тг^ Vx : \x\2 — Г2. (15)
Тогда любой допустимый процесс Примера 1 слабо регулярен.
Покажем, что в примере выполнены все предположения, сформулированные в Замечании 1. Тогда в его силу любой допустимый процесс будет слабо регулярным. Действительно, имеем:
д2(х) = \х\2 — г2, г (и) = \и\2 — п, Г2(х,и) =(2х,0(х) + и).
Покажем, что векторы и линейно независимы на множестве
(х,и) : г(и) = 0, Г2(х,и) = 0, д2(х) = 0.
Действительно, имеем, что
дг дГ2
— (и) = 2и,—— (х,и) = 2х. и и
Поскольку Г2(х,и)=0, то (х,и) = —(0(х),х) . Из (15) имеем, что \(х,и) \ < г \ г2 . Но \х\ = , \и\ = , и поэтому последнее неравенство влечет линейную независимость векто-
р°в ш(и) и (х,и).
Легко видеть, что выполнены все предположения, сформулированные в Замечании 1. Поэтому любой допустимый процесс является слабо регулярным.
Таким образом, в силу Теоремы 1, для любого оптимального процесса найдется гельдерова функция-множитель Лагранжа ^(Ь) .
П р и м е р 2. Пусть n = m , Т\ - заданное положительное число, w - заданный единичный вектор, ф : М2га — R1 , в : Мга — Мга - заданные гладкие функции. Рассмотрим задачу:
( г1
/ ф(х,и)йЬ — min, J о
< Х = в(х) + и, \и\2 < т1, (w, х) < 0, ,х(0) = ХА, х(1)= Хв.
Предположим, что
\(в(х),w)\ < у/Т1 Vх : (w,х) =0. (16)
Тогда любой допустимый процесс Примера 2 слабо регулярен.
Доказательство. Покажем, что в примере выполнены все предположения, сформулированные в Замечании 1. Тогда в его силу любой допустимый процесс будет слабо регулярен. Действительно, имеем:
д2(х) = (w,х), т(и) = \и\2 — т1, Г2(х,и) =(w,e^)+ и).
Покажем, что векторы du (и) и Щи (х,и) линейно независимы на множестве
(х,и) : т(и) = 0, Г2(х,и) = 0, д2(х) = 0.
Действительно, du,(и)=2и , ^ы (х,и) = w . Поскольку Г2(х,и) = 0 , то (w,u) = — (в(х),w) . Из (16) имеем, что \{w,u)\ < уЛ , a поскольку \w\ = 1 и \и\ = уЛ , то векторы §u, и не коллинеарны.
Легко видеть, что выполнены все предположения, сформулированные в Замечании 1. Поэтому любой допустимый процесс является слабо регулярным.
Таким образом, в силу Теоремы 1, для любого оптимального процесса найдется гельдерова функция-множитель Лагранжа ß2(t) .
ПримерЗ. Пусть n = m , k <m , a - заданное положительное число, w - заданный единичный вектор, ф: М2га — R1 , в: Мга — Мга - заданные гладкие функции. Рассмотрим задачу:
( Г1
/ ф(х,и)йЬ — min, J о
х = в(х) + и, * \uj\ < a, j = 1,..., k, w, х < 0, х(0) = ха, х(1) = хв.
Предположим, что
3 j* >k : wj* =0. (17)
Тогда любой допустимый процесс Примера 3 слабо регулярен.
Доказательство. Покажем, что в примере выполнены все предположения, сформулированные в Замечании 1. Тогда в его силу любой допустимый процесс будет слабо регулярным. Действительно, имеем:
д2(х) = (w, х), rj(и) = uj — a, j = 1,..., k,
rj(и) = —uj-k — a, j = k + 1,..., 2k,
Г2(х,и) =( -ш,0(х) + и).
Легко видеть, что векторы 'ди(и) , у € I(и) , и д2 (х, и) линейно независимы на множестве
(х,и) : Г2(х,и) = 0, д2(х) = 0.
Действительно, -ди (и) есть соответствующий единичный вектор (взятый с плюсом или минусом), у которого все координаты с номером выше, чем к , равны нулю, а д2(х, и)= 'ш . Поэтому условие (17) сразу влечет, что векторы не коллинеарны. Значит, выполнены все предположения Замечания 1. Поэтому любой допустимый процесс является слабо регулярным.
Примеры 1-3 несложно обобщить, рассматривая их на некоторой регулярной поверхности уровня, т. е. добавляя фазовые ограничения типа равенств.
Рассмотрим ряд вспомогательных утверждений. Следующее утверждение является простым следствием Предложения 5 из [1], условия (12) и определений § + , .
Следствие! Существуют числа С,5> 0 такие, что для произвольного и * €Ы (Ь *), у € 1 (Ь *) и АЬ> 0 справедливы следующие оценки.
Если и* €Ы-(Ь*) пд+(Ь*) и Г2(и*,Ь*) > 0 , то
* + АЬ) — ц32(Ь-)\ < Если и * €Ы+(Ь *) П§-(Ь *) и Г2> (и *,Ь *) < 0 , то
\л2(Ь* — АЬ) — ¿2(1+)\ <
С ■ АЬ
Г2(и *,Ь*)
—С ■ АЬ
Г2(и *,Ь*)
Обозначим через е(Ь*) наибольшее положительное число е > 0 такое, что ,1 (Ь) С ,1 (Ь*) V Ь € (Ь* — е,Ь* + е) , значение включая. (Будем считать, что х* (Ь) = х2 V Ь>Ь2 и х* (Ь) = = х\ V Ь<Ь\). Многозначное отображение 1 (Ь) полунепрерывно сверху, поэтому число е> 0 существует (оно зависит от Ь*).
П р е д л о ж е н и е 3. Пусть экстремальный процесс слабо регулярен и выполнено условие (12). Тогда существуют числа С,5> 0 такие, что для произвольных Ь* € (¿1 ,Ь2) и АЬ € (0, шт{5, е(Ь*)}) выполняются следующие оценки. Оценка корневого роста справа:
\ц.2(Ь* +АЬ) — Ц2(Ь-)\ < С -у/АЬ.
Оценка корневого роста слева:
* — АЬ) — ц2(Ь+)\ < С -у/АЬ.
Доказательство дается дословным повторением доказательства Предположения 5 из [1], но при слабой регулярности. Добавляя (12) к оценкам Предложения 5 из [1], ввиду слабой регулярности, получаем необходимую равномерность оценок.
П редложение4. Пусть Ь * € (Ь1, Ь2) , у € ,1 (Ь *) . Предположим, что
и(Ь*) П {и :Т32(и,Ь*) = 0} = 0, (18)
Тогда, ^2(Ь) является постоянной в окрестности точки Ь* , то есть 3 5 = 5(Ь*) > 0: ^2{Ь) = = ц{(Ь*) VЬ € [Ь* — 5,Ь* + 5].
Доказательство. В силу (12) существуют векторы и+ €и+(Ь *) П§-(Ь *) и и- €и-(Ь*) П§+(Ь*) . Тогда из (18) следует, что Г32(и+,Ь*) < 0 и Г32(и-,Ь*) > 0 . Далее из Следствия 1 получаем, что функция ¡2 имеет линейный рост в точке Ь* .
Покажем, что существует число 5 > 0 такое, что
1(Т п [г, — 5,и + 5]) =0.
Здесь Т = {г € Т: 3 € 3(г)} . Действительно, в противном случае
£(Т п [г, — 5,и + 5]) > 0 V5 > 0. (19)
Функция д2(г) , будучи абсолютно непрерывной, достигает своего максимального значения в каждой точке г € Ту . Таким образом, для почти всех г € Ту производная этой функции равна
нулю. Следовательно, (г) = Г2(г) для почти всех г . Таким образом, Т32(г) = 0 для почти всех г € Т . Теперь, (19) противоречит (18) ввиду определения замыкания по мере. Следовательно, необходимое число 5 существует.
При уменьшении, если это необходимо, числа 5, можно гарантировать, что условие (18) выполняется для всех г € [г, — 5, г, + 5] , а не только в одной точке г, . Это возможно в силу полунепрерывности сверху отображения и (г) и непрерывности Г2 . Тогда, используя рассуждения, приведенные выше, получаем, что ¡2 имеет линейный рост в каждой точке [г, — 5, г, + 5] . Более того, ввиду оценки из Следствия 1, этот рост равномерен. Тогда ¡л2(г) липшицева на этом интервале. Однако, носитель ¡2 лежит во множестве Ту , которое имеет нулевую меру. Это доказывает, что ¡2 является постоянной. □
Предложение 5. Пусть г, € [¿1, £2.) , 3 € 3 (г,) . Предположим, что
и+(г,) п {и: т32(п, г,) = 0} = 0. (20)
Тогда функция ¡2(г) является постоянной справа в окрестности г, , то есть 3 5 = 5(г,) > 0:
¡2(г) = ¡2(в) Vг, в € (г,, г, + 5).
Если г, € (г,,г*2] и и-(г,) п{и :Т{(и,г,) = 0} = 0 , тогда 3 5 = 5(г,) > 0: ¡2(г) = ¡4(в) Vг, в € (г, — 5, г,).
Доказательство. Докажем, что ¡2(г) является постоянной справа. Используя условие (20) и тот факт, что и +(г,) = Ыш8ир и (г) , выберем число 5 такое, что
и (г) п{и: т32(и,г) = 0} = 0 V г € (г,,г, + 5).
Тогда из Предложения 4 следует, что ¡2 является постоянной в окрестности каждой точки г € Ту П (г,, г, + 5) . Из условия (а) ПМ не трудно получить, что ¡2 является постоянной на (г,,г, + 5).
Доказательство
слева от точки г* аналогично. □
Доказательство Теоремы 1. Из Предложения 3 и Леммы 2 из [1] сразу следует п). Таким образом, ¡2 непрерывна на (г,, г,) . Будем использовать это ниже.
Далее, покажем, что в предположениях слабой регулярности выполнено условие нетривиальности (12). Предположим, что (12) нарушается. Тогда,
А0 = 0 и 3 го € Т : ф(го) —
— ¡2(г0)дх(г0) = а 1§х (г0) , где а есть некоторый вектор из М-(й1) . В силу Замечания 3.1 из [3], получаем, что множители Лагранжа
~ дд
А, 1~(г) := ф(г) — (а, ¡2^0))дх(г), ~~(г) := ¡(г) — ^,¡2^0)), V
удовлетворяют всем условиям ПМ кроме условия б).
Вначале предположим, что t0 € (t\,t2) . Рассмотрим произвольную точку t* € (t\,t2) такую, что ¡¡2 (t*) =0. Установим существование положительных чисел 5 и const, где const не зависит от t* , таких, что
\12(t)\ < const \ip(t)\ для почти всех t € [t* — 5,t* + 5]. (21)
Пусть выполняется предположение 1) теоремы. Тогда отображение J(t) является постоянным справа и слева от точки t* . Поэтому, существует число 5 такое, что J(t) = J(s) = = Q V t,s € (t *,t * + 5) .Тогда, i32(t) = 0 V t € [t *,t * + 5] V j € J (t *) \ Q . (Здесь мы пользуемся непрерывностью j\ и условием а) ПМ.) Для j € Q имеем g32(t)=0 Vt € [t *,t* + 5] . Поэтому, существует вектор и* €U +(t*) : Г32(и*,t*) = 0 V j € Q .
Выберем вектор d, соответствующий и*,t* из определения слабой регулярности оптимального процесса, и умножим равенство (10) на вектор —d. Тогда учитывая монотонность jh2 и тот факт, что ¡12(t) < 0 , где t > t* , уменьшая при необходимости 5 , получаем оценку (21) справа от t* . (См. подробнее в [5], Теорема 4.5). Выполняя те же самые рассуждения слева от точки t* , но умножая (10) на вектор d, а не на —d, получаем оценку (21) слева от точки t* . Константа const не зависит от t* в силу стандартных соображений компактности и слабой регулярности.
Пусть выполняется предположение 2) теоремы. В этом случае, если существует вектор и * €U+(t *) : Г2(и *,t *) =0 , j € J (t *) , проведем все те же самые рассуждения, что и для случая 1). Если такого вектора не существует, тогда в силу непрерывности j2 и Предложения 5 получаем, что ¡12(t) = 0 V t € [t *, t* + 5] для некоторых 5> 0 . Значит имеем оценку (21) справа от t . Проводя рассуждения слева от точки t , получаем (21) слева.
Таким образом, (21) доказано. Из слабой регулярности процесса и (21) несложно вытекает оценка
\1i(t)\ + \v(t)\ < const \ip(t)\ для почти всех t € [t * — 5,t* + 5]. (22)
Теперь докажем, что
tp(t)=0, i2(t) = 0 Vt € (tl,t*2). (23)
Заметим, что обе функции непрерывны на рассматриваемом интервале. Далее, принимая во внимание, что множество нулей вектор-функции (ф, ¡2) не пусто (точка to принадлежит множеству нулей), для доказательства (23) достаточно установить что, если ф(Ь*) =0 и j2(t*) = 0 , то найдется число 5 > 0 такое, что ф(Ь) = 0 , 12(t) = 0 Vt € [t * — 5, t* + 5] . Однако последнее является следствием неравенства Гронуолла, (5) и неравенств (21) и (22). Ясно, что (22) и (23) влечет h = 0 , v = 0 .
Из условий трансверсальности (6), (9), и определения H, получаем:
w.v-ws*>) =|(p*^ s = ^2 (24)
Из (23), в силу условий трансверсальности (6), получаем
(—!)'dk(Р*,Х)= I2(t*)Ц(t*). s = 1. 2.
Аналогично, в силу (9) и непрерывности h,
(—'■^Ws (Р*-Х)= ¡2(t*)д2(t*), s = 1, 2.
В итоге, 12(t\) > 0 и j2(t2) < 0 в силу условия в) ПМ и того факта, что j2(t) = 0 Vt € (t\,t2) . Поэтому, подставляя полученные формулы в (24), используя условия управляемости в p* (которые выполняются благодаря Предложению 2), получаем j2(t*l) = j2(t2) = 0 . Следовательно,
j2 = 0 и тогда j2(t) = j2(t0) Vt £ T ^ /12 = 0 в силу условия б). Поэтому ф(t0) £ im -gr(t0) . А это противоречит (4) и Теореме 1 из [1]. Значит, (12) доказано.
Случай, когда t0 = t* или t0 = t* рассматривается аналогично, но в определении jj2 из /12 вычитаем j2(t\+) или j2(t*-) соответственно, но не j2(t0) . Утверждение i) доказано.
Утверждение iii) доказывается полностью аналогично утверждению iii) Теоремы 2 из [1].
Далее покажем, что ji2 удовлетворяет (13). Предположим, что выполняется 1). Рассматривая интервалы, где J(t) является постоянной, применяя Лемму 3 из [1], рассматривая конечное покрытие для каждого интервала (оно существует благодаря равномерной оценке на At) и осуществляя те же самые выкладки, что и при доказательстве пункта iv) Теоремы 2 из [1], выводим оценку (13).
Предположим, что выполняется 2). В силу условия J(t) < 1 V t £ T и полунепрерывности сверху J (t) существует число £0 > 0 такое, что \t — s\ > £0 , как только \J (t)| = \J (s)\ = 1 и J(t) = J(s) . Следовательно, если J(t*) = 0 , тогда e(t*) > £0 . Теперь проведем выкладки аналогичные выкладкам доказательства пункта iv) Теоремы 2 из [1]. (Разница лишь в том, что вместо 5 нужно взять min{5, £0} ). Условие (13) получено.
Теорема доказана. □
СПИСОК ЛИТЕРАТУРЫ
1. Горбачева А.В., Карамзин Д.Ю. Уточнение условий оптимальности в задачах управления с фазовыми ограничениями типа равенств и неравенств // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2016. Т. 21. Вып. 1. С. 40-54.
2. Arutyunov A.V., Karamzin D.Yu. On some continuity properties of the measure Lagrange multiplier from the maximum principle for state constrained problems // SIAM J. Control Optim. V. 53. № 4. P. 2514-2540.
3. Arutyunov A.V., Karamzin D.Yu., Pereira F.L. The Maximum Principle for Optimal Control Problems with State Constraints by R.V. Gamkrelidze: Revisited // J. Optim. Theory Appl, 2011. V. 149. P. 474-493.
4. Arutyunov A.V., Karamzin D.Yu. Non-degenerate necessary optimality conditions for the optimal control problem with equality-type state constraints // J. Glob. Optim., 2015. P. 1-25.
5. Захаров Е.В., Карамзин Д.Ю. К исследованию условий непрерывности меры-множителя Лагранжа в задачах с фазовыми ограничениями // Дифференциальные уравнения, 2015. Т. 51. № 3. С. 395-401.
БЛАГОДАРНОСТИ: Работа выполнена при финансовой поддержке гранта Президента РФ № МД-4639.2016.1.
Поступила в редакцию 9 февраля 2016 г.
Горбачева Анна Викторовна, Российский государственный социальный университет, г. Москва, Российская Федерация, преподаватель кафедры прикладной математики, e-mail: [email protected]
2016. T. 21, Bbm. 1. MaTeMaTHKa
UDC 517.977.52
DOI: 10.20310/1810-0198-2016-21-1-28-39
THE CONTINUITY OF THE MEASURE LAGRANGE-MULTIPLIER FROM THE MAXIMUM PRINCIPLE FOR AN OPTIMAL CONTROL PROBLEM WITH EQUALITY AND INEQUALITY STATE CONSTRAINTS UNDER WEAK REGULARITY CONDITIONS OF THE EXTREMAL PROCESS
© A. V. Gorbacheva
Under weak regularity assumptions, the continuity of the measure Lagrange multiplier from the maximum principle for control problems with state constraints of equality and inequality types is investigated. Appropriate assertions are proved. Key words: optimal control; maximum principle; state constraints.
ACKNOWLEDGEMENTS: The present work is partially supported by the grant of the President of the Russian Federation № M^-4639.2016.1.
REFERENCES
1. Gorbacheva A.V., Karamzin D.Yu. Utochnenie uslovij optimal'nosti v zadachah upravleniya s fazovymi ogranicheniyami tipa ravenstv i neravenstv // Vestnik Tambovskogo universiteta. Seriya Estestvennye i tekhnicheskie nauki. Tambov, 2016. T. 21. Vyp. 1. S. 40-54.
2. Arutyunov A.V., Karamzin D.Yu. On some continuity properties of the measure Lagrange multiplier from the maximum principle for state constrained problems // SIAM J. Control Optim. V. 53. № 4. P. 2514-2540.
3. Arutyunov A.V., Karamzin D.Yu., Pereira F.L. The Maximum Principle for Optimal Control Problems with State Constraints by R.V. Gamkrelidze: Revisited // J. Optim. Theory Appl, 2011. V. 149. P. 474-493.
4. Arutyunov A.V., Karamzin D.Yu. Non-degenerate necessary optimality conditions for the optimal control problem with equality-type state constraints // J. Glob. Optim., 2015. P. 1-25.
5. Zaharov E.V., Karamzin D.Yu. K issledovaniyu uslovij nepreryvnosti mery-mnozhitelya Lagranzha v zadachah s fazovymi ogranicheniyami // Differencial'nye uravneniya, 2015. T. 51. № 3. S. 395-401.
Received 9 February 2016.
Gorbacheva Anna Viktorovna, Russian State Social University, Moscow, the Russian Federation, Lecturer of the Applied Mathematics Department, e-mail: [email protected]