Научная статья на тему 'Липшицевость меры-множителя Лагранжа из принципа максимума для задачи оптимального управления с фазовыми ограничениями типа равенств и неравенств'

Липшицевость меры-множителя Лагранжа из принципа максимума для задачи оптимального управления с фазовыми ограничениями типа равенств и неравенств Текст научной статьи по специальности «Математика»

CC BY
98
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / ПРИНЦИП МАКСИМУМА / ФАЗОВЫЕ ОГРАНИЧЕНИЯ / УСЛОВИЕ ЛЕЖАНДРА / OPTIMAL CONTROL / MAXIMUM PRINCIPLE / STATE CONSTRAINTS / LEGENDRE CONDITION

Аннотация научной статьи по математике, автор научной работы — Горбачева Анна Викторовна, Карамзин Дмитрий Юрьевич

Изучаются свойства регулярных экстремалей в задачах оптимального управления с фазовыми ограничениями типа равенств и неравенств. Доказывается, что в условиях регулярности усиленное условие Лежандра влечет липшицевость меры-множителя Лагранжа из принципа максимума.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Горбачева Анна Викторовна, Карамзин Дмитрий Юрьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LIPSCHITZ CONTINUITY OF THE MEASURE LAGRANGE MULTIPLIER FROM THE MAXIMUM PRINCIPLE FOR OPTIMAL CONTROL PROBLEMS WITH STATE CONSTRAINTS OF EQUALITY AND INEQUALITY TYPE

Properties of regular extremals in optimal control problems with equality and inequality state constraints are studied. It is proved that, under the regularity conditions, the strengthened Legendre condition implies Lipschitz continuity of the measure Lagrange multiplier from the maximum principle.

Текст научной работы на тему «Липшицевость меры-множителя Лагранжа из принципа максимума для задачи оптимального управления с фазовыми ограничениями типа равенств и неравенств»

УДК 517.977.52

DOI: 10.20310/1810-0198-2017-22-3-508-516

ЛИПШИЦЕВОСТЬ МЕРЫ-МНОЖИТЕЛЯ ЛАГРАНЖА ИЗ ПРИНЦИПА

МАКСИМУМА ДЛЯ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ ТИПА РАВЕНСТВ И НЕРАВЕНСТВ

© А. В. Горбачева1) , Д. Ю. Карамзин2)

Российский университет дружбы народов, 117198, Российская Федерация, г. Москва, ул. Миклухо-Маклая, 6 E-mail: avgorbacheva@inbox.ru 2) Вычислительный центр им. А.А. Дородницына Федерального исследовательского центра «Информатика и управление» Российской академии наук, 119333, Российская Федерация, г. Москва, ул. Вавилова, 40 E-mail: dmitry_karamzin@mail.ru

Изучаются свойства регулярных экстремалей в задачах оптимального управления с фазовыми ограничениями типа равенств и неравенств. Доказывается, что в условиях регулярности усиленное условие Лежандра влечет липшицевость меры-множителя Лагранжа из принципа максимума.

Ключевые слова: оптимальное управление; принцип максимума; фазовые ограничения; условие Лежандра

1. Введение

В недавних работах авторов [1], [2] была установлена гельдеровость меры-множителя Лаг-ранжа Ц.2О , возникающей в принципе максимума Понтрягина для задачи оптимального управления с фазовыми ограничениями типа равенств и неравенств. Настоящая работа является продолжением исследования, предпринятого в этих двух работах, в том направлении, что вопрос о непрерывности меры подменяется более тонким вопросом об абсолютной непрерывности меры. Заметим, что монотонная гельдерова функция может и не быть абсолютно непрерывной. Например, для каждого а € (0,1) , легко построить Канторову лестницу, которая будет гельдеровой с показателем а. Поэтому возникает естественный вопрос: при каких дополнительных условиях по сравнению с [1], [2] можно гарантировать абсолютную непрерывность /Л2(Ь) ? Заметим, что абсолютная непрерывность меры играет важную роль в связи с приложениями (см. лит. цит. в [1]). В данной работе устанавливается, что одним из таких дополнительных условий может служить усиленное условие Лежандра. При этом усиленное условие Лежандра гарантирует даже липшицевость меры-множителя. Настоящая работа является развитием некоторых результатов работы [3] на случай более общей задачи управления, содержащей как фазовые ограничения типа неравенств, так и равенственные фазовые ограничения.

2. Постановка задачи и основные определения

Рассмотрим следующую задачу оптимального управления

Ф(р, u(-)) := e0(p) + ft u, t)dt ^ min, x = p(x,u,t), t e [ti,t2 ], ti <t2, gi(x,t) = 0, g2(x,t) < 0, r(x, u, t) < 0, ei(p) = 0, e2(p) < 0, J) = (xi,x2,ti,t2).

Будем считать, что вектор-функции r, ei, gi принимают значения в евклидовых пространствах размерности d(r) , d(ei) , d(gi) соответственно, функции e0 , ф0 являются скалярными, х = ^ , tE[ti,t2] - время (концы времени t\ и t2 не предполагаются фиксированными), x есть фазовая переменная из n-мерного евклидово го пространства Rn , и u e Rm -переменная управления. Вектор p e Rn х Rn х Ri х Ri называется концевым. Управляющая функция, или просто управление, есть измеримая существенно ограниченная функция u(-) , т. е. элемент пространства Lixi([ti,t2]) .

Предположим, что функции e0 , ei, ф0 , ф непрерывно дифференцируемы, функции gi дважды непрерывно дифференцируемы, а функции ф,ф0 ,r дважды непрерывно дифференцируемы по u для всех x, t .

Определение 1. Пусть u(t) , t e [ti,t2 ] - управление, а x(t) , t e [ti,t2] - соответствующая этому управлению траектория, т. е. x = ф^^)^,^)^) , и p - соответствующий концевой вектор. Допустимым процессом будем называть тройку (p, x, u) , если она удовлетворяет

. концевым ограничениям: ei(p) = 0 , e2(p) < 0 ,

. смешанным ограничениям: r(x(t),u(t),t) < 0 для п.в. t e [ti,t2] , и

. фазовым ограничениям gi(x(t),t) = 0 , g2(x(t),t) < 0 Vt e [ti,t2] .

Определение 2. Будем говорить, что допустимый процесс оптимален, если значение функционала Ф является наименьшим на множестве всех допустимых процессов.

Определение 3. Смешанные ограничения называются регулярными, если для любых (x, u, t) : r(x, u,t) < 0 существует вектор q = q(x, u, t) такой, что

drj \

— (x,u,t),qj >0 Vj :r>(x,u,t)=0. (2)

Введем необходимые обозначения:

J(x,t) = {j : g2(x,t) = 0}, I(x,u,t) = {i : ri(x,u,t) = 0},

Ti(x, u, t) = ^(x, t)ip(x, u, t) + ^¡-(x, t), г = 1,2, U(x, t) := {u e Rm : r(x, u, t) < 0, Г2(x, u, t) = 0}, Г = (ri, r2),g = (gi,g2).

Пусть £(t) :R ^ Rm - заданная измеримая ограниченная функция.

Определение 4. Замыканием справа по мере функции £ (t) в точке т называется множество 2+(т) таких векторов u e Rm что

^{t e [т,т + е]: £(t) e Bs(u} > 0 Vе> 0.

Здесь, Б£(и) = [у € Мт: \у — и\<е} , и £ - мера Лебега на М . Соответственно, замыкание слева - это множество Е,-(г) таких векторов и € Мт, что

¿({t £ [т - е, т] : ((t) £ Be(u} > 0 Vе> 0.

Многозначное отображение 'Е(1):='Е-(1) и ^+(1) , где 1 € М , называется замыканием ((1) по мере Лебега1.

Введем понятие регулярной точки множества и(х,1) .

Определение 5. Назовем точку и € и (х,1) регулярной, если существует вектор д £ кег (х, и, ¿) такой, что

' дГ

' ' ' £

/ orJ \

{ — (x,,u,t),qj >0 Уj £ I(x,u,t).

Подмножество всех регулярных точек множества и (х,1) обозначим через и и (х,1) . Положим 0,(х,1) :=с\ии(х,1) (с\ обозначает замыкание).

Рассмотрим расширенную функцию Гамильтона-Понтрягина

Н(х, и, ф, ц, Л0,1) = (ф, р(х, и, 1)) — (ц, Г(х, и,1)) — Л°^0(х, и, 1),

где ц = (ц1,ц2) , и малый Лагранжиан

1(р, Л) = Л°в0(р) + {Л1,в1(р)) + {Л2, в2(р)), Л = (Л0, Л1, Л2).

Определение 6. Будем говорить, что допустимый процесс (р*,х*,и*) в задаче (1) удовлетворяет принципу максимума Понтрягина, если существует вектор Л = (Л0,Л1,Л2): Л0 € € М, Л1 €М^(е1), Л2 €М^(е2) , Л0 > 0 , Л2 > 0 , (Л2,в2(р*)) = 0, абсолютно непрерывная функция ф : Т = [11,12] ^ Мга , функция ц = (ц1,ц2) : Т ^ , и измеримая ограниченная функция V : Т ^ М^(г) такие, что

да*

либо Л0 + |/х2(^)| >0, либо (3)

дН дг

Ф = + (4)

= + 8 = 1,2, (5)

тах Н(и, 1) = Н(1) п.в. 1, (6)

пеп(г)

дН дг

}1=—(1)-1У(1) — (1)П.В.1, (7)

= 8 = 1,2, (8) дН дг

= (9)

(V(1),т(1)) = 0, V(1) > 0 п.в. 1, (10)

где Н(1) := тахи&{ь) Н(и, 1) .

хТермин "замыкание по мере" был введен А.Я. Дубовицким и А.А. Милютиным в [4].

Более того, функция h(t) абсолютно непрерывная на T, а вектор-функция ц = (ц1,ц2) обладает следующими свойствами:

а) каждая из функций постоянна на каждом отрезке времени [a, b] , на котором траектория x*(t) целиком лежит во внутренности фазового множества, задаваемого j -ым фазовым ограничением-неравенством, т. е. когда gj(t) < 0 V t £ [a,b] ;

б) вектор-функция ц2 непрерывна слева на интервале (tl,tj) , и ii2(tj) = 0;

в) каждая из функций ц2 (нестрого) монотонно убывает;

г) вектор-функция ii измерима и ограничена на T.

Процесс (p*,x*,u*) , удовлетворяющий принципу максимума, называется экстремалью, а набор (X, ф, ц, v) - множителями Лагранжа, отвечающими процессу (p*,x*,u*) в силу принципа максимума.

В работе приняты следующие соглашения относительно обозначений. Во-первых, если у отображений H,д,г,ф, О , и т. п., или их производных какие-нибудь из аргументов опущены, то вместо них подставлены значения x*(t),u*(t) или множители Лагранжа ф^),ц^),Х. Во-вторых, все множители Лагранжа или элементы сопряженных пространств рассматриваются как вектор-строки, в то время как вектор-функции или векторы, такие как ф, x, u, рассматриваются как вектор-столбцы. Градиенты функций считаются элементами сопряженных пространств. Элементы матрицы Якоби F(x) :Кга —>Шк имеют вид , и ее строками являются градиенты координатных функций Fi.

3. Липшицевость i2(t)

Определение 7. Будем говорить, что экстремаль (p*,x*,u*) удовлетворяет усиленному условию Лежандра, если найдутся множители Лагранжа (X, ф, ц, v) такие, что для почти всех t £ T, верно следующее неравенство

Здесь константа const > 0 не зависит от t. Введем несколько предположений.

Предположение (А) Существует целое число N> 0 и точка ti £ (t*,t*), i = 1,...,N такие, что ti <t2 <...<tN , отображение J(t) постоянно для каждого интервала (t*,ti), (ti,ti+i), i = 1,...,N - 1 и (tN ,t2) .

Точка ti или t*,t* называется точкой стыка (или точкой контакта), если отображение J(t) не является постоянным в любой из ее окрестностей. Пусть

G+ (t) = {u £ U(t): TJ2(u, t) > 0 V j £ J(t)}, G~ (t) = {u £ U(t): r((u, t) < 0 V j £ J(t)}.

Пусть U означает замыкание по мере экстремального управления u* . Далее будем считать выполненными априори следующие условия:

U+(t) П G~(t) = 0, U~(t) П G+(t) = 0 Vt £ T. (12)

Введем основное предположение регулярности.

дГ drj

Предположение (P) Для любого t<ET, u£U{t), векторы ~Q^(u,t), 1=1,.., d{g\),

VjeJ(t), (u, t) , Mi € I(u, t) , линейно независимы.

Теорема 1. Предположим, что (p*,x*,u*) экстремаль и (Х,ф,ц,ю) соответствующие ей множители Лагранжа. Пусть смешанные ограничения регулярны, процесс (p*,x*,u*)

удовлетворяет Предположению (Р), и выполнено усиленное условие Лежандра (11). Кроме того, предположим, что имеет место (12) и выполнено Предположение (А). Тогда функция ц2(1) липшицева на (11,1*) . Рассмотрим два вспомогательных утверждения.

Предложение 1. Пусть матрица А € Мтхт знакоопределена, и матрица Б € Мтхк имеет полный ранг. Тогда

А Б * Б0

= 0.

Доказательство. Действительно, пусть вектор (х, у) , где х € Мт , у € Мк , принадлежит ядру блочной матрицы. Тогда, Ах + Б*у = 0 и Бх = 0 . Умножая второе уравнение на у* слева и транспонируя, получаем х*Б*у = 0 . Умножая первое уравнение на х* слева, получаем х*Ах = 0 ^ х = 0, у = 0. Следовательно, ядро блочной матрицы тривиально, и, следовательно, ее определитель не равен нулю. □

В условиях Теоремы 1 множество и(1) конечно для всех 1 € Т . Более того, существует число М> 0 такое, что \и(1)\ <М V1 € Т.

Доказательство. Из Предположения (Р) вытекает слабая регулярность экстремального процесса. Таким образом, в силу Предложения 3 из [2] и условия (12) получаем, что функция Ц2 непрерывна на (1* ,1**) . Кроме того, выполняя аналогичные рассуждения, как в доказательстве пункта ш) Теоремы 2 из [1], изменяя Ц2 на Ц2 (непрерывное продолжение Ц2 из (11,1**) на весь интервал Т минус скачок Ц2 в правом конце Ц2(*)) и учитывая, что новый набор множителей Лагранжа Лт,фт, Ц1, (см. его определение в доказательстве

теоремы) тоже удовлетворяет ПМ, без ограничения общности получаем, что 2 непрерывна на Т .

Пусть М£,с(1) , где е,е> 0 , 1 € Т , множество таких векторов и € Мт , для которых существует множество индексов Ь С[1, ...,й(д1)} , 3 С 3(1) и I С I(и,1) , и числа щ , I € Ь , bj , 3 € 3 , сг, г € I такие что

*) - *) - I) - *)) [Ди]2 < -е\Аи\2-,

¡еь jеJ ге1

дН ^ дГ\г . дГ32. . ^ дгг . .

¡еь jеJ ге1

Г\(и,1) = 0, I € Ь; Г(и,1) = 0, 3 € 3; \а1 \ < с, Ь\ < с, \сг\ <с, I € Ь, г € I, 3 € 3,

векторы (и, ¿) , I € Ь , , j£J1 £), ге/ линейно независимы, и матрица,

состоящая из них, имеет минор второго порядка \Ь\ + \I\ + \3\ с модулем не меньше е.

Очевидно, что множество М£,с(1) является закрытым для всех 1 €Т , и всех е,с> 0 . Кроме того, его пересечение с любым ограниченным шаром конечно. Это легко проверить, решая, для каждого фиксированного множества индексов Ь,^3 , т + \Ь\ + \3\ + \I\ уравнения

дН ^ ЗГ\, . ^, дГ{ . . ^ дгг . .

^ *)-£ Ъ-22*ьГкМ = °>

¡еь jеJ ге1

Г[(и,1) = 0, Г{(и,1) = 0, гг(и, 1) = 0

относительно того же числа неизвестных ик , а1, bj и сг .С помощью теоремы об обратной функции в окрестности точки и € М£,с(1) , определения М£,с(1) , и также Предложения 1 (в силу которого определитель линеризованной системы не равен нулю), и т. к. число уравнений равно числу неизвестных, получаем, что и является изолированной точкой. Поэтому,

т. к. приведенные выше рассуждения равномерны по t, и U(t) ограничено, существует число N = N(е, с) > 0: \Mc,e(t) П U(t) \ <N,V t £ T.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для того, чтобы доказать лемму, достаточно показать, что 3е,с> 0 :

U(t) CMe,c(t) V t £ T. (13)

Выберем точку t* £ T и пусть u* £U(t*) . Предположим, что t* <t* , и u* £U+(t*) . (Случай u* £ U~(t*) , t* > t* рассматривается аналогично.) Ввиду конечного числа выходов на границу, 3 5> 0 : J(t) = J(s) = J Vt,s £ (t*,t* + 5) и ii32(t) постоянна на [t*,t* + 5] для всех j £ J(t*) \ J . (Здесь используется непрерывность ц32 и условие а) ПМ.) Вычитая из i2(t) значения ¡i2(t*) , и из ip(t) функции /i2(i*)f|f(i) , гарантируем, что ¡¿2{t) = 0 VtG[t*,t* + £] для всех j £ J(t*) \ J . (Новый набор множителей Лагранжа удовлетворяет условиям максимума, кроме б) и усиленному условию Лежандра.) Так как j £ J и gi,(t) = 0 Vt £ [t*,t* + 5] ^ r32(t) = 0 V j £ J для почти всех t £ [t*,t* + 5] .

Используя свойства замыкания по мере (см. Предложение 2 из [1]), найдем последовательность точек ti > t* таких, что ti — t* , u*(ti) — u* и таких, что в точках ti, условие стационарности Эйлера-Лагранжа (9), условие (10) и усиленное условие Лежандра (11) выполняются, а также Т32 (ti) = 0 V j £ J , I(ti) = I, где I некоторое постоянное (не зависящее от i) множество индексов. Очевидно, что в силу компактности, Предположения (Р), и определения Me,c(t) существуют числа е,с> 0 , которые могут быть выбраны независимо от (t*,u*) такие, что u* £Me,c(t*).

Условие (13), и, следовательно, сама лемма доказаны. □

Доказательство Теоремы 1. Из Предположения (P) следует слабая регулярность экстремального процесса. Из Предложения 3 в [2] и (12) получаем непрерывность Ц2 на (t*,t**) . Более того, производя аналогичные рассуждения, как в доказательстве пункта iii) Теоремы 2 из [1], изменив ц2 на р,2 , и учитывая, что новый набор Хт,фт,ц1, p,2,v (см. доказательство Теоремы 2 из [1]) удовлетворяет ПМ, без ограничения общности получаем, что ц2 непрерывна на T.

Выберем точку t* £ [t*,t2) . Докажем, что ц2 имеет линейный рост справа от t* . Так как существует только конечное число точек выхода на границу, 3 5 > 0 : J(t) = J(s) = Q V t,s £ (t*,t* + 5) и ii32(t) постоянна на [t* ,t* + 5] для всех j £ J (t*) \ Q . (Здесь используется непрерывность j и условие а) ПМ.)

Вычитания из /J.2(t) значения /¿2> а из ф^) функции ц2{t*)^r{t) , получаем, что li32(t) = 0 Vt £ [t*,t* + 5] для всех j £ J(t*) \ Q . (Новый набор множителей Лагранжа удовлетворяет условиям ПМ кроме условия б) и усиленному условию Лежандра.) Так как j £ Q и д2(t) = 0 Vt £ [t*,t* + 5] ^ r32(t) = 0 V j £ Q для почти всех t £ [t*,t* + 5] . Выберем вектор u* £U+(t*) таким образом, что для множества E + соответствующего u* из Предложения 2 из [1], получаем, что точка t* не является точкой разрежения (см. [5]). Это осуществимо благодаря конечности множества U(t*) , см. Лемму . Таким образом, существует последовательность точек ti £ E+ таких, что:

ti+\ < ti, —< const Mi, (14)

ti+i t*

u*(ti) — u* , а также в точках ti, выполнены условия стационарности Эйлера-Лагранжа (9), условие (10), усиленное условие Лежандра (11) и Т32 (ti, ) = 0 V j £ J , I (ti, ) = I, где I некоторое постоянное (не зависит от i ) множество индексов.

Не ограничивая общности предположим, что Q = {1, 2,..., \Q\} , I = {1, 2,..., \I\} , L = {1, 2,...,\L\} .Далее, покажем, что v (ti,) — v* и ni(ti) — ц* , где

(l*,v*) =

ди ' ди '

дф*, лдН_( л du, Qn *)>

и ф = (Т\,г) . Заметим, что в силу Предположения (Р) обратная матрица ^¡-(и*, существует.

Действительно, из (9) и Предположения (Р), следует:

(ß l(ti),v(ti)) =

du [U)du[U)

l

дф* . .ОН. ,

где V(1г) = (V 1(1г), v2(1i),..., V11 \(и)) . Это очевидно, из доказательства построения, принимая во внимание, что Ц2 непрерывна, и правая часть стремиться к (ц\^*) . Это, вместе с условием (10) доказывает, что V(1г) ^ V* ц1(1г) ^ ц*.

Тогда, при г ^то, выполнены следующие соотношения:

a) 0;

b) = 0.

с) Г2(и*,1*) = 0 Vз€Я , и ц2(1*) = 0 Vз/д;

ё) г* (и*,1*) = 0 V 3 € I, и V* = 0 V j/I.

е) Г\(и*,1*) = 0 VI € Ь .

Обозначим через ¡12 вектор ММ , который получается из Ц2 отбрасыванием всех 3 -координат, когда 3 €Я . Соответственно, V € М11 вектор V с выброшенной координатой 3 / I. Рассмотрим вектор-функцию Г (и, ц1, ¡2, V, 1) :

р : мт+|Ь|+|д|+|/\+1 ^ мт+|ь|+!^!+|11,

с компонентами

9Н (и, t) k = l,...,m-,

drj

duk

leL

j eQ

'duk

jei

duk

T[(u,t), l £ L; TJ2(u,t), j £ Q; rj (u,t), j £ I.

Очевидно, что ввиду b), c), и d),

F(u*, ßi(t*), ß2(t*),v*,t*) = 0.

Решим уравнение F (u, ßl, ß2,v,t)=0 относительно переменных u, ßl, ß2,v2 в окрестности (u*,ßi(t*), ß2(t*), v*,t*) . Вычислим матрицу Якоби в этой точке. Обозначим через B матрицу,

состоящую из строк («*,i*), , , с l£b, j£Q, % £/. Принимая во

внимание c) и d), получаем,

dF(u*,ßi(t*),ß2(t*), v*,U) д(и, ßi,ß2,ü)

A B * B0

Ввиду а), матрица А отрицательно определенная. Таким образом, по Предложению 1 якобиан не равен нулю. Применяя теорему о неявной функции (см. [6]), учитывая способ построения последовательности [1г} , получаем, что существует окрестность О точки 1* и, однозначно определенные на О функции а(1),в(1),ш(1),р(1) такие, что Г(а(1),в(1),ш(1),р(1),1) = 0 и а(1*)=и* , в(1*)= Ц* , ш(1**) = ¡2(1*) , р(1*)=V* , а(1г)=и*(1г) , в(1г)= Ц1(1г) , ы(1г)= ¡2(1г) ,

р(1г) = ¡(1г) .

Траектория х*(Ь) липшицева. Таким образом, по теореме о неявной функции, все функции а,в,ш,р липшицевы. Но из липщшицевости ш , монотонности ¡л.2 и (14) следует линейный рост ц2 справа от Ь*.

Линейный рост слева на Ь* € (Ь*,Ь2,] доказывается аналогично. Эти рассуждения справедливы для любой точки Ь* € Т. Таким образом, получили липшицевость ¡л.2 на всем интервале времени Т. □

СПИСОК ЛИТЕРАТУРЫ

1. Горбачева А.В., Карамзин Д.Ю. Уточнение условий оптимальности в задачах управления с фазовыми ограничениями типа равенств и неравенств // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2016. Т. 21. Вып. 1. С. 40-55.

2. Горбачева А.В. Непрерывность меры-множителя Лагранжа из принципа максимума для задачи оптимального управления с фазовыми ограничениями типа равенств и неравенств в условиях слабой регулярности экстремального процесса // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2016. Т. 21. Вып. 1. С. 28-39.

3. Arutyunov A.V., Karamzin D.Yu. On some continuity properties of the measure Lagrange multiplier from the maximum principle for state constrained problems // SIAM J. Control Optim. 2015. V. 53. № 4. P. 2514-2540.

4. Дубовицкий А.Я., Милютин А.А. Необходимые условия слабого экстремума в задачах оптимального управления со смешанными ограничениями типа неравенств // Журнал вычислительной математики и математической физики. 1968. Т. 8. № 4. С. 725-779.

5. Натансон И.П. Теория функций вещественной переменной. М.: Наука, 1974.

6. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М.: Наука, 1979.

БЛАГОДАРНОСТИ: Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проекты № 16-01-00283, 16-31-60005) и гранта Президента РФ № МД-4639.2016.1.

Поступила в редакцию 6 марта 2017 г

Горбачева Анна Викторовна, Российский университет дружбы народов, г. Москва, Российская Федерация, преподаватель кафедры прикладной математики, e-mail: avgorbacheva@inbox.ru

Карамзин Дмитрий Юрьевич, Вычислительный центр им. А.А. Дородницына Федерального исследовательского центра «Информатика и управление» Российской академии наук, г. Москва, Российская Федерация, доктор физико-математических наук, ведущий научный сотрудник, e-mail: dmitry_karamzin@mail.ru

UDC 517.977.52

DOI: 10.20310/1810-0198-2017-22-3-508-516

LIPSCHITZ CONTINUITY OF THE MEASURE LAGRANGE MULTIPLIER FROM THE MAXIMUM PRINCIPLE FOR OPTIMAL CONTROL PROBLEMS WITH STATE CONSTRAINTS OF EQUALITY AND INEQUALITY TYPE

© A. V. Gorbacheva1) , D.Yu. Karamzin2)

RUDN University 6 Miklukho-Maklay St., Moscow, Russian Federation, 117198 E-mail: avgorbacheva@inbox.ru 2) Institution of Russian Academy of Sciences Dorodnicyn Computing Centre of RAS, 40 Vavilov St., Moscow, Russian Federation, 119333 E-mail: dmitry_karamzin@mail.ru

Properties of regular extremals in optimal control problems with equality and inequality state constraints are studied. It is proved that, under the regularity conditions, the strengthened Legendre condition implies Lipschitz continuity of the measure Lagrange multiplier from the maximum principle.

Key words: optimal control; maximum principle; state constraints; Legendre condition

REFERENCES

1. Gorbacheva A.V., Karamzin D.Yu. Utochnenie uslovij optimal'nosti v zadachah upravleniya s fazovymi ogranicheniyami tipa ravenstv i neravenstv // Vestnik Tambovskogo universiteta. Seriya Estestvennye i tekhnicheskie nauki - Tambov University Reports. Series: Natural and Technical Sciences. Tambov, 2016. V. 21. Iss. 1. P. 40-55.

2. Gorbacheva A.V. Nepreryvnost' mery-mnozhitelya Lagranzha iz principa maksimuma dlya zadachi optimal'nogo upravleniya s fazovymi ogranicheniyami tipa ravenstv i neravenstv v usloviyah slaboj regulyarnosti ehkstremal'nogo processa // Vestnik Tambovskogo universiteta. Seriya Estestvennye i tekhnicheskie nauki - Tambov University Reports. Series: Natural and Technical Sciences. Tambov, 2016. V. 21. Iss. 1. P. 28-39.

3. Arutyunov A.V., Karamzin D.Yu. On some continuity properties of the measure Lagrange multiplier from the maximum principle for state constrained problems // SIAM J. Control Optim. 2015. V. 53. № 4. P. 2514-2540.

4. Dubovickij A.YA., Milyutin A.A. Neobhodimye usloviya slabogo ehkstremuma v zadachah optimal'nogo upravleniya so smeshannymi ogranicheniyami tipa neravenstv // Zhurnal vychislitel'noj matematiki i matematicheskoj fiziki. 1968. T. 8. № 4. S. 725-779.

5. Natanson I.P. Teoriya funkcij veshchestvennoj peremennoj. M.: Nauka, 1974.

6. Alekseev V.M., Tihomirov V.M., Fomin S.V. Optimal'noe upravlenie. M.: Nauka, 1979.

ACKNOWLEDGEMENTS: The present research is supported by the Russian Fund for Basic Research (projects № 16-01-00283, 16-31-60005) and grant of the President of the Russian Federation (project № M^-4639.2016.1.).

Received 6 March 2017

Gorbacheva Anna Viktorovna, RUDN University, Moscow, the Russian Federation, Lecturer of the Applied Mathematics Department, e-mail: avgorbacheva@inbox.ru

Karamzin Dmitry Yurjevich, Dorodnicyn Computing Center of the Federal Research Center "Informatics and Control" of the Russian Academy of Sciences, Moscow, the Russian Federation, D.Sc., Leading Researcher, e-mail: dmitry_karamzin@mail.ru

Информация для цитирования:

Горбачева А.В., Карамзин Д.Ю. Липшицевость меры-множителя Лагранжа из принципа максимума для задачи оптимального управления с фазовыми ограничениями типа равенств и неравенств // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2017. Т. 22. Вып. 3. С. 508-516. DOI: 10.20310/1810-0198-2017-22-3508-516

Gorbacheva A.V., Karamzin D.Yu. Lipshicevost' mery-mnozhitelya Lagranzha iz principa maksimuma dlya zadachi optimal'nogo upravleniya s fazovymi ogranicheniyami tipa ravenstv i neravenstv [Lipschitz continuity of the measure Lagrange multiplier from the maximum principle for optimal control problems with state constraints of equality and inequality type]. Vestnik Tambovskogo universiteta. Seriya Estestvennye i tekhnicheskie nauki - Tambov University Reports. Series: Natural and Technical Sciences, 2017, vol. 22, no. 3, pp. 508-516. DOI: 10.20310/1810-0198-2017-22-3-508-516 (In Russian)

i Надоели баннеры? Вы всегда можете отключить рекламу.