УДК 517.977.52
О некоторых классах задач управления с фазовыми
ограничениями
А. В. Горбачева*^, Д. Ю. Карамзин*
* Кафедра нелинейного анализа и оптимизации Российский университет дружбы народов ул. Миклухо-Маклая, д. 6, Москва, Россия, 117198 ^ Кафедра прикладной математики Российский государственный социальный университет ул. Вильгельма Пика, д. 4, стр. 6, Москва, Россия, 129226 * Вычислительный центр им. А.А. Дородницына ФИЦ ИУ РАН ул. Вавилова, д. 40, Москва, Россия, 119333
В принципе максимума для задач оптимального управления с фазовыми ограничениями возникает борелевская мера-множитель Лагранжа д. В различных инженерных приложениях, в частности, в некоторых задачах кинематического управления одним из важных вопросов является вопрос о непрерывности или абсолютной непрерывности такой меры. Скорость в подобного рода задачах имеет смысл фазовой переменной. Если модуль скорости ограничен, например, сверху (что вполне естественно в задачах кинематического управления), то это приводит к фазовым ограничениями, и, следовательно, к упомянутой выше мере-множителю Лагранжа д в необходимых условиях оптимальности. Методы, которые используются для решения таких задач, как правило, подразумевают непрерывность меры. В этой работе рассматриваются примеры задач управления с фазовыми ограничениями, для которых можно гарантировать a priori (то есть без вычисления экстремального процесса), что соответствующая мера непрерывна.
Ключевые слова: оптимальное управление, принцип максимума, фазовые ограничения, борелевская мера, условие Гельдера.
1. Постановка задачи и основные определения
Рассмотрим следующую задачу оптимального управления
ко(р) + ¡^ /о(х, и, ^ шш, х = /(х, и, 1), £ € t1 <Ь2,
р(х,£) < 0, В.(х,и,£) < 0, (1)
К1(р) = 0, К2(р) < 0, р = (Х1,Х2,Ь1,12).
Здесь отображения К, K^ принимают значения в пространствах размерности й(К), й(Кг) соответственно, функции К0, /0, р скалярные, х = , t € [¿ь£2] - время (концы времени ¿1 и ¿2 не предполагаются фиксированными), х есть фазовая переменная из Кп, и и € Кт - переменная управления. Вектор р € Кп х Кп х К1 х К1 называется концевым. Управляющая функция, или просто управление, есть измеримая существенно ограниченная функция и(-), т.е. элемент пространства Ь^([11,12]).
Пусть и(1), £ € [Ь1,Ь2] - управление, х(1), £ € [Ь1,Ь2] - соответствующая траектория, и р - соответствующий концевой вектор. Тройка (р, х, и) называется допустимым процессом, если удовлетворены концевые ограничения К1(р) = 0, К2(р) < 0, смешанные ограничения и(1) € и(х (£),£) для п.в. £ € ^-}_,12], и фазовое ограничение р(х(£),£) < 0 V£ € [^,¿2]. Здесь, и(х,£) = {и : К(х,и,1) < 0}.
Статья поступила в редакцию 13 января 2016 г. Работа выполнена при поддержке Российского фонда фундаментальных исследований (проекты 16-01-00283, 16-31-60005), гранта Президента РФ № МД-4639.2016.1.
Допустимый процесс называется оптимальным, если значение минимизируемого функционала является наименьшим возможным на множестве всех допустимых процессов.
Относительно функций, вовлечённых в постановку задачи, предположим следующее: функции К0, К1,К2, /о,/, К, р непрерывно дифференцируемы, функция р дважды непрерывно дифференцируема, а функции /, /0, К дважды непрерывно дифференцируемы по и для всех х, ¿.
Введём необходимые определения.
Определение 1. Концевые ограничения называются регулярными в р = (х1,х2, t1, Ь): К1(р) = 0, К2(р) < 0, если
Л ту- Л ту-
dim —1 (p) = d(K1), 3d е ker —1 (р) : ( ^(p),d) > 0 Vj : К(р) = 0. ар ар
: (f (Ц
Определение 2. Смешанные ограничения называются регулярными, если для любых (х,и, ¿): К(х,и, 1) ^ 0 существует вектор д = д(х,и, 1) такой, что
/ dRj \
t),q) > 0 V j е I(x,u, t) := {j : R°(x,u, t) = 0}.
(2)
Определение 3. Фазовое ограничение называется регулярным, если для любых (х, Ь): р(х, Ь) = 0 имеет место ^(х, Ь) = 0.
Определение 4. Фазовое ограничение называется согласованным с концевыми ограничениями в точке р*, если существует число £ > 0 такое, что
{ре К п+2 : | р*-р| < е,К1(р) = 0,К2 (р) < 0} С {р : фи ^) < 0, ф2,Ь) < 0}.
Пусть : К ^ Кт заданная измеримая ограниченная функция.
Определение 5. Замыканием справа по мере функции в точке т называется множество Е+(т) таких векторов и е Кт, что
^{Ъ е [т,т + £]: Ф) е в£(и)}^ > 0 Уе > 0.
Здесь, В£(и) = {V е Кт : |г> — и| < е}, и I - мера Лебега на К. Соответственно, замыкание слева - это множество "В-(т) таких векторов и е Кт, что
{Ъ е [т — е, т]: ^) е в£(и)}^ > 0 Уе > 0.
Многозначное отображение "В(Ь) := и где Ь е К, называется замы-
канием ( ) по мере Лебега.
О некоторых свойствах замыкания по мере можно прочитать в [1]. Ниже будем рассматривать оптимальный в задаче (1) процесс (р*,х*,и*). Замыкание по мере оптимального управления и*(1) обозначим через и(¿).
Определение 6. Процесс (р*,х*,и*) называется регулярным, если для всех Ь еТ, и е и (Ь), векторы (и, ¿), ] е 1(и, ¿), линейно независимы, и существует вектор й = й(и, 1) е Кт такой, что й е кег (и, 1) У ] е 1(и, Ь),
(^и(и, V, ^ = 0 (3)
как только ф(х*(1),£) = Г(и,£) = 0, где
Т(х,и,£) = (x,t),f (х,и,г)^ + ^ (х,г).
В общем случае, когда множество и(¿) сложно вычислить, достаточно проверить условие (3) для всех и € и(Ь). Более того, из условия Ь) предложения 3.2 из [1] вытекает следующее простое утверждение.
Замечание 1. Любой допустимый процесс в задаче (1) регулярен, как только при всех х,Ь и всех и € и(х,Ь), векторы ^^(х,и,Ь), ] € I(х,и,Ь), линейно независимы, и существует вектор й = й(х,и,Ь) € Ят, такой, что й € кег (х,и,Ь), V] € I(х, и,1), и
(х,и,г),^ = 0
как только (р(х, £) = Г(ж, и, £) = 0.
Напомним определение из [2].
Определение 7. Говорят, что выполняются условия управляемости в концевых точках относительно фазового ограничения, если для 8 = 1, 2,
3 Д € I(х*,и(х**Х)Х) :
(-1У
* *) * дер ■
ъ*), у + ^ (х*, г*)
> 0
как только р(х*,г*) = 0.
Следующее утверждение есть аналог Леммы 2.1 из [3].
Предложение 1. Пусть процесс (р*,х*,и*) является регулярным. Тогда выполнены условия управляемости.
2. Принцип максимума
Рассмотрим функцию
Г(х,и,£) = ^ (x,t),f (х,и,г)^ + ^ (x,t),
расширенную функцию Гамильтона-Понтрягина
Й(х, и, ф, р,, Х0,1) = (ф, /(х, и, {)) — рГ(х, и, {) — Х0/0(х, и, {), и малый лагранжиан
1(р, X) = Х0Ко(р) + (Х1,К1(р)) + (Х2,К2(р)) ,
где Л = (Л0,Л1,Л2).
В работе [1] была получена следующая теорема.
Теорема 1. Пусть регулярный процесс (р*,х*, и*) является оптимальным в задаче (1). Предположим, что концевые, фазовые и смешанные ограничения регулярны, и фазовое ограничение согласовано с концевыми ограничениями в точке р*.
Тогда процесс (р*,х*,и*) удовлетворяет принципу максимума, т.е. найдутся
вектор X = (Х0,Х1 ,Х2) : X0 е К, X1 е Ка(к1), X2 е Ка(К2), X0 > 0, X2 > 0,
(Л2, К2(р*)) = 0, абсолютно непрерывная функция ф : ^*, 12] ^ Кп, функция ц :
[1 *,Ь2\ ^ , и измеримая ограниченная функция г : [£*,Ь*} ^ Ка(к), такие, что
X0 +
т -¡At) (t)
> 0 yte [t**,t*], (4)
; dH . . . . dR. . гр = -дНН(*) + г(г) ® п-в- ^ (5)
Ж) = (-1)8+1 -§-s(p*,x) + iAK)(t**), s = i,2, (6)
max Н(и, t) = H(t) п.в. t, (7)
иеи (t)
дН . . . . dR. . .„.
h = —(t) - r(t)—(t) п.в. t, (8)
h(t*) = (-iyddr (P*,X)-i(t*)^(t**), s = 1,2, (9)
dH . . . . dR . . „.
ж (t)=4t) - W пв t, ( )
(r(t),R(t)) = 0, r(t) > 0 п.в. t, (11)
где h(t) := maxueU(t) Н(и, t).
Более того, функция h(t) абсолютно непрерывна на [i*, t*], а функция i удовлетворяет следующим свойствам:
a) ¡(t) постоянна на каждом интервале времени S = [si, s2], где траектория х* целиком лежит во внутренности фазового множества, т.е. когда <p(s) < 0 У s £ S;
b) ¡(t) убывает, и t*) = 0;
c) ¡(t) непрерывна всюду на [i*, Ц] и более того, даже является гельдеровой с показателем 1/2, т.е.:
Il(t)-i(s)I < constat - si Уt,s £ [i*, t**]. (12)
Выше приняты обозначения и конвенции из [2], Глава 2. Важно отметить, что условие регулярности здесь существенно. Без него t) может претерпевать разрывы, что показывают соответствующие примеры из [4].
3. Несколько классов задач с фазовыми ограничениями
Нас будут интересовать такие классы задач с фазовыми ограничениями, для которых а ргот, т.е. заранее не зная и не вычисляя оптимальный процесс, тем не менее можно гарантировать, что мера множитель Лагранжа ^(1) из принципа максимума непрерывна всюду на оптимальном отрезке времени. Ясно, что в силу Теоремы 1 так и будет, если гарантировать, что любой допустимый процесс задачи (1) является регулярным. Это зависит от вида ограничений и правой части. Ниже подберём специальные классы задач так, чтобы гарантировать выполнение всех предположений сформулированной теоремы.
Пример 1. Пусть п = т, г1, г2 - заданные положительные числа, ф : Л2п ^ Л1, в : Лп ^ Лп - заданные гладкие функции. Рассмотрим задачу:
( 1
1Ф(Х,и)* " min,
X = в(х) + и, \и\2 < г1, \х\2 < г2, ^ж(0) = ха, х(1) = хв.
Лемма 1. Предположим, что
\ (9(х),х) \ < /г 1Г2 Vx : \х\2 = Г2.
Тогда любой допустимый процесс примера 1 регулярен.
(13)
Доказательство. Для доказательства воспользуемся Замечанием 1. Покажем, что в примере выполнены все предположения, сформулированные в этом замечании. Тогда в его силу любой допустимый процесс будет регулярным. Действительно, имеем:
<р(х) = \х\2 — г2, Л(и) = \и\2 — г1, Г(х,и) = (2х, 6(х) + и) .
Покажем, что векторы ^(и) и ^(х,и) линейно независимы на множестве (х, и) : Л(и) = 0, Г(ж, и) = 0, <^(х) = 0.
Действительно, имеем, что
дЛ 5Г
—— (и) = 2и, — (х, и) = 2х. ои ои
Поскольку Г(ж,и) = 0, то (х,и) = — (в(х),х). Из (13) имеем, что \ (х,и) \ < /г1г2. Но \х\ = /2, \и\ = /¥\, и поэтому последнее неравенство влечёт линейную
независимость векторов (и) и ^(х,и).
Легко видеть, что выполнены все предположения, сформулированные в Замечании 1. Поэтому любой допустимый процесс является регулярным.
Лемма доказана. □
Таким образом, в силу Теоремы 1 и Леммы 1 для любого оптимального процесса найдётся гельдерова функция-множитель Лагранжа р^).
Пример 2. Пусть п = т, Г1 - заданное положительное число, д - заданный единичный вектор, ф : Л2п ^ Л1, в : Лп ^ Лп - заданные гладкие функции. Рассмотрим задачу:
( 1
!ф(х,иЖ ^
X = в(х) + и, \и\2 < г1, (д, х) < 0, ^ж(0) = ха, х(1) = хв.
Лемма 2. Предположим, что
\(в(х), д) \ < у/п "Vх : (д,х) = 0.
(14)
Тогда любой допустимый процесс примера 2 регулярен.
Доказательство. Для доказательства воспользуемся Замечанием 1. Покажем, что в примере выполнены все предположения, сформулированные в этом замечании. Тогда в его силу любой допустимый процесс будет регулярен. Действительно, имеем:
<р(х) = (д,х) , Щи) = \и\2 — г1, Г(х,и) = (д, в(х) + и).
Покажем, что векторы ^(и) и (х,и) линейно независимы на множестве (х, и) : Щи) = 0, Г(х, и) = 0, <^(х) = 0.
Действительно, (и) = 2и, |Г (х,и) = д. Поскольку Г(х, и) = 0, то (д ,и) = — (в(х),д). Из (14) имеем, что \ (д,и) \ < /г\, а поскольку \д\ = 1 и \и\ = /гЦ, то векторы ^ (и) и ^Г (х,и) неколлинеарны.
Легко видеть, что выполнены все предположения, сформулированные в Замечании 1. Поэтому любой допустимый процесс является регулярным.
Лемма доказана. □
Таким образом, в силу Теоремы 1 и Леммы 2, для любого оптимального процесса найдётся гельдерова функция-множитель Лагранжа р^).
Пример 3. Пусть п = т, к < т, а - заданное положительное число, д -заданный единичный вектор, ф : К2п ^ К1, в : Кп ^ Кп - заданные гладкие функции. Рассмотрим задачу:
' 1
1Ф(х,и)т ^ ^
о
< х = в(х) + и, \и \ < а, ] = 1,..., к, (а,х) < 0,
,х(0) = ха, х(1) = хв.
Лемма 3. Предположим, что
3 з* >к : д** = 0. (15)
Тогда любой допустимый процесс примера 3 регулярен.
Доказательство. Для доказательства воспользуемся Замечанием 1. Покажем, что в примере выполнены все предположения, сформулированные в этом замечании. Тогда в его силу любой допустимый процесс будет регулярным. Действительно, имеем:
1Р(х) = (д, х), Щ (и) = и* — а, ] = 1,..., к,
К*(и) = —и*-к — а, з = к + 1,..., 2к, Г(х, и) = (д, 6(х) + и).
Легко видеть, что векторы ^- (и), ] £ 1(и), и ^Г (х,и) линейно независимы на множестве
(х, и) : Г(х, и) = 0, <^(х) = 0.
Действительно, ( и) есть соответствующий единичный вектор (взятый с плюсом или минусом), у которого все координаты с номером выше, чем к, равны нулю, а ^(х,и) = д. Поэтому условие (15) сразу влечёт, что векторы некол-линеарны. Значит, выполнены все предположения Замечания 1. Поэтому любой допустимый процесс является регулярным.
Лемма доказана. □
4. Заключение
В работе были рассмотрены некоторые классы задач управления с фазовыми ограничениями, для которых можно гарантировать непрерывность меры-множителя Лагранжа |(t) из принципа максимума. Непрерывность меры является важным фактором, который может быть полезен при отыскании решения задачи с помощью принципа максимума.
Литература
1. Arutyunov A. V., Karamzin D. Y. On Some Continuity Properties of the Measure Lagrange Multiplier from the Maximum Principle for State Constrained Problems // SIAM Journal on Control and Optimization. — 2015. — Vol. 53, No 4. — Pp. 2514-2540.
2. Arutyunov A. V. Optimality Conditions: Abnormal and Degenerate Problems. — Dordrecht/Boston/London: Kluwer Academic Publisher, 2000.
3. Arutyunov A. V., Karamzin D. Y., Pereira F. L. The Maximum Principle for Optimal Control Problems with State Constraints by R. V. Gamkrelidze: Revisited // J. Optim. Theory Appl. — 2011. — Vol. 149. — Pp. 474-493.
4. Zakharov E. V., Karamzin D. Y. On the Study of Conditions for the Continuity of the Lagrange Multiplier Measure in Problems with State Constraints // Differential Equations. — 2015. — Vol. 51, No 3. — Pp. 399-405.
UDC 517.977.52
On Some Classes of Optimal Control Problem with State
Constraints
A. V. Gorbacheva*^, D. Yu. Karamzin*
* Department of nonlinear analysis and optimization
Peoples' Friendship University of Russia 6, Miklukho-Maklaya str., Moscow, Russia, 117198 ^ Department of applied mathematics Russian state social university 4, Wilhelm Pieck str., Moscow, Russia, 129226 * Dorodnicyn Computing Centre of the Russian Academy of Science 40, Vavilova str., Moscow, Russia, 119333
A Borel measure Lagrange multiplier appears in the maximum principle for state constrained problems. The question of continuity or absolute continuity of the measure-multiplier is highly relevant for various applications in particular for some problems of kinematic control. The velocity in such problems is considered as a state variable. As soon as the magnitude of the velocity is bounded, for instance above, (which is quite natural in problems of kinematic control), this leads to the state constraints and to a measure Lagrange multiplier in the necessary optimality conditions. In Control Theory, the methods that are use to solve these conditions often require the continuity of the measure. In this paper, we consider some examples of optimal control problems with state constraints for which one can ensure that this measure is continuous, without a calculation of extremal process.
Key words and phrases: optimal control, maximum principle, state constraints, Borel measure, Holder condition.
References
1. A. V. Arutyunov, D. Y. Karamzin, On Some Continuity Properties of the Measure Lagrange Multiplier from the Maximum Principle for State Constrained Problems, SIAM Journal on Control and Optimization 53 (4) (2015) 2514-2540.
2. A. V. Arutyunov, Optimality Conditions: Abnormal and Degenerate Problems, Kluwer Academic Publisher, Dordrecht/Boston/London, 2000.
3. A. V. Arutyunov, D. Y. Karamzin, F. L. Pereira, The Maximum Principle for Optimal Control Problems with State Constraints by R. V. Gamkrelidze: Revisited, J. Optim. Theory Appl. 149 (2011) 474-493.
4. E. V. Zakharov, D. Y. Karamzin, On the Study of Conditions for the Continuity of the Lagrange Multiplier Measure in Problems with State Constraints, Differential Equations 51 (3) (2015) 399-405.