Научная статья на тему 'Некоторые оценки для скачка производной функции-множителя Лагранжа в задачах оптимального управления с фазовыми ограничениями второго порядка'

Некоторые оценки для скачка производной функции-множителя Лагранжа в задачах оптимального управления с фазовыми ограничениями второго порядка Текст научной статьи по специальности «Математика»

CC BY
2
0
Читать
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
оптимальное управление / фазовые ограничения / принцип максимума Понтрягина / условия регулярности / численные методы / optimal control / state constraints / Pontryagin’s maximum principle / regularity assumptions / numerical methods

Аннотация научной статьи по математике, автор научной работы — Карамзин Дмитрий Юрьевич

Исследуется задача оптимального управления нелинейной динамической системой ¾каскадного¿ типа с общими концевыми и нерегулярными поточечными фазовыми ограничениями  так называемыми ограничениями глубины 2. Эта задача допускает уточненную формулировку принципа максимума Понтрягина в терминах (нестандартной) функции Гамильтона – Понтрягина второго порядка. Исследуется вопрос об оценке скачка производной функции – множителя Лагранжа, отвечающего фазовому ограничению. Получены условия, при которых принцип максимума влечет равномерные по времени оценки на скачок указанной функции. В частности, приводятся достаточные условия отсутствия скачка (т. е. непрерывной дифференцируемости) множителя. Результаты опираются на понятия 2-регулярности фазового ограничения и так называемые зоны регулярности задачи. Полученные оценки представляют интерес для теории принципа максимума Понтрягина и могут быть использованы на практике, в том числе для реализации известного метода ¾стрельбы¿ в рамках одного из стандартных подходов к численной интерпретации необходимого условия оптимальности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Карамзин Дмитрий Юрьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
Предварительный просмотрDOI: 10.26516/1997-7670.2024.49.3
i Надоели баннеры? Вы всегда можете отключить рекламу.

Some Estimates for the Jump of the Derivative of the Lagrange Multiplier Function in Optimal Control Problems with Second-order State Constraints

The optimal control problem for a nonlinear dynamic system of a cascade type with endpoint and irregular pointwise state constraints (the so-called state constraints of depth 2) is studied. This problem admits a refined formulation of Pontryagin’s maximum principle in terms of a (non-standard) Hamilton-Pontryagin function of the second order. The question of estimating the jump of the derivative of the Lagrange multiplier corresponding to the state constraint is studied. Some sufficient conditions have been obtained under which the maximum principle implies uniform in time estimates for the jump of the specified function. In particular, sufficient conditions have been given for the absence of a jump (i.e., continuous differentiability) of the multiplier. These results are based on the concepts of 2-regularity of the state constraint and the so-called regularity zone of the problem. The obtained estimates are of interest for the theory of Pontryagin’s maximum principle and can be used in practice, including the implementation of the known shooting method within the framework of one of the standard approaches to the numerical interpretation of the necessary optimality condition.

Текст научной работы на тему «Некоторые оценки для скачка производной функции-множителя Лагранжа в задачах оптимального управления с фазовыми ограничениями второго порядка»

ДИНАМИЧЕСКИЕ СИСТЕМЫ И ОПТИМАЛЬНОЕ

УПРАВЛЕНИЕ

DYNAMIC SYSTEMS AND OPTIMAL CONTROL

Онлайн-доступ к журналу: http: / / mathizv.isu.ru

Серия «Математика»

2024. Т. 49. С. 3-15

Научная статья

УДК 517.977 МБС 49Л20

Б01 https://doi.Org/10.26516/1997-7670.2024.49.3

Некоторые оценки для скачка производной функции-множителя Лагранжа в задачах оптимального управления с фазовыми ограничениями второго порядка

Д. Ю. Карамзин12И

1 Федеральный исследовательский центр «Информатика и управление» РАН

2 Институт динамики систем и теории управления им. В. М. Матросова СО РАН И dmitry_karamzin@mail.ru

Аннотация. Исследуется задача оптимального управления нелинейной динамической системой «каскадного» типа с общими концевыми и нерегулярными поточечными фазовыми ограничениями — так называемыми ограничениями глубины 2. Эта задача допускает уточненную формулировку принципа максимума Понт-рягина в терминах (нестандартной) функции Гамильтона - Понтрягина второго порядка. Исследуется вопрос об оценке скачка производной функции - множителя Лагранжа, отвечающего фазовому ограничению. Получены условия, при которых принцип максимума влечет равномерные по времени оценки на скачок указанной функции. В частности, приводятся достаточные условия отсутствия скачка (т. е. непрерывной дифференцируемости) множителя. Результаты опираются на понятия 2-регулярности фазового ограничения и так называемые зоны регулярности задачи. Полученные оценки представляют интерес для теории принципа максимума Понтрягина и могут быть использованы на практике, в том числе для реализации известного метода «стрельбы» в рамках одного из стандартных подходов к численной интерпретации необходимого условия оптимальности.

Ключевые слова: оптимальное управление, фазовые ограничения, принцип максимума Понтрягина, условия регулярности, численные методы

Благодарности: Исследование выполнено за счет гранта Российского научного фонда № 23-21-00161 в Институте динамики систем и теории управления им. В.М. Матросова СО РАН, https://rscf.ru/project/23-21-00161/.

Ссылка для цитирования: Карамзин Д. Ю. Некоторые оценки для скачка производной функции-множителя Лагранжа в задачах оптимального управления с фазовыми ограничениями второго порядка // Известия Иркутского государственного университета. Серия Математика. 2024. Т. 49. C. 3-15. https://doi.Org/10.26516/1997-7670.2024.49.3

Research article

Some Estimates for the Jump of the Derivative of the Lagrange Multiplier Function in Optimal Control Problems with Second-order State Constraints

Dmitry Yu. Karamzin1'2H

1 Federal Research Center "Computer Science and Control" RAS, Moscow, Russian Federation

2 Matrosov Institute for System Dynamics and Control Theory SB RAS, Irkutsk, Russian Federation

ЕЭ dmitry_karamzin@mail.ru

Abstract. The optimal control problem for a nonlinear dynamic system of a cascade type with endpoint and irregular pointwise state constraints (the so-called state constraints of depth 2) is studied. This problem admits a refined formulation of Pontryagin's maximum principle in terms of a (non-standard) Hamilton-Pontryagin function of the second order. The question of estimating the jump of the derivative of the Lagrange multiplier corresponding to the state constraint is studied. Some sufficient conditions have been obtained under which the maximum principle implies uniform in time estimates for the jump of the specified function. In particular, sufficient conditions have been given for the absence of a jump (i.e., continuous differentiability) of the multiplier. These results are based on the concepts of 2-regularity of the state constraint and the so-called regularity zone of the problem. The obtained estimates are of interest for the theory of Pontryagin's maximum principle and can be used in practice, including the implementation of the known shooting method within the framework of one of the standard approaches to the numerical interpretation of the necessary optimality condition.

Keywords: optimal control, state constraints, Pontryagin's maximum principle, regularity assumptions, numerical methods

Acknowledgements: The study was financially supported by the Russian Science Foundation in the Matrosov Institute for System Dynamics and Control Theory of SB RAS, grant no. 23-21-00161, https://rscf.ru/project/23-21-00161/.

For citation: Karamzin D. Yu. Some Estimates for the Jump of the Derivative of the Lagrange Multiplier Function in Optimal Control Problems with Second-order State Constraints. The Bulletin of Irkutsk State University. Series Mathematics, 2024, vol. 49, pp. 3-15. (in Russian) https://doi.org/10.26516/1997-7670.2024.49.3

1. Введение

Работа посвящена исследованию теории принципа максимума Понт-рягина для классической задачи управления с нерегулярными фазовыми ограничениями высших порядков и изучению свойств соответствующей функции-множителя Лагранжа. В настоящей заметке ограничиваемся случаем фазовых ограничений глубины 2 (или «второго порядка», см. определение в § 2), но отмечаем, что представленные результаты допускают обобщение на задачи с нерегулярными ограничениями любого порядка к, к € N.

Задачи исследуемого класса возникают в моделях многоуровневых динамических систем «треугольного типа», которые можно встретить, например, в робототехнике. Эталонным примером выступает уницик-лическая модель мобильного робота при ограничениях на состояние, см., например, работу [5] и цитированную там литературу.

Центральным для настоящей статьи является вопрос о непрерывной дифференцируемости множителя Лагранжа и — если последняя не имеет места — об оценке скачка производной в точках стыка. Результаты такого (технического) типа важны в контексте построения непрямых численных методов оптимального управления. Так, оценки скачка множителя Лагранжа необходимы для организации эффективного метода стрельбы — одного из стандартных подходов к решению краевой задачи для гамильтоновой системы принципа максимума [10].

Представленный здесь анализ опирается на уточненную форму классического необходимого условия оптимальности и специальное (глобальное) понятие регулярности фазового ограничения — так называемая регулярность второго порядка (см. определение 2 в § 3).

На отрезке времени [0,1] рассмотрим специальную задачу оптимального управления с фазовыми ограничениями:

2. Постановка задачи и основные определения

I /0(х(Ь),п(Ь))М ^ шт, о

X !(*) = /1(х(*)),

X 2(*) = /2 (х(Ь),и(Ь)),

(х(0), х(1)) € 5,

и(Ь) € и для п.в. Ь € [0,1],

5(Ж1 (Ь)) < 0 V Ь € [0,1].

(2.1)

Здесь х = (ж1,ж2), ж1, ж2 € К" — фазовая переменная, и € — переменная управления; Б С К2" и и С — заданные замкнутые множества. Отображения

предполагаются достаточно гладкими.

Выделение подвекторов Ж1, Ж2 обусловлено специальным видом фазового ограничения, которое формулируется на подпространстве переменной Ж1. Системы такой структуры возникают, например, в робототехнике, см. введение в работе [6]. При этом говорят о фазовом ограничении глубины 2, или об ограничении второго порядка.

Допустимым управлением считается функция и(-) € Ите([0,1]; ), удовлетворяющая при п. в. £ € [0,1] включению и(£) € и. Допустимая траектория х(-) = (ж1(-),ж2(■)), отвечающая управлению и(-), — это липшицевая функция, удовлетворяющая при п. в. £ € [0,1] дифференциальной связи Х(£) = £(х(£),и(£)), краевым условиям с множеством Б, а также неравенству ^(ж1 (£)) < 0 при всех £ € [0,1]. Пару (х(-),и(-)), составленную из допустимого управления и порожденной им допустимой траектории, будем называть допустимым процессом задачи (2.1). Допустимый процесс (Х(-),и(-)) называется оптимальным, если значение целевого функционала на нем является наименьшим из возможных на множестве всех допустимых процессов.

Сделаем следующее

Предположение 1. Существует оптимальный процесс (х(-),и(-)) задачи (2.1), удовлетворяющий условиям

Данное предположение позволяет исключить известный случай вырождения принципа максимума Понтрягина [1-3] и существенно упрощает изложение. В последующем зафиксируем допустимый процесс (х(-),и(-)), удовлетворяющий предположению 1, который будет подлежать исследованию на оптимальность.

Специальная структура задачи (2.1) позволяет в условиях повышенной гладкости эквивалентным образом переформулировать классический принцип максимума Понтрягина из [8; 9] и тем самым уточнить известные условия оптимальности. Для формулировки соответствующего результата нам потребуются следующие обозначения:

£ = (/ъ /2), /1 : К2" ^ К", /2 : К2" х Кт ^ К", и д : К" ^ К

5(Ж1(0)) < 0 и д(Ж1 (1)) < 0.

Го(х) := ^(Ж1),

и

Н(х, и, 0, Л) := (0, {(х, и)) + ^Г2(х, и) — А/0(х, и).

Здесь ф = (-01 , ф2) € (R2n)* (вектор-строка) и ц € R. Заметим, что Гд суть производная k-го порядка функции g в силу рассматриваемой дифференциальной системы, k = 0,1, 2. Конструкцию H называют функцией Гамильтона - Понтрягина второго порядка.

Определение 1. Скажем,, что процесс управления (x(-),u(-)) задачи (2.1) удовлетворяет принципу максимума, если найдутся число Л > 0, вектор-функция ф = (ф1,ф2) € W1;^([0,1]; (R2n)*) и скалярная функция Ц € W1;^([0,1]; R) такие, что

Ц(-) убывает и ц(1) = Ц(1) = 0,

и выполнены следующие условия:

0(t) = —Н^М^ф^ц^Л), (2.2)

(ф(0) - Цц(0)Г0(х(0)) + ц(0)Г1(х(0)), —ф(1)) € Ns(p), (2.3) max н(х(£),'и,ф(£),ц(£),Л) =

ueu (2.4) H(x(t), u(t), 0(t), Л) для п.в. t € [0,1],

/ g(X1 (t))d/i(t)=0, (2.5)

Jo

Л + |ф(0)| + |ц(0)| > 0. (2.6)

Здесь p = (x(0),x(1)), Ns(p) есть предельный нормальный конус к множеству S в точке p [7]; Ц — производная функции-множителя Лагранжа ц; обозначает пространство липшицевых функций.

Ясно, что в силу наложенных условий, функция Ц неотрицательна, а ц возрастает и неположительна.

Дифференциальное уравнение (2.2) известно как сопряженное уравнение. Условия (2.3)—(2.6) принято называть условиями трансверсальности, максимума, дополняющей нежесткости и нетривиальности, соответственно. Процесс управления, удовлетворяющий принципу максимума, называют экстремальным.

Всякий оптимальный процесс (x(-),u(-)) задачи (2.1) удовлетворяет принципу максимума. Кроме того, имеют место следующие факты, [6].

Замечание 1. Из условия (2.5) следует, что ц(-) есть линейная функция на любом отрезке времени [c, d], на котором g(x1 (t)) < 0 Vt € [c, d]. Таким образом, ц^) = а0 + a1(t — c), где a0 = ц(с) и a1 = Ц(с).

Замечание 2. Из условий (2.2), (2.4) и (2.5) вытекает закон сохранения:

maxH(x(t), u, 0(t), ц^), Л) — /i(t)r!(x(t)) = const Vt € [0,1]. (2.7)

u£U

Замечание 3. Рассмотрим произвольный набор множителей Лагран-жа (А, 0,^), с которым выполнен принцип максимума, и пусть а = (а, в) € К2. Тогда следующий набор множителей

(А, + аГ0 (х(£)) — (а + в)Г1(Х(£)),^(£) + + в) (2.8)

также удовлетворяет условиям (2.2), (2.4) и (2.5). Отметим, однако, что при такой замене условия (2.3) и (2.6) могут быть нарушены.

3. Леммы об оценках скачка ft

Рассмотрим вопрос об оценке величины

Af(to) := f(i0") - f(t+) > 0

в терминах значений A, ^(to),f(to) и f(t+) или ff(t-0) в некоторой заданной точке to € [0,1]. Точнее, вопрос состоит в нахождении условий, которые гарантировали бы, что сформулированный принцип максимума влечет равномерные оценки

Af (to) < const(A + №(io)| + |f(to)| + /f(t+))

и/или (3.1)

Af (to) < const(A + №(io)| + |f (to)| + /f(i0)),

где константа const не зависит от to. Такие оценки имеют очевидное прикладное значение для численной реализации принципа максимума и решения соответствующей краевой задачи, к которой можно свести его условия, см., например, [4; 5] и цитируемую там литературу. Ниже покажем, что подобным условием может выступать некоторое условие регулярности фазового ограничения — т.н. регулярность второго порядка или 2-регулярность.

Будем предполагать, что множество U имеет следующий вид:

U = {u € Rm : ф(и) < 0}, (3.2)

где ф : Rm ^ — заданная гладкая функция. Точку u € U назовем регулярной, если

dim € P(и)ф'(и) = |1 (u)|,

где I(u) := {i : фг(u) =0} — множество активных индексов; P(u) € Rqxq — диагональная матрица такая, что в позиции (i,i) стоит 1, если i € I(u) и 0 в противном случае; |M| — мощность множества M (в

нашем случае — количество элементов множества). Таким образом регулярность точки u означает, что градиенты активных компонент фг(и) функции ф в этой точке линейно независимы. Ниже будем считать, что все точки множества U регулярны. Дадим следующее

Определение 2. Фазовые ограничения задачи (2.1) называются 2-регулярными, если при любых ж, y € u € U равенства

g(x) = Г1 (ж, y) = Г2 (ж, y, u) = 0

влекут

(r2)U(x,y,u) € imP(и)ф'(и). (3.3)

Заметим, что условие из определения 2 носит глобальный характер и его проверка в конкретных примерах обычно не составляет труда.

Вернемся к оценкам (3.1). С прикладной точки зрения предпочтительной является ситуация, когда const = 0, т. е. функция Ц непрерывна. Этот факт удается установить в некоторых частных случаях.

Лемма 1. Пусть допустимый процесс (x(-),u(-)) удовлетворяет принципу максимума из определения 1, а (Л, ф, ц) — один из соответствующих наборов множителей Лагранжа. Предположим, что функции u ^ /2(х, u) и ф линейны, а фазовые ограничения 2-регулярны. Предположим также, что отображение I(u(t)) непрерывно в точке t0 € [0,1]. Тогда функция ц^) имеет производную в точке t = t0.

Доказательство. С учетом представления (3.2), применяя классическое правило множителей Лагранжа в задаче максимизации (2.4), получаем

HU(x(t), u(t), 0(t), Ц^), Л) = V(t^'(u(t)),

где v (t) > 0 - множитель Лагранжа, удовлетворяющий условию v(t) = v(t)P(u(t)). Отсюда и из определения функции H следует равенство

02(t)(/2)U(X(t),u(t)) = (Mt),V (t))

— (r2)U (x(t),u(t))

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

P (u(tM(u(t))

(3.4)

где ф = (фьф2), фк € Кга, к = 1,2. Заметим, что производные (/2)Ц, и ф' не зависят от и в силу предположения леммы, а функция Р(й(-)) постоянна в окрестности ¿о по определению. Умножая выражение (3.4) справа на соответствующую псевдообратную матрицу (это возможно в силу условия регулярности (3.3)), можно получить явное представление вектора (¿)). Тогда ясно, что степень гладкости функции предопределена степенью гладкости х(-) и ф(-). Однако последние функции дифференцируемы в точке ¿о- П

Если хотя бы одна из функций u ^ /2(х, u) и ф нелинейна, можно установить (непрерывную) дифференцируемость функции f (■) в предположении непрерывной дифференцируемости экстремального управления. Однако такое предположение является довольно жестким и не всегда отвечает практическим задачам. Например, подобное условие заведомо нарушено в задачах робототехники, потому что оно означает, что рывок непрерывен (т. е. физическая величина, определяемая как производная ускорения). Но рывок, как правило, разрывен в момент выхода траектории на границу допустимой области.

Тем не менее в нелинейном случае можно предложить оценку скачка производной f в момент касания границы допустимой области. Нам потребуются следующие дополнительные предположения:

Предположение 2. Управление u(-) кусочно-непрерывно.

Обозначим

To := {t € [0,1] : g(Xi (t)) = 0} и заметим, что для любого t € To выполнено равенство Ti(x(t)) = 0.

Предположение 3. Множество T0 является объединением конечного числа интервалов.

Моментом схода с границы допустимой фазовой области называется точка т € T0 такая, что g(x1 (т + е)) < 0 для всех достаточно малых е > 0. Если выполнено симметричное условие $(ж(т—е)) < 0 для достаточно малых е > 0, то говорят о моменте выхода на границу.

Для заданной функции w(t) обозначим через w(t+) = lim w(t) и

t—ут+

w(t-) = lim w(t) ее правый и левый односторонние пределы в точке т.

t— т-

Лемма 2. Пусть (x(-),u(-)) — экстремальный процесс задачи (2.1). Предположим, что фазовые ограничения 2-регулярны, и рассмотрим точку t0 € T0 схода с границы такую, что

r2(X(to), u+) = 0, u+ := u(t+). (3.5)

Тогда для любого набора множителей Лагранжа (А, ^,f), удовлетворяющего принципу максимума из определения 1, имеет место оценка

Af(t0) < C ■ |^(t0) — f(t-)g'(Xi(t0)) + f(t0)r1(x(t0))|, (3.6)

где константа C > 0 не зависит от (А,^,f).

Аналогично: если r2(x(t0),u-) = 0, u- := u(t-), и t0 есть точка выхода на границу, то имеет место оценка

A/i(t0) < C ■ ^(t0) — f (t+)g'(Xi(t0)) + f (t0)r1(x(t0)) . (3.7)

Доказательство. Получим оценку (3.6). В силу замечания 3, полагая а = — и в = — /(¿0) в выражении (2.8), имеем новый набор

множителей Лагранжа (А,ф^(^),

ф(*) = фф — ¿(¿-У (*(*)) + (М*-)(« — ¿0) + ^(¿о))г!(ж(^), |7(^)), /(¿) = /(¿) — А(*0 )(* — ¿о) — М*о)

со свойством /(¿0) = /(¿0) = 0. Таким образом, можем допустить без ограничения общности, что /(¿0) =0 и /х(¿0) = 0.

Обозначим с := Д//(£0) > 0. Из (3.4) вытекает неравенство

Иг)| = ф — ¿0) < К|ф2(г)| V 4 € [¿0, ¿0 + £0], (3.8)

где К, £0 > 0 — некоторые числа, которые существуют в силу условия 2-регулярности, условия (3.5) и предположений 2 и 3.

Применяя неравенство Гронуолла к уравнению (2.2), находим равномерную по £ € [¿0, ¿0 + £0] оценку

|ф(^)| < |ф(^0)| + [ «1|ф(в)| + [ «2Св^

2

где константы К1,К2 ограничивают нормы производных ££. и (Г2)Х Комбинируя эту оценку с (3.8) и полагая t = ¿0 + £0, имеем

Выбирая (достаточно малое) £0 из условия

£0 > К£0к2вК1£° (3.9)

и определяя С = приходим к неравенству (3.6). Остается лишь

заметить, что константа С в (3.6) не зависит от выбранного набора множителей Лагранжа.

Оценка (3.7) устанавливается по аналогии. □

Для применения полученной оценки в контексте численных методов необходимо знать константу С. Покажем, что при некоторых дополнительных предположениях эту константу можно вычислить явно. Для этого удобно ввести понятие зоны регулярности: положим

Ф(х,и) := тах ((^(х, и), (3.10)

¿€кег Р(и)ф'(и), Н = 1

где максимум по пустому множеству полагается равным нулю. Легко видеть, что $(£,u) > 0. Зоной регулярности в задаче (2.1) назовем множество точек

M(5) := {(£,u) € R2n х U : $({,u) >

где число 5 > 0 играет роль параметра.

Рассмотрим экстремальный процесс управления (x(-),u(-)) и определим константы

Ki = max Ifi(x(t),u(t))L к2 = max |(r2)X(x(t),uz(t))|, te[o,i] 4 1 ie[o,ir 1

к3 = max |fU(x(t),u(t))L te[o,iy u 1

Если множества U и S компактны, а f удовлетворяет условию под-линейного роста по x, то константы кг, i = 1, 2, 3, оцениваются сверху некоторой универсальной величиной к > 0, общей для всех допустимых значений x, u.

Лемма 3. Предположим, что (x(t),u(t)) € M(5) Vt € To для некоторого 5 > 0. Пусть r* означает минимально возможное расстояние между двумя последовательными точками стыка,1 и пусть s* означает единственный положительный корень уравнения

s(«i + KK2eK1s)

= 1,

где К = 1. Тогда в качестве константы С из леммы 2 можно выбрать величину

2КеК1Т*

Доказательство. В случае, когда исследуемая экстремаль полностью содержится в зоне регулярности, константу К в доказательстве леммы 2 можно выбрать равномерной по времени и вычислить ее следующим образом.

Умножая (3.4) на вектор доставляющий максимум в (3.10),

получим

(МЪШ'иШМг)),^ (*)'

Тогда

и K = к3 5 1.

$(x(t),u(t)) |f(t)|< K35o1|^(t)|

1 Если таких двух точек не существует, полагаем rt :=

Как следует из доказательства леммы 2, наилучшее (в смысле точности получаемой оценки) значение С есть минимум скалярной функции

2КеК15

7(в) =

2в — Кк2в2еК15

на интервале в € [0, шт{г*, во}], где во - единственный положительный корень уравнения

Кк2веК15 = 2.

Действительно, оценка (3.8) устанавливается на интервале [¿0, ¿о + £о], на котором — линейная функция, и, как следует из (3.9), е0 < в0. Заметим, что в* < во, и кроме того, 7;(в*) = 0. Тогда по построению функции 7, в* — точка ее минимума на (0, во), которая и определяется выражением (3.11). □

4. Заключение

Предложены некоторые уточнения к общей формулировке принципа максимума Понтрягина в задачах с фазовыми ограничениями, касающиеся поведения соответствующей функции-множителя Лагранжа. Естественное приложение полученных результатов можно найти в области непрямых численных методов на основе приближенного решения краевой задачи принципа максимума. Разработка такого метода, учитывающего найденные явные оценки, и его применение к модельным задачам робототехники станет предметом последующих исследований.

Автор выражает признательность М.В.Старицыну за внимание к работе и ряд ценных замечаний.

Список источников

1. Arutyunov A. Optimality Conditions: Abnormal and Degenerate Problems. Dordrecht : Springer, 2000.

2. Arutyunov A. V., Karamzin D. Yu. A Survey on Regularity Conditions for State-Constrained Optimal Control Problems and the Non-degenerate Maximum Principle // Journal of Optimization Theory and Applications. 2020. Vol. 184, N 3. P. 697-723.

3. Arutyunov A. V., Karamzin D. Yu., Pereira F. L. Investigation of Controllability and Regularity Conditions for State Constrained Problems // IFAC-PapersOnLine. 2017. Vol. 50, N 1. P. 6295-6302.

4. An indirect numerical method for a time-optimal state-constrained control problem in a steady two-dimensional fluid flow / R. Chertovskih, D. Karamzin, N. T. Khalil, F. L. Pereira // 2018 IEEE/OES Autonomous Underwater Vehicle Workshop. 2018. P. 1-6.

5. An Indirect Method for Regular State-Constrained Optimal Control Problems in Flow Fields / R. Chertovskih, D. Karamzin, N. T. Khalil, F. L. Pereira // IEEE Transactions on Automatic Control. 2021. Vol. 66, N 2. P 787-793.

6. Karamzin D. Yu., Pereira F. L. On Higher-Order State Constraints //SIAM Journal on Control and Optimization. 2023. Vol. 61, N 4. P. 1913-1933.

7. Mordukhovich B. Sh. Maximum principle in the problem of time optimal response with nonsmooth constraints // Journal of Applied Mathematics and Mechanics. 1976. Vol. 40, N 6. P. 960-969.

8. Neustadt L. W. An Abstract Variational Theory with Applications to a Broad Class of Optimization Problems. II. Applications // SIAM Journal on Control. 1967. Vol. 5, N 1. P. 90-137.

9. The Mathematical Theory of Optimal Processes. Interscience / L. S. Pontryagin, V. G. Boltyanskii, R. V. Gamkrelidze, E. F. Mishchenko. New York, 1962.

10. Numerical Recipes: The Art of Scientific Computing / W. H. Press, S. A. Teukolsky, W. T. Vetterling, B. P. Flannery. Cambridge University Press. New York, 2007.

References

1. Arutyunov A. Optimality Conditions: Abnormal and Degenerate Problems. Springer Dordrecht, 2000.

2. Arutyunov A.V., Karamzin D.Yu. A Survey on Regularity Conditions for State-Constrained Optimal Control Problems and the Non-degenerate Maximum Principle. Journal of Optimization Theory and Applications, 2020, vol. 184, no. 3, pp. 697-723.

3. Arutyunov A.V., Karamzin D.Yu., Pereira F.L. Investigation of Controllability and Regularity Conditions for State Constrained Problems. IFAC-PapersOnLine, 2017, vol. 50, no. 1, pp. 6295-6302.

4. Chertovskih R., Karamzin D., Khalil N.T., Pereira F.L. An indirect numerical method for a time-optimal state-constrained control problem in a steady two-dimensional fluid flow. 2018 IEEE/OES Autonomous Underwater Vehicle Workshop, 2018, pp. 1-6.

5. Chertovskih R., Karamzin D., Khalil N.T., Pereira F.L. An Indirect Method for Regular State-Constrained Optimal Control Problems in Flow Fields. IEEE Transactions on Automatic Control, 2021, vol. 66, no. 2, pp 787-793.

6. Karamzin D.Yu., Pereira F.L. On Higher-Order State Constraints. SIAM Journal on Control and Optimization, 2023, vol. 61, no. 4, pp. 1913-1933.

7. Mordukhovich B.Sh. Maximum principle in the problem of time optimal response with nonsmooth constraints. Journal of Applied Mathematics and Mechanics, 1976, vol. 40, no. 6, pp. 960-969.

8. Neustadt L. W., An Abstract Variational Theory with Applications to a Broad Class of Optimization Problems. II. Applications. SIAM Journal on Control, 1967, vol. 5, no. 1, pp. 90-137.

9. Pontryagin L.S., Boltyanskii V.G., Gamkrelidze R.V. and Mishchenko E.F. The Mathematical Theory of Optimal Processes. Interscience, New York, 1962.

10. Press W.H., Teukolsky S.A., Vetterling W.T., Flannery B.P. Numerical Recipes: The Art of Scientific Computing. Cambridge University Press, New York, 2007.

Об авторах

Карамзин Дмитрий Юрьевич,

д-р физ.-мат. наук, ведущий научный сотрудник, Федеральный исследовательский центр «Информатика и управление» РАН, Москва, 119333, Российская Федерация; ведущий научный сотрудник, Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, 664033, Российская Федерация, dmitry_karamzin@mail.т, https: //orcid.org/0000-0001-6579-4276

About the authors Dmitry Yu. Karamzin, Dr. Sci.

(Phys.-Math.), Leading Researcher, Federal Research Center "Computer Science and Control" RAS, 119333; leading researcher, Matrosov Institute for System Dynamics and Control Theory SB RAS, Irkutsk, 664033, Russian Federation, dmitry_karamzin@mail.ru, https: //orcid.org/0000-0001-6579-4276

Поступила в 'редакцию / Received 12.03.2024 Поступила после рецензирования / Revised 06.05.2024 Принята к публикации / Accepted 13.05.2024

i Надоели баннеры? Вы всегда можете отключить рекламу.