Том 25, № 131 2020
© Кутерин Ф.А., 2020
DOI 10.20310/2686-9667-2020-25-131-263-273
УДК 517.977.5
К вопросу о регуляризации классических условий оптимальности в выпуклой задаче оптимального управления
е фазовыми ограничениями
Фёдор Алексеевич КУТЕРИН
ФГБНУ «Федеральный исследовательский центр Институт прикладной физики
Российской академии наук» 603950, Российская Федерация, г. Нижний Новгород, ул. Ульянова, 46, БОКС-120
On the regularization of classical optimality conditions in a convex optimal control problem with state constraints
Fedor A. KUTERIN
Federal Research Center Institute of Applied Physics of the Russian Academy of Sciences 46 Ul'yanov St., Nizhny Novgorod 603950, Russian Federation
Аннотация. Рассматривается регуляризация классических условий оптимальности в выпуклой задаче оптимального управлении для линейной системы обыкновенных дифференциальных уравнений с поточечными фазовыми ограничениями типа равенства и неравенства, понимаемыми как ограничения в гильбертовом пространстве суммируемых с квадратом функций. Множество допустимых управлений задачи по традиции вкладывается также в пространство суммируемых с квадратом функций. Однако целевой функционал оптимизационной задачи не является, вообще говоря, сильно выпуклым. Получение регуляризованных классических условий оптимальности основано на приеме, связанном с использованием двух параметров регуляризации. Один из них «отвечает» за регуляризацию двойственной задачи, другой же содержится в сильно выпуклом регуляризирующем добавке к целевому функционалу исходной задачи. Основное предназначение получаемых регуляризованных принципа Лагранжа и принципа максимума Понтрягина — устойчивое генерирование минимизирующих приближенных решений в смысле Дж. Варги для целей практического решения рассматриваемой задачи оптимального управлений с поточечными фазовыми ограничениями.
Ключевые слова: оптимальное управление; фазовые ограничения; некорректные задачи; двойственная регуляризация
Благодарности: Работа выполнена при поддержке РФФИ (проекты № 20-01-00199_а, № 19-07-00782_а) и Министерства науки и высшего образования Российской Федерации (договор № 075-02-2020-1632 от 12 мая 2020 г.).
Для цитирования: Кутерин Ф.А. К вопросу о регуляризации классических условий оптимальности в выпуклой задаче оптимального управления c фазовыми ограничениями // Вестник российских университетов. Математика. 2020. Т. 25. № 131. С. 263-273. DOI 10.20310/2686-9667-2020-25-131-263-273.
Abstract. We consider the regularization of classical optimality conditions in a convex optimal control problem for a linear system of ordinary differential equations with pointwise state constraints such as equality and inequality, understood as constraints in the Hilbert
space of square-integrable functions. The set of admissible task controls is traditionally embedded in the space of square-integrable functions. However, the target functional of the optimization problem is not, generally speaking, strongly convex. Obtaining regularized classical optimality conditions is based on a technique involving the use of two regularization parameters. One of them is used for the regularization of the dual problem, while the other is contained in a strongly convex regularizing addition to the target functional of the original problem. The main purpose of the obtained regularized Lagrange principle and the Pontryagin maximum principle is the stable generation of minimizing approximate solutions in the sense of J. Varga for the purpose of practical solving the considered optimal control problem with pointwise state constraints.
Keywords: optimal control; state constraints; ill-posed problem; dual regularization
Acknowledgements: The work is partially supported by the Russian Foundation for Basic Research (projects no. 20-01-00199_a, no. 19-07-00782_a) and Ministry of Science and Higher Education of the Russian Federation (contract no. 075-02-2020-1632 from 12 May 2020).
For citation: Kuterin F.A. K voprosu o regulyarizatsii klassicheskikh usloviy optimal'nosti v vypukloy zadache optimal'nogo upravleniya c fazovymi ogranicheniyami [On the regula-rization of classical optimality conditions in a convex optimal control problem with state constraints]. Vestnik rossiyskikh universitetov. Matematika - Russian Universities Reports. Mathematics, 2020, vol. 25, no. 131, pp. 263-273.
DOI 10.20310/2686-9667-2020-25-131-263-273. (In Russian, Abstr. in Engl.)
Введение
Работа посвящена регуляризации принципа Лагранжа (ПЛ) и принципа максимума Понтрягина (ПМП) в выпуклой задаче оптимального управления для линейной системы обыкновенных дифференциальных уравнений с поточечными фазовыми ограничениями типа равенства и неравенства. Множество допустимых управлений задачи по традиции вкладывается в пространство суммируемых с квадратом функций, однако, ее целевой функционал не является, вообще говоря, сильно выпуклым. Основное предназначение доказываемых в работе регуляризованных классических условий оптимальности (КУО) — устойчивое по отношению к погрешностям исходных данных задачи конструирование минимизирующих приближенных решений (МПР) в смысле Дж. Варги [1, гл. III].
Задачи, совпадающие по форме своих постановок с изучаемой в данной работе, а также и более общие подобные нелинейные задачи рассматривались с точки зрения получения КУО во многих публикациях на протяжении более чем пяти десятков лет. В частности, весьма полную библиографию, посвященную публикациям по теории ПМП в задачах оптимального управления системами обыкновенных дифференциальных уравнений с поточечными фазовыми ограничениями, можно найти в [2,3]. Отличительной особенностью данной работы, по сравнению с указанными публикациями, является учет возможного неточного задания исходных данных оптимизационной задачи и, как следствие, учет ее возможной неустойчивости, а также и соответствующей возможной неустойчивости КУО. Примеры неустойчивости КУО в задачах оптимального управления с поточечными фазовыми ограничениями-равенствами могут быть найдены в [4-6].
Первые результаты по регуляризация КУО в задачах условной выпуклой оптимизации в гильбертовых пространствах были получены в работах [4,7,8]. В их основе лежат
методы двойственной регуляризации [9]. Задачи оптимального управления линейными системами обыкновенных дифференциальных уравнений с поточечными фазовыми ограничениями, близкие, так или иначе, по постановкам задаче данной работы, рассматривались в [7,10,11]. Их отличительной особенностью является то, что фазовые ограничения во всех этих работах понимаются как ограничения в пространстве суммируемых с квадратом функций. При этом в [7] задача с фазовыми ограничениями рассматривалась при точном задании исходных данных, а в [11, 12] в ограничениях задачи отсутствовали фазовые ограничения-неравенства.
Настоящая работа непосредственно опирается на результаты работ [9,10]. Постановка задачи в ней совпадает с постановкой задачи в [10], однако результаты этой работы и [10] существенно разнятся благодаря разнице методов их получения. Как в [10], так и в данной работе выпуклый целевой функционал задачи не является, вообще говоря, сильно выпуклым. Указанная разница в методах получения результатов в [10] ив данной работе состоит в следующем. В [10] МПР конструируется из точек минимума функции Лагранжа задачи, соответствующих значениям двойственных переменных из некоторой последовательности, определяемой регуляризованными КУО. В отсутствие сильной выпуклости целевого функционала, при ограниченном множестве допустимых элементов, гарантируется лишь существование элемента МПР в соответствующем множестве минималей выпуклой по прямой переменной функции Лагранжа. Как следствие, генерирование МПР в силу регуляризованных КУО в такой ситуации в существенной степени теряет свою конструктивность. Для преодоления этого недостатка [10] в данной работе, как и в аналогичном случае в [9], вместо одного используются два параметра регуляризации. Один из них, как и в [7,10,11], «отвечает» за регуляризацию двойственной задачи, другой же содержится в сильно выпуклом регуляризирующем добавке к целевому функционалу исходной задачи. Таким образом, исходная задача с фазовыми ограничениями аппроксимируется семейством задач, в каждой из которых целевой функционал задачи является сильно выпуклым, и, соответственно, сильно выпуклой по прямой переменной является и ее функция Лагранжа.
Применяемый в данной работе прием, связанный с использованием двух параметров регуляризации, может быть эффективен и при получении регуляризованных КУО в итерационной форме [11-13] в рассматриваемой задаче оптимального управления с поточечными фазовыми ограничениями, однако вопросы итеративной двойственной регуляризации в данной работе не рассматриваются. Численные эксперименты по применению регуляризованных КУО в задачах бесконечномерной условной оптимизации, в том числе и в задачах оптимального управления, рассматривались ранее в [12-15].
1. Постановка задачи
Рассматривается выпуклая задача оптимального управления с поточечными фазо-
выми ограничениями типа равенства и неравенства, понимаемыми как ограничения в гильбертовом пространстве Н = Ь2(Х)
т
¡6 (и) = у (г)х& [п](ь),х6 [п](ь)) + <Сг (ь)п{г),п(ь))) <и ^ шт, и (Р&)
0
Я?(и)(Ь) = «(¿),х?[и](Ь)> = к?(Ь), я?(и)(Ь) = <(*,х?^ 0 при п. в. Ь € X.
Здесь: /? : ¿2(0,Т) ^ К1 — непрерывный выпуклый функционал с измеримыми по Лебегу неотрицательными ограниченными матрицами Р? : [0,Т] ^Кгахга, О? : [0,Т] ^ Ктхга, V С ¿2(0,Т) — допустимое множество, Р = € ¿2(0,Т): и(Ь) € и при п. в. Ь €
(0,Т)}, и С — выпуклый компакт, X С [0,Т], X = с1 X, X[и](Ь), Ь € [0,Т] — решение задачи Коши
х = А?(Ь)х + В?(Ь)и(Ь), х(0) = € Ь € [0,Т], (1.1)
с измеримыми по Лебегу ограниченными матрицами А? : [0,Т] ^ кпхп, в? : [0,Т] ^ Кпхт, <1, к? € ) — заданные функции, < : X х ^ К1 — непрерывная вы-
пуклая по х при всех Ь € X функция, удовлетворяющая условию |<2(Ь, х) — <2(Ь,у)| ^ ¿м|х — у| Vх,у € Б'М = {^ € : |г| ^ М}, где постоянная Ьм не зависит от Ь € X.
Верхний индекс 5 в исходных данных задачи (Р?) означает, что эти данные соответствуют либо ситуации их точного задания (5 = 0), либо являются возмущенными (5 > 0), т. е. задаются с ошибкой, 5 € [0, 50], 50 > 0 — некоторое фиксированное число.
Будем считать, что выполняются следующие оценки для отклонений возмущенных исходных данных задачи
11^? — Р0|2,(0;Т) ^ С5, ||С? — С0|2,(0;Т) ^ С5, ||< — ^ С5, ||к? — к0|Ь,х ^ С5, (1.2)
|<2(Ь,х) — <2(Ь,х)| ^ См5 V(Ь,х) € X х Бпм,
||А? — А0|и;(о)Т) ^ С5, ||В? — В0Щ(о,т) ^ С5, |х0 — х0| ^ С5,
где С, См > 0 не зависят от 5.
Тогда на основании оценок (1.2) отклонения возмущенных исходных данных от точных, глобальной разрешимости задачи Коши (1.1) и равномерной по 5 € [0,50], и € V ограниченности ее решений можно утверждать, что
|/?(и) — /0(и)| ^ С15 ^ € V, (1.3)
||я1 (и) — я0(и)|2,х ^ С25(1 + ||и12,(о,т)) Vu € ¿2(0,Т), ||к? — к01|2,Х ^ С5,
||я2(и) — Яо(и) ||2,х ^ Сз5 Vu € V,
где постоянные С1, С2, С3 > 0 не зависят от 5 € (0,50], и € ¿2(0,Т).
Замечание 1.1. При определенных условиях на исходные данные задачи (Р ?) ее ограничения можно, естественно, трактовать и как ограничения в ) (<1, к €
¿те^)) и С(X) (<1, к € С(X)). При этом понятия оптимальности управления в указанных частных случаях эквивалентны понятию оптимальности для случая «тех же» ограничений в ).
Целью настоящей работы является конструирование минимизирующего приближенного решения в задаче (Р0) в смысле Дж. Варги при условии, что мы располагаем лишь приближенно известными с ошибкой 5 исходными данными. Напомним, что под МПР понимается такая последовательность иг € V, г = 1, 2,..., для которой справедливы
соотношения f 0(иг) ^ ß + $г, иг G D0€i для некоторых последовательностей сходящихся к нулю неотрицательных чисел $г, ег, i = 1, 2,.... Здесь ß — обобщенная нижняя грань, определяемая соотношениями
в = в+0 = lim во & = inf f°(u), в€ = если D0€ = 0,
е^+0 u€V0e
D2€ = {u G D : ||g2(u) - h2||2,x ^ e, min ||g2(u) - z||2,x ^ e}, e ^ 0,
zeH-
H- = {z G L2(X) : z(t) ^ 0 при п.в. t G X}, D00 = D0.
Очевидно, в общей ситуации в ^ в0, где во — классическое значение задачи. Но в случае поставленной выше задачи (P0) имеет место равенство в = во.
Пусть решение задачи (P0) (единственное, в случае строгой (сильной) выпуклости f0) существует. Будем обозначать множество всех таких решений U0 = {u* G D0 :
f0(u*) = min f0(u)}, а решение с минимальной нормой — через u0. Очевидно, задача uev0
(P0) заведомо разрешима, если D0 = 0.
Введем регулярный функционал Лагранжа L2(u,A,^) = f2(u) + (A,$2(u) — h2) +
(u)/, вогнутый двойственный функционал V2(A,^) = inf L2(u,A,^), (A,^) GHxH
«SD
и соответствующую двойственную задачу V2(A,^) ^ sup, (A,^) G H x H+.
В силу ограниченности множества D двойственный функционал V2, очевидно, определен и конечен для любого элемента (A, G H x H. При этом, также очевидно, значение V2(A, достигается на элементах u2[A,^] из множества U2[A, = Argmin{L2(u,A,ju), u G D} при (A,^) G H x H+, где H+ = {zGL2(X): z(t) ^ 0 при п. в. t G X} .
2. Аппроксимация выпуклой задачи задачами с сильно выпуклыми
функционалами цели
С целью построения МПР в исходной выпуклой задаче (P0), действуя, как в работе [9] в случае линейно-выпуклой задачи с конечным числом функциональных ограничений типа неравенства, введем семейство регуляризованных задач
/(u) = /2(u) + y||u||2 ^ min, u G D, (P2)
g2(u)(t) = <^(t),x2[u](t)> = h2(t), g2(u)(t) = ^2(t,x2[u](t)) ^ 0 при п.в. t G X.
При каждом y > 0 задача (P2) является задачей с сильно выпуклым функционалом /2 с постоянной сильной выпуклости y/2, так как сумма выпуклого и сильно выпуклого функционала является сильно выпуклым функционалом. Отметим также, что функционал / 2 является субдифференцируемым, так как он выпуклый и дифференцируемый (как квадратичный).
Обозначим через (u0 = u0 — нормальное решение исходной выпуклой задачи (P0) = (PQ )) единственное решение задачи (PQ). Тогда по теореме о сходимости метода стабилизации Тихонова (см. [16, Глава 9, §4, Теорема 1]) имеет место сходимость
||u° - u0|| ^ 0, y ^ 0. (2.1)
Определим регулярный функционала Лагранжа задачи (Pf) L^(u,A, = ff(u) + Y||u||2 + (A, gi(u) — hf) + (^,gf(u)), и соответствующую двойственную задачу
Vf (А,^) ^ sup, (A,ju) GHxH+) Vf (A,ju) = inf LY (u, A,ju), (A,ju) gHxH.
Y Y «eD y
Вследствие сильной выпуклости по u, минимум функционала Лагранжа L^(•, А,
достигается в единственной точке uY[А, = argmin Li*,(u, А,^) при (A,^) G H x H+.
Y «eD Y
Ниже нам понадобится оценка отклонения значения двойственного функционала возмущенной регуляризованной задачи от двойственного функционала невозмущенной задачи.
Лемма 2.1. В случае ограниченного множества D справедлива оценка
|Vf(A,0) — V°(A,^)| ^ K(5(1 + ||(A,^)||) + y), (2.2)
в которой постоянная K > 0 зависит от maxi lull, а также констант C, Ci, C2,
«eD iii
C3 соотношений (1.3) и не зависит от 5, y, (А, G H x H+.
Доказательство. Предположим без ограничения общности рассуждений, что Vf (A, ^ V°(A, В этом случае, используя оценки (1.3), можем записать:
Vf (А,^) — V°(A,^) = Vf (A,^) — inf (L°(u,A,^) — LY(u, A,^) + LY(u, A,^)) ^ ' «eD
^ — inf (L°(u, A,— lY(u,A,^)) ^ sup |lY(u, A,— L°(u,A,^)| ^ K(5(1+ ||(A,^)||) + y)
«eD «eD
Обозначим через (А^'а, единственное в H x H+ решение задачи максимизации
Pf^A,^) = Vf (A,^) — a||(A,^)||2 ^ max, (A,^) G H x H+.
Пусть выполняется условие согласования 5/а(5) ^ 0, а(5) ^ 0, 5 ^ 0.
Применим здесь теорему 1 из [10], представляющую собой теорему сходимости метода двойственной регуляризации для задачи (P°) с выпуклым целевым функционалом. Так как целевой функционал задачи (Pf) является сильно выпуклым при y > 0, то множество решений каждой такой задачи при y > 0 состоит из единственного элемента uf7 = uYY [A7a(f) ]. Поэтому теорема 1 из [10] приобретает при каждом y > 0 следующий вид.
Теорема 2.1. Вне зависимости от того, разрешима или нет двойственная к (P°) задача, при каждом y > 0 имеют место соотношения
a(5)|(Aia(2),^ia(2))l^ 0, f°(uÔ7) ^ minf°(u) = f?K), 5 ^ 0,
g°(uÔ7) — h° ^ 0, g°(uÔ7) ^ ф(5, y), Ф(5, y) ^ 0, ||0(5,y)|| ^ 0, 5 ^ 0,
((А^'а(0)), (gf (uf7) — hf ,gf (uÔ7))> ^ 0, 5 ^ 0.
При этом, так как функционал f° является субдифференцируемым в смысле выпуклого анализа, справедливо и предельное соотношение uf7 ^ u°, 5 ^ 0.
Следствием этой теоремы и предельного соотношения (2.1) является
Теорема 2.2. Вне зависимости от того, разрешима или нет двойственная к (Р°) задача, существует такая зависимость £(7), £(7) ^ 0, 7 ^ 0, что имеют место соотношения
а(£(7))||(А7,/}7)|Н 0, /°(и7) ^ шт /°(и) = /°(и°), 7 ^ 0,
д°(и7) - ^ 0, д°(и7) ^ ф(£(7),7), Ф(£(7),7) ^ 0, ||ф(£(7),7)||^ 0, 7 ^ 0, <(А7,/а7), (д^(и7) - (и7))> ^ 0, 7 ^ 0,
где (А7,/а7) = (Л^)'а(г(-г)),/^(7)'а(г(7))), щ = и?7)[А?7)'а(й(7)),/?7)'а(й(7))]. Одновременно справедливо и предельное соотношение и7 ^ и°, 7 ^ 0.
3. Регуляризованные принцип Лагранжа и принцип максимума Понтрягина
В настоящем разделе сформулируем и докажем необходимые и достаточные условия существования МПР в задаче (Р°). Эти условия можно трактовать, соответственно, как регуляризованные принцип Лагранжа и принцип максимума Понтрягина в задаче оптимального управления с поточечными фазовыми ограничениями, целевой функционал которой является выпуклым, но, вообще говоря, не сильно выпуклым.
Регуляризованный принцип Лагранжа. Справедлива следующая теорема — регуляризованный принцип Лагранжа в задаче (Р°).
Теорема 3.1. Пусть 7к > 0, 7к ^ 0, к ^ то — произвольная фиксированная последовательность. Для существования МПР в задаче (Р°) , в независимости от фактов существования или несуществования решения двойственной к (Р°) задачи, необходимо и достаточно, чтобы существовали последовательность £к > 0, £к ^ 0, к ^ то и последовательность двойственных переменных (Ак ,/к) бНх Н+, к = 1, 2,..., такие, что £к||(Ак,/к)|| ^ 0, к ^ то, и выполнялись предельные соотношения
[Ак,/к] € , ек ^ 0, к ^ то, (3.1)
<(Ак,/к), (д?(и^к[Лк,/к]) - ^,дГ«к[Лк,/к]))> ^ 0, к ^ то. (3.2)
При этом последовательность и^ [Ак,/к], к = 1, 2,..., является искомым МПР и каждая его слабая предельная точка есть решение задачи (Р°). В качестве последовательностей £к, (Ак,/к), к = 1, 2,..., могут быть взяты последовательности £(7к), (Ау7 ),а(г(т )),/^17 ),а(г(т ))), к = 1, 2,..., генерируемые методом двойственной регуляризации теоремы 2.2 при 7 = 7к. Для них справедливо предельное соотношение
<k[А«?^^ k^))] — u°, k — то. (3.3)
Одновременно с предельными соотношениями (3.1), (3.2) выполняется и предельное соотношение
V°(Ак) — sup V°(A,^), k —у то. (3.4)
Замечание 3.1. В силу ограниченности множества Р условие (3.1) можно заменить условием и^к [Ак,/к] € Р°е , где Лк ^ 0, к ^ то.
Доказательство. Для доказательства необходимости условий теоремы, прежде всего, заметим, что задача (Р°) разрешима, т. е. и° = 0, благодаря условиям на исходные данные и существованию МПР. Теперь включение (3.1) и предельное соотношение (3.2), а также предельное соотношение £к||(Ак,/к)|| ^ 0, к ^ то, теоремы вытекают из соотношений теоремы 2.2 с учетом ограниченности Р, если в качестве последовательности £к, к = 1, 2,..., и точек (Ак,/к), и^к[Ак,/к] взять поИ к\ 7 1 о ^¿(тк ),«(^(тк)) ¿(тк ),«(^(тк))\ ~ N следовательность £(7к), к = 1, 2,..., и точки (Ау/ ,/к ) = (Лк,/к),
Д^к) Г\. = „~. ^ - 10 ™™ТТТТ,Л „ щк
,,к
и^ )[Лк,/к] = ик, к = 1, 2,..., соответственно, с 7к ^ 0, к ^ то. Покажем, что,
одновременно с соотношениями (3.1), (3.2), выполняется и сходимость (3.4). Можем записать
<к(7 )(Лк,/к) = /<^к)(ик) + 7к||ик||2 + <(Лк,/к), (д?7 )(ик) - ь'(Лд2(7 )(ик))>.
Тогда в силу (3.2) получаем, что У"^7 )(Лк,/к) - /й(тк)(ик) ^ 0, к ^ то, откуда в силу ограниченности допустимого множества Р и предельного соотношения (см. теорему 2.2) /°(ик)^/°(и°), к ^ то, следует, что /г(^к)(ик)^/°(и°), к ^ то. Таким образом, справедливо предельное соотношение )(Лк,/к) ^ /°(и°), к ^ то. Но тогда, пользуясь оценкой (2.2) и условием согласования £к||(Ак,/к)|| = £(7к)||(Лк,/к)|| ^ 0, к ^ то, получаем окончательно равенство (3.4).
Для доказательства достаточности заметим, прежде всего, что множество и° не пусто ввиду включения и^к [Ак ,/к] € Рг кек, ограниченности Р и условий на исходные данные задачи (Р°). Далее, так как иг \ [Ак,/к] минимизирует функционал кк (., Ак,/к), можем записать
/йк«к[Ак,/к])+ 7к||и^к[Ак,/к]||2 + <(Ак,/к), (д1к«к[Ак,/к]),д£к(и£[Ак,/к]))>
^ /к(и) + 7к||и||2 + <(Ак,/к), (д1к(и),д2 к(и))> Vи € Р. В силу условий теоремы отсюда следует, с учетом ограниченности Р, что
/к(и£[Ак,/к]) ^ /к(и) + <(Ак,/к), (д1к(и),д2к(и))> + Vи € Р, ^ ^ 0, к ^ то.
Положим здесь и = и° € и° и используем условие согласования £к ||(Ак,/к)|| ^ 0, к ^ то. Тогда получаем /°(иук [Ак,/к]) ^ /°(и°) + /, / ^ 0, к ^ то. Так как одновременно мы имеем включение иук [Ак ,/к] € Р кек, то, используя классические свойства слабой компактности ограниченного выпуклого замкнутого множества и слабой полунепрерывности снизу непрерывного выпуклого функционала в гильбертовом пространстве, получаем, что /°(иук [Ак,/к]) ^ /°(и°), к ^ то, то есть последовательность и£ [Ак,/к], к = 1, 2,..., является МПР в задаче (Р°). Последнее предельное соотношение в совокупности с (3.2) приводят, в свою очередь, к предельному соотношению ,/к) ^ /°(и°), к ^ то. Далее, так как благодаря оценке (2.2) и предельному
соотношению 5к||(Ак)|| ^ 0, к ^ то, можно утверждать, что справедливо предельное соотношение (Ак) — V0(Ак) ^ 0, к ^ то, то получаем, окончательно, предельное соотношение (3.4).
Регуляризованный принцип максимума Понтрягина. При каждых 5 > 0, 7 > 0, (А,^) € Н х Н+ рассмотрим задачу минимизации
LY ^ inf, u GD, (Л,^) GHxH+. (3.5)
Для ее решения может быть использован классический принцип максимума Понтрягина в простейшей (только с геометрическими ограничениями) задаче оптимального управления [17, § 4.2]. При этом предположим в дополнение к условиям на исходные данные задачи (P5), что существует непрерывный на X x градиент Vx^2 функции
Введем стандартное обозначение Щ(t,x, u, Л^), ^(t)) = (t)x + B5(t)u) —
((F5(t)x,x) + (G5(t)u,u) + 7<u,u>) — Л(^((^),х) — h5(t)) — ju(t)^(t,x) при Л, ^ G L2(X). Здесь и ниже в случае, если функции Л, ^ G L2(X) рассматриваются на всем временном интервале [0, T], то полагается, что Л(£) = ^(t) = 0 при t G [0,T] \X и одновременно для этих функций, рассматриваемых на более широком интервале, сохраняется прежнее обозначение. Формально полагаем также, что <$2(t,x) = 0, Vx<^2(t,x) = 0 при t G [0,T] \ X. Справедлива [17, § 4.2]
Лемма 3.1. Как элемент, минимизирующий при дополнительном предположении существования непрерывного градиента Vx^2 выпуклый регулярный функционал Лагранжа LY(-,Л,^) на множестве D, управление uY[Л, при (Л, G H x H+ удовлетворяет принципу максимума Понтрягина в задаче (3.5), т.е. удовлетворяет при u = uY [Л, соотношению максимума при п.в. t G [0,T]
Щ (t, x5 [u](t), u(t), ^(t), Л^), ju(t)) = max Щ (t, x5 [u](t), v, ^(t), Л^), ^(t)), (3.6)
где ^(t), t G [0,T] — решение сопряженной задачи
V> = —VxH^(t,x5[u](t), u(t), v, Л^), ^(t)), ^(T) = 0 (3.7)
при u = uY [Л, И, обратно, очевидно, в силу выпуклости задачи (P0) любой элемент u gD, удовлетворяющий вместе с некоторыми (Л, G H x H+ соотношениям (3.6), (3.7), совпадает с элементом uY[Л,^].
Обозначим через [/7т[Л,^] множество всех управлений из D, удовлетворяющих ПМП в задаче (3.5) при сформулированном выше дополнительном условии существования непрерывного градиента Vx^2. Очевидно, в нашем случае, благодаря сильной выпуклости ¿Y(•, Л, , это множество состоит из одного элемента [/7)т[Л,^] = ^>т[Л,^], и справедливо равенство = uY[Л,^]. С учетом леммы 3.1 утверждение теоремы
3.1 может быть переписано в форме регуляризованного ПМП.
Теорема 3.2. Пусть Yk > 0, Yk ^ 0, k ^ то — произвольная фиксированная последовательность. Для существования МПР в задаче (P0), в независимости от фактов существования или несуществования решения двойственной к (P0) задачи, необходимо и достаточно, чтобы существовали последовательность 5fc > 0,
5к — 0, k — то и последовательность двойственных переменных (Ак ) бНх H+, k = 1, 2,..., такие, что 5к||(Ак)|| — 0, k — то, и выполнялись предельные соотношения (3.1), (3.2) с заменой uу[Ак,^к] на Uy! т[Ак] (т. е. с заменой на элементы, удовлетворяющие принципу максимума Понтрягина (3.6) при 5 = 5к, 7 = 7к, (А,^) = (Ак) ). При этом последовательность Uy т[Ак], k = 1, 2,..., является искомым МПР, и каждая его слабая предельная точка есть решение задачи (P°). В качестве последовательностей 5к, (Ак), k = 1, 2,..., могут быть взяты последовательности 5(7к), (Ау7 )'а(г(7 )'а(й(7 ))), k = 1, 2,..., генерируемые методом двойственной регуляризации теоремы 2.2. Для них справедливы предельные соотношения (3.3), (3.4).
References
[1] Дж. Варга, Оптимальное управление дифференциальными и функциональными уравнениями, Наука, М., 1977; англ. nep.:J. Warga, Optimal Control of Differential and Functional Equations, Academic Press, 1972.
[2] А.В. Арутюнов, Условия экстремума. Анормальные и вырожденные задачи, Факториал Пресс, М., 1997. [A. V. Arutyunov, Extremum Conditions. Abnormal and Degenerate Problems, Factorial Publ., Moscow, 1997 (In Russian)].
[3] А.А. Милютин, А.В. Дмитрук, Н.П. Осмоловский, Принцип максимума в оптимальном управлении, Изд-во Центра прикладных исследований при мех.-мат. фак-те МГУ, М., 2004. [A. A. Milyutin, A. V. Dmitruk, N. P. Osmolovskii, Maximum Principle in Optimal Control, Izd. MGU, Moscow, 2004 (In Russian)].
[4] М.И. Сумин, "Устойчивое секвенциальное выпуклое программирование в гильбертовом пространстве и его приложение к решению неустойчивых задач", Ж. вычисл. матем. и матем. физ., 54:1 (2014), 25-49; англ. пер.^Л. Sumin, "Stable sequential convex programming in a Hilbert space and its application for solving unstable problems", Comput. Math.. Math. Phys., 54:1 (2014), 22-44.
[5] М.И. Сумин, "Зачем нужна регуляризация принципа Лагранжа и принципа максимума Понтрягина и что она дает", Вестник Тамбовского университета. Серия: естественные и технические науки, 23:124 (2018), 757-775. [M. I. Sumin, "Why regularization of Lagrange principle and Pontryagin maximum principle is needed and what it gives", Tambov University Reports. Series: Natural and Technical Sciences, 23:124 (2018), 757-775 (In Russian)].
[6] М. И. Сумин, "Регуляризованные принцип Лагранжа и принцип максимума Понтрягина в оптимальном управлении и обратных задачах", Тр. Ин-та математики и механики УрО РАН, 25:1 (2019), 279-296. [M.I. Sumin, "Regularized Lagrange principle and Pontryagin maximum principle in optimal control and in inverse problems", Trudy Inst. Mat. Mekh. UrO RAN, 25:1 (2019), 279-296 (In Russian)].
[7] М.И. Сумин, "Параметрическая двойственная регуляризация для задачи оптимального управления с поточечными фазовыми ограничениями", Ж. вычисл. матем. и матем. физ., 49:12 (2009), 2083-2102; англ. пер.^. I. Sumin, "Parametric dual regularization for an optimal control problem with pointwise state constraints", Comput. Math. Math. Phys., 49:12 (2009), 1987-2005.
[8] М.И. Сумин, "Регуляризованная параметрическая теорема Куна-Таккера в гильбертовом пространстве", Ж. вычисл. матем. и матем. физ., 51:9 (2011), 1594-1615; англ. пер.^. I. Sumin, "Regularized parametric Kuhn-Tucker theorem in a Hilbert space", Comput. Math. Math. Phys., 51:9 (2011), 1489-1509.
[9] М. И. Сумин, "Регуляризация в линейно-выпуклой задаче математического программирования на основе теории двойственности", Ж. вычисл. матем. и матем. физ., 47:4 (2007), 602-625; англ. пер.^Л. Sumin, "Duality-based regularization in a linear convex mathematical programming problem", Comput. Math. Math. Phys., 47:4 (2007), 579-600.
[10] М. И. Сумин, "Устойчивый секвенциальный принцип максимума Понтрягина в задаче оптимального управлении с фазовыми ограничениями", Труды XII Всероссийского совещания по проблемам управления, XII Всероссийское совещание по проблемам управления
(16-19 июня 2014 г.), Сборник трудов, Изд-во ИПУ им. В.А. Трапезникова РАН, М., 2014, 796-808. [M. I. Sumin, "Stable sequential Pontryagin maximum principle in optimal control problem with state constraints", Proceedings of XIIth All-Russia Conference on Control Problems, XIIth All-Russia Conference on Control Problems (Juny, 16-19, 2014), Proceedings, Institute of Control Sciences of RAS, Moscow, 2014, 796-808 (In Russian)].
[11] Ф.А. Кутерин, М. И. Сумин, "Регуляризованный итерационный принцип максимума Понтрягина в оптимальном управлении. I. Оптимизация сосредоточенной системы", Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 26:4 (2016), 474-489. [F. A. Kuterin, M. I. Sumin, "The regularized iterative Pontryagin maximum principle in optimal control. I. Optimization of a lumped system", Vestn. Udmurtsk. Univ. Mat. Mekh. Komp. Nauki, 26:4 (2016), 474-489].
[12] Ф. А. Кутерин, М. И. Сумин, "Регуляризованный итерационный принцип максимума Понтрягина в оптимальном управлении. II. Оптимизация распределенной системы", Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 27:1 (2017), 26-41. [F. A. Kuterin, M. I. Sumin, "The regularized iterative Pontryagin maximum principle in optimal control. II. Optimization of a distributed system", Vestn. Udmurtsk. Univ. Mat. Mekh. Komp. Nauki, 27:1 (2017), 26-41].
[13] Ф.А. Кутерин, М. И. Сумин, "Устойчивый итерационный принцип Лагранжа в выпуклом программировании как инструмент для решения неустойчивых задач", Ж. вычисл. матем. и матем. физ., 57:1 (2017), 55-68; англ. пер.^.А. Kuterin, M.I. Sumin, "Stable iterative Lagrange principle in convex programming as a tool for solving unstable problems", Comput. Math. Math. Phys., 57:1 (2017), 71-82.
[14] Ф.А. Кутерин, "Об устойчивом принципе Лагранжа в итерационной форме в выпуклом программировании и его применении при решении неустойчивых операторных уравнений первого рода", Вестник Тамбовского университета. Серия: естественные и технические науки, 20:5 (2015), 1239-1246. [F. A. Kuterin, "On stable Lagrange principle in iterative form in convex programming and its application for solving unstable operator equations of the first kind", Tambov University Reports. Series: Natural and Technical Sciences, 20:5 (2015), 1239-1246 (In Russian)].
[15] Ф.А. Кутерин, М.И. Сумин, "О регуляризованном принципе Лагранжа в итерационной форме и его применении для решения неустойчивых задач", Матем. моделирование, 28:11 (2016), 3-18; англ. пер.^. A. Kuterin, M. I. Sumin, "On the regularized Lagrange principle in the iterative form and its application for solving unstable problems", Math. Models Comput. Simul., 9:3 (2017), 328-338.
[16] Ф.П. Васильев, Методы оптимизации: В 2-х кн., МЦНМО, М., 2011. [F.P. Vasil'ev, Metody Optimizatsii: V 2-kh. kn., MCCME, Moscow, 2011 (In Russian)].
[17] В. М. Алексеев, В. М. Тихомиров, С. В. Фомин, Оптимальное управление, Наука, М., 1979; англ. пер.У. M. Alekseev, V. M. Tikhomirovv, S.V. Fomin, Optimal Control, Plenum Press, New York, 1987.
Информация об авторе
Кутерин Фёдор Алексеевич, научный сотрудник отдела геофизической электродинамики. Федеральный исследовательский центр Институт прикладной физики Российской академии наук, г. Нижний Новгород, Российская Федерация. E-mail: [email protected] ORCID: http://orcid.org/0000-0001-6740-2037
Поступила в редакцию 15.07.2020 Поступила после рецензирования 31.08.2020 Принята к публикации 09.09.2020
Information about the author
Fedor A. Kuterin, Researcher of the Geophysical Electrodynamics Department. Federal Research Center Institute of Applied Physics of the Russian Academy of Sciences, Nizhny Novgorod, Russian Federation. E-mail: [email protected] ORCID: http://orcid.org/0000-0001-6740-2037
Received 15.07.2020 Reviewed 31.08.2020 Accepted for press 09.09.2020