Известия Института математики и информатики Удмуртского государственного университета
2022. Том 59. С. 85-113
УДК 517.9
© В. И. Сумин, М. И. Сумин
О РЕГУЛЯРИЗАЦИИ ПРИНЦИПА ЛАГРАНЖА В ЗАДАЧАХ ОПТИМИЗАЦИИ ЛИНЕЙНЫХ РАСПРЕДЕЛЕННЫХ СИСТЕМ ВОЛЬТЕРРОВА ТИПА С ОПЕРАТОРНЫМИ ОГРАНИЧЕНИЯМИ
Рассматривается регуляризация классических условий оптимальности — принципа Лагранжа и принципа максимума Понтрягина — в выпуклой задаче оптимального управления с операторным ограничением-равенством и функциональными ограничениями-неравенствами. Управляемая система задается линейным функционально-операторным уравнением II рода общего вида в пространстве Ь™, основной оператор правой части уравнения предполагается квазинильпотентным. Целевой минимизируемый функционал задачи является сильно выпуклым. Получение регуляризованных условий оптимальности основано на использовании метода двойственной регуляризации. Основное предназначение регуляризованных принципа Лагранжа и принципа максимума Понтрягина — устойчивое генерирование в рассматриваемой задаче обобщенных минимизирующих последовательностей — минимизирующих приближенных решений в смысле Дж. Варги. В качестве приложения результатов для задачи оптимального управления линейным функционально-операторным уравнением II рода общего вида рассматриваются два примера конкретных задач оптимального управления, связанных с системой уравнений с запаздыванием и с интегродифференциальным уравнением типа уравнения переноса.
Ключевые слова: выпуклое оптимальное управление, распределенная система, функционально-операторное уравнение вольтеррова типа, операторное ограничение, некорректность, регуляризация, двойственность, минимизирующее приближенное решение, регуляризирующий оператор, принцип Лагранжа, принцип максимума Понтрягина.
10.35634/2226-3594-2022-59-07 Введение
Статья посвящена регуляризации классических условий оптимальности (КУО) — принципа Лагранжа (ПЛ) и принципа максимума Понтрягина (ПМП) — в выпуклой задаче оптимального управления распределенными системами, описываемыми линейным функционально-операторным (функциональным) уравнением II рода общего вида в Ц7-, основной оператор правой части которого квазинильпотентен. При этом задача оптимального управления имеет сильно выпуклый целевой функционал, операторное (т. е. задаваемое оператором с бесконечномерным образом) ограничение-равенство и конечное число функциональных ограничений-неравенств. Главное назначение регуляризованных КУО — устойчивое генерирование обобщенных минимизирующих последовательностей (ОМП), состоящих из минималей функционала Лагранжа рассматриваемой задачи оптимизации, взятого при значениях двойственных переменных, вырабатываемых в соответствии с процедурой двойственной регуляризации.
История развития теории оптимизации распределенных систем насчитывает более шести десятков лет (см., например, книги [1,2] и библиографию в них). Ее основу, как известно, составляет изучение различных вопросов, связанных с КУО в рассматриваемых в рамках этой теории оптимизационных задачах. Многообразие этих вопросов очень велико, их сложность и актуальность постоянно на протяжении десятков лет привлекают внимание исследователей, о чем можно судить, бросив даже беглый взгляд на публикации,
посвященные связанным с КУО вопросам, в целом ряде ведущих математических журналов [3-12]. Отличительная черта настоящей статьи — исследование вопросов регуляризации КУО. Идея регуляризации КУО в задачах условной оптимизации на основе методов двойственной регуляризации [13] была относительно недавно предложена в [14], см. также [15] и библиографию там же. Данная статья продолжает линию исследований по регуляризации КУО в задачах оптимального управления линейными распределенными системами работ [16,17], в которых рассматривались оптимизационные задачи с функциональными ограничениями.
Естественная потребность в регуляризации КУО объясняется свойствами их некорректности, под которыми понимаются их возможные невыполнимость и неустойчивость по возмущению исходных данных, заложенные в самой природе задач условной оптимизации [14,15]. Заметим, что о невыполнимости КУО естественно говорить как в случае когда этот факт строго доказывается (см. пример на с. 260 в [18], а также соответствующие примеры в [14,15]), так и в случае, когда мы не знаем так это или нет (см. ниже обсуждение задачи (P)). Проверка же на корректность конкретных задач условной оптимизации и оптимального управления, их систем оптимальности представляет собою, как правило, сложную самостоятельную математическую задачу. Поэтому, если мы хотим «привлекать» КУО к решению сложных оптимизационных задач, то и «относиться» к ним необходимо как к математическим объектам с выраженными свойствами некорректности [19,20]. Наконец, говоря о целесообразности регуляризации КУО, представляется естественным указать здесь на работы самого последнего времени [4,5] (см. также библиографию этих работ) по обоснованию так называемого SQH-метода (Sequential Quadratic Hamiltonian Method) для решения задач оптимального управления, представляющего собою основанную на ПМП итерационную схему, предполагающую использование числовых регуляризирующих добавок к гамильтониану задачи. Подчеркнем, в то же время, что SQH-метод [4, 5] предназначен для решения лишь задач оптимального управления с геометрическими ограничениями.
С общей точки зрения рассматриваемая в данной статье задача оптимального управления представляет собою каноническую задачу выпуклого программирования [18, п. 3.3.1] в гильбертовом пространстве с операторным ограничением-равенством и функциональными ограничениями-неравенствами (см. задачу (1.3) ниже). Главную трудность при работе с такими ограничениями представляет, как известно, операторное равенство. Для пояснения содержательного смысла результатов данной статьи вкратце рассмотрим классическую некорректную задачу поиска нормального решения операторного уравнения I рода [19,20], частным случаем которой становится наша базовая задача (1.3), если в ней отбросить функциональные ограничения и упростить целевой функционал. Речь идет о задаче на условный экстремум
(P) ||u||2 ^ inf, G[u] = h, u G D C Z,
где G: Z ^ H — линейный ограниченный оператор, Z, H — гильбертовы пространства, h G H — заданный элемент, D — выпуклое замкнутое множество в Z.
Прежде чем говорить о регуляризации принципа Лагранжа для более специальных задач типа базовой задачи (1.3) данной статьи, естественно сначала выяснить как этот принцип может быть записан в задаче (P). Случай конечномерного ограничения-равенства, как известно, не вызывает затруднений. В общем случае на пути вывода для задачи (P) принципа Лагранжа встают существенные трудности, связанные как раз с операторным ограничением-равенством. Так, например, известные подходы к выводу принципа Лагранжа [18] требуют замкнутости образа оператора G1. Это требование не выполняется, напри-
!Как отмечено в [18, п. 3.2.4, с. 260], невыполнение этого условия замкнутости может приводить к тому, что ПЛ вовсе не выполняется, см. также соответствующие примеры в [14,15].
мер, в случае вполне непрерывного оператора G (см. [21, с. 225, теорема 1]), часто встречающемся в распределенных задачах оптимизации. Подход к выводу для задачи (P) принципа Лагранжа с помощью метода возмущений (см., например, [18, п. 3.3.2]), использующий включение этой задачи в семейство аналогичных задач, зависящих от параметра p £ H, вида
(Pp) INI2 ^ inf, G[u] = h + p, u £ D С Z,
предполагает жесткую связь соотношений принципа Лагранжа с субдиффференциальны-ми свойствами функции значений задачи (Pp). Именно, как показано в [14, теорема 2.1], этот подход позволяет формально получить невырожденный (регулярный или нерегулярный) принцип Лагранжа в задаче (P) = (Po) тогда и только тогда, когда имеет место хотя бы одно из двух соотношений, dß(0) = 0 или ö^ß(0) = {0}, где 0,5(0) и 8™ß(0) — субдифференциал и асимптотический субдифференциал (в смысле выпуклого анализа) выпуклой
полунепрерывной снизу функции значений ß(p) = min ||u||2, p £ H, в нуле. Одна-
«eD, g[u]=h+p
ко, к сожалению, проверка выполнимости нужных субдифференциальных свойств функции значений представляет собою трудную самостоятельную математическую задачу.
Наконец, если задача (P) такова, что в ней все же «можно записать» принцип Лагранжа, то его «практическое» использование (например, при нахождении приближений к решению задачи) неизбежно наталкивается на проблему его неустойчивости [14,15].
Сказанное выше означает, что регуляризация КУО в задачах условной оптимизации с операторными ограничениями, в известном смысле, гораздо более актуальна по сравнению с регуляризацией в случае функциональных ограничений. Заметим попутно, что задачи с операторными ограничениями-равенствами, например, в форме задачи (P), естественным образом возникают при рассмотрении широкого класса представляющих большой интерес обратных задач для распределенных систем (например, обратных задач наблюдения [15]). В то же время, как показано в данной статье, схема регуляризации КУО при операторных ограничениях аналогична схеме регуляризации при функциональных ограничениях.
Как и в [16,17] основной целью данной статьи является естественная трансформация-регуляризация КУО в генерирующие ОМП регуляризирующие алгоритмы для решения рассматриваемых задач оптимального управления. При этом, как и в [16,17], центральным в работе является понятие регуляризирующего алгоритма для задачи условной оптимизации, введенное ранее в [22]. Оно неразрывно связано с понятием ОМП — минимизирующ1го приближенного решения (МПР) в смысле Дж. Варги [23, гл. III]. Используемое в статье понятие регуляризирующего алгоритма (см. определение 3) можно квалифицировать как занимающее промежуточное положение между применяемыми в [20, гл. 9] понятиями регуля-ризирующих алгоритмов первого типа (сходимость нижних граней, см. определение 1 [20, гл. 9, § 2, с. 802]) и второго типа (сходимость по аргументу, см. определение 1 [20, гл. 9, § 6, с. 837, 838]). Это понятие регуляризирующего алгоритма, как и производное от него понятие МПР-образующего алгоритма (см. определения 1, 4) нацелено прежде всего на устойчивое построение МПР в задаче и «жестко привязано» именно к понятию МПР, органично учитывающему, как запросы математической оптимизационной теории [23, гл. IV-VIII], так и потребности инженерной практики [23, гл. III], предполагающей неизбежное наличие у приближенных решений ненулевых «зазоров» как по выполнению ограничений задачи, так и по близости к значению (нижней грани) задачи. Понятие МПР-образующего алгоритма в совокупности с двойственным подходом позволяет получать регуляризованные КУО при весьма общих предположениях об исходных данных задачи. Одновременно оно естественным образом «встраивается» в формулировки КУО.
В завершение вводной части статьи выделим основные свойства, характеризующие получаемые в ней результаты. Регуляризованные КУО: 1) формулируются как теоремы суще-
ствования МПР в исходной задаче, состоящих из минималей функционала Лагранжа, двойственная переменная для которого генерируется в соответствии с процедурой тихоновской регуляризации в двойственной задаче, с одновременным конструктивным представлением конкретных МПР; 2) формулируются для любой задачи рассматриваемого в статье класса задач вне зависимости от свойств задающих ограничения операторов с бесконечномерными образами и субдифферекнциальных свойств функций значений; 3) могут трактоваться как условия обычной оптимальности, но выраженные в секвенциальной форме; 4) выражаются в терминах регулярных классических функций Лагранжа и Гамильтона-Понтрягина; 5) являются секвенциальными обобщениями классических аналогов — своих предельных вариантов, сохраняя общую структуру последних; 6) «преодолевают» свойства некорректности КУО и представляют собою универсальные регуляризирующие алгоритмы для решения оптимизационных задач.
Рассматриваемая в данной статье регуляризация КУО нацелена на преодоление свойств некорректности КУО в задачах оптимизации распределенных систем, описываемых линейными функциональными (иначе, функционально-операторными) уравнениями второго рода общего вида в пространствах типа L2. Отличительная черта рассматриваемых уравнений — квазинильпотентность основного линейного оператора правой части. Подобным свойством обладают, прежде всего, различного рода вольтерровы операторы2. Поэтому рассматриваемые уравнения можно назвать функциональными уравнениями вольтеррова типа. К таким уравнениям естественным образом (обращением главной части) сводятся самые разнообразные начально-краевые задачи для различных уравнений с частными производными (гиперболических, параболических, интегро-дифференциальных, систем таких уравнений, уравнений с запаздываниями разного рода и др., см., например, разнообразные конкретные примеры в [24, глава 2], обзоры в [24,28]). Это позволило в настоящей статье получить регуляризованные ПЛ и ПМП единообразно для широкого класса распределенных оптимизационных задач. В работе существенным образом используется предложенное нами ранее понятие равностепенной квазинильпотентности семейства операторов, (историю вопроса см. в [28]). В качестве конкретных иллюстрирующих примеров нами рассматриваются задачи оптимального управления, связанные с системой уравнений с запаздыванием и с ин-тегродифференциальным уравнением типа уравнения переноса. Частным случаем задачи, связанной с интегродифференциальным уравнением, является некоторая обратная задача финального наблюдения.
Примем следующие обозначения и соглашения: Rn — пространство n-вектор-столбцов; (', ')п и Мп — евклидовы скалярное произведение и норма в Rn; 0п — нуль в Rn; векторы, если не оговорено противное, считаются столбцами; col {а,..., b} — вектор-столбец с последовательными частями а,... ,b; * — знак сопряжения и транспонирования; П С Rn — ограниченное и измеримое по Лебегу множество изменения независимых переменных, элементы которого обозначаем через t = {t1,..., tn}; Lp(П) — лебегово пространство со стандартной нормой (1 ^ p ^ то); Lm = U¡m(П) = (Lp(П))т (1 ^ p ^ то); ||-||pm — стандартная норма прямого произведения в L^; (■,-)2 m — стандартное скалярное произведение в L^;
I p, m*l
Lm*1 = Lm*1 (П) — пространство (mx /)-матриц-функций с элементами из Lp(П);
2Начиная с известных работ Ь. ТопеШ (1929) и А. Н. Тихонова (1938) название «вольтерровы операторы» (операторы типа Вольтерра) присваивалось разными авторами различным классам операторов со сходными свойствами (используются также названия: причинные операторы, наследственные операторы и др.); см., например, краткий обзор определений вольтерровых операторов [24, Дополнение], а также [25]. В случае линейных операторов эти определения так или иначе связаны со свойством квазинильпотентности: либо это свойство включено в само определение вольтеррова оператора (см., например, [26, с. 10]), либо при естественных условиях следует из этого определения (см., например, определение [27] функционального оператора, «вольтеррова на системе множеств», являющееся многомерным обобщением определения А. Н. Тихонова, и опирающийся на определение [27] цепочечный признак квазинильпотентности [25, теорема 2]).
стандартная норма прямого произведения в ; Н — некоторое гильбертово пространство со скалярным произведением (■, -)я и нормой ||-||я; Х[«,в](С) = {1, С £ [а,в]; 0, С € [а,в]}, С € И, — характеристическая функция отрезка [а, в] действительной прямой.
§ 1. Постановка задачи оптимального управления
Базовая оптимизационная задача. Пусть заданы: натуральные числа т, в; функция с(-) € ¿т; А: ¿т ^ ¿ГГ — линейный ограниченный оператор (ЛОО) с нулевым спектральным радиусом; ЛОО В: ¿2 ^ ¿ГГ• Рассмотрим уравнение
г(г) = А[г](г) + В[и](г) + с(г), г € П, г € и € ¿2, (1.1)
считая и(-) € ¿2 управлением. Ввиду квазинильпотентности А, уравнение (1.1) имеет для каждого и(-) € ¿2 единственное в ¿ГГ решение г(г), г € П, и справедлива формула
г(г) = 5[В [и] + с](г), г € П, и € , (1.2)
те
в которой 5[у] = Аг[у], у € ¿Г. Отвечающее управлению и(-) € ¿2 и задаваемое форму-
г=0
лой (1.2) решение г(-) уравнения (1.1) обозначаем ги(■).
Пусть имеются ЛОО А: ¿ГГ ^ Н, ЛОО В: ¿2 ^ Н, элемент С € Н, выпуклые функционалы ^ [г, и], {г, и} € ¿ГГ х ¿2, г = 0,1, ■■■,&, причем ^0[г,и] = К [г] + М [и], г € ЬГГ, и € ¿2, где К: ЬГГ ^ И — выпуклый функционал, а М: ¿2 ^ И — сильно выпуклый функционал с постоянной сильной выпуклости к. Зададим на ¿2 функционалы 70[и] = ^"0[ги,и] = К[ги] + М[и], ^[и] = Ji[zu,и], г = 1, ■■■,&, и оператор £ [и] = А [ги] + В [и], и € ¿2. Функционал 70[-] — сильно выпуклый, функционалы Ji[•], г = 1, ■ ■ ■, к, — выпуклые. Пусть V — выпуклое ограниченное и замкнутое множество пространства ¿2. Мы будем рассматривать задачи оптимизации системы (1.1) вида
70[и] ^ шт, £[и] = С, 71 [и] ^ 0,■■■,Jfc[u] ^ 0, и € V, (1.3)
с операторным ограничением-равенством £ [и] = С, функциональными ограничениями-неравенствами 7 [и] ^ 0, г = 1, ■■■,&, минимизируемым целевым функционалом 70[и] и множеством допустимых управлений V.
Точная и приближенные оптимизационные задачи. Задача (1.3) полностью определяется набором исходных данных f = {А, В, с, А, В, С, К, М, ^ (г = 1, ■ ■ ■, к)}. Предположим, что точные исходные данные {0 = {А0, В0, с0, А0, В0, С0, К0, М0, (г = 1, ■ ■ ■, к)} нам не известны, но мы можем оперировать с приближенными исходными данными ^ = {А5,В5,с5, А5, В5, С5,К5,М5, (г = 1, ■■■,&)}, где 5 € (0,50] — числовой параметр (50 — фиксированное число), характеризующий близость приближенных данных ^ к точным данным f0 в указанном ниже условиями Б и В смысле. Таким образом, при каждом 5 € [0,50] существуют: квазинильпотентный ЛОО А5: ¿ГГ ^ ¿т ЛОО В5: ¿2 ^ ¿т с5(■) € ; ЛОО А5: ^ Н, ЛОО В5: ¿2 ^ Н, С5 € Н; выпуклый функционал К5 [г]: ¿ГГ ^ И; сильно выпуклый функционал М5 [и]: ¿2 ^ И с постоянной сильной
г5 Г~ лЛ • Т г ^ те
выпуклости к; выпуклые функционалы Л5[г,и]: ¿ГГ х ¿2 ^ И (г = 0,1, ■■■,&), причем [г,и] = К5[г] + М5[и]. Предполагаем, что выполняется следующее условие.
Условие 1.1. Функционалы К5, М5 и (г = 1, ■■■,&), 5 € [0,50], липшицевы на каждом ограниченном множестве пространств ¿ГГ, ¿2 и ¿ГГ х ¿2 соответственно, причем липшицевость равномерна по параметру 5 € [0,50], то есть соответствующие постоянные Липшица не зависят от 5 € [0,50].
Считаем также, что приближенные исходные данные f5, 5 € (0,50], связаны с точными данными Iю приведенными ниже условиями 1.2, 1.3, 1.4.
Условие 1.2. Существует постоянная С > 0 такая, что при любом 6 Е (0, 6°] имеем
||А6 - А°|| ^ С6, ||Б6 - Б0\\ ^ С6, ||с6 - с°||2т ^ С6, ||А6 - А0\\ ^ С6,
\\В6 -В°\\ ^ С6, \\С6-С°\\н ^ С6, \М6[и] - М°[и]\^ С6 (и ЕV).
Условие 1.3. Существует неубывающая функция И.+ ^ И.+ такая, что для
каждого I > 0 и любого 6 Е (0, 6°] при ||г||2 т ^ I, и Е V выполняются неравенства
\К6 [г] - К°[г]\ ^ N1(1)6, \^6 [г,и] -^°[г,и]\^ N1(1)6 (г = 1,...,к).
Чтобы сформулировать условие 1.4 воспользуемся следующим введенным нами ранее понятием равностепенной квазинильпотентности (историю вопроса см. в [28]). Пусть В — банахово пространство, Е — некоторое множество, {С(£)[•]: В ^ В}?е3 — семейство зависящих от параметра £ Е Е квазинильпотентных ЛОО (квазинильпотентность ЛОО
G(£)[■]: B — B означает, что Н {G(£)}k — 0 при k — то). Семейство {G(£)}§ез назы-
ваем равностепенно квазинильпотентным, если sup k
{G(£ )}k
— 0 при k — то.
Ус л о в и е 1.4. Семейство : Lm — Lim}s [0 й , равностепенно квазинильпотентно.
"2 ^2 /бе[°,¿0] При любом 6 Е [0, 6°] управляемое функциональное уравнение
г(г) = А6[г](г) + Б6[и](г) + с6(г), г Е П, г Е ¿т, и Е Ь2, (1.4)
имеет для каждого и Е Ь2 единственное в Ьт решение г (г), г Е П, причем
г (г) = £6 [Б6 [и] + с6 ](г), г е п, и е Ь2, (1.5)
те
6
где Ss[y] = (A)i[y], y G Lmm. Отвечающее управлению u G Ls2 и задаваемое форму-
i=0
>S . отвечающее управлению U
лой (1.5) решение z(-) уравнения (1.4) обозначаем zsu(■), 5 G [0,5°]. При любом 5 G [0,5°] имеется задача оптимизации системы (1.4)
J°[u] — min, Gг[u] = Cг, J[u] ^ 0,...,Jsk[u] ^ 0, u G D, (OCs)
где
GS[u] =Лг [zU] + B[u], J\[u] = J[zU,u] (i = 0,1,... ,k), u G LS. (1.6)
Задачу (OC°) (то есть задачу (OCS) при 5 = 0) называем точной задачей, а задачи (OC5), 5 G (0,50], — приближенными задачами оптимального управления.
МПР и МПР-образующий оператор. Для компактности записи введем обозначение
Js[u] = {J([u],...,Jsk[u]}. Положим
D*,e = {u GD: ||Gг[u] -Cг||H ^ e, J[u] ^ e (i = 1,...,k)}, где 5 G [0,5°], e ^ 0,
и пусть D0 = D°'°. Определим обобщенную нижнюю грань ß задачи (OC0) как предел
ß = в+0 = lim ße, где ßе = inf J°[u], если D°'e = 0, и ßе = +то, если D0,e = 0. Очевидно,
что ß ^ ß0, где ß0 = inf J°°[u] — классическая нижняя грань задачи (OC0). Так как (OC0)
выпуклая задача с сильно выпуклым функционалом цели, то она может иметь не более одного оптимального элемента, а ß = ß°. Если задача (OC°) имеет оптимальный элемент (будем обозначать его u°), то на нем и достигаются грани ß и ß°.
Напомним, что последовательность uk G D, k =1, 2,..., называется МПР задачи (OC°), если J°°[uk] — ß при k — то, причем uk G D°'e для некоторой сходящейся к нулю последовательности положительных чисел ek, k = 1, 2,....
Определение 1 (см. [22]). Пусть ök е (0, ö0), k = 1, 2,..., — сходящаяся к нулю последовательность. Зависящий от ök, k = 1, 2,..., оператор R(-, ök), ставящий в соответствие набору исходных данных f5 элемент = u5 е D, называем МПР-образующим
в задаче (OC0), если последовательность u5k, k = 1, 2,..., есть МПР в этой задаче.
§2. Эквивалентная задача выпуклого программирования и регуляризация принципа Лагранжа
Задача выпуклого программирования. Задача (OC5) при любом ö е [0,ö0] — это задача выпуклого программирования в L2. Перепишем ее в виде, позволяющем напрямую воспользоваться результатами [14, 22] о регуляризации КУО в задачах выпуклого программирования в гильбертовом пространстве. Определим ЛОО G5 [•]: L2 — H формулой G5[u] = A5 [SsB5[u]] + B5[u], u е L2, ö е [0, ö0]. Для единообразия записи положим: J0[u] = J05[u], J5[u] = Jf [u] (i = 1,..., k), u е L2. Пусть e5 = C5 - A5S5[c5], ö е [0, öo]. При каждом ö е [0, ö0] задача выпуклого программирования в L2
J0[u] — min, G5[u] = e5, j5[u] < 0 (i = 1,...,k), u е D, (P5)
эквивалентна задаче (OC5): совпадают множества решений и значения задач. Задачи (P5), ö е [0,ö0], принадлежат классу задач выпуклого программирования в гильбертовом пространстве с сильно выпуклыми функционалами цели, изучавшемуся в [14,22].
Следствием условия 1. 1 является следующее свойство липшицевости функционалов J5 (i = 0,1,..., k): существует неубывающая функция N2(-): R+ — R+ такая, что при каждом ö е [0, ö0] для любого l > 0
| J5Ы - J5[u2]| < N2(1) ||ui - u2||2)s, ui,u2 е L2, ||ui|2>s, ||u2H2jS < l (i = 0, 1, . . . , k). Условия 1.2 и 1.4 влекут за собой такое свойство семейства операторов {A5}0<г<(5о. Л е м м а 1. Существует число K такое, что ||S5 — S°|| < K ||A5 — A0|| при 0 < ö < ö0.
Доказательство. Из условия 1.2 следует существование постоянной C1 такой, что ||A51| < Ci, 0 < ö < ö0. Фиксируем любое е е (0,1). В силу условия 1.4 найдется
натуральное N (е) такое, что (A5)* < ег при i ^ N (е), 0 < ö < ö0 .То есть при любом
ö е (0, ö0] имеем ||S51| < ^=о)-1 (C^ + (е) ег. Зависящее от е число, стоящее в правой части последнего неравенства, обозначим через C2. Произвольно выберем z е L^. Так как S5[z] = A5 [S5[z]] + z, ö е (0,ö0], то S0[z] - S5[z] = A0 [S0[z] - S5[z]] + (A0 - A5) [S5[z]] и поэтому S0[z] - S5[z] = S0 [(A0 - A5) [Ss[z]]]. Следовательно, при любом ö е (0,ö0] имеем ^S5 - S0| < C2 ||S0|| ^A5 - A0^ и можно взять K = C2 ||S0||. □
Используя лемму 1, простыми выкладками получаем из условий 1.2, 1.3, 1.4 следующую связь входных данных задачи (P0) с входными данными задач (P5) при ö е (0, ö0].
Л е м м а 2. Существует постоянная Г, зависящая лишь от операторов A0, B0, A0, B0, функционалов K0, J0 (i = 1,..., k), функций c0, Nb чисел C, K, ö0 и множества D, такая, что для каждого ö е (0, ö0] выполняются неравенства
HG* - G0^ < rö, ^e5 - e0||H < rö; J [u] - J0[u]|< rö, u еР (i = 0,1,...,k).
МПР и МПР-образующий оператор в задаче выпуклого программирования. Имеем:
= {п ер: ЦС5 [п] - е5 ||н ^ 6, Jf[u] ^ 6 (г = 1,...,к)}, 8 € [0,8о], е ^ 0. Так как обобщенная нижняя грань задачи (Р0) определяется фактически той же самой формулой, что и обобщенная нижняя грань задачи (ОС0), и эти грани совпадают, то мы сохраним
за ней то же обозначение ß. Имеем ß = ß+0 = lim ße, ße = inf J0[u], если D0'e = 0;
ße = +то, если D0'e = 0. Как уже отмечалось, очевидно неравенство ß ^ ß0, где ß0 = = inf J0[u] — классическая нижняя грань задачи (P0). Так как (P0) — выпуклая задача
с сильно выпуклым функционалом цели, то она может иметь не более одного оптимального элемента, а ß = ß0. Если задача (P0) имеет оптимальный элемент (будем обозначать его u0), то на нем и достигаются грани ß и ß0.
Определение 2. Последовательность {uj}°=1 С D называется минимизирующим приближенным решением (МПР) задачи (P0), если существует такая стремящаяся к нулю последовательность положительных чисел {е-7=1, что uj G D0'eJ (j = 1, 2,...) и Jj° [uj] — ß
при j — то, ß = inf J0[u].
ЛеммаЗ. 5 силу ограниченности D существование МПР в задаче (P0) равносильно неравенству ß < +то. Если ß < +то и сильно выпуклый функционал J0 является суб-дифференцируемым (в смысле выпуклого анализа) в точках D, то для любого МПР uk, k =1, 2,..., в разрешимой единственным образом в этом случае задаче (P0) справедливо предельное соотношение uk — u0, k — то.
Доказательство. Пусть ß < +то. Так как Jj° — непрерывный и сильно выпуклый, то упомянутая последовательность uk, k = 1, 2,..., ограничена. Благодаря единственности решения задачи (P0), слабой полунепрерывности снизу функционалов J0[u], J0[u] (i = 1,... ,k), u G D, а также свойствам ЛОО G0, элементы uk при k — то сходятся слабо к решению u0. Так как J0[uk] — Jj°[u0], k — то, то при субдифференцируемости J0 в точках D имеем сильную сходимость uk к u0 при k — то. □
Положим: Já [u] = col {Jf [u],..., Jk [u]}. Введем для задачи (P0) согласованное с понятием МПР понятие регуляризирующего оператора [22]. Набором исходных данных задачи (Pá) является набор fá = J Já, Gá, eá}.
Определение 3. Зависящий от 6 G (0, 60) оператор R(-, ■, 6), ставящий в соответствие каждому набору исходных данных {J0, Já, Gá,es} элемент R(J0, Já, Gá,es,6) = = uá G D, называется регуляризирующим в задаче (P0), если us G D0'e(á) при 6 G (0,60) и J0[uá] — ß, e(6) — 0 при 6 — 0.
Введем понятие МПР-образующего оператора в задаче (P0) как задаче выпуклого программирования.
Определение 4. Пусть 6k G (0,60), k = 1, 2,..., — сходящаяся к нулю последовательность. Зависящий от 6k, k = 1, 2,..., оператор R(-, ■, ■, ^,6k), ставящий в соответствие каждому набору исходных данных {J0k, J¿k, G¿k ,e&k} задачи (P&k) элемент R(J0, J¿k, G¿k ,e&k ,6k) = u¿k G D, называется МПР-образующим в задаче (P0), если последовательность u&k, k = 1, 2,..., есть МПР в этой задаче.
Двойственная задача. Регулярная функция Лагранжа задачи (Ps)
L¿(u,X,ß) = J0[u] + (X, Gá[u] - es)H + (ß, Já[u])k , u G LS, X G H, ß G R+, (2.1) при любых X G H, ß G R+, 6 G (0, 60] сильно выпукла и непрерывна как функция перемен-
4
ной и в Ь2, а следовательно, достигает минимума на ограниченном выпуклом и замкнутом
в L2 множестве D, причем в единственной точке; обозначим ее п5[А, у] (см., например, [20, гл. 8, §2, теорема 10]). Двойственной к задаче выпуклого программирования (Р5) является задача
V5(А, у) = min L5(u, А, у) — sup, А G H, у G R+. (2.2)
Следующая лемма доказывается так же, как и оценка (2.32) в [22].
Л е м м а 4. Справедлива оценка
(А,^) - V0(Л,м)| ^ K8(1 + ||A||h + N|fc), A G H, ^ G R+, 8 G (0,80], (2.3)
в которой постоянная K > 0 зависит от sup ||u1
uev
Двойственная регуляризация. При любых a G R+, 8 G (0,80] функционал
Я5'а(Л,^) = Vй(А,^) - a||A||H - а|И2, А G H, ^ G R+,
сильно вогнут и достигает на множестве H х R+ максимума в некоторой единственной точке |А5'а, . Пусть a(8), 8 G (0, 80], — положительная функция и выполняется условие согласования
8
—- ->• 0, а(8) ->• 0 при 8 ->• 0. (2.4)
a(8)
В задаче (P5) выполняются все условия, при которых к ней может быть применена теорема сходимости метода двойственной регуляризации работ [14,22] (см., например, теорему 1 в [22]), опирающиеся на предложенный ранее в [13] и основанный на теории двойственности подход к регуляризации в задачах условной оптимизации. Задача (P5) является частным случаем задачи (P5) этих работ: набор исходных данных {J0, J5, G5, e5} данной работы соответствует набору исходных данных {/5, g5, A5, h5 } в [14,22].
Применяя теорему 3.1 из [14] или, что одно и то же, теорему 1 раздела 2.1 из [22], сформулируем для задачи (P5) теорему сходимости метода двойственной регуляризации. Пусть задача (P0) имеет решение u0. Положим
^(8) - 8 ■ Г ■ {(1 + ||u0|£e) + ЦА^Цн (2 + ||u0|g + ||/<a(5)||fc (1 + ||u°||2,)}, m = 4 - J° [u°] - 8 • Г • (1 + ||И°||У,
Ci = (3/2) Г, C2 = V2Cr • (1 + ||и°||У,
ф(8, a) = C26 + у/C2262 - 8aK(8), ¿е(0,й0].
Теорема1. Пусть задача (P0) имеет решение u0. Если выполняется условие согласования (2.4), то (вне зависимости от того, разрешима или нет двойственная к (P0) задача (задача (2.2) при 8 = 0)), имеют место предельные соотношения
a(8) ||А5,а(5)||н ^ 0, a(8) ||/'a(5)||k ^ 0, 8 ^ 0, (2.5)
<Л5'а(5), G5 [u5 [Л5'а(5)У'а(5)]] - e5>н + </>a(5), J5 [u5 [A5'a(5V'a(5)]])fc ^ 0, 8 ^ 0,
(2.6)
и на полуинтервале (0,80] существуют неотрицательные функции Ф^8), Ф2(8), Фз(8), стремящиеся к нулю при 8 ^ 0, такие, что выполняются неравенства
J0 [u5 [Л5'а(5) У'а(5)]] ^ J0 [u0] + Ф1(8), 8 G (0,80], (2.7)
^G0 [u5 [Л5'а(5)У'а(5)]] - e0^ Ф2(8), 8 G (0,80], (2.8)
J0 [u5 [Л5'а(5)У'а(5)]] ^ Фз(8) (i = 1,...,k), 8 G (0,80]. (2.9)
Если же сильно выпуклый функционал J0 субдифференцируем (в смысле выпуклого анализа) в точках множества D, то
Hu5 [Л5'а(5),/'a(5)] - u0|2s ^ 0 при 8 ^ 0. (2.10)
В любом случае, п5 [А5'а(5), y5'a(5)] слабо сходится к п° в пространстве L2 при 8 — 0.
То есть вне зависимости от того, разрешима или нет двойственная к (Р0) задача, алгоритм Я(^,8), задаваемый равенством R(J0, J5, G5, e5,8) = п5 [A5'a(5) , y5'a(5)] для набора исходных данных |J0, J5, G5, e5 }, является регуляризирующим, причем, в случае субдиф-ференцируемости J0 в точках D, имеет место и сильная сходимость (2.10). Если же такой субдифференцируемости нет, то можно гарантировать лишь слабую сходимость п5 [А5'а(5) ,у5'а(5)] к п0 при 8 — 0.
Замечание 1. Предельные соотношения (2.5) являются следствием первого предельного соотношения теоремы 3.1 из [14], а также и следствием оценки (2.14) из [22]. В обозначениях данной работы эта оценка имеет вид
а(5)^\\XS'a^\\2H + \\^)\\2 <; С25 + ^/С2252 - 8а{5){К - J°(u°) - Т5( 1 + |И|2)), (2.11)
где K — величина, ограничивающая снизу значения J0(u) для всех u G D, 5 G [0,50]. В качестве ^(5), Ф2(5), Фз(5) в (2.7)-(2.9) подходят, например, величины (см. [14,22])
Ф1(5) = ф(5) + 5 • Г • (1 + в2), Ф2(5) = ф(5,а(5)) + 5 • Г • (2 +в), Фз(5) = ф(5,а(5)) + 5 • Г • (1 + в2),
где в = sup ||u||2)S (см. раздел 2 в [22]). Оценки (2.7)-(2.9) в совокупности с оценкой (2.11) дают
uev
явные оценки отклонения приближенных решений, о которых идет речь в теореме 1, от точного решения u0 по функции и «по ограничениям».
Регуляризованный принцип Лагранжа. Следующую теорему можно назвать регуля-ризованным принципом Лагранжа для задачи (Р0).
Теорема 2. МПР в задаче (Р0) существует тогда и только тогда, когда существуют стремящиеся к нулю последовательности положительных чисел {8j }°=1, {y-7 }°=1 и последовательность пар двойственных переменных {Aj,yj}°=1 С H х R+ такие, что
8j {^ Аj||H + ||yj||fc} — 0 при j — то, (2.12)
и выполняются включения
п
5j [Aj ,yj] G D5j (j = 1, 2,...),
(2.13)
а также предельное соотношение
Aj, G
5j
п
» [Aj,yj]J - e») + (yj, J* [п5 [Aj,yj]
— 0 при j — то.
(2.14)
Если указанные последовательности {8j }°=1, {y-7 }°=1 и {Aj , y7 }°=1 существуют, то
5 [А-7,yjЯ — J0 [п0] при j — то,
J0 J0
п
(2.15)
то есть последовательность иёз [А7, у7], ] = 1, 2,..., является МПР задачи (Р°). Как следствие соотношений (2.12)—(2.14) выполняется и предельное соотношение
V0 (Aj ,yj) — sup V0 (А,у) = J0 [п0] при j —
.
(2.16)
(л,^}ея xR+
В случае субдифференцируемости J0 на D имеет место и предельное соотношение
п
[Aj ,yj -
п
2,s
— 0 при j — то.
(2.17)
k
Другими словами, вне зависимости от того, разрешима или нет двойственная к (Р0) задача, алгоритм Р(^,57), задаваемый равенством , ^, С6^, в63, 577) = и6^ [Л7, ] для
каждого набора исходных данных | J0J, J6J, С6', е6' |, является МПР-образующим, причем
в случае субдифференцируемости J0 в точках V имеет место и сильная сходимость (2.17). Если же такой субдифференцируемости нет, то, строго говоря, можно гарантировать лишь слабую сходимость и6^ [Л7, ] к и0 при 57 ^ 0, Э ^ то. В качестве конкретной последовательности {Л7 , д7}, Э = 1, 2,..., можно взять, например, последовательность |Л6' )}, Э = 1, 2,..., если 5/а(5) ^ 0, а(5) 0 при 5 ^ 0, т.е., если вы-
полняется условие согласования (2.4) (здесь {Л6'а(6) , ^6'а(6)} — точка, о которой идет речь в теореме 1).
Доказательство. Для доказательства необходимости, прежде всего, заметим, что выпуклая задача (Р0), все функционалы которой непрерывны, разрешима благодаря ограниченности V и существованию МПР. По этой причине мы можем воспользоваться теоремой 1. Включение (2.13) и предельное соотношение (2.14), а также предельное соотношение (2.14) доказываемой теоремы вытекают из (2.8), (2.9), (2.6), с учетом ограни-ченпости V, и (2.5), если в качестве точек {Л-7, }, и6^ [Л-7, ] взять соответственно точки |л6' ))}, и6' [Л6' ) ], Э = 1, 2,..., с 57 ^ 0, Э ^ то. Следствием (2.7), (2.8) и (2.9) является (2.15). То есть последовательность и6^ [Л7, д7], Э = 1, 2,..., есть МПР. Тот факт, что предельное соотношение (и одновременно равенство) (2.16) есть следствие (2.12), (2.13), (2.14), будет доказан в процессе доказательства достаточности условий теоремы 2 для существования МПР.
Для доказательства достаточности заметим, прежде всего, что выпуклая задача (Р0), все функционалы которой непрерывны, разрешима ввиду включений (2.13) и ограниченности V. Так как и6^ [Л7, ] минимизирует функционал Р^ (•, Л7, ), то
J0J [и6' [Л7 + ( Л7, С6' [и6' [Л7- е6') + , J6J [и6' [Л7 У]]} к ^
^ J0J [и] + <Л, С6[и] - е6>я + (^ J6[и])к , и е V. В силу условий теоремы отсюда следует, с учетом ограниченности V, что
J0J [и6' [Л7,7 ^ J0J [и] + (Л, С6[и] - е6>н + (^ J6[и])к + V7 (и е V), где V7 ^ 0, э ^ то.
Г0К [Л7^ .01
Положив здесь и = и0, из (2.12) получаем J0[u6J [Л7]] ^ J0[u0] + V7, где V7 ^ 0, э ^ то. Так как одновременно и6^ [Л7 ] е V6J'7J, то используя свойства слабой компактности ограниченного выпуклого замкнутого множества и слабой полунепрерывности снизу непрерывного выпуклого функционала в гильбертовом пространстве, получаем, что J0[u6J [Л7 ]] ^ J0[u0], Э ^ то, то есть последовательность и^ [Л7 ], Э = 1, 2,..., является МПР в задаче (Р0). Последнее предельное соотношение в совокупности с (2.14) дает: Vя (Л7) ^ J0[u0], Э ^ то. Так как благодаря оценке (2.3) и соотношению (2.14) справедливо предельное соотношение У6^ (Л7 ) — V0 (Л7 ) ^ 0, Э ^ то, то получаем предельное соотношение (и одновременно равенство) (2.16). □
§ 3. Регуляризация классических условий оптимальности в задачах оптимального управления распределенными системами
Переформулировка теорем 1, 2 в терминах исходной задачи оптимального управления. Функция Лагранжа задачи оптимального управления (ОС6), совпадающая с функцией Лагранжа задачи выпуклого программирования (Р6), имеет вид
Р6(и,Л,= 4[и] + (Л,£6[и] -С6>н + <^,76[и])к, и е Р2, Л е Н, ^ е К+,
где 7й [u] = col j J u],..., J [u]|. Соответственно задача
Vй(X,ß) = min Ls(u, X,ß) — sup, [X,ß] G H x R+,
является двойственной к задаче (ОСй). Пусть |Хг'а(г) ,ßs'a(s)] G H x R+ — решение регу-ляризованной двойственной задачи
Vй(X,ß) - a(5)\\X\\H - a(5)\\ß\\2k — max, [X,ß]G H x R+, 5 G (0Л],
считаем выполненным условие согласования (2.4). «Расшифровка» теорем 1, 2 в терминах исходной задачи оптимального управления приводит соответственно к регуляризирующему двойственному алгоритму (теорема 3) и регуляризованному принципу Лагранжа (теорема 4) в задаче оптимального управления (OC0). Как и выше, пй [X, ß] — точка минимума (она существует и единственна) сильно выпуклой функции L5(•, X, ß) на множестве D при данных X G H, ß G R+.
Теорема 3. Пусть выполняется условие (2.4). Тогда оператор R(^5j), ставящий в соответствие набору исходных данных fS] управление Rf ,5j) = uS] [XÖJ \ßS] является МПР-образующим в задаче (OC°). Более того, имеют место следующие оценки отклонения приближенных решений от точного по функции и ограничениям
7 0 J
u
^ 70 [u0] + Ф^),
J0
G0
u
X&j,a(5j) ß&j ,a(5j)
0
H
jyw) ^ ), (i =i,...,k),
где можно взять, например (см. замечание 1),
Ф^5) = ф(5) + 5 • Г • (1 + 02), Ф2(5) = ф(5, а(5))5 • Г • (2 + 0), Фз(5) = ф(5, а(5)) + 5 • Г • (l + 02), с 0 = sup \\u\\2>s,
№ - ^ ■ Г ■ { (l + \\и%в) + ||я (2 + + ||^)||fc (l + \\u%
ф(6, a(S)) = C26 + ^C262 - 8a(6)К(6) ^ C26 + ^C262 - 8a(6)K,
5 G (0,5o];
K(5) = J0 [us[X^^ У'а(й)]] - J00 [u0] - 5 • Г • (l + Ci = (3/2) Г, C2 = V2C1-(l +
1 \\2,s
u \\2,s
К > 0 — величина, ограничивающая снизу значения [и] для всех и С V, 5 С [0,5о]. Справедлива оценка:
= \\2Н ||2 ^
а(5)
(с26 + у/С262 - 8а(6) {К - J0>°] - Т5(1 + \\и°\\2)}^.
Теорема 4. МПР в задаче (ОС0) существует тогда и только тогда, когда существуют стремящиеся к нулю последовательности положительных чисел (57 }°=1, (77}°=1 и последовательность пар двойственных переменных (А-7}°=1 С Н х И.+ такие, что
5j (||Xj||H + ||ßj||J — 0 при j —
,
(3.1)
5
и
6' [Л7У] е V6Í•7Í (э = 1,2,...),
(3.2)
Л7, £
6'
и
^ [Л7
- С
6'
+ {^, 76' [и^ [Л7'^ 0 при э ^ то. (3.3)
Если указанные последовательности {57}°=1, {77 }°=1 и {Л7 }°=1 существуют, то
7 0 7П
и
6' [Л7,7 ^ 7,0 [и0] при э ^ то,
и последовательность и6^ [Л7, ], э = 1, 2,..., является МПР задачи (ОС0).
Л*ак следствие соотношений (3.1)—(3.3) выполняется и предельное соотношение
У0(Л7 у) ^
вир
У0(Л,^) = 70 [и0] при э ^ то.
В случае субдифференцируемости 7° на Б имеет место и предельное соотношение
и
[л7 ,7 -
и
2,«
^ 0 при э' ^ то.
(3.4)
Другими словами, вне зависимости от того, разрешима или нет двойственная к (ОС0) задача, алгоритм Д(-, 57), задаваемый для наборов исходных данных f6 равенством
, 57) = и6' [Л7 ],
является МПР-образующим, причем в случае субдифференцируемости 7 в точках V имеет место и сильная сходимость (3.4). Если же такой субдифференцируемости нет, то можно гарантировать лишь слабую сходимость и6^ [Л7 ] к и0 при 57 ^ 0, э ^ то. В качестве конкретной последовательности {Л7, }, э = 1, 2,..., например, можно взять
последовательность |Л6', э = 1, 2,..., о которой идет речь в теореме 3.
Заметим, что в силу ограниченности V условие (3.2) со стремящимися к нулю последовательностями положительных чисел {57 }°=1, {77 }°=1 имеет место тогда и только тогда, когда и6^ [Л7 ] е (э = 1, 2,...) для некоторой сходящейся к нулю последовательно-
сти положительных чисел {т7 }°=1.
О минимизации функции Лагранжа. Ключевой задачей процедуры двойственной регуляризации процесса приближенного решения задачи (ОС0), а также возможного применения регуляризованных КУО для практического решения задач оптимального управления является задача минимизации функции (функционала) Лагранжа Р6(и,Л,^), {Л,^} е е Н х И+, задачи (ОС6)
Р6(и,Л,^) ^ шт, и е V,
(3.5)
решение которой мы обозначили через и6[Л,^]. От «качества» решения этой «простейшей» задачи напрямую зависит и «качество» решения исходной задачи (ОС0) на основе регуляризованных КУО. Для упрощения изложения предположим, что при каждом 5 е (0, 50] функционалы К6 [г]: Р^ ^ И, М6 [и]: Р2 ^ И, [г, и]: Р^ х Р2 ^ И (г = 1,...,к) дифференцируемы по Фреше. Тогда при каждом 5 е (0,50] дифференцируемы по Фреше функционалы J6[и]: Р2 ^ И. (г = 0,1,..., к) и функционал Лагранжа Р6(и, Л, В этом случае решение и6[Л, задачи (3.5) удовлетворяет критерию минимума
Р6и (и6[Л,^],Л,^) [и - и6[Л,^ 0, и е V,
(3.6)
где Р6^ (и, Л, [•] — производная Фреше функционала Р6(и, Л, по переменной и в точке
и е Р2 при фиксированных Л, Пусть Ф6[и,Л, е Р2 — функция Рисса функционала
6 / * Р6и (и, Л, [•] е (Р2) . Критерий (3.6) можно записать в виде
<Ф6[и6[Л,^],Л,^],и - и6[Л,^]>2« ^ 0, и е V. (3.7)
Найдем представление функции Ф6[и, Л, ^](£), £ е П, в терминах приближения (ОС6), 5 > 0, к точной задаче оптимального управления (ОС0), а точнее — в терминах уравнения (1.4), операторов А6, В6 и функционалов К6, М6, (г = 1,...,к), 5 > 0. Непосредственно из (1.5), (1.6) и (2.1) следует, что
Р6и (и, Л, [V] = К6/ (£6В6и + £6с6) £6В6 [V] + М6и (и) [V] + к к + 5] В6и + £6с6, и) £6В6 [V] + ^ ^(£6В6и + £6с6, и) [V] +
г=1 г=1
+ ((А6)* [Л],£6В6[V]) +((В6)* [Л],Л , V е Р2, и е Р2. (3.8) \ / 2,? \ / 2,«
Пусть Г6[и]0 е Р?, Т6[и]0 е Р2, ©6[и]0 е Р?, ^6[и]0 е Р2, Л6[Л]0 е Р? — функции Рисса для К6/ (£6В6и + £6с6) £6 е (Р?)*, М6^ (и) е (Р2)*, ^г6/ В6и + £6с6, и) £6 е
е (Р?)*, ^ (^6В6и + 56с6,и) е (Р2)*, <(А6)* [Л], 56Н)^ е (Р?)* (г = 1,..., к) соответственно. Формулу (3.8) перепишем следующим образом:
Р6и (и, Л,[V] = - <^6[и,Л,^],В6 [V]>2,? + <Ф6М,^]^, V е Р2, (3.9)
к
V6[и,Л,^] = -Г6[и] - ^^г©6[и] - Л6[Л], (3.10)
г=1
к
ф6[и,Л,^] = Т6[и] + £^6[и] + (В6)* [Л]. (3.11)
г=1
Пусть Ф6[и]0 е Р? и ^6ИО е Р? — функции Рисса для К6/ (£6В6и + £6с6) е (Р?)* и ^ В6и + £6с6,и) е (Р?)* (( = 1,...,к) соответственно. По определению сопряженного оператора имеем: Г6 [и] = (£6)* Ф6 [и], ©6 [и] = (£6 )* ^6 [и] (г = 1,...,к), Л6 [Л] =
= (^6)* [(А6)* [Л]]. Так как (56)* = ((Е - А6)-1)* = ((Е - А6)*)-1 = (Е - (А6)*)-1,
где Е — единичный оператор в Р?, то определяемая формулой (3.10) функция V6[и,Л,^]
есть (единственное в Р?) решение уравнения
( ) к ( )
- (А6)* №](*) = -Ф6[и](£) ^6[и](£) - (А6)* [Л](£), £ е П, V е Р?, (3.12)
г=1
правая часть которого записана в терминах задачи (ОС6). Таким образом, из (3.9) получаем
Л /
такое представление производной Р6ад (и, Л, в терминах этой задачи:
Р6и(и,Л,^,)Н = (В6)* [^6[и,Л,^]] + ф6[и,Л,^],^2 , V е Р2, (3.13)
что и дает искомое представление функции Ф6[и, Л,
Ф6[и,Л,^](£) = - (В6)* [^6[и,Л,^]] (£) + ф6[и,Л,^](£), £ е П, (3.14)
где ф5[и, Л, у] — единственное в Lm решение (3.12), ф5[и, Л, у] задается формулой (3.11).
Случай ограниченных управлений. Рассмотрим задачу (OC0) в ситуации, когда допустимые управления принимают значения из некоторого ограниченного замкнутого и выпуклого множества U С Rs (D = {u(-) G L^ : u(t) G U,t G П}). В этом случае получаем из (3.7) критерий минимума функционала Лагранжа в виде следующего линеаризованного поточечного принципа максимума.
Л е м м а 5. Функция û(-) G D есть решение задачи (3.5) тогда и только тогда, когда
(Ф5[û, Л, y](t),û(t))s = max (Ф5[û, Л, y](t),w)s при почти всех t G П, (3.15)
где Ф5[û, Л, у] задается формулой (3.14), в которой ф5[û, Л, у] —решение (3.12).
Доказательство. Необходимость для решения û задачи (3.5) условия (3.15) доказывается простейшим игольчатым варьированием, а достаточность получается стандартным применением теоремы А. А. Ляпунова (см., например, [29, §2.4, § 8.2]). □
Обозначим через Um [Л, у] множество всех управлений из D, удовлетворяющих (при сформулированных выше дополнительных условиях дифференцируемости) принципу максимума леммы 5. Очевидно, в нашем случае, благодаря сильной выпуклости целевого функционала, множество Um [Л, у] состоит из одного элемента, обозначим его через и5т[Л,у], и ит[Л,у] = и5[Л,у]. То есть непосредственно из теоремы 4 и леммы 5 получаем следующий регуляризованный ПМП для задачи (OC0).
Теорема5. При сформулированных выше дополнительных условиях дифференцируемости все утверждения теоремы 4 останутся справедливыми, если в них и5 [Л-7, у-7 ] заменить везде на usm [Л-7, у-7].
§ 4. Примеры регуляризации классических условий оптимальности в конкретных задачах оптимизации распределенных систем
Естественный переход от начально-краевой задачи к эквивалентному ей функциональному уравнению II рода вольтеррова типа осуществляется с помощью обращения главной части задачи. Разнообразные конкретные примеры начально-краевых задач (для параболических, гиперболических, интегро-дифференциальных уравнений с частными производными и систем таких уравнений, различных уравнений с запаздывающим аргументом и др.), которые допускают эквивалентное описание с помощью функциональных уравнений вольтеррова типа можно найти, например, в [24] (см. также обзор в [28]). Из огромного множества самых различных подобных начально-краевых задач мы для иллюстрации изложенной выше теории мы выбрали две: начальную задачу для системы с запаздыванием и начально-краевую задачу для интегро-дифференциального уравнения типа уравнения переноса. Частным случаем рассматриваемой нами оптимизационной задачи, связанной с интегро-дифференциальным уравнением, является некоторая обратная задача финального наблюдения. В конце каждого примера выписываются те основные конструкции, которые и участвуют в формулировке регуляризованных КУО (формирующая критерий минимума функционала Лагранжа функция, сопряженное уравнение, ... ). Сформулировать с их помощью соответствующие регуляризованные КУО — конкретные реализации теорем 3, 4, 5 читателю не составит большого труда.
Пример 1 (Оптимизационная задача для системы с запаздыванием). Пусть n = 1, П = [0,1]; р G (0,1) — фиксированное число; n G Rm — фиксированный вектор; а(-),
в(■) е ¿тхт, 7(■) е , £(■) е Р™ [-р, 0] — фиксированные функции. Рассмотрим начальную задачу для линейной управляемой системы дифференциальных уравнений с запаздывающим аргументом (х(-) — это т-вектор-функция)
х = а(г)ж(г)+ в(*)х(* - р) + 7(*)и(*), * е [0,1]; (4.1)
х(*) = £(*), * е [-р, 0); х(0) = п, (4.2)
где и(-) е ¿2 — управление. Решение начальной задачи (4.1), (4.2) понимаем как решение в смысле «почти всюду» из пространства (Ш2[0,1])т абсолютно непрерывных функций, рассматривая первое из условий (4.2) как требуемое в (4.1) условие доопределения х(*) слева от * = 0: р) = £(*-р) при р < 0. Приведем задачу (4.1), (4.2) к эквивалентному уравнению вида (1.1), показав тем самым, что каждому и(-) е ¿2 отвечает единственное в классе Ш функций х(-) е (Ш2[0,1])т, удовлетворяющих второму условию (4.2), решение этой задачи. Для этого сделаем в (4.1), (4.2) замену по формуле
Х(*) = п + / ЖК, * е [0,1], (4.3)
Jо
устанавливающей взаимно однозначное соответствие между классом Ш функций х(-) и пространством ¿т функций г(-) (такое преобразование задачи (4.1), (4.2) естественно назвать обращением главной части этой задачи). «Подставляя» (4.3) в (4.1) (с учетом при * е [0, р) первого условия (4.2)), получаем
г*
Ж) = а(*)п + а(*) / ЖЖ + в(*)П + в(*) / ЖЖ + 7(*)и(*), * е [р, 1], (4.4) Jо Jо
Ж) = а(*)п + Ж)/ ЖЖ + в (*)£ (* - р)+ 7 (*)и(*), * е [0,р). (4.5)
о
Положим ш(*) = {£(* - р),* е [0, р); п,* е [р, 1]}, * е [0,1]; Е1 [*](*) = /0* ЖК, Е2 [*](*) = = |0т,* е [0,р]; £-рЖЖ,* е (р, 1]}, *(•) е . Запишем (4.4), (4.5) в виде
Ж) = Ж) {п + Е^)} + в(*) {Ж) + ^2[*](*)} + 7(*)и(*) =
= {а(*)Е1 [*](*) + в(№[*](*)} + 7(*)и(*) + {а(*)п + в(Ж(*)} , * е П. (4.6)
Уравнение (4.6) и есть уравнение вида (1.1), эквивалентное начальной задаче (4.1), (4.2). Здесь П = [0,1]; Л[г](*) = а(*)Е1 [*](*) + в(^[¿К*), *(•) е ДТ, * е П (квазинильпотентность оператора А[-]: ¿т ^ легко проверяется, например, с помощью цепочечного признака [25, теорема 2], см. также [28, с. 269]); В[и](*) = 7(*)и(*), и(-) е ¿2, * е П; с(*) = а(*)п + в(*)ш(*), * е П. Если х(-) е Ш — решение задачи (4.1), (4.2) при некотором и(-) е ¿2, то связанная с х(-) формулой (4.3) функция г(-) е ¿т есть решение уравнения (4.6) при том же и(-). И наоборот, если г(-) е ¿т — решение уравнения (4.6) при данном и(-) е ¿2, то функция х(-), связанная с г(-) формулой (4.3), есть решение класса Ш задачи (4.1), (4.2) при этом и(-). Отвечающие управлению и(-) е ¿2 решения задачи (4.1)-(4.2) и уравнения (4.6) обозначим через и соответственно.
Пусть задано следующее: выпуклые функции СД-): И™ ^ И, г = 1,...,к; функции Р(■, ■) е ¿2Хт(П X П), ■) е ¿2Х5(П X П) п(-) е ¿2; выпуклое ограниченное и замкнутое множество V пространства ¿2. Формулами ^¿[х] = СДж(1)), г = 1,...,к, для х(-) е (Ш2[0,1])т определены терминальные функционалы. Рассмотрим задачу оптимального управления системой (4.1), (4.2) с минимизируемым целевым функционалом Р0 [и] = ||и||2 з, и е ¿2, при ограничениях
Гр(*,£)х(£Ж + /^(¿,£)и(£Ж = п(*) (* е П), ВД ^ 0,...,^[х] ^ 0, (4.7) 00
и множестве допустимых управлений D. Эту задачу символически запишем в виде
Fo[u] — min, (4.1), (4.2), (4.7), u G D. (4.8)
Сделав в задаче (4.8) замену (4.3), получим следующую эквивалентную задачу оптимизации управляемой системы (4.6):
Fo[u] — min, P [zu] (t) + Q [u] (t) = n(t) - / P(t,£)nä£ (t G П),
Jo
Wi[zu] ^ 0 (i =1,...,k), u gD,
где
Wi[z] = Gi( n + f z(( )ä<) (i =1,...,k), p [z] (t) = jf (v(t, о 0 z(Z)<%) zO g Lm;
Q [u] (t) = /'q(t,C)u(£u(0 G L2.
o
Это задача (1.3), здесь
Jo[u] = Fo[u] (K [z] = 0, M [u] = Fo[u]);
H = L2, C = n(t) -/ P(t,£Ш (t G П),
o
операторы A : Lm — H и B : Ls2 — H задаются формулами
A[z](t) = P[z](t) (t G П, z G LT), B[u](t) = Q[u](t) (t G П, u G L2) ; Ji[u] = Ji[zu, u] = Wi[zu] ( Ji[z, u] = Wi[z]) (i = 1,..., k).
Пусть f = {n,a, ß,Y,i; P,Q,n; Gi (i = 1,...,k)} — набор данных задачи (4.8), которые подвергаются возмущению, и точный набор f0 = {n0, а0, в0, Y0, С0; P0,Q0,n0; G0 (i = 1,..., k)} нам не известен, но можно оперировать с приближенными наборами ff = = {П ,в Ô,YÔ PS,QS ; Gf(i = 1,...,k)}, i G (0, 60] (¿0 > 0 фиксировано), которые связаны с набором f0 следующими условиями 4.1-4.3.
Условие 4.1. Функции Gf (•) : Rm — R (i = 1,..., k) выпуклы при любом 6 G [0, 60] и равномерно по 6 G [0, 60] липшицевы на любом ограниченном множестве.
Заметим, что условие 4.1 выполняется, в частности, если функции Gf : Rm — R (i = 1,..., k) выпуклы при любом 6 G [0, 60] и равномерно по 6 G [0, 60] ограничены на любом ограниченном множестве пространства Rm (см., например, [30, теорема 8.2]).
Условие 4.2. Существует постоянная C > 0 такая, что при любом 6 G (0,60] величины ||nf - n°|| , ||aô - а°||0 , ||вг - в°11о , IIyô - Y°IL , - f0|lrmr m,
Il ' ' Ilm' Il Il2,mxm' II" ! Il2,mxm' II ' ' Il2,mxs' II' ' IIL™ [—p,0]
ПPf - p0|l , Hqô - Q0П , - п0|к не превосходят величины C6.
II 11 2,1 X ^^ II 11 2,1 X S II 112,1
Условие 4.3. Существует неубывающая функция Ni(-): R+ — R+ такая, что для каждого I > 0 и любого 6 G (0,60] величина |Gf(y) - G0(y)| при \\y||m ^ l не превосходит величины N1(l)6 (i = 1,..., k).
При любом ö £ [0, ¿о] мы имеем управляемую начальную задачу
ж = a5(t)x(t) + в5(t - p) + Y5(t)u(t), t £ [0,1]; (4.9)
x(t) = £5(t), t £ [—p, 0); ж(0) = n5, (4.10)
набор ограничений
/V (t,£ )x(£ )d£ + / V (t,£ )u(£ )d£ = П (t)(t £ П), Ff [x] ^ N ^ 0, (4.11)
оо
где F/[x] = G5(x(1)) (i = 1,...,k), и задачу оптимизации системы (4.9), (4.10) c минимизируемым функционалом цели F0[u] при ограничениях (4.11) и множестве допустимых управлений D. Эту задачу оптимального управления символически запишем в виде
Fo[u] ^ min, (4.9), (4.10), (4.11), u £ D. (4.12)
Пусть xrU(-) — отвечающее управлению u(-) ре1ление начальной задачи (4.9), (4.10).
Сделав в задаче (4.12) замену x(t) = n5 + /0 z(Z)d(, t £ [0,1], соответствующую обращению главной части начальной задачи (4.9), (4.10), получим эквивалентную задачу оптимизации управляемой системы
z(t) = {a5(t)£i[z](t) + в5(t)£2[z](t)} + Y5(t)u(t) + {a5(t)n5 + в5(t)^5(t)} , t £ П, (4.13)
где ш5(t) = {£5(t — p), t £ [0,p); n5, t £ [p, 1]}, t £ П. Эту задачу запишем в виде
Fo[u] ^ min, P5 [4] (t) + Q5 [u] (t) = П(t) — P5(t, £)n5d£ (t £ П),
/о
^ ]
W5К] ^ 0 (i = 1,...,k), u £ D,
где P5 [z] (t) = /0 ^P5(t, £) /0? z(Z)d(Jd£, zf(■) — отвечающее u(-) решение уравнения (4.13).
Q5 [u] (t) = /о1 Q5(t, £)u(£)d£, W[z] = Gf (> + /о1 z(Z)d<) (i = 1,..., k).
Положив
A5 [z](t) = a5 (t)Ei [z](t) + в5(t)E2 [z](t), t £ П, z £ P^
j2;
B5[u](t) = y5(t)u(t), t £ П, u £ P2;
с5(*) = а5(*)п5 + в55(*), * е П, переписываем (4.13) в форме (1.4). Задача (4.14) имеет вид (ОС5), здесь
7 [и] = Ро [и] (К5 И = 0, М5 [и] = Ро [и]);
7 [и] = [^и ,и] = Ш5 ] (^Т;5 [г, и] = Ш5 [г]) (г = 1,...,к);
н = , С5 = п5(*) -/ Р5(*,£)п5(* е П),
Jо
А5[г](*) = Р5[г](*) (* е П, г е ¿т, В5 [и](*) = 25[и](*) (* е П, и е ¿2).
При сделанных относительно семейства задач (4.12), 8 е [0,80], предположениях семейство задач (4.14), 8 е [0,80], удовлетворяет условиям 1.1-1.4. Действительно, условия 1.1 и 1.2 получаются элементарными выкладками из предположений в условиях 4.14.3 и 4.2 соответственно. Чтобы доказать выполнение условия 1.3, оценим при произвольных I > 0 и г е ¿т таких, что ||г||2т ^ /, для г е {1, 2,..., к}, 8 е [0,80], величину
^ И - | = |С (У + /о1 Ж ж) - со (п° + /о1 Ж Ж)
. Имеем
к И - И?[*]| С
^ + /° Ж Ж ) - СП п + / Ж Ж
+
+
о / \ №
Г1 N / Г 1
о / „г
С" + Уо ЖЖ^ - С + уо ЖЖ
„г
. (4.15)
В силу условия 4.3 и неравенства ||пг - По||т С С5 из условия 4.2, первое слагаемое правой части (4.15) не превосходит величины N (/ + ||по||т + С5о) 5. Функция Со: И™ — И. лип-шицева на любом ограниченном множестве пространства И™. То есть существует неубывающая функция у(-): И+ — И+ такая, что |Со(у1) - Со(у2)| С у(1) ||у1 - у2||т, если
С 1,
С 1. А так как
пг + ЖЖ
о
с
по + ЖЖ
о
+ ||пг - по|
ЖЖ
С ||Жт С
то второе слагаемое правой части (4.15) не больше, чем у (/ + С5 + ||по||т) ||пг - По||т, то есть не превосходит у (/ + С5о + ||по||т) С5. Таким образом, условие 1.3 выполняется с функцией N1(1) = С ■ у (/ + С5о + ||по||т) + N1 (/ + С5о + ||по||т), 1 > 0. Выполнение условия 1.4 несложно доказывается с помощью цепочечного признака равностепенной квазинильпотентности [28, теорема 2].
Предположив дополнительно, что функции Сг, г = 1,..., к, 5 € (0, 5о], гладкие, можем выписать для этого примера критерии (3.7) и (3.15) решения задачи (3.5). Прямые вычисления дают:
Фг[«](*) = 0, фг[и, А, у](*) = 2и(*) + /1 (О(£,*))* А(£Ж,
^[«](*) = (Сг/ (4(1)))*, г = 1,...,к, Л[А](*) = о ( Г (Рг(Ж))* ^ * € П.
]о \
По определению сопряженного оператора
(Аг)*[ф](*) = £1 (аг)* ф (*) + £* (вТ ф (*),* € П, ф € ^; £ [у] (*) = у(СЖ,
£2 [у](*) ^ / у(С Ж, 0 С * С 1 - р; 0™, 1 - р<* С 1* € П, у € ь
Ыь+Р
То есть уравнение (3.12) можно записать в виде
1
ф(сЖ = йг[и,А,у](*), 1 - р С * С 1;
ф(*) - J 1«
-1 г-1
„г//-'Л* / Адг//\)* _
Ф(*) - ИО) Ф(СЖ - (вЖ)) Ф(СЖ = ^[и,А,у](*), 0 С * С 1 - р, (4.16)
где Ьг[и,А,у](*) = Е11 У" (Сг/ (4 (1)))* + /о1 (// (Рг(Ж))* А(^. Формирующая
критерии (3.7) и (3.15), которым удовлетворяет решение иг[А, у] задачи (3.5), функция Фг[и, А, у] задается формулой
Фг[и, а,У](*) = (7г(*))* Фг[и, А,У](*) + 2«(*) + [1 (ог(е,*))* А(е* € п,
о
1
1
1
1
1
т
о
™
™
™
о
1
ь
1
где V5[и, Л,р] — решение сопряженного уравнения (4.16). Это уравнение вольтеррова типа. Единственное в ДГ решение V5[и, Л,р] уравнения (4.16) абсолютно непрерывно на П и принадлежит классу (Ш2(П))т. Уравнение (4.16) эквивалентно системе уравнений
V + (а5(*))* = - /1 (Р5(V,*))* Л^Ж, 1 - р ^ * ^ 1;
Jо
к (4.17)
^(1) = £ ^ (4 (1)))*;
г=1
^ + (а5(*))* + + р))* + р) = - [ (Р5(V,*))* Л^0 ^ * ^ 1 - р; (4.18)
./о
С1 к
^(1 - р)= / (а5(С))* V«Ж + £Р* (4(!)))' +
_ ЬЧ у^т / ^ '
1-р ~ (4.19)
0 \J1-p
+ (Р5(ж))*^л^ж,
состоящей из задачи Коши (4.17) для обыкновенного дифференциального уравнения, рассматриваемого на отрезке 1 - р ^ * ^ 1, с условием Коши в точке * = 1, и начальной задачи (4.18), (4.19) для рассматриваемого на отрезке 0 ^ * ^ 1 - р дифференциального уравнения с опережением (4.18), в которой условие (4.19) играет роль условия Коши в точке * = 1 - р; требуемое в (4.18) и (4.19) доопределение функции V справа от точки * = 1 - р обеспечивается задачей Коши (4.17).
П р и м е р 2 (Оптимизационная задача для интегро-дифференциального уравнения типа уравнения переноса). Пусть п = 3, П = [0,1] х [0,1] х [-1,1]. Рассмотрим на П следующую краевую задачу для линейного интегро-дифференциального уравнения (краевая задача (4.20) подобна смешанной задаче для простейшего линейного нестационарного интегро-дифференциального уравнения переноса (см., например, [31])
дж/д*1 + *3 ■ дж/д*2 = а(*)ж(*) + в (*) J У (С; ) + 7 (*)и(*), * € П;
х(0,*2, *3) = 0 ^ *2 ^ 1, -1 ^ *3 ^ 1; (4.20)
ж(*1, 0,*3) = ,*3), 0 ^ ^ 1, 0 ^ *3 ^ 1; ж(*1, 1,*3) = ^2(*1 ,*3), 0 ^ ^ 1, -1 ^ *3 ^ 0,
где а, в, 7, Ж У — фиксированные измеримые по совокупности переменных и огра-
ниченные скалярные функции, и(-) € Д2 — управление. Левую часть уравнения (4.20) понимаем как полную производную функции ж(-) по переменной вдоль характеристики дифференциального выражения, стоящего в левой части. Такую производную от ж(-) вдоль характеристики I будем обозначать дж(-)/д/. Пусть Ш — класс всех функций ж(-) из Д2, абсолютно непрерывных вдоль почти любой характеристики I и таких, что (перебирая все характеристики /, имеем) дж(-)/д/ € Д2. Функцию ж(-) из Ш назовем решением задачи (4.20), отвечающим управлению и(-), если она почти везде (по линейной мере) на почти каждой I в П удовлетворяет уравнению (4.20) и почти всюду удовлетворяет краевым
___ __2 _з
условиям (4.20). Характеристика I = /(¿), проходящая через точку I = {Г, Г, Г}, задается
уравнениями {Ь1 = ¿2 = I2 + ¿3(£ — I1), ¿3 = I3}, где £ — параметр. Она обязательно пересекает границу П в одной из тех ее частей, где или = 0, или *2 = 0, *3 > 0, или *2 = 1,
t3 < 0; значение tl в соответствующей точке пересечения обозначим через fit). Из краевых
v(t),t + t (u(t) — t ),t ) = 9(t), где
tp(t2 — ТЧ1 Д3), если u(t) = 0;
eÇt) = { ф^? - t/t,t), если u{t) >0, t > 0; Çt G П) (4.21)
ф2(? + (1-?)/?,?), если u(t) > 0, f<0.
Формула
x(t) = e(t) + Ei [z](t), t G П, (4.22)
t1
где E1 [z](t) = / z(£,t2 + t3(£ — t1),t3) , t G П, устанавливает взаимно однозначное
v(t)
соответствие между классом L2 функций z(^) и классом удовлетворяющих краевым условиям (4.20) функций я(-) из W. Задача (4.20) заменой (4.22) сводится к эквивалентному функциональному уравнению (1.1) (это и есть в данном случае процедура обращения главной части краевой задачи (4.20)), в котором n =3, m =1, s = 1, П = [0,1] х [0,1] х [—1,1];
B[u](t) = Y(t)u(t), «(•) G L2, t G П; A[z](t) = a(t)Ei[z](t) + в(t)E2[z](t), E2 [z](t) = Г Y(Z; t) Г z(£,t2 + Z (£ — t1),*)«, z(0 G L2, t G П;
J-i Jv (t1 ,t2 )
c(t) = a(t)e(t) + в (t) J Y (Z ; t)0(t1,t2 ,Z )dZ, t G П.
Так как ЛОО L2 — L2 квазинильпотентен (это простое следствие признака [25, теорема 2]), то указанное уравнение (1.1), а вместе с ним и краевая задача (4.20), имеет единственное решение для любого u G L2. Отвечающее управлению u G L2 решение xu задачи (4.20) связано с соответствующим решением zu уравнения (1.1) формулой (4.22).
Положим O = {{t2,t3} : 0 ^ t2 ^ 1, —1 ^ t3 ^ 1}. Пусть заданы: выпуклые функции G0(y) : R — R, Gi(y, w) : R х R — R, i = 1,..., k; функции P(•) G L^(O), тт(^) G L2(O). Формулами Fo [x,u] = Go (fn x
(t)dt) + ||u|2)1, Fi[x,u] = Gi (fn x(t)dt, /п u (t)dt) (1 ^ i ^ k) для x(-) G W, u(^) G L2 определены функционалы. Пусть D — выпуклое ограниченное и замкнутое множество в L2. Рассмотрим задачу оптимального управления системой (4.20) c минимизируемым целевым функционалом F0[x,u] при ограничениях
P (t2,t3) x (1,t2,t3) = п (t2,t3) ({t2, t3} G O) , F1[x,u] ^ 0,..., Fk[x, u] ^ 0, (4.23)
и множестве допустимых управлений D. Эту задачу символически запишем в виде
F0[x,u] — min, (4.20), (4.23), u G D. (4.24)
Заметим, что при G0 = 0 задача (4.24) является обратной задачей финального наблюдения (см., например, [15]).
Сделав в задаче (4.24) замену (4.22), получим следующую эквивалентную задачу оптимизации соответствующей управляемой системы (1.1):
W0[zu,u] — min, P [zu](t2,t3) = n(t2,t3) — P(t2,t3)e(1,t2,t3) ({t2,t3} G O), Wi[zu,u] ^ 0 (i = 1,..., k), u GD,
где
Wi[z, u] = Fi[в + E1[z],u], i = 0,1,..., k, P[z](t2,t3) = P(t2,t3)E1 [z](1,t2,t3), {t2,t3} G O.
Это задача вида (1.3), здесь
J[u] Jzu ,u] = W (i = 0,K [z] = G0( I (0(t) + Ei [z](t)) dt
'П
М[и] = |Н|2Д , Н = ¿2(0), ЛИ = Р[г] (г € ^(П)),
С = п(*2,*3) - Р(*2,*3)0(М2,*3) ({*2,*3}€ 0), В[и] = 0 (и € ¿2(П)).
Пусть f = {а, в, 7, У, Р, п; О (г = 0,1,..., к)} — набор входных данных зада-
чи (4.24), которые могут подвергаться возмущению, и точный набор
^ = {а0, в0,70, У0, Ж Ж ^0; Р0, п0; О0 (г = 0,1,..., к)}
нам не известен, но можно оперировать с приближенными наборами
^ = {а5 ,в5,7й ,У5 У ЖЖ; Р5 ,п5; 05 (г = 0,1,...,к)}, 5 € (0Л]
(50 > 0 фиксировано), которые связаны с набором f0 следующими условиями.
Условие 4.4. Функции 00(-): И — И и (■, ■): И х И. — И (г = 1,..., к) выпуклы при любом 5 € [0, 50] и равномерно по 5 € [0, 50] липшицевы на любом ограниченном множестве.
Условие 4.5. Существует постоянная С > 0 такая, что величины ||а5 - а°|| ,
Г - вЩр НУ - тЦ^р ||у5- ^Ц^ ЦУ - 11 Ьто([0,1] ж [— 1,1]), IV5 - ^0|Ьте ([0,1] х [0Д]),
К - 11 Ьто([0,1] х [—1,0]), - Р 0 11 (О), ^ - п0 11 ¿2(0) прилюбом 5 € (0,50] не превосхо-
дят величины С5.
Условие 4.6. Существует неубывающая функция И+ —> И+ такая, что для
каждого 1 > 0 и любого 5 € (0,50] величины |00(у) - О0(у)|, (О5(у,ад) - С0(у,ад)| (г = 1,..., к) при |у|, ^ 1 не превосходят величины N1(1)5.
При любом 5 € [0,50] имеем управляемую краевую задачу
дх/д*1 + *3 ■ дх/д*2 = а5(*)х(*) + в5(*) J У5(С; *)х(*1,*2,<К + 7*(*)и(*), * € П; х(0,*2,*3) = </(*2,*3), 0 ^ *2 ^ 1, -1 ^ *3 ^ 1;
ж(*1, 0,*3)= V (*1,*3), 0 ^ ^ 1, 0 ^ *3 ^ 1; ж(*1,1,*3)= V(*1,*3), 0 ^ ^ 1, -1 ^ *3 ^ 0;
(4.25)
(ее решение, отвечающее управлению и € ¿2, обозначаем через х^), минимизируемый
функционал F0[x,u] = G0(/п x(t)dt) + ||u||2 1, набор ограничений
P5 (t2,t3) x (1,t2,t3) = п5 (t2 ,t3), Fl5 [x,u] ^ 0,...,Ffc5 [x,u] ^ 0, (4.26)
1
,u| = GM InX|ildtJnMlt)dn (i = 1,..., k), и
где F/[x, u] = G5 (/п x(t)dt, /п u(t)dt) (i = 1,..., k), и задачу оптимального управления
F0[x,u] ^ min, (4.25), (4.26), u G D. (4.27)
Сделав в задаче (4.27) соответствующую обращению главной части краевой задачи (4.25) подстановку x(t) = (t) + E1[z](t), t G П, где (■) определяется формулой
(4.21) c заменой фь ф2 на , ф2, ф2 соответственно, получим эквивалентную задачу оптимизации системы (1.4), в которой n = 3, m =1, s = 1, П = [0,1] х [0,1] х [-1,1];
B2[u](t) - (t)u(t), u(-) G L2, t G П; A2[z](t) - a2(t)Ei[z](t) + в2(t)E2[z](t),
E*[z](t) - Г Y2(Z; t) Г z(£,t2 + Z(£ - t1)^)^, z(-) G L2, t G П; J-i Jv(t1 ,i2,C)
c2 (t) - a2 (t)tf2 (t)+ e2(t) J Y2 (Z; t)tf2 (ti,t2, Z )dZ, t G П. Эту задачу оптимизации запишем в виде
W°2[zU,u] — min, P2 [zU] (t2,t3) = n2(t2,t3) - P2(t2,t3)tf2(1,t2,t3) ({t2,t3} G O),
W2[zU,u] ^ 0 (i = 1,...,k), u GD, (4.28)
где W2[z,u] - Fi2[tf2 + Ei[z],u] (i = 0,1,...,k), P2[z](t2,t3) - P2(t2,t3)Ei[z](1,t2,t3) ({t2,t3} G O). Задача (4.28) имеет вид (OC2), здесь
JH-**-- i = 0,,.. ..k. K.,„. G0 (/n ,ft„.E,IB,d,).
M2 - M, H = L2(O), A2[z] -P2[z] (z G P2(П)), C2 - n2(t2,t3) - P2(t2,t3)tf2(1,t2,t3) ({t2,t3} G O), B2[u] - 0 (u G L2(П)).
При сделанных относительно семейства задач (4.27), ö G [0, ö°], предположениях семейство задач (4.28), ö G [0,ö0], удовлетворяет условиям 1.1-1.4. Действительно, условия 1.1 и 1.2 получаются элементарными выкладками из предположений в условиях 4.4-4.6 и 4.5?? соответственно. Чтобы доказать выполнение условия 1.3 оценим величину
|J2[z,u] - J°[z,u]| - |W2[z,u] - W°[z,u]|
при произвольных u(-) G D, l > 0 и z(-) G L2 таких, что ||z||2 i ^ l, для i G {1, 2,..., k}, ö G [0, ö°]. Она не превосходит суммы
| F2 tf + Ei [z], u] - F° [tf2 + Ei [z], u] | + | F° [tf2 + Ei [z], u] - F° [tf ° + Ei [z], u] |. (4.29)
В силу условия 4.5 величина |/п (tf2 + E1[z]) dt| не превосходит а (^0,Ф°,Ф2, C,ö°,l) -
- max{ ||^0уь_([0,1]х[-1>0]) , ||ф0|ж([°,1]х[-1,1]) , ||ф0|ж([0,1]х[°,1])} + Cö° + ||E|l, ||E| —норма ЛОО E 1: L2 — Р2. Из этой оценки и условия 4.6 следует, что первое слагаемое (4.29)
не больше ö ■ N 1 а (<р°, ф°, ф°, C, ö°, l), maxueD ||u||2 .
Функция G°: R х R — R липшицева на любом ограниченном множестве. То есть существует неубывающая р(-): R+ — R+ такая, что
|G°(yi,W1) - G°(y2,w2)| ^ Р(1) (|У1 - У21 + |w1 - w21 ) ,
если |y1| ^ l, |y2| ^ l, |w1| ^ l, |w2| ^ 1. Поэтому второе слагаемое в (4.29) не больше произведения р ^ma^а (<р°,ф°,ф°, C,ö°,l) , maxueD ||u||2 1 jj ■ |/п (tf2 - tf°) dt|, второй сомножитель которого не превосходит числа Cö. Таким образом, условие 1.3 для функционалов J2,..., J2, 0 < ö ^ ö°, выполняется с функцией
Ni(l) - N 1 ^max jа ф °, ф°, C,ö°,l) , max Hu||2>1}) + + C ■ р (max {а (/,ф°,ф0, C,ö°,l) ,l}), l > 0.
Аналогичные выкладки можно провести и для функционалов Кг, 0 <5 С 5о. Выполнение условия 1.4 легко проверить, пользуясь цепочечным признаком равностепенной квазинильпотентности [28, теорема 2].
Предположив дополнительно, что функции Сг, г = 0,1,..., к, 5 € (0, 5о], гладкие, можем выписать для данного примера критерии (3.7) и (3.15). Сопряженные к £1: Ь2 — Ь2 и £¡2: Ь2 — Ь2 операторы имеют вид:
г р(*)
£М*)= / ж,*2+*3(е-),*3)с
Л1
г 1 гр(ь)
(£2)* [г](*) = J у уг(*3;е,*2+*3(е- *1),о ж,*2+*3(е - *1),о^с, * € п,
р(Т) — значение переменной /1 в точке пересечения характеристикой ЦТ) той части границы П, где либо = 1, либо *2 = 0, *3 < 0, либо *2 = 1, *3 > 0. Введем обозначения:
Пг(и) = 4 (С Ж
./п
п(и) = и(С Ж.
п
Непосредственно вычисляя, находим:
Фг[«](*) = £1 [Со/ (пг(й))1 (*), Тг[«](*) = 2и(*), ^[«](*) = £1 [С/ (пг(й),п(й))1 (*),
г
МС0 = (Пг(Ж п(и)) (г = ^ ..., ^ (Лг)* [А](*) = ,ьз),1](*1) Рг (*2 + *3(*1 - 1),*3) А (*2 + *3(*1 - 1),*3), * € П,
где а(*2,*3) = 0 при 0 С *2 С 1 - *3, *3 ^ 0 и при -*3 С *2 С 1, *3 С 0; а(*2,*3) = = 1 - (1 - *2)/*3 при 1 - *3 С *2 С 1, *3 > 0; а(*2,/) = 1 + *2/*3 при 0 С *2 С -*3, *3 < 0. То есть сопряженное уравнение (3.12) имеет вид
ф(*) - £1 [агф] (*) - (£2)* [вгф] (*) = -£
со/ (пг(и)) + у"Сг/ (пг(и),п(и))
"=1
(*) -
- Х[а(42,43),1](*1) Рг (*2 + *3(*1 - 1),*3) А (*2 + *3(*1 - 1),*3), * € П, (4.30)
и является функциональным уравнением вольтеррова типа. Функция Фг, формирующая критерии (3.7) и (3.15), которым удовлетворяет решение иг[А, у] задачи (3.5), задается формулой Фг[и, А,у](*) = 7г(*)фг[и, А,у](*) + 2и(*) + ^¡=1 у"(пг(и),п(и)), * € П, где фг[и, А, у] — решение уравнения (4.30). Единственное в Ь2 решение этого уравнения принадлежит классу Ш. Уравнение (4.30) эквивалентно краевой задаче
дф/д*1 + *3 ■ дф/д*2 = -аг(*)ф(*) - I У(*3; *\*2,С) в"Ж ,Л<) Ф(Л*2,С) ^ +
'-1
+ Со/ (пг(и)) + ^угСг/ (пг(и),п(и)), * € П
"=1
ф(1,*2,*3) = Рг (*2,*3) А(*2 ,*3), ф(*1,1, *3) = 0, ф(*1,0,*3) = 0,
0 С *2 С 1, 0 С С 1, 0 С С 1,
-1 С *3 С 1 0 С *3 С 1 -1 С *3 С 0
интегро-дифференциальное уравнение которой получается из (4.30) дифференцированием вдоль характеристик, а краевые условия — подстановками соответствующих значений независимых переменных.
1
Финансирование. Исследования первого автора выполнены при финансовой поддержке РФФИ в рамках научного проекта 20—01—00199_а. Исследования второго автора выполнены при финансовой поддержке РФФИ в рамках научного проекта 20-01 -00199_а.
СПИСОК ЛИТЕРАТУРЫ
1. Фурсиков А. В. Оптимальное управление распределенными системами. Теория и приложения. Новосибирск: Научная книга, 1999.
2. Troltzsch F. Optimal control of partial differential equations. AMS, 2010. https://doi.org/10.1090/gsm/112
3. Dieye M., Diop M. A., Ezzinbi Kh. Necessary conditions of optimality for some stochastic integro-differential equations of neutral type on Hilbert spaces // Applied Mathematics and Optimization. 2018. Vol. 77. P. 343-375. https://doi.org/10.1007/s00245-016-9377-x
4. Breitenbach T., Borzi A. A sequential quadratic Hamiltonian method for solving parabolic optimal control problems with discontinuous cost functionals // Journal of Dynamical and Control Systems. 2019. Vol. 25. No. 3. P. 403-435. https://doi.org/10.1007/s10883-018-9419-6
5. Breitenbach T., Borzi A. On the SQH scheme to solve nonsmooth PDE optimal control problems // Numerical Functional Analysis and Optimization. 2019. Vol. 40. Issue 13. P. 1489-1531. https://doi.org/10.1080/01630563.2019.1599911
6. Casas E., Mateos M., Rosch A. Error estimates for semilinear parabolic control problems in the absence of Tikhonov term // SIAM Journal on Control and Optimization. 2019. Vol. 57. Issue 4. P. 2515-2540. https://doi.org/10.1137/18M117220X
7. Aronna M. S., Bonnans J. F., Kroner A. Optimal control of PDEs in a complex space setting: application to the Schrodinger equation // SIAM Journal on Control and Optimization. 2019. Vol. 57. Issue 2. P. 1390-1412. https://doi.org/10.1137/17M1117653
8. Betz L.M. Second-order sufficient optimality conditions for optimal control of nonsmooth, semilinear parabolic equations // SIAM Journal on Control and Optimization. 2019. Vol. 57. Issue 6. P. 4033-4062. https://doi.org/10.1137/19M1239106
9. Casas E., Troltzsch F. On optimal control problems with controls appearing nonlinearly in an elliptic state equation // SIAM Journal on Control and Optimization. 2020. Vol. 58. Issue 4. P. 1961-1983. https://doi.org/10.1137/19M1293442
10. Lin P., Yong J. Controlled singular Volterra integral equations and Pontryagin maximum principle // SIAM Journal on Control and Optimization. 2020. Vol. 58. Issue 1. P. 136-164.
https ://doi.org/10.1137/19M124602X
11. Zhang X., Li H., Liu Ch. Optimal control problem for the Cahn-Hilliard/Allen-Cahn equation with state constraint // Applied Mathematics and Optimization. 2020. Vol. 82. Issue 2. P. 721-754. https://doi.org/10.1007/s00245-018-9546-1
12. Casas E., Kunisch K. Optimal control of the two-dimensional evolutionary Navier-Stokes equations with measure valued controls // SIAM Journal on Control and Optimization. 2021. Vol. 59. Issue 3. P. 2223-2246. https://doi.org/10.1137/20M1351400
13. Сумин М. И. Регуляризация в линейно выпуклой задаче математического программирования на основе теории двойственности // Журнал вычислительной математики и математической физики. 2007. Т. 47. № 4. С. 602-625. https://elibrary.ru/item.asp?id=9535238
14. Сумин М. И. Регуляризованная параметрическая теорема Куна-Таккера в гильбертовом пространстве // Журнал вычислительной математики и математической физики. 2011. Т. 51. № 9. С. 1594-1615. https://elibrary.ru/item.asp?id=16766246
15. Сумин М. И. Регуляризованные принцип Лагранжа и принцип максимума Понтрягина в оптимальном управлении и обратных задачах // Труды Института математики и механики УрО РАН. 2019. Т. 25. № 1. C. 279-296. https://doi.org/10.21538/0134-4889-2019-25-1-279-296
16. Сумин В. И., Сумин М.И. Регуляризованные классические условия оптимальности в итерационной форме для выпуклых задач оптимизации распределенных систем вольтеррова типа //
Вестник Удмуртского университета. Математика. Механика. Компьютерные науки. 2021. Т. 31. Вып. 2. С. 265-284. https://doi.org/10.35634/vm210208
17. Сумин В. И., Сумин М. И. Регуляризация классических условий оптимальности в задачах оптимального управления линейными распределенными системами вольтеррова типа // Журнал вычислительной математики и математической физики. 2022. Т. 62. № 1. С. 45-70. https://doi.org/10.31857/S0044466921110144
18. Алексеев В.М., Тихомиров В.М., Фомин С. В. Оптимальное управление. М.: Наука, 1979.
19. Тихонов А. Н., Арсенин В. Я. Методы решения некорректных задач. М.: Наука, 1986.
20. Васильев Ф. П. Методы оптимизации. М.: МЦНМО, 2011.
21. Треногин В. А. Функциональный анализ. М.: Наука, 1980.
22. Сумин М. И. О регуляризации классических условий оптимальности в выпуклых задачах оптимального управления // Труды Института математики и механики УрО РАН. 2020. Т. 26. № 2. C. 252-269. https://doi.org/10.21538/0134-4889-2020-26-2-252-269
23. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977.
24. Сумин В. И. Функциональные вольтерровы уравнения в теории оптимального управления распределенными системами. Нижний Новгород: ННГУ, 1992.
25. Сумин В. И., Чернов А. В. Операторы в пространствах измеримых функций: вольтерровость и квазинильпотентность // Дифференциальные уравнения. 1998. Т. 34. № 10. С. 1402-1411. http://mi.mathnet.ru/de9796
26. Гохберг И. Ц., Крейн М. Г. Теория вольтерровых операторов в гильбертовом пространстве и ее приложения. М.: Наука, 1967.
27. Сумин В. И. Функционально-операторные вольтерровы уравнения в теории оптимального управления распределенными системами // Доклады Академии наук СССР. 1989. Т. 305. № 5. C. 1056-1059. http://mi.mathnet.ru/dan7167
28. Сумин В. И. Управляемые вольтерровы функциональные уравнения и принцип сжимающих отображений // Труды Института математики и механики УрО РАН. 2019. Т. 25. № 1. C. 262-278. https://doi.org/10.21538/0134-4889-2019-25-1-262-278
29. Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. М.: Наука, 1974.
30. Дмитрук А. В. Выпуклый анализ. Элементарный вводный курс. М.: МАКС Пресс, 2012.
31. Jorgens K. An asymptotic expansion in the theory of neutron transport // Communications on Pure and Applied Mathematics. 1958. Vol. 11. Issue 2. P. 219-242. https://doi.org/10.1002/cpa.3160110206
Поступила в редакцию 24.12.2021 Принята в печать 15.03.2022
Сумин Владимир Иосифович, д. ф.-м. н., профессор, Нижегородский государственный университет им. Н. И. Лобачевского, 603950, Россия, г. Нижний Новгород, пр. Гагарина, 23; Тамбовский государственный университет им. Г. Р. Державина, 392000, Россия, г. Тамбов, ул. Интернациональная, 33.
ORCID: https://orcid.org/0000-0002-7479-2181 E-mail: [email protected]
Сумин Михаил Иосифович, д. ф.-м. н., профессор, Тамбовский государственный университет им. Г. Р. Державина, 392000, Россия, г. Тамбов, ул. Интернациональная, 33;
Нижегородский государственный университет им. Н. И. Лобаческого, 603950, Россия, г. Нижний
Новгород, пр. Гагарина, 23.
ORCID: https://orcid.org/00000-0002-3700-6428
E-mail: [email protected]
Цитирование: В. И. Сумин, М. И. Сумин. О регуляризации принципа Лагранжа в задачах оптимизации линейных распределенных систем вольтеррова типа с операторными ограничениями // Известия Института математики и информатики Удмуртского государственного университета. 2022. Т. 59. С. 85-113.
V.I. Sumin, M.I. Sumin
On regularization of the Lagrange principle in the optimization problems for linear distributed Volterra type systems with operator constraints
Keywords: convex optimal control, distributed system, functional-operator equation of Volterra type, operator constraint, ill-posedness, regularization, duality, minimizing approximate solution, regularizing operator, Lagrange principle, Pontryagin maximum principle.
MSC2020: 49K20, 39B22, 49N15, 47A52
DOI: 10.35634/2226-3594-2022-59-07
Regularization of the classical optimality conditions — the Lagrange principle and the Pontryagin maximum principle — in a convex optimal control problem subject to functional equality and inequality constraints is considered. The controlled system is described by a linear functional-operator equation of second kind of the general form in the space L™. The main operator on the right-hand side of the equation is assumed to be quasi-nilpotent. The objective functional to be minimized is strongly convex. The derivation of the regularized classical optimality conditions is based on the use of the dual regu-larization method. The main purpose of the regularized Lagrange principle and regularized Pontryagin maximum principle is to stably generate minimizing approximate solutions in the sense of J. Warga. As an application of the results obtained for the general linear functional-operator equation of second kind, two examples of concrete optimal control problems related to a system of delay equations and to an integro-differential transport equation are discussed.
Funding. The study of the first author was funded by RFBR, project number 20-01-00199_a. The study of the second author was funded by RFBR, project number 20-01-00199_a.
REFERENCES
1. Fursikov A. V. Optimal control of distributed systems. Theory and applications, AMS, 2000.
2. Troltzsch F. Optimal control of partial differential equations, AMS, 2010. https://doi.org/10.1090/gsm/112
3. Dieye M., Diop M. A., Ezzinbi K. Necessary conditions of optimality for some stochastic integro-differential equations of neutral type on Hilbert spaces, Applied Mathematics and Optimization, 2018, vol. 77, pp. 343-375. https://doi.org/10.1007/s00245-016-9377-x
4. Breitenbach T., Borzi A. A sequential quadratic Hamiltonian method for solving parabolic optimal control problems with discontinuous cost functionals, Journal of Dynamical and Control Systems, 2019, vol. 25, no. 3, pp. 403-435. https://doi.org/10.1007/s10883-018-9419-6
5. Breitenbach T., Borzi A. On the SQH scheme to solve nonsmooth PDE optimal control problems, Numerical Functional Analysis and Optimization, 2019, vol. 40, issue 13, pp. 1489-1531. https://doi.org/10.1080/01630563.2019.1599911
6. Casas E., Mateos M., Rosch A. Error estimates for semilinear parabolic control problems in the absence of Tikhonov term, SIAM Journal on Control and Optimization, 2019, vol. 57, issue 4, pp. 2515-2540. https://doi.org/10.1137/18M117220X
7. Aronna M. S., Bonnans J. F., Kroner A. Optimal control of PDEs in a complex space setting: application to the Schrodinger equation, SIAM Journal on Control and Optimization, 2019, vol. 57, issue 2, pp. 1390-1412. https://doi.org/10.1137/17M1117653
8. Betz L. M. Second-order sufficient optimality conditions for optimal control of nonsmooth, semilinear parabolic equations, SIAM Journal on Control and Optimization, 2019, vol. 57, issue 6, pp. 4033-4062. https://doi.org/10.1137/19M1239106
9. Casas E., Troltzsch F. On optimal control problems with controls appearing nonlinearly in an elliptic state equation, SIAM Journal on Control and Optimization, 2020, vol. 58, issue 4, pp. 1961-1983. https://doi.org/10.1137/19M1293442
10.
11
12.
13.
14.
15.
16.
17.
18.
19.
20
21
22
23
24
25
26
27
28
29
30
31
Lin P., Yong J. Controlled singular Volterra integral equations and Pontryagin maximum principle, SIAM Journal on Control and Optimization, 2020, vol. 58, issue 1, pp. 136-164. https://doi.org/10.1137/19M124602X
Zhang X., Li H., Liu Ch. Optimal control problem for the Cahn-Hilliard/Allen-Cahn equation with state constraint, Applied Mathematics and Optimization, 2020, vol. 82, issue 2, pp. 721-754. https://doi.org/10.1007/s00245-018-9546-1
Casas E., Kunisch K. Optimal control of the two-dimensional evolutionary Navier-Stokes equations with measure valued controls, SIAM Journal on Control and Optimization, 2021, vol. 59, issue 3, pp. 2223-2246. https://doi.org/10.1137/20M1351400
Sumin M. I. Duality-based regularization in a linear convex mathematical programming problem, Computational Mathematics and Mathematical Physics, 2007, vol. 47, no. 4, pp. 579-600. https://doi.org/10.1134/S0965542507040045
Sumin M. I. Regularized parametric Kuhn-Tucker theorem in a Hilbert space, Computational Mathematics and Mathematical Physics, 2011, vol. 51, no. 9, pp. 1489-1509. https://doi.org/10.1134/S0965542511090156
Sumin M. I. Regularized Lagrange principle and Pontryagin maximum principle in optimal control and in inverse problems, Trudy Instituta Matematiki i Mekhaniki UrO RAN, 2019, vol. 25, no. 1, pp. 279-296 (in Russian). https://doi.org/10.21538/0134-4889-2019-25-1-279-296 Sumin V. I., Sumin M. I. Regularized classical optimality conditions in iterative form for convex optimization problems for distributed Volterra-type systems, Vestnik Udmurtskogo Universiteta. Matem-atika. Mekhanika. Komp'yuternye Nauki, 2021, vol. 31, issue 2, pp. 265-284 (in Russian). https://doi.org/10.35634/vm210208
Sumin V. I., Sumin M. I. Regularization of the classical optimality conditions in optimal control problems for linear distributed systems of Volterra type, Computational Mathematics and Mathematical Physics, 2022, vol. 62, no. 1, pp. 42-65. https://doi.org/10.1134/S0965542521110142 Alekseev V. M., Tikhomirov V. M., Fomin S.V. Optimal control, New York: Springer, 1987. https://doi.org/10.1007/978-1-4615-7551-1
Tikhonov A.N., Arsenin V. Ya. Solutions of ill-posed problems, New York: Halsted Press, 1977. Vasil'ev F. P. Metody optimizatsii (Optimization methods), Moscow: Moscow Center for Continuous Mathematical Education, 2011.
Trenogin V. A. Funktsional'nyi analiz (Functional analysis), Moscow: Nauka, 1979. Sumin M. I. On the regularization of the classical optimality conditions in convex optimal control problems, Trudy Instituta Matematiki i Mekhaniki UrO RAN, 2020, vol. 26, no. 2, pp. 252-269 (in Russian). https://doi.org/10.21538/0134-4889-2020-26-2-252-269
Warga J. Optimal control of differential and functional equations, New York-London: Academic Press, 1972.
Sumin V.I. Funktsional'nye vol'terrovy uravneniya v teorii optimal'nogo upravleniya raspredelen-nymi sistemami (Functional Volterra equations in the theory of optimal control of distributed systems), Nizhny Novgorod: Nizhny Novgorod University, 1992.
Sumin V. I., Chernov A. V. Operators in the spaces of measurable functions: the Volterra property and quasinilpotency, Differential Equations, 1998, vol. 34, no. 10, pp. 1403-1411. https://elibrary.ru/item.asp?id= 13282777
Gohberg I. C., Krein M. G. Theory and applications of Volterra operators in Hilbert space, AMS, 1970. https://doi.org/10.1090/mmono/024
Sumin V. I. Volterra functional-operator equations in the theory of optimal control of distributed
systems, Sov. Math., Dokl., 1989, vol. 39, no. 2, pp. 374-378. https://zbmath.org/?q=an:0695.49006
Sumin V. I. Controlled Volterra functional equations and the contraction mapping principle, Trudy
Instituta Matematiki i Mekhaniki URO RAN, 2019, vol. 25, no. 1, pp. 262-278 (in Russian).
https://doi.org/10.21538/0134-4889-2019-25-1-262-278
Ioffe A. D., Tikhomirov V. M. Theory of extremal problems, Elsevier, 1979.
Dmitruk A. V. Vypuklyi analiz. Elementarnyi vvodnyi kurs (Convex analysis. Elementary introductory course), Moscow: MAKS Press, 2012.
Jorgens K. An asymptotic expansion in the theory of neutron transport, Communications on Pure and
Applied Mathematics, 1958, vol. 11, issue 2, pp. 219-242. https://doi.org/10.1002/cpa.3160110206
Received 24.12.2021 Accepted 15.03.2022
Vladimir Iosifovich Sumin, Doctor of Physics and Mathematics, Professor, Nizhnii Novgorod State University, pr. Gagarina, 23, Nizhnii Novgorod, 603950, Russia; Tambov State University, ul. Internatsional'naya, 33, Tambov, 392000, Russia. ORCID: https://orcid.org/0000-0002-7479-2181 E-mail: [email protected]
Mikhail Iosifovich Sumin, Doctor of Physics and Mathematics, Professor, Tambov State University, ul. Internatsional'naya, 33, Tambov, 392000, Russia;
Nizhnii Novgorod State University, pr. Gagarina, 23, Nizhnii Novgorod, 603950, Russia. ORCID: https://orcid.org/00000-0002-3700-6428 E-mail: [email protected]
Citation: V. I. Sumin, M. I. Sumin. On regularization of the Lagrange principle in the optimization problems for linear distributed Volterra type systems with operator constraints, Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 2022, vol. 59, pp. 85-113.