Научная статья на тему 'ПРИНЦИП ЛАГРАНЖА И ЕГО РЕГУЛЯРИЗАЦИЯ КАК ТЕОРЕТИЧЕСКАЯ ОСНОВА УСТОЙЧИВОГО РЕШЕНИЯ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ И ОБРАТНЫХ ЗАДАЧ'

ПРИНЦИП ЛАГРАНЖА И ЕГО РЕГУЛЯРИЗАЦИЯ КАК ТЕОРЕТИЧЕСКАЯ ОСНОВА УСТОЙЧИВОГО РЕШЕНИЯ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ И ОБРАТНЫХ ЗАДАЧ Текст научной статьи по специальности «Математика»

CC BY
94
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЫПУКЛОЕ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / ОБРАТНАЯ ЗАДАЧА / ПАРАБОЛИЧЕСКОЕ УРАВНЕНИЕ / ОПЕРАТОРНОЕ ОГРАНИЧЕНИЕ / ГРАНИЧНОЕ УПРАВЛЕНИЕ / МИНИМИЗИРУЮЩАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ / РЕГУЛЯРИЗИРУЮЩИЙ АЛГОРИТМ / ПРИНЦИП ЛАГРАНЖА / ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА / ДВОЙСТВЕННАЯ РЕГУЛЯРИЗАЦИЯ

Аннотация научной статьи по математике, автор научной работы — Сумин Михаил Иосифович

Статья посвящена регуляризации классических условий оптимальности (КУО) - принципа Лагранжа и принципа максимума Понтрягина в выпуклой задаче оптимального управления для параболического уравнения с операторным (поточечным фазовым) ограничением-равенством в финальный момент времени. Задача содержит распределенное, начальное и граничное управления, причем множество ее допустимых управлений не предполагается ограниченным. В случае частного вида квадратичного функционала качества задачу естественно трактовать как обратную задачу финального наблюдения по нахождению возмущающего воздействия, вызвавшего данное наблюдение. Главное предназначение регуляризованных КУО - устойчивое генерирование минимизирующих приближенных решений (МПР) в смысле Дж. Варги. Регуляризованные КУО: 1) формулируются как теоремы существовании МПР в исходной задаче с одновременным конструктивным представлением конкретных МПР; 2) выражаются в терминах регулярных классических функций Лагранжа и Гамильтона-Понтрягина; 3) являются секвенциальными обобщениями КУО и сохраняют их общую структуру; 4) «преодолевают» некорректность КУО, являются регуляризирующими алгоритмами для решения оптимизационных задач и составляют теоретическую основу для устойчивого решения современных содержательных некорректных оптимизационных и обратных задач.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Сумин Михаил Иосифович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LAGRANGE PRINCIPLE AND ITS REGULARIZATION AS A THEORETICAL BASIS OF STABLE SOLVING OPTIMAL CONTROL AND INVERSE PROBLEMS

The paper is devoted to the regularization of the classical optimality conditions (COC) - the Lagrange principle and the Pontryagin maximum principle in a convex optimal control problem for a parabolic equation with an operator (pointwise state) equality-constraint at the final time. The problem contains distributed, initial and boundary controls, and the set of its admissible controls is not assumed to be bounded. In the case of a specific form of the quadratic quality functional, it is natural to interpret the problem as the inverse problem of the final observation to find the perturbing effect that caused this observation. The main purpose of regularized COCs is stable generation of minimizing approximate solutions (MAS) in the sense of J. Warga. Regularized COCs are: 1) formulated as existence theorems of the MASs in the original problem with a simultaneous constructive representation of specific MASs; 2) expressed in terms of regular classical Lagrange and Hamilton-Pontryagin functions; 3) are sequential generalizations of the COCs and retain the general structure of the latter; 4) “overcome” the ill-posedness of the COCs, are regularizing algorithms for solving optimization problems, and form the theoretical basis for the stable solving modern meaningful ill-posed optimization and inverse problems.

Текст научной работы на тему «ПРИНЦИП ЛАГРАНЖА И ЕГО РЕГУЛЯРИЗАЦИЯ КАК ТЕОРЕТИЧЕСКАЯ ОСНОВА УСТОЙЧИВОГО РЕШЕНИЯ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ И ОБРАТНЫХ ЗАДАЧ»

Том 26, № 134 © Сумин М.И., 2021

DOI 10.20310/2686-9667-2021-26-134-151-171 УДК 517.9

Принцип Лагранжа и его регуляризация как теоретическая основа устойчивого решения задач оптимального управления и обратных задач

Михаил Иосифович СУМИН

ФГБОУ ВО «Тамбовский государственный университет им. Г.Р. Державина» 392000, Российская Федерация, г. Тамбов, ул. Интернациональная, 33 ФГАОУ ВО «Нижегородский государственный университет им. Н.И. Лобачевского» 603950, Российская Федерация, г. Нижний Новгород, пр-т Гагарина, 23

Lagrange principle and its regularization as a theoretical basis of stable solving optimal control and inverse problems

Mikhail I. SUMIN

Derzhavin Tambov State University 33 Internatsionalnaya St., Tambov 392000, Russian Federation

Nizhnii Novgorod State University 23 Gagarin Ave., Nizhnii Novgorod 603950, Russian Federation

Аннотация. Статья посвящена регуляризации классических условий оптимальности (КУО) — принципа Лагранжа и принципа максимума Понтрягина в выпуклой задаче оптимального управления для параболического уравнения с операторным (поточечным фазовым) ограничением-равенством в финальный момент времени. Задача содержит распределенное, начальное и граничное управления, причем множество ее допустимых управлений не предполагается ограниченным. В случае частного вида квадратичного функционала качества задачу естественно трактовать как обратную задачу финального наблюдения по нахождению возмущающего воздействия, вызвавшего данное наблюдение. Главное предназначение регуляризованных КУО — устойчивое генерирование минимизирующих приближенных решений (МПР) в смысле Дж. Варги. Регуляризованные КУО: 1) формулируются как теоремы существовании МПР в исходной задаче с одновременным конструктивным представлением конкретных МПР; 2) выражаются в терминах регулярных классических функций Лагранжа и Гамильтона-Понтрягина; 3) являются секвенциальными обобщениями КУО и сохраняют их общую структуру; 4) «преодолевают» некорректность КУО, являются регуляризирующими алгоритмами для решения оптимизационных задач и составляют теоретическую основу для устойчивого решения современных содержательных некорректных оптимизационных и обратных задач.

Ключевые слова: выпуклое оптимальное управление, обратная задача, параболическое уравнение, операторное ограничение, граничное управление, минимизирующая последовательность, регуляризирующий алгоритм, принцип Лагранжа, принцип максимума Понт-рягина, двойственная регуляризация

Благодарности: Работа выполнена при поддержке РФФИ (проекты № 19-07-00782_а, № 20-01-00199_а, № 20-52-00030 Бел_а).

Для цитирования: Сумин М.И. Принцип Лагранжа и его регуляризация как теоретическая основа устойчивого решения задач оптимального управления и обратных задач

2021

// Вестник российских университетов. Математика. 2021. Т. 26. № 134. С. 151-171. DOI 10.20310/2686-9667-2021-26-134-151-171.

Abstract. The paper is devoted to the regularization of the classical optimality conditions (COC) — the Lagrange principle and the Pontryagin maximum principle in a convex optimal control problem for a parabolic equation with an operator (pointwise state) equality-constraint at the final time. The problem contains distributed, initial and boundary controls, and the set of its admissible controls is not assumed to be bounded. In the case of a specific form of the quadratic quality functional, it is natural to interpret the problem as the inverse problem of the final observation to find the perturbing effect that caused this observation. The main purpose of regularized COCs is stable generation of minimizing approximate solutions (MAS) in the sense of J. Warga. Regularized COCs are: 1) formulated as existence theorems of the MASs in the original problem with a simultaneous constructive representation of specific MASs; 2) expressed in terms of regular classical Lagrange and Hamilton-Pontryagin functions; 3) are sequential generalizations of the COCs and retain the general structure of the latter; 4) "overcome" the ill-posedness of the COCs, are regularizing algorithms for solving optimization problems, and form the theoretical basis for the stable solving modern meaningful ill-posed optimization and inverse problems.

Keywords: convex optimal control, inverse problem, parabolic equation, operator constraint, boundary control, minimizing sequence, regularizing algorithm, Lagrange principle, Pontryagin maximum principle, dual regularization

Mathematics Subject Classification: 49K20, 49N60, 49N15, 47A52

Acknowledgements: The work is partially supported by the Russian Foundation for Basic Research (projects no. 19-07-00782_a, 20-01-00199_a, 20-52-00030 Bel_a).

For citation: Sumin M.I. Printsip Lagranzha i ego regulyarizatsiya kak teoreticheskaya osnova ustoychivogo resheniya zadach optimal'nogo upravleniya i obratnykh zadach [Lagrange principle and its regularization as a theoretical basis of stable solving optimal control and inverse problems]. Vestnik rossiyskikh universitetov. Matematika - Russian Universities Reports. Mathematics, 2021, vol. 26, no. 134, pp. 151-171. DOI 10.20310/2686-9667-2021-26-134-151-171. (In Russian, Abstr. in Engl.)

Введение

Работа посвящена регуляризации классических условий оптимальности (КУО) — принципа Лагранжа (ПЛ) и принципа максимума Понтрягина (ПМП) в выпуклой задаче оптимального управления для параболического уравнения с операторным ограничением-равенством в финальный момент времени. Задача содержит распределенное, начальное и граничное управления, причем множество ее допустимых управлений не предполагается ограниченным. В случае частного вида квадратичного функционала качества ее естественно трактовать как обратную задачу финального наблюдения по нахождению возмущающего воздействия, вызвавшего данное наблюдение. Задачи оптимального управления с операторными ограничениями-равенствами являются в огромном числе случаев типичными некорректными задачами. К свойствам некорректности таких задач относятся несуществование их решений и решений двойственных к ним задач, а также неустойчивость решений как по аргументу, так и по функции (см., например, [1, гл. 9]). Естественно, свойства некорректности в полной мере наследуют и соответствующие КУО. Говоря о некорректности КУО, в первую очередь мы имеем здесь в виду такие ее проявления как их возможные неустойчивость и невыполнимость, примеры которых и соответствующие комментарии можно найти в [2-4]. Кроме того, примеры такой некорректности КУО, относящиеся непосредственно к рассматриваемой в работе задаче оптимального управления, можно найти ниже в разделе 3.

Анализ различных примеров задач условной оптимизации, оптимального управления приводит к естественному выводу о том, что свойства их некорректности, а также некорректности соответствующих КУО заложены в самой природе этих задач. Поэтому, если возникает потребность «привлекать» КУО непосредственно к решению современных содержательных оптимизационных задач, то и «относиться» к ним необходимо, в соответствии с традициями теории некорректных задач [5] как к математическим объектам с выраженными свойствами некорректности. В этом случае возникает естественная необходимость регуляризации КУО, то есть создания их «неких аналогов», в отсутствие точного задания исходных данных, «преодолевающих» указанные свойства некорректности. В данной работе мы ставим во главу угла именно эту необходимость, предполагающую регуляризацию КУО и естественным образом объединяющую два направления математической теории: 1. КУО в задачах условной оптимизации и оптимального управления; 2. Регуляризация некорректных задач. В ней продолжается линия работы [4], в которой также рассматривалась регуляризации КУО в задаче оптимального управления с операторным ограничением-равенством, но в случае сосредоточенной управляемой системы. Заметим здесь же, что при условии ограниченности множества допустимых элементов (управлений, возмущений) аналогичная регуляризация ПЛ и ПМП для управляемого параболического уравнения была рассмотрена в [6].

Как и в [2-4,7], центральными понятиями в работе являются понятие обобщенной минимизирующей последовательности — минимизирующего приближенного решения (МПР) в смысле Дж. Варги [8] (в теории математического программирования подобные обобщенные (минимизирующие) последовательности, удовлетворяющие ограничениям задачи «в пределе», известны также под названием обобщенных (оптимальных) планов [9]) и жестко с ним связанное понятие МПР-образующего (регуляризирующего) алгоритма [4,7] (см. определение 1.1). Последнее, так же, как и в [4,7], «встраивается» в получаемые регуляризованные ПЛ и ПМП. Заметим, что широко используемое в оптимизации понятие обобщенной минимизирующей последовательности органично сочетает в себе учет как запросов строгой математической оптимизационной теории [8, гл. 1У-УШ], [9], так и потребностей инженерной практики, предполагающей неизбежное наличие у приближенных решений ненулевых зазоров и при выполнении ограничений задачи и при приближении значений функционала цели к ее (обобщенной) нижней грани [8, гл. III]. Регуляризованные КУО: 1) формулируются как теоремы существовании МПР в исходной задаче с одновременным конструктивным представлением конкретных МПР; 2) выражаются в терминах регулярных классических функций Лагранжа и Гамильтона-Понтрягина; 3) являются секвенциальными обобщениями КУО и сохраняют их общую структуру; 4) «преодолевают» некорректность КУО и являются регуляризирующими алгоритмами для решения оптимизационных задач. Такая трансформация-регуляризация КУО основана, по аналогии с [4,7], на использовании двух параметров регуляризации, первый из которых «отвечает» за регуляризацию двойственной задачи, второй же содержится в сильно выпуклом регуля-ризирующем добавке к целевому функционалу исходной задачи, не являющемуся, вообще говоря, сильно выпуклым. Подчеркнем одновременно, что в случае сильной выпуклости целевого функционала второй регуляризирующий параметр является излишним и его следует считать равным нулю, подробности см. в разделе 4. Отметим также, что применяемое здесь понятие МПР-образующего алгоритма [4, 7] можно квалифицировать как занимающее промежуточное положение между двумя привычными понятиями регуляризирующих

алгоритмов первого (сходимость нижних граней, см. определение 1 [1, гл. 9, § 2, с. 802]) и второго (сходимость по аргументу, см. определение 1 [1, гл. 9, § 6, с. 837, 838]) типа, применяемых в [1, гл. 9] (см. также [4,7]).

1. Постановка задачи

Пусть и С М1, V С М1, Ш С М1 — выпуклые замкнутые множества, Qт = П х (0,Т), Б = дП, Бт = {(х,Ь) : х € Б, Ь € (0,Т)}, П — ограниченная область в Ега, V = VI хV2 х Vз, VI = {и € Ь2{дт) : и(х,Ь) € и п. в. на Qт}, V2 = {у € Ь2(П) : у(х) € V п. в. на П}, Vз = {ш € 12(Бт) : ш(х,Ь) € Ш п. в. на Бт}, V С Ь2^т) х Ь2(п) х Ь2(Бт) = Н, и, у, ш — управляющие функции. Норму в гильбертовом пространстве Н с элементами п = (и,у,ш) обозначим через ||п||н = ||п||.

Рассмотрим выпуклую задачу условной минимизации (вообще говоря, не сильно выпуклого функционала) с операторным (поточечным фазовым в финальный момент времени) ограничением-равенством

(ОС) /(п) ^ шт, д(п)(х) = С1(х)г[п](х,Т) + С2(х) = 0 при п. в. х € П, п € V С Н,

где непрерывный выпуклый функционал / : М1 и аффинный оператор д : Ь2(П) задаются равенствами

/(п) = (Л^, ^[п](; [*](•, •))Ь2(Ят) + (Л2(^[п]^,Т),г[п](;Т)>Мп)

+ (М; •),^[п](; •)>Ь2(Ят) + Ш, М; •),и(•, •)> Ыдт)

+ (В2(>0,у0>Мп) + (Бз(; •)'(•, •),'(•, -)>^т), д(п) = С^г[п](;Т) + С2(•).

Здесь и ниже г[п\ — соответствующее тройке п решение класса V1'0^т) [10, гл. III] третьей начально-краевой задачи для параболического уравнения дивергентного вида

г - дХ1 (аьз (х,Ь)гх.) + а(х,Ь)г + и(х,Ь) = 0, (1 1)

г(х, 0) = у(х), х € П, + &(х,Ь)г = ш(х,Ь), (х,Ь) € Бт.

В (1.1), как и в [10], д^Х^ = а^ (х,Ь)гХ5 (х,Ь)со^ аг(х,Ь), аг(х,Ь) — угол, образованный внешней нормалью к Б с осью хг.

Замечание 1.1. Целевой функционал задачи (ОС) имеет квадратичный вид. Это позволяет заметно сократить получение регуляризованных ПЛ и ПМП. Однако, излагаемый ниже подход может быть применен и к задачам с целевыми функционалами более «общего выпуклого» вида.

Ниже нам потребуются следующие условия на исходные данные оптимизационной задачи (ОС) :

а) функции Л1 : Qт ^ М1, Л2 : П ^ М1, Л3 : Бт ^ М1, В1 : Qт ^ М1, В2 : П ^ М1, В3 : Бт ^ М1, С1 : П ^ М1, С2 : П ^ М1 измеримы по Лебегу;

б) выполняются неравенства

0 < Л1(х,Ь), В1(х,Ь) < Ь при п. в. (х,Ь) € Qт, 0 < Л2(х), В2(х) < Ь при п. в. х € П, 0 < Л3(х,Ь), В3(х,Ь) < Ь при п. в. (х,Ь) € Бт, Сг € Ь(П), г = 1, 2,

где L — некоторая положительная постоянная;

в) функции aij, a : Qt ^ R1, i, j = 1,... , n, и : St ^ R1 измеримы в смысле Лебега;

г) справедливы оценки

v|£|2 < ai,j(x,t)&£j < ^|2 V(x,t) G Qt, 0;

д) справедливы оценки

|a(x,t)| < K при п. в. (x,t) G QT, |и(х,£)| < K при п. в. (x,t) G ST,

где K > 0 — некоторая постоянная;

е) граница S является кусочно-гладкой.

Замечание 1.2. Отметим, что фазовое ограничение-равенство

g(n) = g(n)(-) = Gi(-)z[n](-,T ) + G2(-) = 0

понимается как равенство почти всюду в П : G1(x)z[n](x, T) + G2(x) при п. в. x G П. Так как z[n] G V21,0(QT) и G1, G2 G Lœ(H), оно, очевидно, эквивалентно равенству в L2(H). Поэтому в качестве пространства образов оператора g(-) ниже выбрано пространство L2(n). Возможные неустойчивость и невыполнимость КУО [3] в подобных ситуациях характеризуют те сложности, которые возникают при анализе задачи (OC) в случае такого выбора пространства образов.

Пусть F — множество всевозможных наборов исходных данных

f = |Ai, Bi, i = 1, 2, 3, Gi, i = 1, 2, ai,j, i = 1,..., n, j = 1,..., n, a, и},

для каждого из которых выполняются условия а), б), в), г), д), е) с независящими от набора постоянными L, K. Определим наборы невозмущенных f0 и возмущенных f0 исходных данных, соответственно:

f0 = {A0, B0, i = 1, 2, 3, G0, i = 1, 2, a0,j, i = 1,...,n, j = 1,...,n, a0, и0}

и

f1 = {A?, B?, i = 1, 2, 3, G1, i = 1, 2, afj, i = 1,... ,n, j = 1,...,n, a1, и0}, i G (0, ô0], ô0 > 0 — некоторое число. Будем считать, что выполняются следующие оценки

||A1 - A0|L,qt , ||A2 - ^L,^ ||A3 - A0IL,sT < ô

l|Bi — B°\\œ,QT, — B°\œ,n, \|Bg — B°\œ,sT < ô, ||Gf — G0\œ,n < ô, i = 1, 2, (1.2) ||af,j — a0,j H^,qt < ô, \af — a0||œ,QT, Ци1 — и0||те,,дт < ô.

Обозначим задачу (OC), решение z[п], функционал /, оператор g, соответствующие набору исходных данных f1, ô G [0,ô0], через (OC1 ), z1 [п], f1, g1, соответственно. Решения задачи (OC0) будем обозначать через п0, а всю совокупность таких решений через П0. Введем также обозначение: D1,e = {п G D : ||gô(п)|| = ||gô(п)||^2(п) < е} е > 0, D0,0 = D0. Определим значение в : L2(H) ^ R1 U {+œ} задачи (OC0)

в = в+0 = lim ве, ве = inf /0(п), ве = если D0,e = 0.

е^+0 ned°-e

Очевидно, в общей ситуации в < во, где во = /0(п) — классическое значение задачи.

Центральным для нас будет, как уже сказано во введении, понятие минимизирующего приближенного решения (МПР) в смысле Дж. Варги [8] в задаче (ОС0), то есть последовательности элементов пг € V, г = 1, 2,..., такой, что

/0(пг) < в + 5г, пг € V0'ё (1.3)

для некоторых последовательностей сходящихся к нулю неотрицательных чисел 5г, ег,

г = 1,2,....

В общей ситуации задачи (ОС0) при условии ее разрешимости мы формально не можем исключать строгого неравенства в < в0. Различные достаточные условия выполнимости равенства в = в0 в задачах выпуклого программирования общего вида в банаховых пространствах можно найти в [9, гл. 3]. Однако, далее мы будем в зависимости от ситуации (свойств исходных данных) конструировать для задачи (ОС0), строго говоря, не только МПР в указанном выше смысле (1.3), а и минимизирующие последовательности пк € V, к = 1, 2,... , удовлетворяющие соотношениям

/0(пк) < в0 + 1к = /0(п0) + 1к, пк € V0'ek, 1к, ек ^ 0, к (1.4)

которые будем называть МПР в смысле (1.4) и которые, очевидно, заведомо являются МПР в указанном выше смысле (1.3) в случае в = в0. Введем важное для всех последующих построений

Определение 1.1. Пусть 5к € (0, 50), к = 1, 2,... , — сходящаяся к нулю последовательность положительных чисел. Зависящий от 5к, к = 1, 2,..., оператор К(^,5к), ставящий в соответствие каждому набору исходных данных ^, удовлетворяющих оценкам (1.) при 5 = 5к, элемент пё € V, называется МПР-образующим в задаче (ОС0),

Як -,—г

если последовательность п , к = 1, 2,..., есть МПР в этой задаче.

Если МПР в задаче (ОС0) понимается в смысле (1.4), то будем говорить, соответственно, и об МПР-образующем операторе в задаче (ОС0) в смысле (1.4).

2. Вспомогательные результаты

В силу условий в), г), д), е) теорема существования обобщенного решения третьей начально-краевой задачи для линейного параболического уравнения с дивергентной главной частью [11] (см. также [10, гл. III, § 5]) обеспечивает разрешимость прямой задачи (1.1) в классе У2'°^т) для любой тройки п = (и,у,ш) € Н и любого Т > 0, а также необходимые оценки.

Лемма 2.1. Если выполняются условия в), г), д), е), то для любой тройки п € Ь2^т) х Ь2(П) х Ь2(Бт) существует единственное решение г[п] класса У2'°) задачи (1.1) и имеет место оценка

Ип]^ + Цг[п] Ь'йт < Ст(ЦиЦ2^т + |Мкп + ЦшУ'вт) (2.1)

(напомним, что, как и в [10], | г[п] | дт = 0ШаХ И^О, Ь)||2,п + Цгх||адт — норма в банаховом

пространстве У2'° )), где постоянная Ст не зависит от п € Ь2^т) х Ь2 (П) х Ь2(Бт) и набора исходных данных f € Р. Кроме того, пусть

f, ^ € Р — два произвольных набора

исходных данных, гф], Ъф] — соответствующие им решения задачи (1.1). Тогда, если выполняются условия в), г), д), е), то для любых двух троек п1, п бН

№] - г[п]|дт + ||г+[п1] - ф]||2,*т

гага

< ст(Е Е ||гх[п]|2,дт||а^- - ^^т + |г[п]|2,дт||а - а|и,^т (2.2)

»=1¿=1

+ ||М - «Ьот + |К - V || 2,П + Ц^1 - И^т + |г[п]|2,5т |И - ^и.йт),

где Ст не зависит от наборов исходных данных f, ^ € Р и троек управляющих параметров п = (м,^,^), п1 = (м1,^1,^1) € Н.

Помимо прямой задачи (1.1) ниже при получении регуляризованного ПМП существенную роль будет играть и сопряженная с ней задача

д

-П - (х,Ь)Пх) + а(х,Ь)п + х(х,Ь) = 0;

дх, (2.3)

дп

п(х,Т) = ф(х), х € П; т^ + а(х,Ь)п = ш(х,Ь), (х,Ь) € $т

с х € Ь2(фт), ф € Ь2(П), ш € Ь2($т), решение которой обозначим через п[х,Ф,ш].

Так как сопряженная краевая задача (2.3) стандартной заменой времени приводится к более привычному виду начально-краевой задачи (1.1) (с начальным условием при Ь = 0), то можно считать, что следствием первого утверждения леммы 2.1 является следующая

Лемма 2.2. Пусть выполняются условия в), г), д), е). Тогда имеет место однозначная разрешимость в У2' (фт) для любых функций х € ), ф € Ь2(П), Ш € ¿2(^т) при любом Т > 0 сопряженной (к (1.1)) задачи (2.3).

Далее сформулируем лемму о так называемом интегральном представлении линейного непрерывного функционала на пространстве решений третьей начально-краевой задачи для линейного параболического уравнения. Она используется при вычислении первых вариаций функционалов в задачах оптимального управления, связанных с указанной начально-краевой задачей. Ее доказательство см. в [12, лемма 3].

Лемма 2.3. Пусть задана третья краевая задача

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

д

Ъ - (а^(х,г)гл,-) + а(х,Ь)г + /(ж, г) = 0;

дх» (2.4)

дг

г(0,х) = ф(х), х € П; т^ + а(х,Ь)г = х(х, г), (ж,г) € $т,

с коэффициентами а^, а, а, удовлетворяющими условиям в), г), д), е) и с / € ),

ф € Ь2(П), х € Ь2($т). Тогда, если функция г € У21,0(фт) есть решение задачи (2.4), то для любых d € Ь2(П), с € ), # € Ь2($т) имеет место равенство

/ с(х,г)г(х,г) dxdt - d(x)z(х, Т) dx - / д(з,г)г(з,г) dsdt •/<9т ./п ./5т

= /(х,г)п(х,г) dxdt - ф(х)п(х, 0) dx - / х(5,Ь)п(5,Ь) dsdt, ./дт ./п ./йт

где функция п G V2'° (QT) — единственное обобщенное решение сопряженной задачи

д

-nt - (х, t)nxi) + a(x, t)n + c(x, t) = 0;

дп

n(x,T) = d(x), x G Q; + a(x,t)n = g(x,t), (x,t) G ST.

3. Задача оптимального управления как задача выпуклого программирования с операторным ограничением-равенством,

некорректность ПЛ

Перепишем задачу (OC0) и возмущенные задачи (OC5) в форме задачи выпуклого программирования с операторным ограничением-равенством. Пусть выполняются условия а), б), в), г), д), е). При любом наборе исходных данных f значение оператора g : H ^ L2(Q) на каждом элементе n является суммой элементов A[n] = G\(-)z[n](-,T) и G2(), где оператор A : H ^ L2(Q) задаваемый равенством Л[п] = An = G\(-)z[n](-,T) в силу линейности начально-краевой задачи (1.1) и оценки (2.1) является линейным ограниченным. Так как функционал f : D ^ R1 является одновременно непрерывным и выпуклым, то мы с формальной точки зрения можем переписать задачу (OC0) в форме невозмущенной задачи выпуклого программирования

(р0) f0(n) ^ min, A°n = h0 = -G2 (■), n GVCH.

С учетом приближенного задания исходных данных мы имеем формально вместо задачи (Р0) семейство задач, зависящих от характеризующей ошибку их задания величины 6

(р5) f5 (n) ^ inf, A5n = hs = -Gi(■), n GD.

Получим в силу оценок (1.) оценки отклонения возмущенных исходных данных {f5, A5, hs} от невозмущенных исходных данных {f0, A0, h0} задачи (P0). С этой целью нам потребуются оценки леммы 2.1 отклонения решений начально-краевой задачи (1.1) при возмущении ее коэффициентов и управлений.

В силу оценок (1.) и оценок (2.1), (2.2) леммы 2.1 можем записать

[n](^T) - z0[n](^T)\\2^ < ct6\\п\\п, (3.1)

где, как и выше, постоянная ct не зависит от набора исходных данных f5 и тройки управляющих параметров n = (u,v,w) G H.

Из оценок (2.1), (2.2), (3.1), в свою очередь, следуют оценки для отклонения функционалов (в случае условий а), б), в), г), д), е))

fs (n) - f0(n)l< C6(l + ЦпЦ2) У n GD

и линейных ограниченных операторов, действующих из пространства H в пространство L2(Q), а также элементов h5, h0

\\ASn - A0n\\ < C6(l + ЦпЦ) Уn G H, \\hs - h0\\ < C6,

в которых постоянную C > 0 следует считать независящей от 6 и тройки управляющих параметров n = (u,v,w). Одновременно, выполняется и неравенство

If (ni) - f5 (n2)l < lm\\ni - п2\\Н У ni, n2 GDil sm ,

где LM > 0 — некоторая не зависящая от 6 Е [0,60] и п^ п2 Е D П SM постоянная, Sm = {п Е H : ЦпУн < M}.

О некорректности ПЛ. Далее в данном разделе покажем, что оставаясь в рамках привычного классического ПЛ (см., например, [13, § 3.2], [14, теорема 2.1], [15, теорема 1.1]), теория которого жестко связана с точным заданием исходных данных оптимизационной задачи, у нас «не очень много шансов» получить, непосредственно опираясь лишь на составляющие его соотношения, «приемлемые» приближенные решения задачи выпуклого программирования (-Р0), а, вместе с тем, и исходной задачи оптимального управления (OC0) с операторным ограничением-равенством.

С этой целью рассматриваем далее в данном разделе зависящую от параметра в ограничении-равенстве «простейшую» выпуклую задачу на условный экстремум

(Pp) ||z||2 ^ inf, Az = h + p, z EDC Z,

где p Е H — параметр, A : Z ^ H — линейный ограниченный оператор, h Е H — заданный элемент, D — выпуклое замкнутое множество, Z, H — гильбертовы пространства. Решения задачи (Pp) в случае их существования будем обозначать через

Обозначим: Dp = {z Е D : ||Az — h — p|| < e}, e > 0. Определим классическую функцию значений задачи (Pp) формулой в0(р) = inf ||z||2 Vp Е H. Определим также

обобщенную функцию значений ß : H ^ R1 U посредством соотношений

e(p) = в+о(р) = lim ве(р), ве(р) = inf ||z|2, в(p) = если Dp = 0.

е^+0 zedp

Так как || • ||2 — сильно выпуклый функционал, то справедливо следующее утверждение (см. леммы 1.1, 1.2, 1.3 в [15]).

Лемма 3.1. Функции значений во, в : Н ^ Е1 и совпадают, являясь полуне-

прерывными снизу и выпуклыми.

Введем функцию Лагранжа Ьр(г,^о,А) = ^о||г||2 + (А, Аг - Н - р», Ьр(г, 1,А) = ЬР(г,Л), г € V, ^о > 0, А € Н.

Напомним, что вектором Куна-Таккера задачи (Рр) называется элемент А* € Н, для которого ||гр||2 < ¿р(г, А*) Vг € V. С учетом леммы 3.1 справедливо следующее утверждение (см. [14, теорема 2.1], [15, теорема 1.1], а также замечания 1.1, 1.2 к теореме 1.1 в [15])

Теорема 3.1. [Параметрический ПЛ в недифференциальной форме] Пусть р € Н такая точка, что в(р) < Тогда:

1. Если гР € Vp = {г € V : Аг - Н - р = 0} — оптимальный элемент в задаче (Рр), то есть ||гр||2 = в(р), и ( € дв(р), где дв(р) — субдифференциал в смысле выпуклого анализа, то для множителя Лагранжа А € Н, А = -при = 1 выполняется соотношение

Ьр(гр,^о,А) < Ьр(г,^о,А) Vг €V (3.2)

и при этом - £ = А — вектор Куна-Таккера задачи (Рр).

И, наоборот, если z G Dp такой элемент, что при некоторых > 0, Л G H выполняется соотношение (3.2) с заменой на г, то этот элемент оптимален в задаче (Pp), то есть z = zp, элемент Л/^0 является вектором Куна-Таккера для нее и одновременно — Л/^0 G дв (p).

2. Если G Dp — оптимальный элемент в задаче (Pp), p G д^отв и Z G дœв(p), Z = 0, где д^в(р) — сингулярный (асимптотический) субдифференциал (см., например, [16]), определяемый формулой

д~в(p) = {Л G H : (Л, 0) G Nepiß(р,в(р))},

то для множителя Лагранжа Л G H, Л = —Z, соотношение (3.2) выполняются при ^о = 0.

И, наоборот, если г G Dp — такой элемент, что при = 0 и некотором Л G H, Л = 0, выполняется соотношение (3.2) с заменой на г, то p G д^отв и одновременно — Л G дœe(p).

Пример 3.1. Рассмотрим задачу (Pp) c H = Z, h = 0 (Pp) ||z||2 ^ min, Az = p, z GDC Z,

где A : Z ^ Z — линейный непрерывный инъективный оператор с инъективным сопряженным A*. В этом случае, с учетом равенства (A*)* = A, имеют место равенства R(A) = Z, R(A*) = Z (см. [17, теорема 3.1]).

3.1.1. Неустойчивость ПЛ. При анализе примера 1 в [3] был доказан следующий факт. Пусть p G Z — любой такой элемент, для которого: 1) задача (Pp) разрешима (очевидно, единственным образом); 2) это решение zP удовлетворяет при некотором Л G Z регулярному ПЛ в недифференциальной форме Lp(z0^) < Lp(z, Л) Vz G D (см. (3.2)); 3) существуют слабо, но не сильно, сходящиеся в Z к zP последовательности zk G D, k = 1, 2,... (очевидно, такие последовательности заведомо существуют, если D = Z ), причем для всех таких последовательностей имеет место сильная сходимость Azk ^ AzP = p, k ^ œ (очевидно, последнее заведомо так, если оператор A — вполне непрерывный). Тогда можно утверждать, что существуют такие pk ^ p, k ^ œ, для которых в аппроксимирующих (при p = pk ) задачах (Ppk ) справедливо утверждение регулярного ПЛ такого же, как и в случае невозмущенной задачи (Pp), но для которых одновременно оптимальные «аппроксимирующие» элементы, то есть решения задачи (Pp) при p = pk, не сходятся к решению невозмущенной задачи как по аргументу, так и по функции.

3.1.2. Невыполнимость ПЛ. Положим в задаче (Pp) : D = Z. Предположим также, что оператор A таков, что R(A*) = Z (последнее заведомо так, если оператор A — вполне непрерывный [18, с. 225, теорема 1]). Пусть при сделанных предположениях z G Z \ R(A*) — произвольный элемент. Тогда ПЛ в задаче (Pp) при p = Az не выполняется. Предположим, что это не так. Тогда в соответствии с ПЛ теоремы 3.1 (см. также ПЛ для гладких задач с равенствами [13, с. 253, 254]) существует невырожденная пара множителей (^0, Л) G R+ х Z такая, что 2^0Z + A^ = 0. В этом случае при = 0 получаем Л = 0 в силу инъективности A*, а при = 1, соответственно, противоречивое равенство Z = — 1/2A^ в силу неравенства R(A*) = Z, что и доказывает невыполнимость ПЛ в задаче (Paz).

Пример 3.2. Рассмотрим далее классическую двумерную обратную задачу финального наблюдения по нахождению начальной функции v G D С L2(Q), D — выпуклое замкнутое множество, Q С R2 — ограниченная область с кусочно-гладкой границей S = dQ, в третьей начально-краевой задаче для уравнения теплопроводности (x = (xi,x2))

dz

zt - zXl - zx2 = 0; z(x, 0) = v(x), x G Q; + z = 0, (x,t) G ST = dQ x (0,T), (3.3)

которую можно трактовать также как задачу оптимального управления с фазовым ограничением типа равенства в финальный момент времени по нахождению начального управления-возмущения в начально-краевой задаче (3.3)

(IP) i v2(x) dx ^ inf, z[v]^ ,T)= p G L2(Q), v GDC L2(Q).

Jn

Здесь z[v] — обобщенное решение [10, гл. III] начально-краевой задачи (3.3), соответствующее управлению v G D С L2(Q). Задача (IP) является частным случаем задачи (Pp) из примера 3.1 с Z = L2(Q) и с линейными непрерывными инъективными (инъектив-ность может быть установлена, например, на основе результатов [19, § 2]) операторами A, A* : L2(Q) ^ L2(Q), A[v](■) = z[v](■ ,T), A[v] = Av, A*[A](■ ) = n[A]( ■,0), A*[A] = A*X, n[X] — соответствующее элементу A G L2(Q) обобщенное решение сопряженной третьей краевой задачи

nt + Пх! + Пх2 =0; n(x,T) = A(x), x G Q; ^ + n = 0, (x,t) G St = dQ x (0,T).

3.2.1. Неустойчивость ПЛ и ПМП. Положим в задаче (IP) : p = 0, D = {v G

L2(Q) : v(x) G [-1,1] при п. в. x G Q}. В этом случае решением задачи является v0(x) = 0, x G Q, причем, очевидно, существуют последовательности vk GD, k = 1, 2,..., такие, что vk ^ v0 = 0, k ^ ж слабо в L2(Q), но не сильно, причем для всех таких последовательностей имеет место предельное соотношение Avk ^ p = 0, k ^ ж (последнее имеет место в силу «равномерной гельдеровости» в этом случае обобщенных решений z[vk] в цилиндре {(x,t) : (x,t) G Qe x [e,T]} при любом достаточно малом е > 0, Qe — подобласть области Q, отстоящая на положительное расстояние е от границы S, являющихся одновременно равномерно ограниченными на Q x (0, T), см., например, [10, гл. III, теорема 10.1], а также [11, теорема 1]).

Так как выпуклая полунепрерывная снизу функция значений задачи (IP) субдиффе-ренцируема при p = 0, как достигающая в этой точке минимального значения, то это оптимальное управление удовлетворяет при p = 0 и при некотором A G L2(Q) регулярному ПЛ (см. теорему 3.1)

Lp(v0,A) < Lp (v,A) yv GD, Lp(v,A) = |v|2 + (A,Av - p), v gD, эквивалентному регулярному ПМП

-(v0(x))2 - n[A](x, 0)v0(x) = max {-v2 - n[A](x, 0)v} при п. в. x G Q.

v€[-1,1]

Таким образом, проверена выполнимость всех условий 1)-3) примера 3.1, случай 3.1.1, и значит относительно оптимального элемента v0 задачи (IP) можно сделать вывод: существуют такие pk ^ 0, k ^ ж, для которых в аппроксимирующих задачах (IP) при

p = pk справедливы утверждения регулярных ПЛ и ПМП, аналогичных сформулированным выше для задачи (IP) при p = 0, но, одновременно, оптимальные «аппроксимирующие» управления не сходятся к решению невозмущенной задачи (IP) как по аргументу, так и по функции.

3.2.2. Невыполнимость ПЛ. Положим далее: D = L2(Q). Очевидно, в этом случае R(A*) = L2(Q), но R(A*) = L2(Q) (последнее неравенство имеет место в силу «за-глаженности» решений краевых задач, см., например, [10, гл. III, теорема 8.1]). Пусть V Е L2(Q) \ R(A*) — произвольный элемент. Тогда, как показано в примере 3.1, случай 3.1.2, ПЛ в задаче (IP) при p = z[v\ не выполняется.

4. Регуляризованные ПЛ в задаче оптимального управления

Вернемся к сведенной выше к задаче выпуклого программирования (Р0) исходной задаче оптимального управления (OC0) с возможно неограниченным множеством D, для которой выполняются условия а), б), в), г), д), е). Представляется естественным рассмотреть два отдельных случая задачи (OC0), каждый из которых представляет самостоятельный интерес: 1. Целевой функционал f0 является сильно выпуклым; 2. Целевой функционал f0 является выпуклым. Рассмотрим последовательно оба этих случая, опираясь на результаты работ [4,7,14]. Следуя этому плану, введем, прежде всего, необходимые обозначения. Определим, во-первых, функцию Лагранжа в задаче оптимального управления (OC5)

Ls'£(п, А) = fs(п) + £||п||2 + (А, Asп - hs - p)

= [ Al(x,t)(zs[п](х, t))2dxdt + i As2(x)(zs[n\(x,T))2dx + / As3(s,t)(zs[n\(s,t))2dsdt

Jqt J n Jst

+ B{(x, t)(u(x, t))2dxdt + Bs2(x)(v(x))2dx + / Bs3(s,t)(w(s,t))2dsdt + £||п||2

Jqt Jn J st

+ [ X(x)(G{(x)zs [n\(x,T) + G2(x))dx, п ED, А Е L2(Q), £ > 0, Jn

L6'0(п, А) = Ls(п, X), L0'0(п, А) = L0(п, А).

Введем также обозначение пг'£[А\ = argmm{LS'£ (п, А) : п Е D}. Определим, во-вторых, двойственную задачу

У6'£(А) = inf L6'£(п, А) ^ sup, А Е L2(Q),

Vй(А) = У6'0(А) = inf L6'0(п, А) = inf Ls(п, А) ^ sup, А Е L2(Ü), V0'0(А) = У0(А).

Обозначим через А5'а'£ Е L2(Q), а > 0, решение регуляризованной двойственной задачи

V6'£(А) - а||А||2 ^ max, А Е L2(Ü), А6'а'0 = А6'а.

В общей ситуации задачи выпуклого программирования регуляризация ПЛ [4, 7] подразумевает использование двух регуляризирующих параметров, один из которых «отвечает» за регуляризацию двойственной задачи, другой же содержится в сильно выпуклом регуляризирующем добавке к целевому функционалу исходной задачи. Если целевой функционал является сильно выпуклым, то второй параметр регуляризации £ (в целевом функционале исходной задачи) является излишним и его можно считать равным нулю.

4.1. Регуляризация ПЛ в случае сильно выпуклого целевого функционала.

Задача (Р1) в случае сильно выпуклого целевого функционала представляет собою частный случай задачи выпуклого программирования (Рр,г) работы [ ] ( см. раздел 3.1 указанной работы, с учетом того, что в данной работе параметры р, г отсутствуют). Здесь в качестве гильбертова пространства Z выступает пространство Н и отсутствуют ограничения-неравенства. Поэтому для получения анонсированных регуляризованных КУО в задаче (ОСо) необходимо далее «расшифровать» утверждения теорем 3.1, 4.2 из [14] в терминах исходной задачи (ОСо). Заметим одновременно, что особый интерес представляет важный частный случай задачи (Р>о) с функционалом /°(-) в виде /о(п) = ||п||2, так как такие функционалы возникают прежде всего при рассмотрении обратных задач, подобных задаче в разделе 5.

Пусть а (5) > 0при5 € (0,5о] и выполняется условие согласования

5

-—■ — 0, а(5) — 0, 5 — 0. (4.1)

а(5)

«Расшифровка» теорем 3.1 (см. ниже замечание 4.1) и 4.2 из [14] в терминах исходной задачи приводит соответственно к регуляризирующему двойственному алгоритму и регу-ляризованному ПЛ в задаче оптимального управления (ОСо) в случае сильно выпуклого целевого функционала задачи оптимального управления, когда, напомним, е = 0.

Теорема 4.1. [Регуляризирующий двойственный алгоритм в задаче оптимального управления] Пусть задача (ОСо) разрешима, выполняется условие согласования (4.1) и 5й € (0,5о), 5й — 0, к — то, — произвольная фиксированная последовательность. Тогда оператор ), ставящий в соответствие набору исходных данных ^ , удовлетворяющих оценкам (1.) при 5 = 5й, тройку ,5й) = п1'[А1',а(г')], является МПР-образующим в задаче (ОСо) (см. определение (1.1)). Если же сильно выпуклый функционал /о является и субдифференцируемым (в смысле выпуклого анализа) в точках V, то справедливо и предельное соотношение

цп*к [а^,^)] - по|| — 0, 5й — 0, к — то. (4.2)

Замечание 4.1. В формулировке теоремы 3.1 в [14] были пропущены некоторые полученные при ее доказательстве слагаемые. В формулировке теоремы 1 в [4] все указанные слагаемые восстановлены. Здесь речь идет о слагаемых: ф(5) (см. неравенства (3.23), (3.26) в [14]) — в выражении для ф1(5) в формуле, соответствующей (2.15) в [4]; С5(2 + Ь) — в правой части неравенства, соответствующего (2.16) в [4]; С5(1 + Ь2) — в правой части неравенства, соответствующего (2.17) в [4]. Теорема 4.1 сформулирована уже с учетом указанных коррекций.

Теорема 4.2. [Регуляризованный ПЛ в задаче оптимального управления в случае сильно выпуклого целевого функционала] Пусть 5й € (0,5о), 5й — 0, к — то, — произвольная фиксированная последовательность. Пусть также выполняется условие согласования (4.1).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для того, чтобы в задаче (ОСо) существовало ограниченное МПР (и, следовательно, слабо сходилось к решению задачи по ), необходимо и достаточно, чтобы существовала последовательность € Ь2(П), к = 1,2,..., такая, что 5й||Ай|| — 0, к — то, и выполняются включения

п1' А] € , 7й — 0, к —у то, (4.3)

для некоторой последовательности положительных чисел 7k, k =1, 2,..., ( она играет роль последовательности ek, k =1, 2,... из определения МПР) и предельное соотношение

(Ak,Gf [Ak]](-,T) + Gf (-))^ 0, k ^то, (4.4)

а последовательность п5к'ек [Ak], k = 1, 2,..., была ограничена.

Более того, последовательность п5к [Ak], k = 1, 2,..., является искомым МПР. Другими словами, оператор R(-,5k), ставящий в соответствие набору исходных данных f5 , удовлетворяющих оценкам (1.) при 5 = 5k, управление R(f ,5k) = п5 [Ak], является МПР-образующим (см. определение 1.1), а последовательность п5 [Ak], k = 1, 2,..., слабо сходится к решению задачи (OC0). Если же сильно выпуклый функционал f0 является и субдифференцируемым (в смысле выпуклого анализа) в точках D, то указанную выше слабую сходимость следует считать сильной, то есть в этом случае имеет место предельное соотношение (4.2).

Одновременно с предельным соотношением 5k||Ak|| ^ 0, k ^ то, и соотношениями (4.3), (4.4), выполняется и предельное соотношение

V0(Ak) ^ sup V0(A) = f0(п0).

A€L2(Q)

В качестве конкретной последовательности Ak £ L2(^), k = 1,2,... может быть взята, например, последовательность A5 'а(5 ), k = 1,2,..., о которой идет речь в теореме 4.1.

4.2. Регуляризация ПЛ в случае выпуклого целевого функционала. Для получения анонсированных регуляризованных КУО в задаче (OC0) в случае выпуклого целевого функционала необходимо далее «расшифровать» утверждения теорем 2, 3 из [7] в терминах исходной задачи (OC0). Пусть помимо условия согласования (4.1) выполняется и еще одно подобное условие

г

— ^ 0, е(5) ^ 0, 5 ^ 0. (4.5) е(5)

Предположим также, что величина F равномерно по 5 £ [0, 50] ограничивает снизу на D функционал f5 :

f5(п) > F Vп £ D, 5 £ [0,50]. (4.6)

«Расшифровка» теоремы 2 и теоремы 3 из [7] приводит, соответственно, к следующим теоремам в терминах исходной задачи (OC0).

Теорема 4.3. [Регуляризирующий двойственный алгоритм в задаче оптимального управления] Пусть П0 = 0 и выполняются условия согласования (4.1), (4.5), 5k £ (0,50), 5k ^ 0, k ^ то, — произвольная фиксированная последовательность. Пусть также выполняется условие (4.6) ограниченности снизу целевого функционала. Тогда оператор R(-,5k), ставящий в соответствие набору исходных данных f5 , удовлетворяющих оценкам (1.) при 5 = 5k, тройку R(f5k, 5k) = n5fc'e(5fc) [A5fc,a(5fc),e(5fc)], является МПР-образующим в задаче (OC0) в смысле (1.4) ( см. определение 1.1).

Теорема 4.4. [Регуляризованный ПЛ в задаче оптимального управления в случае ß = ß0 ] Пусть выполняются условия согласования (4.1), (4.5), 5k Е (0,£0), 5k ^ 0, k ^ ж, — произвольная фиксированная последовательность, £k = £(6k). Пусть выполняется равенство ß = ß0, а также условие (4.6) ограниченности снизу целевого функционала. Тогда:

1. Для того, чтобы в задаче (OC0) существовало ограниченное МПР (или, что эквивалентно, оптимальный элемент) необходимо, чтобы существовала последовательность Аk Е L2(Q), k = 1,2,..., такая, что 5k |^k1| ^ 0, k ^ ж, и выполняются включения

п6"£ А\ Е D6"Y, yk ^ 0, k ^ж, (4.7)

и предельное соотношение

А,Gf (• )z6"[п&к£[А^К • ,T) + G2"(• 0, k ^ ж, (4.8)

а последовательность п6"'£" [Аk\, k = 1, 2,..., является (возможно неограниченным) МПР. Другими словами, оператор, задаваемый равенством

R(f6",Sk)= п6"'£к А\, (4.9)

является МПР-образующим (см. определение 1.1), причем каждая слабая предельная точка последовательности п6 '£ [Аk ], k =1, 2,..., в случае ее ограниченности есть решение задачи (OC0). В качестве конкретной последовательности А,г Е L2(Q), k = 1, 2,... может быть взята, например, последовательность А6 'а(6 ^'£(6 \ k = 1, 2,..., о которой идет речь в теореме 4.3.

2. И, наоборот, для того, чтобы в задаче (OC0) существовало ограниченное МПР (а значит и оптимальный элемент) достаточно, чтобы существовали последовательность сходящихся к нулю положительных чисел £k, k = 1, 2,... и последовательность Аk Е L2(Q), k = 1, 2,..., такие, что 5k |^k Ц ^ 0, k ^ ж, и выполняются включения (4.7) и предельное соотношение (4.8), причем, последовательность п6"'£" А], k = 1, 2,... является ограниченной. В этом случае задаваемый равенством (4.9) оператор является МПР-образующим (см. определение 1.1), причем каждая слабая предельная точка последовательности п6 '£ [А^, k = 1, 2,..., есть решение задачи (OC0).

5. Регуляризация ПМП в обратной задаче финального наблюдения

Переходим к формулировке и обоснованию регуляризованного ПМП в задаче (OC0) с сильно выпуклым целевым функционалом. Центральную роль здесь играет задача минимизации функции Лагранжа

L6(п, А) ^ min, п Е D, (5.1)

единственным решением которой является тройка п6 [А\ Е D. Получим поточечный ПМП по всем трем компонентам (u,v,w) для тройки п6[А\ в важном частном случае задачи (OC0), когда ее функционал имеет вид

f°(п) = М2 = ЫН = M^Qt ) + Ыыя) + Ыывт ^ (5.2)

то есть A 1 (•, •) = 0, A2(•) = 0, A3(•, •) = 0, Bi(•, •) = 1, B2(•) = 1, B3(•, •) = 1, что соответствует тому, что мы рассматриваем классическую обратную задачу по нахождению

минимальной по норме тройки управляющих параметров п = (u,v,w) по наблюдению решения начально-краевой задачи в финальный момент времени.

При получении ПМП в задаче (5.1) нам потребуется игольчатое варьирование граничного управления w и одновременно понятие точки Лебега суммируемой функции, задаваемой на боковой поверхности St. Напомним, прежде всего, что понимается под точкой Лебега суммируемой функции, заданной на поверхности St. Так как в соответствии с условием е) граница S области П является липшицевой (она является кусочно-гладкой), то можно утверждать, что существует конечный набор измеримых в смысле (n — 1) -мерной меры, индуцированной на S, множеств Sr, r = 1, 2,...,e, и функций

e

wr, r =1, 2,... , e, таких, что, во-первых, |J Sr = S, int Sk П int S^ = 0, если k = Z, и,

r=1

n— 1

/-Л-ч 1

во-вторых, функции wr : (—P, P) x ... x (—P, P) ^ R1 являются липшицевыми и для некоторой координатной системы (хГ, xr,n) = (xr,1,... , xr,n-1, xr,n) имеет место равенство

n— 1

/-Л-ч

int Sr = {(хГ )) : хГ G (—P, P) x ... x (—P, P)}. Зафиксируем точку х0 G int Sr для некоторого 1 < r < e и организуем для данного достаточно малого е > 0 множество

n— 1

/-Л-V

Se(хо) = {х = (Xr)) : хГ G Be(x0r) С (0,1) x ... x (0,1)}, (5.3)

где Ве(ж0г) — шар радиуса е с центром в точке х0г пространства Rn—1. Определим также множество Sf(х0,^0) = {Se(£0) x (t0 — e,t0 + е)}. Справедлива следующая лемма, доказательство которой можно найти, например, в [20, лемма 7.2].

Лемма 5.1. Пусть задана функция f G L1(ST). Тогда существует измеримое в смысле индуцированной на ST n -мерной меры множество L, (L) = (ST), такое, что для каждой точки (х0,£0) G L имеет место предельное соотношение

lim-T^fT-ТуТ I lf(^,t) — f(^0,t0)|^T(dsdt) = 0.

Указанные в сформулированной лемме точки (ж0,£0) из множества L мы и называем точками Лебега функций из L1(St).

Введем стандартные обозначения: H1(u, n) = —un — u2, H2(u, n) = vn — v2, H3(w, n) = wn — w2. Докажем следующую лемму, выражающую собою поточечный ПМП в задаче минимизации функции Лагранжа в случае функционала качества частного вида (5.2).

Лемма 5.2. Пусть выполняются условия а), б), в), г), д), е), а множества управляющих параметров U, V, W есть выпуклые замкнутые множества на числовой оси. Тройка управлений п5[А] = (u5[A],vö[A],wö[А]), являющаяся решением задачи (5.1) в случае функционала качества частного вида (5.2) удовлетворяет при п = (u,v,w) = п5[А] соотношениям

max Н1(х, t,r, n" [А](х,£)) = Н1(х, t, и(х, t), n" [А](х,^)) при п. в. (х, t) G QT,

reU

max Н2(х,г, n"[А](х, 0)) = Н2(х, v(:r), n"[А](х, 0)) при п. в. х G П, (5.4)

reV ^ ' '

max H3(s,t,r,n"M(s,t)) = H3(s, t, w(s, t), n"[А](з,^) при п. в. (s,t) G ST,

reff

где П [А] € У^'0 ) — решение сопряженной задачи

д г г

(агл(х,г)Пх1) + а [х,г)п = 0;

дх (5.5)

п(х,Т) = -\(х)С{(х), х € + а5(х,г)п = 0, (х,г) € Бт.

И, обратно, в силу выпуклости задачи любой элемент п = (п,у,-ш) € V, удовлетворяющий вместе с некоторой А € Н = Ь2(") соотношениям (5.4), доставляет минимум в задаче (5.1) в случае функционала качества частного вида (5.2), то есть п = п5[А].

Доказательство. Доказываем сначала необходимость. С этой целью применим формулу леммы 2.3 для интегрального представления приращения функционала Ь5(•, А) для пары управляющих троек п = (п,у,-ш) и п5[А] = (и5[А], V5[А], к5[А]). Можем записать, с учетом обозначения Аг5 = г5[п] — г5[п5[А]],

д

Аг5(х, 0)= v(x) — V5[А](х), х € "; + а5(в,г)Аг5 = т(в,г) — к5[А](в,г), (в, г) € Бт.

Кроме того, можем записать также

Ь (п, А) — Ь (п [А] ,А) = [(и(х, г)) — (и

[А](х,г))2]дхдг + [^(х))2 — (V5 [А](х))2]^х

+ [ [(т(в,г))2 — (к5[А](,в,г))2]двдг + [ А(х)С61(х)(г5[п](х,Т) — г5[п5[А]](х,Т))дх. и ят ио

Тогда, применяя лемму 2.3 получаем

Ь5(п, А) — Ь5(п5[А], А)

Аг5 — — (а(х, Ь)Аг8х.) + а5(х,г)Аг5 + и(х,г) — и5[А](х,г) = 0;

дхг

д Аг5

(5.6)

= (и(х,г) — и5 [А](х,г))п5 [А](х,г)йхйг — ^(х) — V5 [А](х))п5 [А](х, 0)дх и (т и о

— (т(в,г) — т5 [А](в,г))п5 [А](в,г)двМ + [(и(х,г))2 — (и5 [А](х,г))2 ]<ь<и

о Зт " (т

+ [ Ых))2 — (V5[А](х))2]дх + ! [(т(в,г))2 — (к5[А](в,1))2]двд1, ио иЗт

где г/5 [А] € У2'°(ЯТ) — обобщенное решение сопряженной задачи (5.5), которое в рассматриваемом частном случае, как можно заметить, не зависит от тройки п = (и^,т).

Используем далее игольчатые вариации управлений и5 [А], V5 [А], к5 [А], определив их следующим образом. Пусть и * С К1, V * С К1, Ш * С К1 — счетные всюду плотные подмножества множеств и, V, Ш. Определим вариацию п5[А] € V, 0 < е < е0 < 1, тройки п [А]

итШх,*) ^ ХиШхЛ)>(хЛ) € дт\V5Шх) ^ Р|А|(х)'х € "\"У'

(и € и*, (х,г) € \у € V*, х € Щ,

(5.7)

(в, в);

к € Ш*, если (в,г) € Бт (в,г),

5Г\и ^ \К если (в,г) € Бт \ Бт(в,в)

К [А](в,г) =

где О-,? = {(ж, г) € Ега+1 : хг - е < хг < ж, г = 1,... , п, / - е < г < /}, П- = {ж € Ега : Уг - е< Хг < уг - ег = 1,... ,п}, х = (жь... ,ж„), у = (уь... ,у„), множество 5Т(/,/ определяется равенством (5.3).

Потребуем, чтобы выполнялись следующие условия на точки (ж,?), у/, (в,?), участвующие в определении вариации п5 [Л] :

1) точка (х,/ является точкой Лебега [21, гл. I, § 1, п. 1.7] функций

(и' - и[Л](х,г))пЙ[Л](х,г), [(и')2 - (и5[Л](х,г))2], (ж,г) € От, и' € и*;

2) точка у/ является точкой Лебега [21, гл. I, § 1, п. 1.7] функций

(V - V5[Л](х))п5[Л](ж, 0) + [(^')2 - (V5[Л](х))2], ж € П, V € V*,

3) точка (/, ?) является точкой Лебега (см. лемму 5.1) функций

(г' - г5[Л](м))п5[Л](м), [(г')2 - (г5[Л](м))2], (в, г) € , г' € w*,

где п5[Л] € ^21,0(фт) — обобщенное решение краевой сопряженной задачи (5.5). Очевидно, в силу классической теоремы о точках Лебега, такой выбор точек (ж,?), у возможен, причем лебегова мера множества всех таких точек (ж,?), у совпадает соответственно с лебеговой мерой цилиндра От и лебеговой мерой области П. Одновременно, благодаря лемме 5.1, такой выбор возможен и в случае точек (/, причем лебегова мера множества всех таких точек (в,/ совпадает с лебеговой мерой боковой поверхности 5т.

Подсчитаем сначала первую вариацию Ит(1/(ега+1))(Ь(п5[Л], Л) - Ь(п5[Л], Л)) функционала Лагранжа в случае п5[Л] = (и1[Л], V5[Л], г5[Л]). Можем записать в силу равенства (5.6) и организации вариации п5[Л] = (и1[Л],г^[Л], г5[Л])

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ит ¡ПГГ (Ь (п5 [Л], Л) - Ь (п5 [Л], Л)) = ^т -¿г J (м - и5 [Л](ж, г))п5 [Л](ж, г) Лж^ - -¿г J (V - V5 [Л](ж))п5 [Л](ж, 0)^ж

+ Ит^Т / [и2 - (и5[Л](ж,г))2]М + Ит^+Т / [V2 - (V5[Л](ж))2^ж

= (м - и5[Л](ж,/))п5[Л](ж,/)-(V - V5[Л](у))п5[Л](у, 0)+м2-(иг[Л](ж,/))2+V2-(V5[Л](у))2 > 0 V и € и * при п. в. (ж,/) € От , V V € V * при п. в. у € П,

откуда выводим первые два соотношения максимума в (5.4).

Далее, вычисляем также первую вариацию функционала Лагранжа, но уже в случае п5[Л] = (и5[Л],г^[Л],и>1 [Л]), то есть г5[Л] варьируется по третьей формуле (5.7). В этом случае можем записать, опять с учетом равенства (5.6), при п5[Л] = (и5[Л],г^[Л],г1[Л]), а также с учетом определения и>1 [Л] и леммы 5.1,

йг ы5тЬ))(Ь (п5 |Л|'Л) - Ь И4Л))

= Ит—/ГД (I (г - г5[Л](в,г))пг[Л](з,г)М + / [г2 - (г5[Л](в,

1^° ^т(51 (ж,^у(х,-) (х-,-)

= (г/ - г5[Л](/, /))п5[Л](/,+ г/2 - (г5[Л](/, /))2 > 0 Vг/ € W* при п. в. (/,/) € 5т.

Из последнего неравенства вытекает третье соотношение максимума в (5.4). Необходимость доказана.

Доказываем далее достаточность. Пусть выполняются соотношения (5.4) для некоторой тройки п = (п,у,т) £ V и некоторого А £ Н = Ь2(0,). Тогда можем записать для произвольного п' = (п',ь',т') £ V

Ь6(п',А) - Ь6(п,А) = ! \(п'(х,г))2 - (п(х,1))2]йхй1 + [ [(у'(х))2 - (у(х))2]йх

¿<<т ¿П

+ I [(и'(в, г))2 - (и(в,г))2]с1всИ + [ А(х)С{(х)(г6[п'](х,Т) - г6[п](х,Т))<!х. и ят ¿п

Можем также записать, с учетом обозначения Аг6 = г6[п'\ - г6[п],

А* - А«) + а*(х,г)А;6 + п'(хЛ) - п(ХЛ) = 0; ох%

х дАг6 х х

Аг6(х, 0) = у'(х) - у(х), х £ П; + а6(в,г)Аг6 = и'(в,г) - и(в,г), (в, г) £ Бт.

Тогда, применяя, как и выше при доказательстве необходимости, лемму 2.3 получаем

Ь6(п',А) - Ь6(п, А) = (п'(х,г) - п(х,г))п6[А](х,г)дхМ - (у'(х) - у(х))п6[А](х, 0)йх

и<<т ип

- {и}'(в, г) - и (в,г))п6[А](в,г)дв& + [(п'(х,г))2 - (п(х,г))2]¿хдг (5.8)

о Зт " <т

+ [ [Ы(х))2 - (у(х))2]йх + [ [(и'(в,г))2 - (и(в,г))2]двМ, ип иЗт

где п6[А] £ ) — обобщенное решение сопряженной задачи (5.5). Замечая теперь,

что в силу соотношений (5.4) выражение в правой части неравенства (5.) неотрицательно при всех п' £V, получаем неравенство Ь6(п', А) -Ь6(п, А) > 0 Vп' £ V, то есть п = п6[А]. Лемма 5.2 доказана.

После доказательства ПМП леммы 5.2, для простейшей задачи оптимального управления (5.1) мы можем переформулировать полученный выше регуляризованный ПЛ теоремы 4.2 для задачи (ОС0) в форме регуляризованного ПМП в том случае, когда ее функционал имеет частный вид (5.2). С целью указанной переформулировки, прежде всего, обозначим через П^[А] множество всех управлений из V, удовлетворяющих ПМП леммы 5.2 в задаче (5.1). Очевидно, в нашем случае, благодаря сильной выпуклости /0( • ) = || • ||2, это множество состоит из одного элемента: П^[А] = п^[А] и справедливо равенство (при соответствующих оговоренных выше условиях) пёт[А] = п6[А]. Тогда непосредственным следствием теоремы 4.2 и леммы 5.2 является следующий регуляризованный ПМП в задаче оптимального управления (ОС0) в случае ее функционала качества частного вида (5.2), для которой в этом случае справедливо равенство 3 = ¡30.

Теорема 5.1. [Регуляризованный ПМП в обратной задаче финального наблюдения] Пусть функционал цели задачи (ОС0) имеет частный вид (5.2) и выполняются условия а), б), в), г), д), е). Тогда все утверждения теоремы 4-2 остаются справедливыми и в том случае, если в них п6к [Ак] заменяется везде на п&т[Ак}, причем, так как || • ЦН — субдифференцируемый функционал, то Цпёт [Ак] - п0 Цн ^ 0, к ^ *х>.

References

[1] Ф.П. Васильев, Методы оптимизации: в 2-х кн., МЦНМО, М., 2011. [F.P. Vasil'ev, Metody Optimizatsii: v 2-kh. kn., MCCME, Moscow, 2011 (In Russian)].

[2] М. И. Сумин, "Зачем нужна регуляризация принципа Лагранжа и принципа максимума Понтрягина и что она дает", Вестник Тамбовского университета. Серия: естественные и технические науки, 23:4(124) (2018), 757-772. [M. I. Sumin, "Why regularization of Lagrange principle and Pontryagin maximum principle is needed and what it gives", Tambov University Reports. Series: Natural and Technical Sciences, 23:4(124) (2018), 757-772 (In Russian)].

[3] М. И. Сумин, "Регуляризованные принцип Лагранжа и принцип максимума Понтрягина в оптимальном управлении и обратных задачах", Тр. ИММ УрО РАН, 25, 2019, 279-296. [M. I. Sumin, "Regularized Lagrange principle and Pontryagin maximum principle in optimal control and in inverse problems", Trudy Inst. Mat. i Mekh. UrO RAN, 25, 2019, 279-296 (In Russian)].

[4] М. И. Сумин, "О регуляризации классических условий оптимальности в выпуклых задачах оптимального управления", Тр. ИММ УрО РАН, 26, 2020, 252-269. [M.I. Sumin, "On the regularization of the classical optimality conditions in convex optimal control problems", Trudy Inst. Mat. i Mekh. UrO RAN, 26, 2020, 252-269 (In Russian)].

[5] А.Н. Тихонов, В. Я. Арсенин, Методы решения некорректных задач, Наука, М., 1986. [A. N. Tikhonov, V. Ya. Arsenin, Solutions of Ill-Posed Problems, Winston; Halsted Press, Washington-New York, 1977 (In Russian)].

[6] М. И. Сумин, "Регуляризация принципа максимума Понтрягина в выпуклой задаче оптимального граничного управлении для параболического уравнения с операторным ограничением-равенством", Тр. ИММ УрО РАН, 27, 2021, 221-237. [M.I. Sumin, "Regularization of the Pontryagin maximum principle in the convex optimal control problem for parabolic equation with a boundary control and with an operator equality-constraint", Trudy Inst. Mat. i Mekh. UrO RAN, 27, 2021, 221-237 (In Russian)].

[7] М. И. Сумин, "О регуляризации принципа Лагранжа и построении обобщенных минимизирующих последовательностей в выпуклых задачах условной оптимизации", Вестн. Уд-муртск. ун-та. Матем. Мех. Компьют. науки, 30:3 (2020), 410-428. [M. I. Sumin, "On the regularization of the Lagrange principle and on the construction of the generalized minimizing sequences in convex constrained optimization problems", Vestn. Udmurtsk. Univ. Mat. Mekh. Komp. Nauki, 30:3 (2020), 410-428 (In Russian)].

[8] Дж. Варга, Оптимальное управление дифференциальными и функциональными уравнениями, Наука, М., 1977; англ. пер.:Л. Warga, Optimal Control of Differential and Functional Equations, Academic Press Publ., New York, 1972.

[9] Е. Г. Гольштейн, Теория двойственности в математическом программировании и ее приложения, Наука, М., 1971. [E. G. Golshtein, Teoriya Dvoistvennosti v Matematicheskom Programmirovanii i ee Prilozheniya, Nauka Publ., Moscow, 1971 (In Russian)].

[10] О.А. Ладыженская, В. А. Солонников, Н.Н. Уральцева, Линейные и квазилинейные уравнения параболического типа, Наука, М., 1967; англ. пер.Ю. A. Ladyzhenskaya, V. A. Solonnikov, N. N. Ural'tseva, Linear and Quasilinear Equations of Parabolic Type, AMS, Providence, 1968.

[11] В.И. Плотников, "Теоремы единственности, существования и априорные свойства обобщенных решений", Докл. АН СССР, 165:1 (1965), 33-35; англ. пер.У.I. Plotnikov, "Uniqueness and existence theorems and apriori properties of generalized solutions", Sov. Math., Dokl., 6 (1965), 1405-1407.

[12] М. И. Сумин, "Регуляризованный градиентный двойственный метод решения обратной задачи финального наблюдения для параболического уравнения", Журн. вычисл. матем. и матем. физ., 44:11 (2004), 2001-2019; англ. пер.^Л. Sumin, "A regularized gradient dual method for the inverse problem of a final observation for a parabolic equation", Comput. Math. Math. Phys., 44:11 (2004), 1903-1921.

[13] В.М. Алексеев, В.М. Тихомиров, С. В. Фомин, Оптимальное управление, Наука, М., 1979; англ. пер.У. M. Alekseev, V. M. Tikhomirov, S. V. Fomin, Optimal Control, Plenum Press Publ., New York, 1987.

[14] М. И. Сумин, "Регуляризованная параметрическая теорема Куна-Таккера в гильбертовом пространстве", Журн. вычисл. матем. и матем. физ., 51:9 (2011), 1594-1615; англ. пер.^.I. Sumin, "Regularized parametric Kuhn-Tucker theorem in a Hilbert space", Comput. Math. Math. Phys., 51:9 (2011), 1489-1509.

[15] М. И. Сумин, "Недифференциальные теоремы Куна-Таккера в задачах на условный экстремум и субдифференциалы негладкого анализа", Вестник российских университетов. Математика, 25:131 (2020), 307-330. [M.I. Sumin, "Nondifferential Kuhn-Tucker theorems in constrained extremum problems via subdifferentials of nonsmooth analysis", Russian Universities Reports. Mathematics, 25:131 (2020), 307-330 (In Russian)].

[16] P. D. Loewen, Optimal Control via Nonsmooth Analysis. V. 2, CRM Proceedings and Lecture Notes, Amer. Math. Soc., Providence, 1993.

[17] С.Г. Крейн, Линейные уравнения в банаховом пространстве, Наука, М., 1971; англ. пер.^. G. Krein, Linear Equations in Banach Spaces, Birkhaiiser, Boston-Basel-Stuttgart, 1982.

[18] В.А. Треногин, Функциональный анализ, Наука, М., 1980. [V. A. Trenogin, Funktsional'nyi Analiz, Nauka Publ., Moscow, 1980 (In Russian)].

[19] В.И. Плотников, "Энергетическое неравенство и свойство переопределенности системы собственных функций", Изв. АН СССР. Сер. математическая, 32:4 (1968), 743-755; англ. пер.У. I. Plotnikov, "An energy inequality and the overdeterminacy property of a system of eigenfunctions", Math. USSR-Izv., 2:4 (1968), 695-707.

[20] E. Casas, "Pontryagin's principle for state-constrained boundary control problems of semilinear parabolic equations", SIAM J. Control Optim., 35 (1997), 1297-1327.

[21] О. В. Бесов, В. П. Ильин, С. М. Никольский, Интегральные представления функций и теоремы вложения, Наука, М., 1975. [O. V. Besov, V. P. Il'in, S. M. Nikol'skii, Integral Representations of Functions and Imbedding Theorems. V.I, II, Halsted Press; John Wiley and Sons, Washington, D.C.; New York-Toronto, Ont.-London, 1978, 1979].

Информация об авторе

Сумин Михаил Иосифович, доктор физико-математических наук, главный научный сотрудник, Тамбовский государственный университет им. Г.Р. Державина, г. Тамбов; профессор, Нижегородский государственный университет им. Н. И. Лобачевского, г. Нижний Новгород, Российская Федерация. E-mail: m.sumin@mail.ru

Information about the author

Mikhail I. Sumin, Doctor of Physics and Mathematics, Chief Researcher, Derzhavin Tambov State University, Tambov; Professor, Nizhnii Novgorod State University, Nizhnii Novgorod, Russian Federation. E-mail: m.sumin@mail.ru

Поступила в редакцию 17.03.2021 г. Поступила после рецензирования 26.05.2021 г. Принята к публикации 10.06.2021 г.

Received 17.03.2021 Reviewed 26.05.2021 Accepted for press 10.06.2021

i Надоели баннеры? Вы всегда можете отключить рекламу.