Научная статья на тему 'Субдифференцируемость функций значений и регуляризация принципа максимума Понтрягина в оптимальном управлении распределенными системами'

Субдифференцируемость функций значений и регуляризация принципа максимума Понтрягина в оптимальном управлении распределенными системами Текст научной статьи по специальности «Математика»

CC BY
194
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / ПАРАБОЛИЧЕСКОЕ УРАВНЕНИЕ / МИНИМИЗИРУЮЩАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ / СУБДИФФЕРЕНЦИРУЕМОСТЬ / ФУНКЦИЯ ЗНАЧЕНИЙ / УСТОЙЧИВОСТЬ / ПРИНЦИП ЛАГРАНЖА / ТЕОРЕМА КУНА-ТАККЕРА / ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА / МОДИФИЦИРОВАННАЯ ФУНКЦИЯ ЛАГРАНЖА / ФАЗОВЫЕ ОГРАНИЧЕНИЯ / ДВОЙСТВЕННАЯ РЕГУЛЯРИЗАЦИЯ / OPTIMAL CONTROL / PARABOLIC EQUATION / MINIMIZING SEQUENCE / SUBDIFFERENTIABILITY / VALUE FUNCTION / STABILITY / LAGRANGE PRINCIPLE / KUHN-TUCKER THEOREM / PONTRYAGIN MAXIMUM PRINCIPLE / MODIFIED LAGRANGE FUNCTION / POINT-WISE STATE CONSTRAINTS / DUAL REGULARIZATION

Аннотация научной статьи по математике, автор научной работы — Сумин Михаил Иосифович

Обсуждается связь субдифференцируемости функций значений с устойчивыми секвенциальными или, другими словами, регуляризованными принципом Лагранжа в недифференциальной форме и принципом максимума Понтрягина в выпуклой и невыпуклой параметрических задачах оптимального граничного управления для линейного параболического уравнения с поточечными фазовыми ограничениями.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Сумин Михаил Иосифович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SUBDIFFERENTIABILITY OF VALUE FUNCTIONS AND REGULARIZATION OF PONTRYAGIN MAXIMUM PRINCIPLE IN OPTIMAL CONTROL FOR DISTRIBUTED SYSTEMS

We discuss regularized or, in other words, stable with respect to errors of input data sequential Lagrange principle in nondifferential form and Pontryagin maximum principle in both convex and nonconvex parametric optimal boundary control problems with point-wise state constraints for parabolic equation.

Текст научной работы на тему «Субдифференцируемость функций значений и регуляризация принципа максимума Понтрягина в оптимальном управлении распределенными системами»

32. Сумин В.И. Особые оптимальные управления распределенных задач и вольтерровы функционально-операторные уравнения // Известия Института математики и информатики УдГУ. 2012. Вып. 1(39). С. 128-129.

33. Сумин В.И. Об особых управлениях в распределенных задачах оптимизации // Вестник Тамбовского Университета. Серия Естественные и технические науки. Тамбов, 2013. Т. 18. Вып. 5. С. 2696-2697.

БЛАГОДАРНОСТИ: Финансовая поддержка Минобрнауки РФ в рамках проектной части государственного задания в сфере научной деятельности в 2014-2016 гг. (проект №1727) и грантом (соглашение от 27.08.13 №02.В.49.21.0003 между Минобрнауки РФ и ННГУ).

Поступила в редакцию 7 мая 2015 г.

Sumin V.I. STRONG DEGENERATION OF THE SINGULAR CONTROLS IN THE SENSE OF THE MAXIMUM PRINCIPLE IN DISTRIBUTED OPTIMIZATION PROBLEMS

It is proved that for distributed optimization problems a sufficiently typical situation is strong degeneration of the singular controls in the sense of the point-wise maximum principle, when together with the maximum principle (which is a first order necessary optimality condition in the case of spike-shaped variation) a second order necessary optimality conditions also degenerates. A derivation of constructive necessary optimality conditions for singular controls is suggested.

Key words: distributed optimization problems; guided Volterra functional-operator equations; point-wise maximum principle; singular controls.

Сумин Владимир Иосифович, Нижегородский государственный университет им. Н. И. Лобачевского, Нижний Новгород, Российская Федерация, доктор физико-математических наук, профессор, заведующий кафедрой математической физики, e-mail: v_sumin@mail.ru

Sumin Vladimir Iosifovich, Nizhny Novgorod State University named after N.I. Lobachevsky, Nizhny Novgorod, the Russian Federation, Doctor of Physics and Mathematics, Professor, the Head of the Mathematical Physics Department, e-mail: v_sumin@mail.ru

УДК 517.977

СУБДИФФЕРЕНЦИРУЕМОСТЬ ФУНКЦИЙ ЗНАЧЕНИЙ И РЕГУЛЯРИЗАЦИЯ ПРИНЦИПА МАКСИМУМА ПОНТРЯГИНА В ОПТИМАЛЬНОМ УПРАВЛЕНИИ РАСПРЕДЕЛЕННЫМИ СИСТЕМАМИ

© М.И. Сумин

Ключевые слова: оптимальное управление; параболическое уравнение; минимизирующая последовательность; субдифференцируемость; функция значений; устойчивость; принцип Лагранжа; теорема Куна-Таккера; принцип максимума Понтрягина; модифицированная функция Лагранжа; фазовые ограничения; двойственная регуляризация. Обсуждается связь субдифференцируемости функций значений с устойчивыми секвенциальными или, другими словами, регуляризованными принципом Лагранжа в недифференциальной форме и принципом максимума Понтрягина в выпуклой и невыпуклой параметрических задачах оптимального граничного управления для линейного параболического уравнения с поточечными фазовыми ограничениями.

Введение. Принцип максимума Понтрягина [1] является центральным результатом всей теории оптимального управления, в том числе, и системами с распределенными параметрами. Его формулировка и доказательство предполагают, прежде всего, что задача

оптимального управления рассматривается в той идеальной ситуации, когда ее исходные данные известны точно. Вместе с тем, в громадном числе практически важных задач оптимального управления, а также многочисленных задач, возникающих во всевозможных естественнонаучных приложениях и сводящихся к задачам оптимального управления, требование точного задания исходных данных является весьма неестественным, а во многих представляющих несомненный интерес ситуациях и просто невыполнимым. В подобных задачах мы не можем, строго говоря, брать в качестве приближения к решению исходной задачи с точными данными управления, формально удовлетворяющие принципу максимума в возмущенных задачах. Причина этого кроется в данной нам от природы неустойчивости по возмущению исходных данных оптимизационных задач. Являясь типичным свойством задач оптимизации в целом, в том числе, и задач условной оптимизации, неустойчивость в полной мере проявляет себя и в задачах оптимального управления (см., например, [2-4]). Как следствие, она порождает и «неустойчивость» классических условий оптимальности, в частности, и тех, что записываются в форме принципа Лагранжа, принципа максимума Понтрягина [2-4]. Эта неустойчивость проявляется в выделении классическими условиями оптимальности сколь угодно далеких «возмущенных» оптимальных элементов от их «невозмущенных» аналогов при сколь угодно малых возмущениях исходных данных задач. Сказанное выше в полной мере относится как к самой рассматриваемой ниже задаче оптимального управления с поточечными фазовыми ограничениями для линейного параболического уравнения в дивергентной форме, так и к классическим для нее условиям оптимальности — принципу Лагранжа и принципу максимума Понтрягина.

В данной работе обсуждается как можно преодолевать проблемы неустойчивости классических условий оптимальности в задачах оптимального управления на основе метода двойственной регуляризации (см., например, [2, 5-7]). В качестве базового понятия оптимизационной теории при этом выступает понятие понятие минимизирующего приближенного решения в смысле Дж. Варги [8]. Центральное внимание в работе уделяется обсуждению так называемых регуляризованных или, другими словами, устойчивых к ошибкам исходных данных секвенциальных принципа Лагранжа в недифференциальной форме и принципа максимума Понтрягина и их теснейшей связи с дифференциальными, точнее, субдифференциальными, свойствами функций значений задач оптимального управления. Важнейшим качеством регуляризованных принципа Лагранжа и принципа максимума Понтрягина является то, что, в независимости от факта устойчивости или неустойчивости самой задачи оптимального управления, они устойчивым образом порождают минимизирующие приближенные решения для нее. Одновременно, они, сохраняя структуру формулировок выражаемых в терминах оптимальных элементов классических условий оптимальности, позволяют получать последние как результат предельного перехода в своих соотношениях [2-4, 9].

Работа состоит из двух основных частей. В первой части рассматривается выпуклая задача оптимального граничного управления для линейного параболического уравнения с поточечными фазовыми ограничениями типа равенства и неравенства. Результаты этой части работы основываются на схеме получения регуляризованных принципа Лагранжа и принципа максимума Понтрягина в работах [9, 10] (см. также [3, 4, 11]) в выпуклой задаче оптимального управления системой обыкновенных дифференциальных уравнений. Во второй части работы рассматривается аналогичная, но нелинейная задача, содержащая лишь нелинейное поточечное ограничение-равенство. Получение результатов этой части основывается на схеме «нелинейной» двойственной регуляризации работ [12, 13] (см. также [14, 15]).

Особо подчеркнем, что в данной работе мы используем в качестве пространств, которым принадлежат образы задающих поточечные фазовые ограничения операторов, гильбертовы пространства суммируемых с квадратом функций. В случае оптимизационных задач [9, 10]

с управляемыми системами обыкновенных дифференциальных уравнений при достаточно общих предположениях, обеспечивающих нужные компактностные свойства их абсолютно непрерывных решений, любое минимизирующее приближенное решение в задаче с фазовыми ограничениями, понимаемыми в пространстве суммируемых с квадратом функций (впрочем, как и суммируемых с любой не равной двум p -той степенью, 1 ^ p < ), является таковым и в том случае, когда те же ограничения понимаются как ограничения в пространстве непрерывных функций. В случае аналогичных задач, но с управляемыми уравнениями в частных производных, все существенно сложнее: тот же самый факт также имеет место, но при этом должны выполняться и соответствующие условия на исходные данные задачи. В этом случае нужные компактностные свойства непрерывных вплоть до границы цилиндра Qt = П х (0, T) решений начально-краевой задачи для дивергентного параболического уравнения обеспечиваются за счет подходящего выбора показателей суммируемости ее коэффициентов и соответствующего условия гладкости границы области Q . В условиях данной работы эквивалентность понятий минимизирущих приближенных решений в случае двух указанных выше вариантов выбора пространств образов операторов фазовых ограничений заведомо имеет место тогда, когда эти ограничения рассматриваются в области, находящейся на конечном расстоянии от боковой поверхности цилиндра Qt и его нижнего основания.

В выпуклом случае при получении регуляризованных условий оптимальности центральную роль играет понятие субдифференцируемости в смысле выпуклого анализа. Это можно пояснить следующим образом. Если функция значений имеет непустой субдифференциал в некоторой точке, то выделяемая ими последовательность двойственных переменных в соответствующей оптимизационной задаче является ограниченной. В случае же пустоты указанного субдифференциала эта последовательность не ограничена. Причем в обоих случаях регуляризованными принципом Лагранжа и принципом максимума Понтрягина устойчивым образом выделяется (порождается) минимизирующее приближенное решение в исходной задаче. Одновременно, в выпуклом случае как субдифференцируемость, так и ее отсутствие при непустом асимптотическом субдифференциале9 неразрывно связаны с используемыми в обсуждаемых регуляризованных условиях оптимальности классическими конструкциями функций Лагранжа и Гамильтона-Понтрягина.

В нелинейном же (невыпуклом) случае необходимо пользоваться понятиями субдиффе-ренцируемости в смысле нелинейного анализа. В качестве таковых в работе применяются проксимальные субградиенты [16-19] и субдифференциалы Фреше [16, 20]. Это связано, во-первых, с неестественностью применения понятия субдифференциала в смысле выпуклого анализа к нелинейным полунепрерывным снизу функциям значений нелинейных задач и, во-вторых, с наличием соответствующих теорем плотности «нелинейной» субдифференцируемости [16, 18-20]. При этом указанная «нелинейная» субдифференцируемость «порождает» и соответствующие конструкции модифицированных функций Лагранжа.

Автор настоящей работы занимается применением метода двойственной регуляризации в различных задачах оптимизации и оптимального управления вот уже более полутора десятков лет. В значительной степени мотивацией к этому способствовало и участие на протяжении долгого времени в работе Международных конференций «Колмогоровские чтения. Общие проблемы управления и их приложения», организация и проведение которых неразрывно связаны с именем замечательного тамбовского математика профессора А.И. Булгакова. Результаты этого участия отражены в целом ряде соответствующих публикаций в Вестнике Тамбовского университета им. Г.Р. Державина [4, 11, 15, 21-26]. Так как помимо автора данной работы в ставших за прошедшие годы очень популярными Тамбов-

9В бесконечномерном случае субдифференциал и асимтотический субдифференциал могут быть одновременно пусты.

ских «Колмогоровских чтениях» принимали участие многие десятки других математиков как российских, так и зарубежных, то можно отчетливо представить тот весомый вклад, который внес профессор А.И. Булгаков в дело развития математической науки.

Постановка выпуклой задачи оптимального управления. Рассмотрим задачу оптимального управления с поточечными фазовыми ограничениями типа равенства и неравенства

(Рр2г) £0(п) ^ шт, п е^с ^ = ¿2(Ог) х ¿2(5г),

£2(п)(ж,£) = Л2(ж,£) + р(ж,£), £2(п)(ж,£) ^ г(ж, ¿) при п.в. (ж, ¿) е

где р, г е — параметры, £0 : V ^ М1 — непрерывный выпуклый функционал,

£1 (п)(ж, ¿) = (ж, ¿)г2[п](ж, ¿), £2(п)(ж, ¿) = <^2(ж,М2[п](ж,^)) , ^>1, Л2 е Ьж(5) — заданные функции, ^ : ^хМ1 ^ М1 — измеримая по ж,£ и выпуклая по г функция, ^О, •)) е

е V* е С(3), д с д4>г, 1 е (0,т), д = с1 <5, V = {п = (и,ад) е Ьж(5т) х

х (Бт) : и(ж,£) е и п.в. на <т, эд(ж,£) е ^ п.в. на Бт} — множество допустимых пар управлений, и , ^ с М1 — выпуклые компакты, г2[п] е ^1,0(5т) П С(<т) — обобщенное решение [27] третьей начально-краевой задачи

д 2 г - дж(а*,.?)+ а (ж,*)г + и(ж,£) = 0, (1)

г(ж, 0) = (ж), ж е П, дг + ст2(ж,^)г = -ш(ж,£), (ж,£) е Бт,

в которой а^ е Ьж(<т), г,.?' = 1,...,п, а2 е Ьж(<т), а2 (ж,£) ^ Со , ст2 е Ьж(Бт), ст2(з, £) ^ С0 , 1)0 е С(П) - заданные функции, П - ограниченная область в Мп с лип-шицевой границей, V|{|2 ^ а^(ж^)^.? ^ ^|£|2 для п.в. (ж, £) е <т, V, ^ > 0. Верхний индекс £ в исходных данных задачи (р2 ) означает, что эти данные соответствуют либо ситуации их точного задания ( 5 = 0 ), либо являются возмущенными ( 5 > 0 ), то есть задаются с ошибкой, 5 е [0,5о] , 5о > 0 — некоторое фиксированное число. В качестве целевого возьмем для определенности терминальный функционал

-2(п) - с2(ж, г2[п|

£0(п) = / С2(ж,г2[п](ж,Т))^ж,

где С2 : П х М1 ^ М1 — измеримая по ж и выпуклая по г функция, С2(•, г(-, Т)) е Ьж(П) Уг(^Т) е С(<) . Будем считать, что выполняются следующие оценки

|С2(ж, г) - С0(ж,г)| < См5 V(ж, г) е П х БМ, - рЦ«,^ < С5, ||Л2 - < С5, (2)

|^2(ж,М) - ^2(ж, г)| < См5 V (ж, ¿, г) е 5 х Б

М,

||а2 - а0|ж,дт < С5, - 10||0) < С5, ||ст2 - ст0|и,5т < С5,

где С, См > 0 не зависят от 5, БМ = {ж е Мп : |ж| < М} .

Как уже отмечалось во введении, в случае выпуклой задачи оптимального управления мы будем опираться при обсуждении регуляризованных принципа Лагранжа и принципа максимума Понтрягина в задаче (Рр,г ) на схему исследования аналогичной оптимизационной задачи в работах [9, 10] для системы обыкновенных дифференциальных уравнений. В этих работах как в качестве пространства допустимых управлений, так и в качестве пространства, которым принадлежат образы задающих поточечные фазовые ограничения

1

операторов, использовались гильбертовы пространства суммируемых с квадратом функций. По этой причине мы вкладываем множество допустимых управлений V в гильбертово пространство, то есть считаем, что V С 2 = ^(От) (£т) • Норму элемента п € 2 будем обозначать через ||п|| = (||и||2 Qт + 1М|2 8т)1/2 • Одновременно, несмотря на то, что условия на исходные данные задачи (Р^ ) таковы, что операторы д\, д|, определяющие фазовые ограничения задачи, формально можно считать действующими в пространство Ьр(О) с любым показателем р € [1, , мы, с учетом сделанного выше замечания, будем вкладывать образы этих функциональных операторов в гильбертово пространство ^(О) = Н. Отметим здесь же, что вложение образов задающих фазовые ограничения операторов д2, д2 в рефлексивное пространство Ьр(О) с 1 < р < 2 при некоторых дополнительных свойствах гладкости области О приводит, строго говоря, к более сильным результатам в задаче (Рр1^ ).

Далее, обозначим через и0г множество решений г = (и0 г , ) задачи (Р0Г ), которое при сделанных предположениях, в случае его непустоты, может состоять и не из одного элемента. Введем также функцию Лагранжа параметрической задачи (Рр,г )

ь2.(п, Л, = д2(п) + (А, д2(п) - Ь2 - р) + д2(п) - т), (А,^) € Н х Н,

p,r \

множество ее точек минимума U2 [Л, ß] = Argmin {Lp,r : п € D}V(A,^) GHx H+ , а

также двойственную задачу

VPfr(Л, ß) = min Lp r(п, Л, ß) ^ sup, (Л, ß) € H x H+,

Обозначим: Dp^r = {п € D : ||gf(п) - h - p||2,Q ^ min (п) - r - z||2,q ^ 4

где H- = {z € L2(Q) : z(x,t) ^ 0 при п.в. (x,t) € Q}, H+ = -H-

min

z&H

Dp'T = Dp r . Как уже отмечено выше, центральным в работе является понятие минимизирующего приближенного решения в смысле Дж. Варги [8] в задаче (Pp,r ), под которым понимается последовательность пг € D, i = 1,2,... такая, что $о(пг) ^ ß(p, r) + 7г, пг € для некоторых последовательностей сходящихся к нулю неотрицательных чи-

сел 7г, ег, i = 1, 2,.... Здесь: ß(p, r) = { min $0(п), если DPr = 0;в ином случае}

— обычная нижняя грань задачи (Рр1 ). При этом в : ^2(О) х Ь2(О) ^ М 1 и —

выпуклая полунепрерывная снизу функция.

Следствием введенных выше условий на исходные данные задачи (Р°г ) и теорем существования обобщенного (слабого) решения третьей краевой задачи для линейного параболического уравнения дивергентного вида, которые могут быть найдены в [27, гл. 111,§ 5], а также, например, в [28], является разрешимость начально-краевой задачи (1), а также и сопряженной к ней задачи, в классе ^21,0(От).

Предложение 1. Для любой пары п = (и, ад) € Ь2(От) х Ь2(5т) = 2 при любом Т > 0 и любом 5 € [0, 50] исходная ( прямая) задача (1) однозначно разрешима в ^(От) и справедлива априорная оценка

I ¿2[п] | QT + ||/[п]||2,5т < Ст(Ы2^т + |К 112,0 + М^Ят),

в которой постоянная Ст не зависит от пары п € 2 и 5 € [0, 50] .

Кроме того, однозначно разрешима в ^21,0(От) для любых функций х € Ь2(От), ^ € € Ь2(О), и € Ь2(^т) при любом Т > 0 и сопряженная задача

д 2 -П - (х,£)Пх + (х,£)п = х(М),

дхз

п(х, Т) = ^(х), х € О, ддп + (х, ¿)п = и(х, ¿), (х, ¿) € £т.

Для ее решения n' [х, справедлива априорная оценка

I п'[X,^w] | QT + lln'[X,^]I|2,ST < (NxH2,Qt + IMl2.fi + IMI2.ST),

в которой постоянная CT не зависит от (х, w) € L2(Qy) х L2(Q) х L2(Sy) и 5 € [0, ¿о] • Одновременно, следствием введенных выше условий на исходные данные и теорем существования (см., например, [29]) непрерывного вплоть до границы цилиндра Qy обобщенного решения начально-краевой задачи (1) является ее разрешимость в классе V21,0(Qy) П C(Qy) • Можно утверждать, что справедливо аналогичное предложению 1

Предложение 2. Пусть l > n+1 • Для любой пары управлений п € Li (Qy ) х Li (St ) при любом T > 0 и любом 5 € [0,5о] однозначно разрешима в V210(Qt) П C(Qy) прямая задача (1) и справедлива априорная оценка

|z'[п]|§Г < Ct(||и||,Лт + |vo|fi0) + N|i'ST),

в которой постоянная Cy не зависит от 5 € [0,5о] и пары п € L^(Qy ) х Li (St ) •

Ниже важнейшее значение будет также иметь задача минимизации функционала Лаг-ранжа Lp r(п, А, ^ min, п € D при (А, € L2(Q) х L+(Q) , являющаяся, как легко заметить, обычной задачей оптимального управления без ограничений типа равенства и неравенства. Эта задача разрешима как задача минимизации на ограниченном выпуклом замкнутом множестве DC Z выпуклого слабо полунепрерывного снизу функционала, причем последнее свойство является следствием его выпуклости и непрерывности. Элементы п' [А, € U' [А, , являющиеся решениями этой задачи, удовлетворяют соответствующему принципу максимума Понтрягина при дополнительном к введенным выше условиям на исходные данные предположении существования непрерывных по z градиентов Vz^>2(x,t,z) , VzG'(ж, z) с оценками |Vz^>2(x,t, z)| ^ CM , |VzG'(ж, z)| ^ CM Vz € SM , в которых Cm > 0 не зависит от 5 . Можно утверждать, что в результате двухпараметрического варьирования [30] пары управлений п' [А,^] € U' [А,^] , которое носит игольчатый характер по управлению и и классический — по управлению w , на основании априорных оценок предложений 1, 2 может быть доказана следующая

Л е м м а 1. Предположим, что выполняется указанное выше дополнительное условие• Тогда любой элемент п' [А,= (и'[А,w'[А,^]) € U'[А,^], (А,€ L2(Q) х L+(Q) удовлетворяет ( обычному) принципу максимума Понтрягина в задаче Lp r(п,А,^) ^ ^ min, п € D : при п = п' [А, выполняются соотношения максимума

H(u(x,t),n'(x,t)) = maxH(и, n'(x,t)) п.в. на QT, (3)

H(w(s,t),n'(s,t)) = maxH(w,n'(s,t)) п.в• на ST,

wew

где H(y,n) = —ПУ , п'(x,t), (x,t) € Qy — решение при п = п'[А,^] сопряженной задачи —П — дЖ"(ai'j(ж,^)Пх4) + a'(x,t)n = ¿)А(ж, t) + Vz<p2(x,t,z'[п](ж, t))^(x, t), (x,t) € Qy,

п(ж, T) = VzG'(ж, z'[п](ж, T)), ж € Q, ^^ + ст'(x,t)n = 0, (x,t) € Sy.

dN

Из элементов п'[А,^], (А,^) € L2(Q) х L+(Q) конструируются минимизирующие приближенные решения в задаче (p0.r ) и, как следствие, различные версии устойчивых секвенциальных принципа Лагранжа и принципа максимума Понтрягина. В случае сильной

выпуклости и субдифференцируемости gQ они представляют собою утверждения об устойчивой аппроксимации в метрике Z = ) х L2(St) решений задачи точками пО[Л, . На основании оценок (2) и предложений 1, 2 можно утверждать, что

|gQ(п) - go(n)| < Ci§ Vn € D, ||gQ (п) - g0(п)^ < C2§(1 + ||п||) Vn € Z, (4)

||hQ - h0|2,Q < C§, ||gQ (п) - g0(n) 11 2,q < Caá Vn € D, где постоянные C1, C2, > 0 не зависят от § € (0, §0] , п .

Регуляризованный принцип максимума Понтрягина в выпуклом случае. Данный раздел посвящен обсуждению регуляризованного или, другими словами, устойчивого секвенциального принципа максимума Понтрягина для задачи (P)r ) как необходимого и достаточного условия на элементы минимизирующих приближенных решений. Условия в его формулировке можно трактовать одновременно как условия существования минимизирующего приближенного решения в задаче (р0г) с возмущенными исходными данными или как условия устойчивого конструирования минимизирующей последовательности в этой задаче. Доказательство необходимости этих условий базируется на методе двойственной регуляризации [2, 5-7], представляющем собою устойчивый алгоритм построения минимизирующего приближенного решения в задаче (P)r ).

Двойственная регуляризация для выпуклой задачи оптимального управления с поточечными фазовыми ограничениями. Оценки (4) дают возможность организовать для построения минимизирующего приближенного решения в задаче ( P)r ) процедуру двойственной регуляризации в соответствии со схемой работы [10]. Как и в [10], двойственная регуляризация для задачи ( P) ) заключается в непосредственном решении двойственной к ней и стабилизированной по Тихонову задачи

яО'"(О)(Л,^) = VpQr(Л,^) - а(§)||(Л,^)||2 ^ max, (Л,^) € ¿2(Q) х L+(Q)

при условии согласования §/а(§) ^ 0, а(§) ^ 0, § ^ 0. Процесс двойственной регуляризации приводит к конструированию минимизирующего приближенного решения в задаче ( р°'Г ) из элементов пО Л' r , ] € Argmin {Lpr(п, Л, : п € D} , где (Лр', г ) = = argmax{fíp?(Л,^) : (Л,^) € L2(Q) х L+ (Q)} .

Можно утверждать, что справедлива следующая теорема «сходимости» метода двойственной регуляризации для задачи ( P) ), доказательство которой может быть проведено в точном соответствии со схемой доказательства соответствующей теоремы в [10]. При этом, как и в [10], используется факт слабой непрерывности операторов gQ, gQ , являющейся следствием условий на исходные данные задачи (P) ) и регулярности ограниченного решения начально-краевой задачи (1) внутри цилиндра Qt [27, гл. III, теорема 10.1].

Теорема1. Вне зависимости от того, пуст или не пуст субдифференциал дв(р, r) ( другими словами, разрешима или нет двойственная к ( р° ) задача), существуют

элементы пО € UQ [Лр, ] такие, что выполняются соотношения

goV) ^ go(пр)'Г), g0(nQ) - h0 - p ^ 0, g0(nQ) - r < к(§), ||к(§)|Н 0, § ^ 0,

<(ЛО;а(О)(Q)), (gQ(пО) - hQ - p,gQ(пО) - r)> ^ 0, § ^ 0,

где неравенство g°(n°) - r ^ к(§) понимается в смысле упорядоченности по конусу неположительных функций в L2(Q) . Одновременно справедливо равенство

lim (Лр;а(0),^р;а(0)) = sup V5)r(Л,^).

(A'^)eHxH+

Если двойственная к ( Pp ) задача разрешима, то выполняется и предельное соотношение (АрГ(5)(5)) — (A^ r), S — 0 , где через (A^ r, ) обозначено минимальное по норме 'решение двойственной задачи.

Регуляризованный принцип Лагранжа в задаче оптимального управления с поточечными фазовыми ограничениями. Как следствие теоремы 1, сформулируем в данном разделе необходимые и достаточные условия существования минимизирующего приближенного решения в задаче (Ррг) , которые можно также назвать устойчивым секвенциальным принципом Лагранжа в недифференциальной форме в этой задаче и одновременно, так как мы имеем дело лишь с регулярной функцией Лагранжа, устойчивой секвенциальной теоремой Куна-Таккера в недифференциальной форме. Необходимость условий формулируемой ниже теоремы вытекает из теоремы 1, а их достаточность является простым следствием выпуклости задачи (рР ), условий на ее исходные данные и условий теоремы. Обоснование этих утверждений в аналогичной ситуации задачи выпуклого программирования в гильбертовом пространстве можно найти в [2, 31].

Теорема 2. Для существования в задаче (рРг) минимизирующего приближенного решения, в независимости от того, пуст или не пуст субдифференциал дв(p, r) ( другими словами, разрешима или нет двойственная к ( Ppr ) задача), необходимо и достаточно, чтобы существовала последовательность (Ak ) eHx H+ , k = 1, 2,... , такая, что Sk||(Ak, )|| — 0 , k —► то , и выполнялись соотношения

п5* [Ak] € DpT*, ^ — 0, k — то, (5)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

((Afc), (gf (п5*[Ak]) - h5* -p,gf (п5*[Ak,/]) - r)> — 0, k — то (6)

для некоторых элементов п5* [Ak ] € U[Ak] . Последовательность п5* [Ak, ] , k = = 1, 2,... , является искомым минимизирующим приближенным решением и каждая его слабая предельная точка есть решение задачи (рРг) . В качестве последовательности

(Ak, ), k = 1, 2,... может быть взята последовательность (Ap,r , ), генери-

руемая методом двойственной регуляризации теоремы 1 . В случае разрешимости двойственной к (р0г) задачи последовательность (Ak, ) € H x H+ , k = 1, 2,... следует считать ограниченной. Как следствие предельных соотношений (5), (6), выполняется и предельное соотношение

Vp0r (Ak,/) — sup Vp0r (A,^). (7)

Одновременно, каждая слабая предельная точка ( в случае существования таковых) последовательности (Ak, ) € H x H+, k = 1, 2,... является решением двойственной задачи Vpr(A, — max, (A, € H x H+ .

Замечание! Если функционал gQ является сильно выпуклым и субдифференци-руемым на D, то из слабой сходимости единственных в этом случае элементов п5* [Ak ] к единственному же элементу при k — то и числовой сходимости gQ(n5 [Ak]) —

— gQ(nPr), k — то вытекает и сильная сходимость п5*[Ak] к пР,г при k — то . Случай задачи (Ppr) с сильно выпуклым gQ , но с точными исходными данными, рассматривался

в [9].

Регуляризованный принцип максимума Понтрягина в задаче оптимального управления с поточечными фазовыми ограничениями. Обозначим через Umax[A, множество элементов п € D, для которых выполняются все соотношения принципа максимума (3) леммы 1. С учетом леммы 1, при условии существования непрерывных по z

с соответствующими оценками градиентов Vz<^2(x,t, z) , VzG5(ж, z) , утверждение теоремы 2 может быть переписано в форме устойчивого секвенциального принципа максимума Понтрягина. Очевидно, что при указанном дополнительном условии имеет место равенство = U5[A,ß] . Заметим, что ниже в случае, если функции Л, ß € L2(Q) рассматриваются на всем цилиндре Qt , то полагается, что Л(ж, t) = ß(x, t) = 0 при (ж, t) € Qt \ Q и одновременно для этих функций, рассматриваемых на более широком множестве, сохраняется прежнее обозначение.

ТеоремаЗ. Для того чтобы в задаче (Pp,r) существовало минимизирующее приближенное решение, в независимости от того, пуст или не пуст субдифференциал dß(p, r) (разрешима или нет двойственная к ( Pp ) задача), необходимо и достаточно, чтобы существовала последовательность (Лй, ) € H х H+ , k = 1, 2,..., такая, что ¿fc||(ЛЙ, )|| ^ 0 при ¿fc ^ 0 и выполнялись предельные соотношения (5), (6) для некоторых элементов п^Л, ] € U5^Л, ] С D. Последовательность п^[Лй, ], k = = 1, 2,..., является искомым минимизирующим приближенным решением и каждая его слабая предельная точка есть 'решение задачи ( Pp ). В качестве последовательности

k k ) 5k af^k)

(Лй, ), k = 1, 2,... может быть взята последовательность (ЛР)Г , ßp,r ), генерируемая методом двойственной регуляризации теоремы 1 при ¿fc ^ 0. В случае разрешимости двойственной к ( Ppr ) задачи последовательность (ЛЙ, ) € L2(Q) х L+(Q), k = 1, 2,... следует считать ограниченной. Как следствие предельных соотношений (5), (6), выполняется и предельное соотношение (7),

Замечание 2. В результате «слабого» предельного перехода в соотношениях теоремы 3 (см., например, [9]) в важном частном случае задачи (Ppr) , когда в ней имеется только ограничение-неравенство ( ^>1(x,t) = h5(x,t) = 0, (x,t) € Q ), может быть получен и традиционный для такого рода задач классический принцип максимума Понтрягина (см., например, [29]), использующий в своей записи неотрицательные меры Радона, входящие в правую часть сопряженного уравнения, а также в его начально-краевые условия.

Постановка нелинейной задачи оптимального управления. Далее будем рассматривать задачу оптимального управления вида (Pp,r ), но, для упрощения изложения, без поточечного ограничения-неравенства. Одновременно, функционал g° и оператор g0 в новой задаче являются нелинейными, а начально-краевая задача (1) остается полностью без изменений. Итак, рассматриваем параметрическую задачу оптимального управления с поточечным фазовым ограничением типа равенства

(Pp5) go (п) ^ min, п € D, g5(п)(ж, t) = p(x, t), при п.в. (ж, t) € Q,

где p € L2(Q) — параметр, : D ^ R1 — непрерывный функционал, g5(п)(ж, t) = = ^1(x,t,z5 [п](ж, t)) , : Q х R1 ^ R1 — измеримая по x,t и непрерывная по z функция, pi(-, ■, z(', ■)) € L^(Q) Vz € C(Q) , Q С Qt)T , 1 € (0, T) , Q = cl Q , D = {п = (u, w) € € L^(QT) х ) : u(x,t) € U п.в. на QT, w(x,t) € W п.в. на ST} — множество допу-

стимых пар управлений, U , W С R1 — выпуклые компакты, Q — ограниченная область в Rn с липшицевой границей (как и в выпуклом случае), z5[п] € V21,0(Qt) П C(Qy) — обобщенное решение [27] линейной третьей начально-краевой задачи (1), коэффициенты которой вместе с условиями на них, а также с оценками отклонений возмущенных коэффициентов от невозмущенных, точно такие же, как и в выпуклом случае задачи (p0r ).

Будем по прежнему считать, что множество допустимых управлений вкладывается в гильбертово пространство, то есть D С Z = L2(Qt) х L2(St) , а оператор g5 действует в гильбертово пространство L2(Q) . Возьмем, как и в выпуклом случае, для определенности

g5(п)- f g5(x,z5[п|

g5(п) = / G5(x,z5[п](ж,T))dx JQ

c измеримой по x , непрерывной по z функцией G^ : Q х R1 ^ R1, G"5(■, z(-, T)) € L^(fi) Vz(-,T) € C(Q).

Считаем, что выполняются следующие оценки

|G(x, z) - G0(x, z)| < CmS V (x, z) € Q х SM, (8)

|^1(x,i,z) - ^(x,t,z)| < CMS V(x, t, z) € Q х SM,

где C, CM > 0 не зависят от S, SM = {x € Rn : |x| < M} .

Последовательность пг € D, i = 1, 2,... — минимизирующее приближенное решение в задаче (), если д0(пг) ^ ß(p) + 7г, пг € Dp£ для некоторых последовательностей сходящихся к нулю неотрицательных чисел 7г, ег, i = 1,2,.... Здесь: Dp'£ = {п € D : ||g1 (п) — p||2,Q ^ , ß(p) — обобщенная нижняя грань задачи ( ):

ß(p) = lim ߣ(p), ߣ(p) = inf g0(n), ße(p) = еслиDP'£ = 0.

Благодаря условиям на исходные данные рассматриваемой задачи, влекущим определенные компактностные свойства решений начально краевой задачи (1), как и выпуклом случае, имеет место равенство ß(p) = ß0(p), где ß0(p) — классическое значение задачи ().

Справедлива следующая важнейшая для дальнейших построений

Л е м м а 2. Функция значений ß : L2(Q) ^ R1 U {+то} является полунепрерывной снизу.

Напомним далее необходимые для последующих конструкций понятия субдифференци-руемости в смысле нелинейного анализа полунепрерывных снизу функций [16-20]. Необходимость в их применении объясняется, во-первых, неестественностью использования понятия субдифференцируемости в смысле выпуклого анализа применительно к невыпуклым функциям, и, во-вторых, наличием соответствующих результатов о плотности субдиффе-ренцируемости полунепрерывных снизу функций в гильбертовом пространстве в смысле нелинейного анализа [16, 18-20]. Одновременно, эти понятия субдифференцируемости приведут нас естественным образом к конструкциям так называемых модифицированных функций Лагранжа. Ниже нам будут нужны два понятия субдифференцируемости полунепрерывных снизу функций — понятия проксимального субградиента и субдифференциала Фреше.

Введем прежде всего понятие проксимального субградиента полунепрерывной снизу функции на основе понятия проксимальной нормали [16-19].

Определение! (а) Пусть H - гильбертово пространство, S С H - замкнутое множество, s € S. Вектор Z € H называется проксимальной нормалью к множеству S в точке s € S, если существует постоянная M > 0 такая, что

(C,s — s) < M||s — s||2 Vs € S.

Множество всех таких векторов Z , представляющее собой конус, обозначим через NVs(s) и назовем проксимальным нормальным конусом.

(б) Пусть f : H ^ R1 U {+то} полунепрерывная снизу функция и x € dom f. Вектор Z € H называется проксимальным субградиентом функции f в точке x , если

(Z, —1) € NVepf (x,f(x)).

Множество всех таких векторов Z обозначим через f (x) и назовем проксимальным субградиентом f в точке xs .

Справедлива [18]

Л е м м а 3. Пусть / : Н ^ М1 и полунепрерывная снизу функция и X € ^ош / .

Вектор £ € Н является проксимальным субградиентом функции / в точке X тогда и только тогда, когда существуют постоянные К > 0 и 5 > 0 такие, что

/(X) - ((, X) ^ /(х) - ((, х) + К||х - Х||2 VX € (X) = {х' € Н : ||х' - х|| < 5}

Определим далее понятие нормали Фреше к замкнутому множеству в банаховом пространстве, а также соответствующее понятие субдифференциала полунепрерывной снизу функции [16, 20].

Определение2. Пусть Q — непустое множество банахова пространства X . Пусть x € cl Q . Тогда непустое множество

NV£(x; Q) = (x* € X* : lim sup ~ X^ < 0}

n ||u - x||

называется нормальным конусом Фреше к Q в x и обозначается NV(x; Q) . При x € cl Q полагается NV(x; Q) = 0 .

Определение 3. Пусть f : X ^ R1 U — полунепрерывная снизу функция,

определенная на банаховом пространстве X , x € dom f . Множество

f (x) = (x* € X* : (x*, -1) € NV((x, f (x)); epi f)},

называется субдифференциалом Фреше функции f в точке x. При этом полагается f (x) = 0 в случае x € dom f. Справедлива [20] Лемма

4. Пусть f : X ^ R1u(+to} — полунепрерывная снизу функция, определенная на банаховом пространстве X, x € dom f, е > 0 . Тогда x* € 9f (x) в том и только в том случае, если существует окрестность X£ точки x такая, что

f(x) — (x*,x) ^ f(x') — (x*,x') + e||x' — x|| Vx' € X£.

Важнейшим свойством полунепрерывных снизу функций f : X — R1 и{+то} является то, что как множество dPf (x) , так и множество df (x) в случае гильбертова пространства X не пусто для плотного в domf множества.

Введенные выше понятия субдифференциалов в смысле нелинейного анализа порождают (необходимые обоснования и подробности см. в [12-14]) смешанную конструкцию модифицированной функции Лагранжа задачи () со штрафным множителем c > 0

4,с(п, A) = g5(п) + <A,g1 (п) - р> + c^(||g?(п) - р||),п € D, A € L2(Q),

где штрафная функция ф : R+ — R+ , определяется формулой

^(t) = ht + I2t2, t € R+,

в которой весовые множители li, I2 € {0,1} .

Естественно, введенная выше модифицированная функция Лагранжа порождает и соответствующую (модифицированную) двойственную задачу

(A) — sup, A € L2(Q), V5c(A) = inf ¿р>с(п, A),

new

а также соответствующее понятие обобщенного вектора Куна-Таккера задачи (р0 ), то есть такого вектора Л € Р2(ф) , Для которого при некотором с > 0 выполняется неравенство

ß(p) < inf L° с(п, Л). neD

Очевидно, возможны две и только две ситуации для исходной задачи (Pp0 ):

A) в задаче имеется обобщенный вектор Куна-Таккера;

Б) в задаче не существует вектора Куна-Таккера в указанном смысле.

Оказывается (подробности в [12-14]), как и в привычной ситуации выпуклой оптимизационной задачи, существование вектора Куна-Таккера в указанном (обобщенном) смысле эквивалентно тому, что целевая функция ^°с(Л), Л € L2(Q) в модифицированной двойственной задаче при некотором c > 0 достигает максимального значения ß(p) в некоторой точке Л0 € L2(Q) . Замкнутое выпуклое множество всех таких точек максимума Л при некотором c > 0 обозначим через KP;C . Заметим при этом, что если задача (р° ) обладает вектором Куна-Таккера в указанном обобщенном смысле при li =0, то, любой такой вектор, взятый с обратны знаком, есть элемент проксимального субградиента dPß(p) . И, наоборот, любой элемент проксимального субградиента dPß(p) есть обобщенный вектор Куна-Таккера при 11 = 0 задачи (р° ) при некотором c > 0 (подробности в [12-14]).

Если выше, в выпуклом случае, центральную роль играла задача минимизации функции Лагранжа, то ниже важнейшее значение будет иметь задача минимизации модифицированного функционала Лагранжа Lp c(n, Л) ^ min, п € D при (Л) € L2(Q) , являющаяся обычной, но, вообще говоря, не выпуклой, а нелинейной задачей оптимального управления без ограничений типа равенства и неравенства. Эта задача разрешима как задача минимизации на ограниченном выпуклом замкнутом и, значит, слабо компактном множестве D С Z слабо непрерывного функционала, причем последнее свойство является следствием условий на исходные данные задачи (р° ) и регулярности ограниченного решения (см. предложения 1, 2) начально-краевой задачи (1) внутри цилиндра Qt [27, гл. III, теорема 10.1]. Как и выпуклом случае, обозначим через Ц? [Л] С D множество всех решений этой задачи. Элементы п? [Л] € Ц? [Л] , являющиеся ее решениями, удовлетворяют соответствующему принципу максимума Понтрягина при упрощающем предположении, что весовой множитель li в штрафном слагаемом сф равен нулю, то есть li = 0, и при дополнительном к введенным выше условиям на исходные данные предположении существования непрерывных по z градиентов Vz<^1(х, t, z), VzG?(x, z) с оценками |Vz^>1(x,t, z)| ^ CM , |VzG?(x,z)| ^ CM Vz € SM , в которых CM > 0 не зависит от 5. Можно утверждать, что, как и выпуклом случае, в результате двухпараметрического варьирования [30] пары управлений п? [Л] € Ц? [Л] , которое носит игольчатый характер по управлению u и классический — по управлению w , на основании априорных оценок предложений 1, 2 может быть доказана следующая

Л е м м а 5. Предположим, что 11 = 0 и выполняется указанное выше дополнительное условие существования непрерывных по z градиентов Vz^>1(x,t, z) . Тогда любой элемент п?[Л] = (u?[Л]) € Ц?[Л], Л € L2(Q) удовлетворяет ( обычному) принципу максимума Понтрягина в задаче Lp,c(п,Л) ^ min, п € D: при п = п?[Л] выполняются соотношения максимума

H(u(x,t),n?(x, t)) = maxH(u, n?(x,t)) п.в. на QT,

«eu

H(w(s, t), n?(s, t)) = max H(w, n?(s, t)) п.в. на ST,

wew

где H(y,n) = —ПУ , П?(x,t), (x,t) € QT — решение при п = п?[Л] сопряженной задачи

д

—nt — дХ" (ai'J (x,t)nxi) + a? (x,t)n = Vz ^!(x,t,z? [п](х, tMx, t) +

2c||g5(п) - p||V*^1(x,t,/[п](x, t)), (x,t) € Qt, n(x,T) = VzG5(x,z5[п](x, T)), x € Q, + ^(x,t)n = 0, (x,t) € St.

Как и в выпуклом случае, из элементов пр[A], A € L2(Q) конструируются минимизирующие приближенные решения в задаче (р0 ) и, как следствие, различные версии устойчивых секвенциальных принципа Лагранжа и принципа максимума Понтрягина. Однако в нелинейном случае в данной работе мы рассматриваем лишь случай когда задача обладает обобщенным вектором Куна-Таккера. По этой причине устойчивый секвенциальный принцип Лагранжа мы будем называть ниже устойчивой секвенциальной теоремой Куна-Таккера.

На основании последних оценок (2), касающихся лишь коэффициентов начально-краевой задачи (1), оценок (8) и предложений 1, 2 можно утверждать, что

|g0(п) - go0(п)| < C5 Уп € D, ||gp(п) - (п)^ < C25 Уп € D, (9)

где постоянные C1, C2 > 0 не зависят от 5 € (0, 50] , п . При этом оператор g5 : D — — L2(Q) в силу условий на исходные данные задачи (р) и регулярности ограниченного решения (см. предложения 1, 2) начально-краевой задачи (1) внутри цилиндра Qt является вполне непрерывным.

Регуляризованный принцип максимума Понтрягина в нелинейном случае. Данный раздел посвящен обсуждению регуляризованного или, другими словами, устойчивого секвенциального принципа максимума Понтрягина для задачи (р° ) как необходимого условия на элементы минимизирующих приближенных решений. Условия в его формулировке можно трактовать одновременно как условия существования минимизирующего приближенного решения в задаче (р°) с возмущенными исходными данными или как условия устойчивого конструирования минимизирующей последовательности в этой задаче. Доказательство необходимости этих условий базируется на методе двойственной регуляризации [12-15], представляющем собою устойчивый алгоритм построения минимизирующего приближенного решения в задаче ( P).

Двойственная регуляризация для нелинейной задачи оптимального управления с поточечным фазовым ограничением-равенством. Оценки (9) дают возможность организовать для построения минимизирующего приближенного решения в задаче (р0 ) процедуру двойственной регуляризации в соответствии со схемой [12-15]. Двойственная регуляризация в нелинейном случае основана, так же, как и в выпуклом случае, на алгоритме поиска максимума в задаче максимизации при c > 0 сильно вогнутого функционала

(A) = V5c(A) - a||A||2, A € L2(Q).

При этом с целью конструирования минимизирующей последовательности в исходной задаче (р0) рассматривается задача (подробности в [12-14])

Яр?(A) — max, A € Лс = {A € L2(Q) : ||A|| < c}. (10)

Обозначим через A^'^'CC единственную в Лс точку, дающую на Лс максимум функционалу Яр,? . Регуляризованный процесс поиска максимума в модифицированной двойственной задаче (10) при выполнении условия согласования 5/а(5) — 0, 5 — 0, а(5) — 0 конструктивно порождает минимизирующую последовательность пг € D, i = 1, 2,... в задаче (р^ ), то есть g0^) — в(р), g0^) - р — 0, i — то . При этом в случае А) величина c может быть взята равной любому фиксированному достаточно большому положительному

числу. В случае же Б), который в данной статье на рассматривается, штрафной коэффициент с необходимо стремить к +то согласованной со стремлением к нулю 5. Основное предположение при этом, с точки зрения практической реализации алгоритма двойственной регуляризации заключается в том, что минимизация модифицированной функции Лагран-жа может проводиться с любой наперед заданной точностью.

Можно утверждать, что справедлива следующая теорема «сходимости« метода двойственной регуляризации для задачи (р° ), доказательство которой может быть проведено в точном соответствии со схемой доказательства соответствующей теоремы в [12, 13].

Теорема 4. Пусть задача (р°) обладает вектором Куна-Таккера в указанном выше обобщенном смысле и ¿1, 12 € {0,1}, (¿1,12) = 0 , 55, в = 1, 2,... — произвольная сходящаяся к нулю последовательность положительных чисел. Тогда найдется достаточно большое с > 0 такое, что справедливы предельные соотношения

д°°(п*) — в(р), д°(п5) - р — 0, Л^) — Л°с, ^(Л^)) — в(р), в — то,

где п5, в = 1,2,... — оптимальные элементы, минимизирующие при положительном к > 0 модифицированную функцию Лагранжа Ррс+к(п,Лр: )), п еР, Лр, с , в = = 1, 2,... — элементы, максимизирующие на множестве Р2(ф) сильно вогнутый функционал ) , 55/а(55) — 0, в — то, Л0,с — минимальный по норме во множестве Кр,с обобщенный вектор Куна-Таккера задачи (р°) .

Регуляризованная теорема Куна-Таккера для нелинейной задачи оптимального управления с поточечным фазовым ограничением-равенством. Как и в выпуклом случае, в качестве следствия теоремы 4 сформулируем в данном разделе необходимые и достаточные условия существования минимизирующего приближенного решения в задаче (р°) , которые можно также назвать, в силу существования для нее обобщенного вектора Куна-Таккера, устойчивой секвенциальной теоремой Куна-Таккера в недифференциальной форме. Заметим, что подобно выпуклому случаю, необходимость условий формулируемой ниже теоремы вытекает из теоремы 4, а их достаточность является простым следствием условий теоремы и условий на исходные данные задачи (р° ).

Теорема 5. Пусть 11, 12 € {0,1}, (11,12) = 0 и задача (р°) обладает обобщенным вектором Куна-Таккера, 55, в = 1, 2,... - произвольная сходящаяся к нулю последовательность положительных чисел. Тогда найдутся достаточно большое с > 0 и ограниченная последовательность Л5 € Р2(ф), в = 1,2,... , такие, что для (любой) последовательности п5, в = 1, 2,... , элементы которой минимизируют при положительном к > 0 модифицированную функцию Лагранжа Рр,с+К(п, Л5), п € Р, справедливы предельные соотношения

д°(п5) — в(р), д°(п5) - р — 0, в — то, (11)

и, как следствие, предельное соотношение

С(Л*) — в(Р), в — то. (12)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В качестве указанной выше последовательности Л5, в = 1, 2,... , может быть взята последовательность Л^с"^ ), в = 1,2,... , из теоремы 4, элементы которой максимизируют на Р2(ф) сильно вогнутый функционал ^¿"^ ) при условии

0 в этом Л -1р,с , в ' ^ , где Лр,с

множестве Кр,с обобщенный вектор Куна-Таккера задачи (р°)

согласования

55/а(55) —^ 0, в — то . При этом Л5 — Л° с , в — то , где Л° с - минимальный по норме во

р,с р

И наоборот, если при некотором достаточно большом с > 0 существует ограниченная последовательность Л5 € Р2(ф), в = 1,2,... , такая что для последовательности п5, в = 1, 2,... , элементы которой минимизируют при к ^ 0 модифицированную функцию Лагранжа £р,с+к(п, Л5), п € Р и удовлетворяют второму предельному соотношению

(11) 10, то выполняется и первое предельное соотношение (11), то есть последовательность ns, s = 1, 2,... , является минимизирующим приближенным решением в задаче (р0) . При этом одновременно выполняется и предельное соотношение (13) .

Регуляризованный принцип максимума Понтрягина в нелинейной регулярной задаче оптимального управления с поточечным фазовым ограничением-равенством. Обозначим через UC,max[A] множество элементов п € D, для которых выполняются все соотношения принципа максимума леммы 5. С учетом леммы 5, при условии существования непрерывных по z с соответствующими оценками градиентов Vz<^2(x,t, z) , VzG?(ж, z) , утверждение теоремы 5, в ее «необходимой» части, может быть переписано в форме устойчивого секвенциального принципа максимума Понтрягина. Очевидно, что при указанном дополнительном условии имеет место включение Ц? [А] С [Л] . Заметим,

что ниже в случае, если функция А € L2(Q) рассматриваются на всем цилиндре Qt , то полагается, что А(ж, t) = 0 при (ж, t) € Qt \ Q и одновременно для этой функции, рассматриваемой на более широком множестве, сохраняется прежнее обозначение. Как и в случае леммы 5, формулировку следующей теоремы приводим при упрощающем предположении, что весовой множитель li в штрафном слагаемом сф модифицированной функции Лагранжа равен нулю.

Теорема 6. Пусть 11 = 0, 12 = 1 и задача (р0) обладает обобщенным вектором Куна-Таккера, s = 1,2,... — произвольная сходящаяся к нулю последовательность положительных чисел. Тогда найдутся достаточно большое с > 0 и ограниченная последовательность As € L2(Q), s = 1,2,... , такие, что для (любой) последовательности ns, s = 1, 2,... , элементы которой минимизируют при положительном к > 0 модифицированную функцию Лагранжа Lp,c+K(n, As), п € D, справедливы предельные соотношения

g0(ns) ^ в(р), g?(ns) - p ^ 0, s ^ то,

и, как следствие, предельное соотношение

V0c(As) ^ в(p), s ^ то.

Одновременно, для элементов ( любой) такой последовательности ns, s = 1, 2,... , справедливы все соотношения ( обычного) принципа максимума Понтрягина в задаче минимизации Lp,c(n, As) ^ min, п € D : выполняются соотношения максимума

H(us(x, t), nS(x, t)) = maxH(u,nS(x,t)) п.в. на QT,

H(ws(x, t), nS(x, t)) = max H(w,nS(x,t)) п.в. на ST,

w€W

где H(y,n) = —ПУ, nS(x,t), (x,t) € QT — решение сопряженной задачи

-nt — дЖ" К" (x,t)nxi) + а?' (x,t)n = Vz pf (x,t,z?s [ns](x, t))As(x, t) +

2c||gf (ns) -p||Vz(x,t,z?s[ns](x,t)), (x,t) € Qt,

n(x,T) = VzG?'(x,z?s [ns](x,T)), ж € Q, ^^ + (x,t)n = 0, (x,t) € St.

В качестве указанной выше последовательности As, s = 1, 2,... , может быть взята последовательность AP;C , s = 1, 2,... , из теоремы 4, элементы которой максимизируют

10Можно заметить, что благодаря ограниченности множества V и условиям на исходные данные задачи (Р0) предельное соотношение д0(пв) — р ^ 0, в ^ то выполняется тогда и только тогда, когда выполняется предельное соотношение д^ (пв) — р ^ 0

^ и, s ^ то

на ^(ф) сильно вогнутый функционал Лр;Са((5 ) при условии согласования 55/а(55) — — 0, в — то . При этом Л5 — Лр,с , в — то , где Лр,с — минимальный по норме во множестве Кр,с обобщенный вектор Куна-Таккера задачи (рр°) .

Замечание 3. Можно показать (подробности в [13, 14]), что при ¿1 = 0 в случае существования минимального по норме элемента во множестве в(р) величину к в теоремах 4, 5, 6 можно считать равной нулю.

ЛИТЕРАТУРА

1. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1969.

2. Сумин М.И. Устойчивое секвенциальное выпуклое программирование в гильбертовом пространстве и его приложение к решению неустойчивых задач // Журн. вычисл. матем. и матем. физ. 2G14. Т. 54. № 1. С. 25-49.

3. Сумин М.И. Регуляризованный секвенциальный принцип максимума Понтрягина в выпуклой задаче оптимального управления с поточечными фазовыми ограничениями // Известия института математики и информатики УдГУ. 2G12. Вып. 1(39). С. 13G-133.

4. Сумин М.И. Устойчивый секвенциальный принцип Лагранжа в выпуклом оптимальном управлении с поточечными фазовыми ограничениями // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2G13. Т. 1S. Вып. 5. С. 269S-2699.

5. Сумин М.И. Регуляризованный градиентный двойственный метод решения обратной задачи финального наблюдения для параболического уравнения // Журн. вычисл. матем. и матем. физ. 2GG4. Т. 44. № 11. С. 2GG1-2G19.

6. Сумин М.И. Регуляризация в линейно выпуклой задаче математического программирования на основе теории двойственности // Журн. вычисл. матем. и матем. физ. 2GG7. Т. 47. № 4. С. 6G2-625.

7. Сумин М.И. Некорректные задачи и методы их решения. Материалы к лекциям для студентов старших курсов: Учебное пособие. Нижний Новгород: Издательство Нижегородского госуниверситета, 2GG9.

S. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977.

9. Сумин М.И. Параметрическая двойственная регуляризация для задачи оптимального управления с поточечными фазовыми ограничениями // Журн. вычисл. матем. и матем. физ. 2GG9. Т. 49. № 12. С. 2GS3-21G2.

1G. Сумин М.И. Устойчивый секвенциальный принцип максимума Понтрягина в задаче оптимального управлении с фазовыми ограничениями // Труды XII Всероссийского совещания по проблемам управления (ВСПУ^М, 16-19 июня 2G14 г.). 2G14. М.: Изд-во ИПУ им. В.А. Трапезникова РАН, С. 796-SGS.

11. Сумин М.И. Параметрическая двойственная регуляризация и принцип максимума в задаче оптимального управления с фазовыми ограничениями // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2GG9. Т. 14. Вып. 4. С. SG7-SG9.

12. Сумин М.И. Регуляризованный двойственный метод решения нелинейной задачи математического программирования // Журн. вычисл. матем. и матем. физ. 2GG7. Т. 47. № 5. С. 796-S16.

13. Sumin M.I. Parametric Dual Regularization in a Nonlinear Mathematical Programming // In book «Advances in Mathematics Research, Volume 11». Chapter 5. New-York: Nova Science Publishers Inc. 2G1G. P. 1G3-134.

14. Канатов А.В., Сумин М.И. Секвенциальная устойчивая теорема Куна-Таккера в нелинейном программировании // Журн. вычисл. матем. и матем. физ. 2G13. Т. 53. № S. С. 1249-1271.

15. Сумин М.И. Параметрическая двойственная регуляризация в оптимизации, оптимальном управлении и обратных задачах // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2G1G. Т. 15. Вып. 1. С. 467-492.

16. Borwein J.M., Strojwas H.M. Proximal Analysis and Boundaries of Closed Sets in Banach Space, Part I: Theory // Can. J. Math. 19S6. V. 3S. №2. P. 431-452; Part II: Applications // Can. J. Math. 19S7. V. 39. №2. P. 42S-472.

17. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 19SS.

1S. Loewen P.D. Optimal Control via Nonsmooth Analysis. CRM Proceedings and Lecture Notes. V. 2. Providence, RI: Amer. Math. Soc., 1993.

19. Clarke F.H., Ledyaev Yu.S., Stern R.J., Wolenski P.E. Nonsmooth Analysis and Control Theory. Graduate Texts in Mathematics, vol. 17S. New York: Springer-Verlag, 199S.

2G. Mordukhovich B.S. Variational Analysis and Generalized Differentiation, I: Basic Theory; II: Applications. Berlin: Springer, 2GG6.

21. Сумин М.И. Параметрическая задача оптимального управления полулинейным эллиптическим уравнением с поточечным фазовым ограничением и граничным управлением // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2000. Т. 5. Вып. 4. С. 495-497.

22. Сумин М.И. Итеративная регуляризация градиентного двойственного метода решения обратной задачи финального наблюдения для параболического уравнения // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2003. Т. 8. Вып. 3. С. 459-460.

23. Сумин М.И. Двойственная регуляризация в оптимизации, оптимальном управлении и обратных задачах // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2007. Т. 12. Вып. 4. С. 527-528.

24. Сумин М.И. Параметрическая двойственная регуляризация и теорема Куна-Таккера // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2011. Т. 16. Вып. 1. С. 77-89.

25. Жидков А.А., Калинин А.В., Сумин М.И. Алгоритм двойственной регуляризации в обратных задачах теории глобальной электрической сети // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2011. Т. 16. Вып. 4. С. 1074-1076.

26. Сумин М.И. Регуляризованная параметрическая теорема Куна-Таккера и ее приложения // Вестник Тамбовского ун-та. Серия Естественные и технические науки. Тамбов, 2011. Т. 16. Вып. 4. С. 1189-1191.

27. Ладыженская О.А., Солонников В.А., Уральцева Н.Н. Линейные и квазилинейные уравнения параболического типа. М.: Наука, 1967.

28. Плотников В.И. Теоремы единственности, существования и априорные свойства обобщенных решений // Докл. АН СССР. 1965. Т. 165. № 1. С. 33-35.

29. Casas E., Raymond J.-P., Zidani H. Pontryagin's Principle for Local Solutions of Control Problems with Mixed Control-State Constraints // SIAM J. Control Optim. 2000. Vol. 39. № 4. P. 1182-1203.

30. Сумин М.И. Первая вариация и принцип максимума Понтрягина в оптимальном управлении для уравнений в частных производных // Журн. вычисл. матем. и матем. физ. 2009. Т. 49. № 6. С. 998-1020.

31. Сумин М.И. Об устойчивом секвенциальном принципе Лагранжа в выпуклом программировании и его применении при решении неустойчивых задач // Тр. Ин-та математики и механики УрО РАН. 2013. Т. 19. № 4. С. 231-240.

БЛАГОДАРНОСТИ: Работа выполнена при финансовой поддержке РФФИ (коды проектов 13-02-12155- офи_м , 15-47-02294- р_поволжье_а) и Минобрнауки РФ в рамках проектной части государственного задания в сфере научной деятельности в 2014-2016 гг. (код проекта 1727), а также при поддержке гранта в рамках соглашения от 27 августа 2013 г. № 02.В.49.21.0003 между Минобрнауки РФ и Нижегородским госуниверситетом им. Н.И. Лобачевского.

Поступила в редакцию 1 июня 2015 г.

Sumin M.I. SUBDIFFERENTIABILITY OF VALUE FUNCTIONS AND REGULARIZATION OF PONTRYAGIN MAXIMUM PRINCIPLE IN OPTIMAL CONTROL FOR DISTRIBUTED SYSTEMS

We discuss regularized or, in other words, stable with respect to errors of input data sequential Lagrange principle in nondifferential form and Pontryagin maximum principle in both convex and nonconvex parametric optimal boundary control problems with point-wise state constraints for parabolic equation.

Key words: optimal control; parabolic equation; minimizing sequence; subdifferentiability; value function; stability; Lagrange principle; Kuhn-Tucker theorem; Pontryagin maximum principle; modified Lagrange function; point-wise state constraints; dual regularization.

Сумин Михаил Иосифович, Нижегородский государственный университет им. Н.И. Лобачевского, Нижний Новгород, Российская Федерация, доктор физико-математических наук, профессор, заведующий кафедрой, e-mail: m.sumin@mail.ru

Sumin Mikhail Iosifovich, Nizhny Novgorod State University named after N.I. Lobachevsky, Nizhny Novgorod, the Russian Federation, Doctor of Physics and Mathematics, Professor, the Head of the Department, e-mail: m.sumin@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.